Skip to content

关于 align阶段的multitask数据集构造和训练方式的疑问 #10

@stonewu9310-dot

Description

@stonewu9310-dot

作者你好,我在第一阶段align时,已经用interleaved 数据训练了embeding层,在这个模型基础上,希望继续训练multitask任务。看论文里的介绍,MI阶段的训练数据是chatml格式的,训练loss是只计算目标token。

我的疑问是:

  1. MI任务是sft还是cpt?训练的是网络中哪些层的权重呢?
    2.MI任务的数据都需要构造成chatml格式么,user interleaved数据看起来不是chatml的,是如何加到MI任务训练的呢?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions