Skip to content

训练的数据问题 #31

@fortune-ai

Description

@fortune-ai

感谢开源你的模型,有两个问题请教下:
1、目前开源的仅仅是预训练模型(codes1b、codes3b、codes7b、codes15b)对吧?sft微调的数据方便开源么?
2、在训练过程,sql 2个epoch,text2code 1个eopch,text 1个epoch,这三部分数据是放到一起训练,还是先训练sql,然后text2code、最后text,每次在一个数据上训练完,选个最好的模型使用下一个数据继续训练;
谢谢

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions