Hello,
如果我不进行SFT,直接通过prompt提示调用云端模型来模拟这个过程,是不是也可以?
云端大模型对指令的遵循也是OK的,只是让大模型多思考几步需要检索哪些相关的内容。
这个里面提到的训练,主要是不是针对小模型。 通过训练可以将这个能力迁移到小模型上,让小模型也能有比较好的效果?
目前,我试了一个问题: 李一桐第一部在电视台播出的电视剧是在哪个台?
通过接入云端大模型:Deepseek-V4-pro, 给出的回复在Round2(做了一次检索, wiki内容已经提前构建好了)中是这个:
[ANSWER] 李一桐第一部在电视台播出的电视剧是《半妖倾城》,该剧于2016年11月8日起在湖南卫视“青春进行时”剧场播出(先网后台形式),因此首播电视台为湖南卫视。[SOLVED]
和你给出的示例结果不一样。
Hello,
如果我不进行SFT,直接通过prompt提示调用云端模型来模拟这个过程,是不是也可以?
云端大模型对指令的遵循也是OK的,只是让大模型多思考几步需要检索哪些相关的内容。
这个里面提到的训练,主要是不是针对小模型。 通过训练可以将这个能力迁移到小模型上,让小模型也能有比较好的效果?
目前,我试了一个问题: 李一桐第一部在电视台播出的电视剧是在哪个台?
通过接入云端大模型:Deepseek-V4-pro, 给出的回复在Round2(做了一次检索, wiki内容已经提前构建好了)中是这个:
和你给出的示例结果不一样。