Skip to content

直接使用云端大模型 #1

@shanghai-Jerry

Description

@shanghai-Jerry

Hello,
如果我不进行SFT,直接通过prompt提示调用云端模型来模拟这个过程,是不是也可以?
云端大模型对指令的遵循也是OK的,只是让大模型多思考几步需要检索哪些相关的内容。

这个里面提到的训练,主要是不是针对小模型。 通过训练可以将这个能力迁移到小模型上,让小模型也能有比较好的效果?

目前,我试了一个问题: 李一桐第一部在电视台播出的电视剧是在哪个台?

通过接入云端大模型:Deepseek-V4-pro, 给出的回复在Round2(做了一次检索, wiki内容已经提前构建好了)中是这个:

[ANSWER] 李一桐第一部在电视台播出的电视剧是《半妖倾城》,该剧于2016年11月8日起在湖南卫视“青春进行时”剧场播出(先网后台形式),因此首播电视台为湖南卫视。[SOLVED]

和你给出的示例结果不一样。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions