类人智能体概念、能力与衍生丨AI Agents闭门研讨观点集锦
2023年12月6日 - 腾讯新闻
通过「Instructionfollowing」方式,我们可以产生大量用于指令微调的数据。我们针对LLaMa等模型进行了微调。例如,加入关于数学的指令数据后,LLaMa模型在数学问题上的性能有巨大提升。在CAMEL项目中,我们提出了在完全自动化的系统中进行「Actor-Critic」。我们引入了一个批评智能体,设定一些标准,让他选择是否修改当前...
详情
通过「Instructionfollowing」方式,我们可以产生大量用于指令微调的数据。我们针对LLaMa等模型进行了微调。例如,加入关于数学的指令数据后,LLaMa模型在数学问题上的性能有巨大提升。在CAMEL项目中,我们提出了在完全自动化的系统中进行「Actor-Critic」。我们引入了一个批评智能体,设定一些标准,让他选择是否修改当前...