斯坦福大学、华盛顿大学研究:1000 个 AI 智能体预测人类行为,准确率最高可达 85%
IT之家11月25日消息,据TheDecoder今日报道,斯坦福大学、华盛顿大学和GoogleDeepMind的研究人员联合开发了一种AI智能体(AIAgent,也称“AI代理”),能够在社会实验中逼真地模拟人类行为。
研究指出,这类模拟系统可以作为一个虚拟实验室,帮助验证经济学、社会学、组织学和政治科学中的理论。研究团队通过对1000多名具有代表性的美国人(覆盖多种年龄、性别、教育背景和政治立场)进行访谈,建立了这些AI智能体模型。
系统运行方式是将详细的访谈记录与GPT-4o模型结合。当用户向智能体提问时,系统会加载访谈记录并让AI模仿受访者的回答。为生成这些记录,研究团队对每位受访者进行了长达两小时的访谈,并通过OpenAI的Whisper技术将对话转录成文本。
研究团队设计了多个测试,评估AI对人类行为的预测能力,涵盖《通用社会调查》、大五人格评估以及若干行为经济学实验。
结果显示,基于访谈数据的AI在预测社会调查(GSS)问题时,准确率高达85%,远超单纯依赖人口统计信息的AI智能体。
研究团队在五项社会科学实验中测试了人类与AI的表现,其中四项研究显示,AI的结果与人类高度一致。相关系数高达0.98,表明AI对人类行为有极强的模拟能力。
与传统的人口统计法相比,访谈驱动的AI显示出显著的优势,尤其是在处理不同种族群体和政治观点的预测时更加准确,同时也能有效减少人口统计类别之间的偏差。
研究团队已将包含1000个AI模型的数据集开放至GitHub,并建立了两层访问机制。综合性数据对研究人员完全开放,而个别参与者的详细数据则需经过特殊审批。
IT之家附数据集地址:
https://github.com/joonspk-research/genagents
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。