百川智能披露Baichuan 3评测结果,知识百科能力超越GPT-4-Turbo

2024-04-30 16:37:25 - 新浪科技

新浪科技讯4月30日下午消息,百川智能今日披露了一份由国内大模型评测机构SuperCLUE发布的评测报告,结果显示,在报告选取的国内外具有代表性的32个大模型4月份的版本中,通过多维度综合性测评,Baichuan3在国内大模型中排名第一,在知识百科能力上Baichuan3以82分的成绩超越了GPT-4-Turbo,位列第一。

SuperCLUE是国内知名通用大模型综合性测评基准,其前身是第三方中文语言理解测评基准CLUE(TheChineseLanguageUnderstandingEvaluation)。据介绍,为更真实反映大模型通用能力,SuperCLUE本次测评由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等,题目为多轮开放式简答题,评测集共2194题。

今日热搜