百川智能披露Baichuan 3评测结果，知识百科能力超越GPT-4-Turbo

2024-04-30 16:37:25 - 新浪科技

新浪科技讯4月30日下午消息，百川智能今日披露了一份由国内大模型评测机构SuperCLUE发布的评测报告，结果显示，在报告选取的国内外具有代表性的32个大模型4月份的版本中，通过多维度综合性测评，Baichuan3在国内大模型中排名第一，在知识百科能力上Baichuan3以82分的成绩超越了GPT-4-Turbo，位列第一。

SuperCLUE是国内知名通用大模型综合性测评基准，其前身是第三方中文语言理解测评基准CLUE（TheChineseLanguageUnderstandingEvaluation）。据介绍，为更真实反映大模型通用能力，SuperCLUE本次测评由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等，题目为多轮开放式简答题，评测集共2194题。