夯实自主可控的国产大模型底座

2024-07-04 05:50:21 - 媒体滚动

转自:中华工商时报

夯实自主可控的国产大模型底座

    “热热闹闹、风起云涌的通用人工智能浪潮,到底有没有自主可控的国产底座能力做支撑,这决定了我们在这条路上到底能走多远。”近日,在讯飞星火大模型V4.0(以下简称“讯飞星火V4.0”)发布会上,科大讯飞董事长刘庆峰的发言掷地有声。在整个会议中,刘庆峰一遍又一遍地强调要重视大模型国产化问题。

    从去年5月6日推出大模型,到目前基于全国首个国产万卡算力集群“飞星一号”完成第6次升级,刘庆峰带领科大讯飞持续追赶大模型国际领先水平。随着大模型探索与应用的不断深入,也积淀着他对中国大模型底座能力的思考和认识。

    打造更懂你的AI助手

    讯飞星火APP自去年9月全面开放以来,在安卓公开市场累计下载量达1.31亿次,在国内工具类通用大模型APP中位居前列。

    在用户的喜爱和鞭策下,科大讯飞持续加紧对大模型技术的研发,各项能力快速提升。此次发布的讯飞星火V4.0七大核心能力全面升级,全面对标GPT-4Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的超越。

    “在国际12项大模型主流测试集之中,绝大部分是英文的,讯飞星火V4.0有8项实现超越,大家可以调用我们的API进行测试。”刘庆峰自信地说。

    现场,刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,星火“智商”的再度“进化”呈现在观众面前。

    “这次讯飞星火升级后非常重要的底层能力是什么?是从通用AI助手变成更懂你的AI助手。”刘庆峰认为,AI助手要能够基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料进行增强学习。

    面向专业领域的个性化应用,科大讯飞本次升级“讯飞晓医”APP,上线个人数字健康空间;发布星火智能批阅机,“AI助教”助力老师减负增效、因材施教;升级讯飞AI学习机,实现“AI1对1”超拟人的答疑辅导。

    “大模型将会改变信息分发和获取的方式,改变人机交互方式,改变内容生产方式,也会改变我们的整个产业形态和竞争格局,改变科研范式,这是大家都能看到的大趋势和未来。”刘庆峰表示,“大模型不仅可以写诗、作画,在改变工业、改变科研范式等方面已经实实在在发挥作用。”

    记者了解到,讯飞星火助力中国科学技术大学刘海燕教授团队,将蛋白质设计成功率从0.1%提升至64%,设计所需时间从6个月缩短至1天。

直达大模型应用“最后一公里”

    从发展大模型至今,刘庆峰一直把落地应用放在至关重要的位置。提升研发水平的同时,是要让先进技术惠及大众。

    “讯飞星火APP的使用高峰期不是周末,而是工作日;不是晚上,而是工作日的上午9点半和下午3点半。这说明大家真正用星火来解决工作中的刚需问题。”刘庆峰拿出这组数据并分析,“我们一直说大模型应该解放生产力、释放每个人想象力,从这些数据就可以看到。”

    在刚刚过去的电商“618”活动中,讯飞录音笔、讯飞翻译机、讯飞智能鼠标等讯飞产品的销量又同比增长70%。刘庆峰表示,这就是大模型所带来的智能硬件在解决刚需问题上又前进了一步。之后,科大讯飞会持续推进软、硬件一体化的研发工作,把更多看得见、摸得着的产品送到用户手中。

    随着讯飞星火V4.0的发布,科大讯飞正式推出星火企业智能体平台,供企业结合业务场景快速构建可落地的智能体应用。基于企业智能体平台,科大讯飞推出星火商机助手、星火评标助手等典型智能体案例。

    在多数大模型应用中,语音识别技术必不可少。刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言。

    前不久,科大讯飞作为第一完成单位申报的“多语种智能语音关键技术及产业化”获国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去10年人工智能领域首个国家科学技术进步奖一等奖。

    在大模型应用的拓展上,科大讯飞的语音识别技术持续发光发热。星火语音大模型突破多人混叠场景下的极复杂场景语音转写,即使在3人混叠说话场景也能实现86%的语音识别准确率,发布会现场的演示引发掌声不断。

    “去年,我们语音识别技术相关的大模型,赋能智能家居和其他C端硬件已经超过2000万台。如今,大模型赋能智能家居产业迎来蓬勃的发展机会。”刘庆峰说。

奔向自主可控的AI产业生态

    值得提及的是,讯飞星火V4.0是基于全国产算力平台训练出来的。

    去年10月24日,科大讯飞与华为联合在安徽发布中国首个国产万卡算力集群“飞星一号”,讯飞星火V3.5成为中国第一个在“飞星一号”平台上训练出的全民开放的大模型;截至V4.0版本的发布,讯飞星火仍是唯一的一个。

    “所有算法都是我们自主可控的,大模型的每一行代码、每一个数据都是我们自己编写、清洗出来的。”刘庆峰认为,一定程度上,评估讯飞星火V4.0的水平,对了解完全自主可控的国产大模型走到怎样的发展阶段,具有非常重要的意义。

    对标国际领先水平,讯飞星火V4.0已经实现多方面能力的超越,但刘庆峰也坦言,在代码和多模态能力上还有差距。他提出,一定要科学认识大模型能力的边界,大模型的能力并不是包治百病,并不是什么任务都能百分百完成,要研究怎样用更少的算力、更高的效率打造专属模型和专属应用。

    “今天人工智能技术的发展,绝不是一家公司可以把所有事情都做完的。”会上,刘庆峰除了发布科大讯飞的最新成果,也呼吁整个行业共同营造生生不息、自主可控的生态,奔向中国通用人工智能大未来。

    自今年1月30日讯飞星火V3.5发布至今,短短5个月,讯飞开放平台的开发者数从598万增长到702万。越来越多开发者正加入讯飞星火生态,释放更多刚需场景的应用价值。

    “一定要保证底座技术完全自主可控,否则我们就把大楼建在别人的院子里,建在沙滩上,随时会倒塌。”刘庆峰坚定地说。

    面对国际差距,刘庆峰表达了追赶的信心。在未来的岁月里,他还要带领科大讯飞不断优化从源头技术、到生态、到产业应用落地的一整套打法,以长期主义推动真正自主可控的AI产业生态的形成。

    (图)大模型不仅可以写诗、作画,在改变工业、改变科研范式等方面已经实实在在发挥作用

今日热搜