关怀人文、赋能科研 科大讯飞展示AI如何改变生活
又一年1024,属于开发者的节日,人工智能领域的“OG”科大讯飞一口气发布了11项与讯飞星火大模型相关的领先技术、硬核产品与创新应用,展示了大模型究竟会怎样改变人们的生活,也展示了一家“老牌”人工智能企业的使命与担当。
语音视觉虚拟人交互“三合一”让聋哑人也能清晰说话
今年上半年,OpenAI在o1模型中展示出了实时交互技术,山姆·奥特曼将其比作科幻电影《Her》中的人工智能助手,但这一次,科大讯飞让“Her”拥有了外观与表情。
随着与交互相关的AI应用不断推陈出新,语音通话、视觉、虚拟人等交互技术“你方唱罢我登场”,不断吸引着人们的眼球。本次发布会上,科大讯飞将上述技术“三合一”——超拟人数字人首次亮相,人机交互从单纯的语音变成了超拟人数字人,语音、视觉、虚拟人的全部联动的多模态交互。
在科大讯飞研究院院长刘聪的现场演示中,超拟人数字人可以随时对用户的问题予以反馈,不仅能够达到实时交互的效果,例如根据玩具摆放的不同姿势实时解说“孙悟空”“奥特曼”“怪兽”的剧情,还能同时做出表情,就像和真实存在的朋友进行视频通话。
值得注意的是,目前讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。可以预见,结合数字人的实时通话能力,这必将进一步扩展大模型的应用场景,让《Her》更快走进现实,让每个人都拥有可以随意定制、随时和自己“视频通话”的能看见的AI伙伴。
此外,今年科大讯飞的演示还更加具有人文关怀。作为AI语音领域的领头羊,今年6月27日,科大讯飞在发布会上“秀”了一把嘈杂环境下三人同时说话语音转文字的惊艳效果;今年9月,科大讯飞在国际最权威、最难的高噪场景的语音识别大赛CHiME上再次获得冠军。而这一最先进的技术,科大讯飞也用到了助残领域。
“大家好,我是舞蹈演员魏菁阳。”当听到这句口齿清晰的语音时,现场爆发出了热烈的掌声。这句话的声音属于中国残疾人艺术团舞蹈演员魏菁阳,她在几年前推出的舞蹈作品《我的梦》引起了巨大震撼,作为一名聋哑人,她说话不够流畅,发音模糊,但通过科大讯飞与华为联合研发的声音修复技术,她能够通过AI“修复”自己的原音,并发出清晰的声音。
“今天的AI技术不仅赋能工业、科研这些重要场景,也可以帮助到每一个特别的你——无论老人、孩子,还是特殊群体。”在现场,科大讯飞董事长刘庆峰动情地说。
展示AI应用“六边形战士”根据地业务技术含量再升级
实际上,上述发布的内容仅是本次科大讯飞1024开发者节的“冰山一角”。具体来看,本次大会发布的硬核产品与创新应用共有11项,分别为:定义多模AIUI标准;发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏,以及讯飞星火大模型的最新升级版本讯飞星火4.0Turbo。
这11项发布展示了科大讯飞在大模型应用领域的深度与广度,其覆盖了从与国家发展相关的工业、科研、央国企服务,到紧系民生的教育、医疗、政务等各种场景,充分说明了为什么业界人士称2024年是AI的“商业化落地元年”。
但从一些技术的进步上,我们可以发现,科大讯飞也正在逐渐增加AI落地具体场景的深度,从其选择切入的场景上,我们能够看出这家公司对技术能力的深入思考。
例如在科大讯飞深耕多年的“根据地业务”之一的医疗板块上,该公司一直希望能够用人工智能打造每个医生的诊疗助理,其“智医助理”人工智能辅助诊疗功能已经上线多年,累计提供8.6亿次的辅助诊断,提醒不合理处方8100多万个。
而这一次,刘庆峰强调,要从更有温度的人文关怀出发,持续学习顶尖医生的能力。科大讯飞找到的切入点是影像数据。
据了解,中国的影像科医生总数相对不足,每年有40%影像数据的增长,但是影像科医生只增长4%;拍片的质量参差不齐,信息不完整率接近40%。对此,科大讯飞在安徽用人工智能率先实现了中国目前为止应用规模最大的影像云平台。安徽省卫生健康委、医保局推动全省所有的公立医院全部联网,使得在全省任何医院的一次检查全省通用,不用再重复检查。一次检查一辈子保存,可以随时查看变化情况。而在这背后,是科大讯飞用人工智能判断检查质量、拍片质量是否达标的技术能力。
这也是一次技术和民生的“双赢”,因为是讯飞星火医疗大模型的能力结合安徽省医学影像云平台的海量数据,在此基础上,讯飞星火医学影像大模型才能正式发布。
为世界提供“第二种选择”中国AI公司的担当
更值得一提的是,在2024诺贝尔奖物理奖和化学奖都颁给了AI相关领域科学家的当下,科大讯飞也强调了AI赋能科研是公司的重要使命。
诺贝尔化学奖获得者,DeepMind创始人哈萨比斯曾在获奖后表示,“我不认为在公司做研究和在学院做研究有什么不同,无论在哪,只要方法得当,都能做出伟大的科学成就,许多新兴科学、新领域和新的研究发现需要大量资源,为什么不利用私营部门的资金来支持这些研究呢?只要坚持科学方法,并以真正科学严谨的态度来对待,追求重大问题即可。”
在本次发布中,刘庆峰展示了科大讯飞是如何“身体力行”赋能科研的:星火科研助手2.0已在中国科学院下属116个院使用,使得科研成果的调研效率提高10倍以上,论文研读效率的有效率超过90%,“这次,我们又进一步升级了论文预审和推荐能力。讯飞星火的代码能力已在全国332所院校开通使用,学生主动提问增加了一倍,教师辅导工作量减少了80%。”
事实上,与双一流985中国科学技术大学同处合肥,吸收广大科研人才的同时,科大讯飞本身对科研也极端重视,在人工智能助力科研攻关方面,科大讯飞不遗余力,如中科大生命学院刘海燕教授团队基于条件扩散生成模型的蛋白质主链设计,把原来需要6个月的实验提速到只需1天完成,已成功设计了48个自然界不存在的全新蛋白质。李建刚院士使用大模型助力合肥人造小太阳——基于Transformer强化学习的托卡马克等离子体控制,把原来模拟器预测误差从7%降到3%,模拟器预测时间从10天降到1小时,具有里程碑意义。
对科研的重视从科大讯飞的财报中也可见一斑。今年上半年,科大讯飞研发投入21.9亿元,同比增长32.23%,占营收比重达23.5%。其中,大模型研发及产业落地拓展等方面,新增投入超过6.5亿元。
相比其他同业公司,科大讯飞在本次发布会中也展示了中国AI公司所必须的担当。如本次首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种,为什么中国大模型要做多语种?刘庆峰表示,“如果中国的大模型厂商都只做中文,全球没有第二种选择,我们就必然会被锁在中国范围之内。”
科大讯飞立志要做自主可控的全国产大模型。科大讯飞联合华为建设了首个国产万卡算力集群“飞星一号”平台,并于去年10月24日上线。刘庆峰表示,最近一年攻克了很多大模型集群训练的“疑难杂症”,解决了500多次基础软硬件问题,模型训练适配优化平台耗时从90天缩减到15天,新增30多项框架和平台特性,优化了150多个基础、通信和融合算子。
这次发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
“今天是一个全面共创的时代,不仅仅是科大讯飞的平台及基础底座能力的厂商、科研院所、开发者、教师医生等专业团队,每一个用户的每一次提问都是大模型进步非常重要的基石,聚沙成塔最重要的来源。你们对AI的愿望,就是我们未来努力的方向,期待着我们携手努力,解放生产力,释放想象力,在中国用人工智能建设美好世界,并且给世界提供第二种选择。”刘庆峰说。
文/罗亦丹