国奖一等奖得主再出“王炸”:发布74个语种方言“自由对话”,破解...
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了软硬件...
奇富科技智能语音模型川渝方言识别准确率提升超35%
同时,融合方言信息提取模块,它能够自动识别不同口音,并在时间维度上对文字进行解码修正,将方言口音的语音识别误差率降低了30%以上,整体语音识别字错率降低了16%以上,显著提升了用户体验。在模型结构上,QI语精灵依托全自研的Qifusion结构,突破传统方言识别模型受限于地区先验条件,需预先知晓方言种类才能准确识别的局限,...
...模型升级:74个语种方言“自由对话”,破解强干扰场景语音识别难题
此次星火语音大模型迎来新突破。星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了...
科大讯飞发布星火大模型V4.0:大模型个性化,语音识别支持多语种多...
发布会现场,星火语言大模型发布新突破——多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。据了解,未来基于多模态的声音识别技术,将应用在讯飞听见智慧...
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
·确定一系列核心方言并为其建立自动语音识别(ASR)模型,当一种未知方言出现时,分析它距离这一系列核心方言中的哪些方言较近,就可以用合适的核心方言ASR模型识别出这种未知方言的内容。·方言应用的窗口期大约是二三十年。AI识别方言的实际困难大,我国方言体系之间甚至每一类方言内部的地域差异都普遍存在,各地方言常以...
腾讯云ASR基于大模型全新升级:首创多语言、多方言混合识别引擎
腾讯云通过采用自研的高新技术,打造多项业界首创的高性能引擎,进一步增强ASR混合识别能力(www.e993.com)2024年7月27日。依托业界首创的支持多种语言和多方言的混合识别引擎,腾讯云成功构建了中文方言大模型能力。提升23个方言语种的平均识别准确率(平均提升指标在7%以上),识别过程无需事先定义方言种类,实现对“普通话+方言”识别场景的自动化适应,为不...
方言也能识别 汉阳法院引入语音识别系统提升办案效率
方言也能识别汉阳法院引入语音识别系统提升办案效率湖北日报讯(记者刘畅、通讯员黄雯馨)“方言也能识别。”武汉市汉阳区法院推广使用庭审语音识别系统,持续提高诉讼便利度、降低诉讼成本。以信息化“小切口”助力优化法治化营商环境。“今天的庭审很流畅,一口气将理由和结论陈述出来,比同类案件传统记录方法的庭审用...
对话上交苏剑波教授:直面手语的「方言」多样性与系统「通用性...
我们目前主要针对国内聋人使用的标准化手语进行研究,并未涉及太多方言,主要是受限于语料库的不足及语料采集的差异化。雷峰网:国内正在推广中国通用手语,会使得以后的手语识别研究难度变小吗?苏剑波:中国通用手语在实际推广和执行过程中还会遇到一些挑战的。
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
实际上,这件事已经有人做了:近日,中国电信人工智能研究院(TeleAI)发布了业内首个支持30种方言自由混说的「星辰超多方言语音识别大模型」,可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型。比如在以下这个会议场景中,面对多种方言的输入,星辰超多方言语音识别大模型...
一声令下 家电设备自动开启 “成都造”语音AI芯片为生活带来...
“在实际应用中,用户对智能语音的要求很高,比如希望设备能够识别方言。”孙振奎介绍,“目前第三代语音AI芯片就能够做到这一点,比如我用‘川普’,甚至山东话去控制风扇,只要方言能够与普通话接近,那么机器就能够识别。”此外,抗噪能力也是关键,在居家电视播放、人声嘈杂的环境中,用户会希望语音设备能够准确识别指令。