...方言“自由对话” 星火语音大模型破解强干扰场景下语音识别难题
刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种...
...发布74个语种方言“自由对话”,破解强干扰场景语音识别难题
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了软硬件...
...模型升级:74个语种方言“自由对话”,破解强干扰场景语音识别难题
星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了软硬件一体化讯飞同传系统,可...
首个支持30种方言混说语音大模型亮相
科技日报讯(记者崔爽)记者6月16日获悉,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。基于几亿用户和丰...
中国电信发布创新语音识别大模型 支持30种方言混说
星辰超多方言语音识别大模型的发布,正是基于AI技术的高效与系统性对方言进行整理归纳的重大成果。该模型不仅能同时识别包括粤语、上海话、四川话、温州话等在内的30多种方言,更在丰富性和质量上居于行业前列。这得益于中国电信人工智能研究院构建的超过30种、总计超过30万小时的高质量方言数据库。
奇富科技智能语音模型再升级,川渝方言识别准确率提升超35%
QI语精灵是奇富科技全自研智能语音模型,此次升级依托自身丰富的贷后提醒及方言数据样本,不仅延续了对国内八种主流地区方言的覆盖,包括东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话,还特别针对四川、重庆、山东、河南、贵州等用户分布较多的地区方言的识别能力进行了强化,平均识别准确...
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
在这样的基础上,如果语音助手能够识别并理解每一种方言,就能彻底击破沟通壁垒,与任何群体无障碍进行语言沟通。实际上,这件事已经有人做了:近日,中国电信人工智能研究院(TeleAI)发布了业内首个支持30种方言自由混说的「星辰超多方言语音识别大模型」,可同时识别理解粤语、上海话、四川话、温州话等各地方言,是...
讯飞星火语音大模型强悍升级!支持74个语种方言“自由对话”
其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率提高。同时发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备,佩戴后即可实...
“秒懂”30种方言中国电信用人工智能守护方言
在中国电信CTO、人工智能研究院院长李学龙的带领下,中国电信人工智能研究院(TeleAI)于5月25日发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。该大模型的最大亮点是摆脱了单一模型只能识别特定单一方言的困境,解译了包括上海方言、粤语、四川方言,以及有“中国最难懂的语言”之称的...
腾讯云ASR基于大模型全新升级:首创多语言、多方言混合识别引擎
通过业界首创的高性能引擎,能够实现23种方言的语音识别,让用户无需事先定义方言,即可让模型进行自动化适应。另外,突破现有ASR引擎的场景局限,腾讯云ASR在线下销售、下沉市场等不同场景都能够灵活、广泛地进行使用。目前,腾讯云ASR已经在微信、王者荣耀等腾讯内部产品以及外部不同行业持续落地,覆盖录音质检、会议...