支持74个语种方言“自由对话” 星火语音大模型破解强干扰场景下...
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能...
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
实际上,这件事已经有人做了:近日,中国电信人工智能研究院(TeleAI)发布了业内首个支持30种方言自由混说的「星辰超多方言语音识别大模型」,可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型。比如在以下这个会议场景中,面对多种方言的输入,星辰超多方言语音识别大模型...
讯飞星火语音大模型强悍升级!支持74个语种方言“自由对话”
基于科大讯飞全球领先的多语种语音技术,星火语音大模型迎来新突破。面向万物互联时代,新增多语种、多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率...
18家中文大模型横评:识别违规内容手段单一 英文合规检测水平待提高
首先,英文合规检测能力不足,导致模型生成的英文内容难以准确判断是否符合我国法规及道德标准。这主要源于检测模型在训练时缺乏足够的英文违规语料,说明许多厂商对模型生成结果的检测算法还不够完善。其次,英文关键词积累不足也削弱了模型的合规检测能力,影响了对英文文本关键信息的准确识别和理解。这些问题可能导致英文内...
字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待
在豆包语音系列模型,豆包语音识别模型具有高准确率和个性化特征,支持多语种识别;豆包合成模型具有自然、多情绪和多演绎特征;豆包声音复刻模型支持5秒复刻,跨语种迁移,与原声具有高相似度。此外,豆包大模型还包括文生图模型、FunctionCall模型、向量化模型等其他细分领域模型。
讯飞双屏翻译机即将首发语音大模型,多语言自动识别重磅亮相
1月30日,科大讯飞正式发布基于首个全国产算力训练的讯飞星火V3.5,科大讯飞董事长刘庆峰表示,讯飞星火V3.5多项核心能力超GPT-4Turbo(www.e993.com)2024年11月11日。同时,科大讯飞正式发布星火语音大模型,讯飞双屏翻译机将首发搭载语音大模型,并上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成软件推送升级,供全部新老用户...
...模型升级:74个语种方言“自由对话”,破解强干扰场景语音识别难题
此次星火语音大模型迎来新突破。星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了...
腾讯云ASR基于大模型全新升级:首创多语言、多方言混合识别引擎
腾讯云通过采用自研的高新技术,打造多项业界首创的高性能引擎,进一步增强ASR混合识别能力。依托业界首创的支持多种语言和多方言的混合识别引擎,腾讯云成功构建了中文方言大模型能力。提升23个方言语种的平均识别准确率(平均提升指标在7%以上),识别过程无需事先定义方言种类,实现对“普通话+方言”识别场景的自动化适应,为不...
国产AI大模型全新升级 74个语种、方言自由对话
湖南日报6月28日讯(通讯员许可亮)6月27日,国产AI大模型再度升级,科大讯飞发布讯飞星火大模型V4.0及相关落地应用,可实现74个语种/方言免切换对话,破解了强干扰场景下语音识别的难题。科大讯飞董事长刘庆峰介绍,星火V4.0性能对标美国人工智能研究公司OpenAI发布的GPT-4Turbo大模型,并在文本生成、语言理解、...
大模型应用场景落地“卷”出新广度
面向万物互联时代,星火语音大模型发布了国际领先的多语种多方言免切换语音识别能力,该能力可支持37个语种、37种方言进行“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。值得一提的是,针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,...