长城汽车申请语音降噪方法及车辆专利,提升语音识别的准确率
所述方法利用非稳态噪声识别模型识别待识别语音中的非稳态噪声,能够准确识别出待识别语音中存在的非稳态噪声,并输出非稳态噪声;在待识别语音中去除非稳态噪声,得到去除非稳态噪声后的语音。通过非稳态噪声识别模型对待识别语音进行识别,能够准确的确定待识别语音中的非稳态噪声,在将待识别语音中的非稳态噪声去除,得到的...
阿里巴巴发表新语音识别算法 准确率高达95%
阿里巴巴发表新语音识别算法准确率高达95%芯科技消息(文/Allis)根据《VentureBeat》报导,中国电商大厂阿里巴巴涉足了许多AI事业,而在今年的神经网络信息处理系统会议(NeurIPS)中,阿里巴巴发布了一项最新的跨公司合作成果,能够在嘈杂的环境中进行语音辨认,准确率甚至高达94%至95%。为了要能准确辨认语音,阿里巴巴利用了...
IBM模拟AI芯片登Nature:能效提升14倍,语音识别速度提升7倍
第一个实验围绕关键词语音检测展开。该团队提出了一种卷积神经网络架构,并在包含12个关键字的谷歌语音命令数据集上进行训练。团队采用了架构更简单的FC(全连接)网络结构,最终达到了86.14%的识别精度,且提交速度比MLPerf目前最佳情况快7倍。该模型使用硬件感知训练在GPU上进行训练,然后部署在团队的模拟AI芯片上。第二...
chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !
Whisper的多语言语音识别和语音翻译的准确率也非常高,甚至在一些零样本的情况下,也能够表现出色。Whisper的性能因语言而异。下图显示了按语言large-v3和模型的性能细分,使用在CommonVoice15和Fleurs数据集上评估的large-v2WER(单词错误率)或CER(字符错误率,以斜体显示)。与其他模型和数据集相对应的其他...
用活人脑细胞造AI系统,语音识别已成功,可无监督学习|Nature子刊
最开始,Brainoware的准确度只有30%-40%。但经过两天的训练之后,它就可以78%的准确率识别出特定说话者。作者在此强调,所谓的训练只是重复音频片段,不给予任何反馈,也就是所谓的无监督学习。不过,需要注意的是,目前Brainoware只能识别谁在讲话,但听不懂任何讲话内容。
神秘大招终结幻觉问题!讯飞星火 V4.0 首秀地表最强 AI 语音助手...
第二个例子则进一步加码难度,在「放背景音乐」+「嘈杂的会场」环境下,让基于星火语音大模型的讯飞听见同时识别三位讯飞研究员的声音,并对发言人进行标注(www.e993.com)2024年7月1日。即使在三人混叠说话场景,也能实现86%的语音识别准确率。语音打断和情绪识别。讯飞输入法和讯飞听见都是大家熟悉的应用,而现场还直接放了一辆奇瑞汽车,演示了...
科大讯飞按下加速键:大模型上车体验已超越传统汽车认知
2015年,某品牌汽车做车载噪音环境下语音识别测试,科大讯飞的语音识别系统,准确率达到86.9%,一年后,这一数字提升至90%。2016年,在Google举行的国际英文语音识别大赛上,科大讯飞的语音识别准确率在全球率先突破97%。科大讯飞多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际...
获奖只是新的起点——访科大讯飞董事长刘庆峰
科大讯飞提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,解决了“鸡尾酒会”的难题,使复杂场景下语音识别准确率得到重大突破。创新点二,是多语种共享建模关键技术突破。为了应对多语种技术“卡脖子”问题,必须解决小语种智能语音系统构建所面临...
1秒内响应、语音识别准确率超90% 上海交大导盲六足机器人进入实地...
机器人可根据盲人的语音指令,基于深度学习端到端语音识别模型理解语义信息,快速响应、准确识别。目前,导盲六足机器人已实现1秒内响应、语音识别准确率超90%。同时,导盲六足机器人能实时反馈行走和环境状况等信息,实现人机双向智能交互。目前,导盲六足机器人最大速度达3米每秒,能够满足盲人慢走、快走、跑步等出行需求。