大语言模型上车后,你的车机真的好用了吗?

2024年10月9日 - 腾讯新闻

**头图由豆包AI生成,提示词:大语言模型,AI,智能座舱,语音交互去年号称大模型技术元年,智能座舱的演进进入了新阶段:大语言模型上车。智能座舱通过运用大模型,将提供千人千面的语音识别、娱乐信息,以及驾驶辅助的个性化定制服务,让座舱具有了深度进化的能力。新能源、电动化、大模型就这样把智能座舱推向了新阶段...

详情

活动报名|Meta语音识别,正确率显著提升,零样本跨语言MMS Zero-shot

2024年9月9日 - 腾讯新闻

尽管自动语音识别(ASR)在语言覆盖方面取得了重大进展,但仍有许多语言未被覆盖。为了解决这一问题,我们提出了MMSZero-shot,这是一种简单的使用罗马化(romanization)而非复杂的音素化的方法。我们首先在包含1078种语言的标注数据集上训练了一个多语言的声学模型(acousticmodel),然后在测试阶段,只需要很少量的未标记...

详情

助听器什么人群可以用?助听器哪款好用?干货大全,建议收藏!

2024年9月4日 - 百家号

助听器什么人群可以用？助听器哪款好用？科大讯飞是一家成立于1999年的品牌，总部位于中国安徽合肥，以人工智能（AI）技术为主导，专注于智能语音和AI应用的研发。公司在语音识别、语音合成、自然语言处理等领域表现不错，并涉足助听器市场。这款助听器外观类似于普通蓝牙耳机，佩戴后不容易被认出是助听器。产品内置了32...

详情

超千条语料,深度测评蔚小理的语音交互效果

2024年8月31日 - 网易

其中,车端模块包括音频处理、本地自动语音识别(AutomaticSpeechRecognition,ASR)、本地自然语音理解(NaturalLanguageUnderstanding,NLU)、本地语音合成(TextToSpeech,TTS)、语音中枢控制、本地仲裁、唤醒词和本地对话系统(DialogSystem,DS)等;云端功能模块主要包括在线ASR、在线NLU、在线对话以及其他推送功能等。

详情

汇纳科技申请<一种融合大语言模型和语音识别的管理方法、系统及...

2024年7月17日 - 网易

汇纳科技申请<一种融合大语言模型和语音识别的管理方法、系统及设备>专利,实现智能,高效,便捷的门店导购服务,专利,语音识别,汇纳科技

详情

Soul App创始人张璐团队推动语音技术升级,发布端到端全双工语音大...

2024年10月15日 - 新浪

Soul的语音大模型能够识别并理解用户的情感变化,并据此作出相应的回应,提供有温度的情感关怀,增强了人机交互的真实感和亲密度(www.e993.com)2024年10月18日。此外,Soul的端到端语音模型可以模拟出多种风格的语言表达,甚至可以模仿出物理世界的动物声音。这种多风格语言的支持不仅增加了语音交互的趣味性,也让用户可以根据个人喜好选择不同的语音风格,...

详情

阿里音频生成大模型开源!50种语言快速理解+5种语言语音生成

2024年7月7日 - 网易

多语言语音识别性能研究团队在开放源数据集上比较了SenseVoice和Whisper的多语言识别性能和推理效率,包括AISHELL-1、AISHELL-2、Wenetspeech、Librispeech和CommonVoice。推理效率评估是在A800机器上进行的。SenseVoice-Small采用非自回归端到端架构,由此带来的推理延迟极低——相比之下,它比Whisper-Small快7倍,比Whisp...

详情

AI配音界的"变脸大师"!Linly-Dubbing让你的视频秒变多语言版

2024年8月16日 - 站长之家

这个小工具可不简单,它懂的语言比联合国翻译还多!无论你想把视频翻译成中文还是其他语言,它都能轻松应对。它的AI语音识别能力堪比福尔摩斯,能精准识别语音并转换成文本,连说话者是谁都能准确识别出来。担心翻译质量差?别怕!Linly-Dubbing可是和GPT这样的大语言模型"联姻"了,翻译起来又快又准,专业性和自然度都没...

详情

国家重点实验室发布6款藏语自然语言处理应用产品

2024年5月27日 - 新浪

实验室聚焦青藏高原地区语言文字信息处理及文化智能等技术难题,积极培育新质生产力,已攻克语音识别、语音合成、语音翻译等关键技术,正在开展跨语言人机交互应用、多领域机器翻译、虚拟播音、大语言模型等多维应用研究。班智达系列软件是近年来实验室潜心科研、合力攻关、产出精品的一次集中展示。班智达系列产品有什么用?省...

详情

半年融资1.6亿美金,AI学语言又来敲Duolingo的门了

2024年4月10日 - 搜狐

最后,说下AI。如果说语音识别+AI对话,是套大模型的壳,上面的模拟场景中的变化和反馈体系,则开始让AI语言产品和Duolingo的现有体验真正产生了一些差异。Loora语法反馈页面(图1),ELSA发音反馈页面(图2),Loora发音反馈页面(图3),Duolingo题目(图4)...

详情

查看更多

语音识别的
语音识别用什么语言表达
语音识别用的什么技术
语音识别用什么算法
语音识别用什么编程语言做
语音识别可以用来做什么
语音识别语言
语音识别用什么语言编写
语音识别哪国语言
语音识别用什么语言开发原因