智能语音技术让人机交互更“丝滑”

2024年7月4日 - 中国创新网

“原来的语音合成、语音识别、机器翻译等单点技术,借助大模型后台的理解能力、文本生成能力,在语义理解、指令跟随、多轮对话、情绪感知、超拟人合成等方面实现了显著提升,使语音交互体验得到极大改善。”高建清说。着眼未来,大模型技术可以在复杂语义理解、长文本建模能力上进一步提升语音识别、合成和翻译的效果。同时基于...

详情

AI大脑让机器人更像人了

2024年6月2日 - 澎湃新闻

焦继超注意到,处理图像和语音的大模型也相继被开发出来,这些模型的能力可以处理和理解机器人采集的视频、音频,像人的大脑能够处理眼睛和耳朵收集到的外部信息一样。2023年9月,OpenAI根据ChatGPT进一步发明出了具备图像和语音识别功能的GPT-4V,这意味着AI开始模拟人脑中复杂的神经网络来识别图像和声音,并将其转换为语言...

详情

智能座舱算法基础之语音识别篇

2024年2月15日 - 腾讯新闻

其主要目标是把语音信号转变为相应的文字,从而让机器具有听觉功能,能够直接接收人的口语命令,实现人机自然的交互。语音识别是一门交叉学科,所涉及的领域有音频信号处理、声学、语言学、模式识别、人工智能等。其应用领域也非常广,涉及工业、军事、通信、消费电子等多个领域。在高度信息化的今天,语音识别技术及其应用已...

详情

惊人技术:迪拜博物馆展示能表达情感的人形机器人

2024年1月17日 - 百家号

人形机器人需要具备情感识别的能力。它需要通过传感器来感知人类的情绪表达，例如面部表情、语音语调和身体姿势等。然后，通过机器学习算法和数据分析，机器人可以将这些信息转化为对应的情感分类。这样，机器人就能够知道人类的情感状态，并做出相应的反应。人形机器人还需要具备情感表达的能力。当机器人理解了人类的情感后...

详情

多模态功能上线,OpenAI让ChatGPT能说话、会看图

2023年9月27日 - 百家号

所以在这一轮的更新中，ChatGPT不仅仅能够理解用户输入的文字，甚至还拥有了识别并理解语音、图像信息的能力。语音识别能力很简单，因为该功能使得ChatGPT获得了类似Siri、小爱同学的能力，并将提供五种不同的语音供用户选择，同时支持语音音频生成文本、将播客内容翻译成其他语言等功能。其实早在今年5月，ChatGPT已经...

详情

华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用|钛...

2024年4月4日 - 网易

好看的皮囊就是它能够听得懂语音,看得懂文本、图片和视频,有这样一个视频、语音的形象,能够跟人实时交互(www.e993.com)2024年7月10日。有趣的灵魂就是它需要像人一样能够去独立思考,有长期记忆,有自己的个性。下面我们就分别从好看的皮囊和有趣的灵魂两个方面来讲。好看的皮囊:多模态理解能力...

详情

智能语音技术让人机交互更“丝滑”

2024年7月10日 - 新浪

详情

语音识别能让机器人听懂人话吗?

2019年7月24日 - 澎湃新闻

语音识别相信大家都不会陌生,我们可以通过语音来输入文字,用语音来告诉我们的设备接下来需要做什么,但是这真的意味着我们可以与机器人完美沟通吗?责任编辑:周双玲特别声明本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用...

详情

能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”

2024年1月25日 - 金融界

在“听得懂”方面,言犀ASR语音识别技术能够识别不同的语气,并给出不同话术。顾客同样说“我知道了”,如果重音落在“知”上,语调先升后降,可能说明客户已经不耐烦,需要推出安抚话术。如果顾客的重音不明显、语调平缓,外呼机器人就会继续讲解业务逻辑。这种“听得懂”的能力,极大程度降低因无效沟通带来的挂断率。

详情

查看更多

语音识别有什么用处
语音识别就是让机器听懂你说的话
语音识别是什么的过程
语音识别是什么技术
语音识别可以用来干什么
语音识别就是让机器听懂你说话对还是错
语音识别能用来做什么
语音识别的目的是让机器能够听懂人类的语音
语音识别是什么原理
语音识别是让机器能够听懂语音的能力吗