进军智能语音赛道 汉王科技发布首款智能语音应用“汉王语音王”
汉王语音王是基于汉王自研多模态天地大模型,自主研发的一款集AI语音记录、智能翻译与同声传译于一体的智能语音旗舰应用,支持AI精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能,用户可以即听即用,帮助跨越语言障碍,提高日常办公、学习、会议、旅游等场景应用效率和便捷性。AI语音记录:精准识...
智能语音技术助力沟通无障碍,讯飞同传连续五年服务中关村论坛年会
深耕智能语音领域25年,科大讯飞不仅将中文语音技术做到了最好,也将多语种语音技术做到了最好。2020年,科大讯飞60个语种的语音识别、翻译和37个语种的语音合成超过谷歌、微软,达到国际领先水平;2021年,科大讯飞在美国国家标准与技术研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中,获得全部受限赛道的15个语种冠军...
智能语音技术让人机交互更“丝滑”
“大模型+语音”的发展模式,被认为将给智能语音技术和产业带来新一轮革命性突破。“比如大模型可以实现语音技术的超拟人合成,让机器说话不再有浓厚的朗读腔,能够像真人一样自然对话。而全双工交互,则可以同时、瞬时进行信号的双向传输,让人机对话可以随时打断和继续等。这些都让大模型在智能语音领域备受关注。”科大...
讯飞星火首发多情感超拟人合成,科大讯飞如何让智能语音更进一步
讯飞星火此次更新的多情感超拟人合成语音,或许会为解决老年人的心理孤独发挥出独特作用,让科技更有温度。行业调研机构德勤Deloitte发布的《未来的语音世界-中国智能语音市场分析》报告中指出,我国智能语音市场行业规模预计在2030年达到1452亿元。德勤指出,随着新兴自然语言技术产生以及已有技术的不断成熟,智能语音技术已经...
OpenAI开发人工智能语音引擎,因风险太大无法公开发布
OpenAI最近分享了语音引擎(VoiceEngine)的初步预览结果和见解,语音引擎是该公司自2022年以来一直在开发的克隆语音的人工智能模型。语音引擎为OpenAI广受欢迎的ChatGPT模型中的朗读功能提供支持,也可以作为文本到语音的API。根据OpenAI的说法,语音引擎工具能够生成一个合成的,但听起来十分自然的声音,仅需要真人15秒的声音...
能微信能语音,这款国产纽曼老人机,比智能手机更好用的功能机
这个逻辑与传统功能机是一样的,随后系统来到桌面,是2*2布局的菜单,图标样式有点像智能机,且翻页的效果也很流畅(www.e993.com)2024年12月19日。菜单里内置有qq、微信和语音电话等。同时也有语音操控的菜单,设置出语音播报、语音报时、朗读屏幕内容和操作,都是为老人设计的。从实际使用体验看,这款纽曼m6老人机的操作非常顺畅,部分软件功能和...
科技创新下的智能学习工具,14 款扫描词典笔的硬件揭秘
HelissonUN-07智能扫描词典笔HelissonUN-07智能扫描词典笔基于科大讯飞OCR文字识别技术和发音技术打造,识别准确率可达99%。使用上,支持课本扫读,查字、查词、查成语、拼读、释义,支持中/英文双语互译,在线翻译,300万+海量词库,满足从小到大各阶段学习。还搭载了AI智能语音助手,支持语音问答,AI...
...侵害声音权益的法律认定——以殷某某诉北京某智能科技公司等人…
数字化时代,声音作为一种独特的信息载体,其权益保护问题日益凸显,AI语音生成技术的广泛应用,对声音权益的保护提出了新的要求。殷某某诉北京某智能科技公司等人格权侵权案,对声音的可识别性判断、AI生成声音的侵权认定进行了实践探索,强调了声音作为个体独特标识的重要性,亮明了全面保护自然人人格权益和引导技术向善发展...
5人天完成AI语音播报,还免费调用!鸿蒙原生版新浪新闻智慧升级
在开发工作量方面,传统语音播报能力的端到端开发量大约90人天,使用HarmonyOSAI朗读控件仅需5人天即可完成开发,不仅提高了开发效率,且完全免费,使开发者无需承担三方朗读SDK的高昂费用。此外,鸿蒙原生版新浪新闻还支持AI智能识别图片中的文字,当用户看到新闻图片中的文字,想要记录下来时可以直接选择并复制,方便快捷...
5 款最佳文本转语音 AI 工具:视频配音、有声书制作必备!
TTSMaker(马克配音)是一款在线的文本转语音平台,通过AI人工智能算法将文本轻松转换成音频。它支持50多种语言和300多个语音包风格,适用于视频配音、有声读物、教育培训和产品营销等多种场景。用户可以免费使用TTSMaker合成语音,并且拥有合成的音频文件的100%版权,可以用于任何合法的商业用途。