...科大讯飞多语种智能语音技术实现了60个语种整体并跑,其中14个...
多语种智能语音技术,指的是包含多语种语音识别、多语种语音合成、多语种翻译技术等为一体的综合技术。多语种智能语音技术对于支撑人机交互、人类语言互通及国家安全等需求具有重大战略意义,是当前国际科技竞争核心焦点之一。为推动中国多语种智能语音技术走在世界前沿,科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学...
诺基亚公布世界上首个“沉浸式 3D 语音通信”技术,打电话也能...
诺基亚宣布成功完成首个沉浸式空间音频电话通话,为语音通信引入了这一创新技术。据悉,这项技术的核心是从单声道音频转向3D音频,通过增加声音在空间维度上的变化,使得通话双方仿佛处于同一房间内。诺基亚现任CEO对此表示这是迄今为止语音通信技术的最大飞跃。诺基亚指出,实现这一空间音频语音通信技术不需要专门的硬件设备,...
智能语音服务市场将超700亿美元,科大讯飞多语种技术正走向世界
创始人刘庆峰和几位同学当时还是中国科学技术大学的学生,在导师王仁华的支持下,立志“中文语音技术要由中国人做到世界最好,中文语音产业要掌握在中国人自己手上”,创立了科大讯飞。经过多年研究和实践,科大讯飞不仅将中文语音技术做到最好,也将多语种技术做到全球领先。语音识别的准确率达到98%,多人会议场景的说话人...
潜力股:世界领先的智能语音技术企业
科大讯飞股份有限公司是一家国家级骨干软件企业,专注于研究人工智能核心技术,如语音及语言处理、自然语言理解、机器学习推理及自主学习等。公司不仅致力于人工智能产品的研发,还积极推动行业应用落地。其主要产品和服务包括讯飞开放平台及消费者业务、智慧教育、智慧医疗、智慧城市、智慧金融以及智慧汽车等。公司亮点:世界...
度小满语音技术研究成果获世界顶级学术会议认可
ICASSP是全球最大、最全面的信号处理及应用方面的顶级会议,已经拥有几十年的历史。作为IEEE(电子技术与信息科学工程师协会)的一个重要会议,其论文还经常被三大检索工具检索。该会议对于信号处理方面的学术人士有着重要意义。它涵盖了音频和声学信号处理,图像、视频和多维信号处理,物联网的信号处理等至少十六个方向...
持续创新语音合成技术,科大讯飞让世界聆听“AI”
在这场人工智能行业盛会上,科大讯飞不仅发布了多款AI新品,为AI人才提供展示舞台,更与行业专家、生态伙伴共同探索人工智能技术的应用新场景(www.e993.com)2024年11月27日。在线上举办的《对话1024-语音合成技术专题》节目中,讯飞AI研究院语音合成负责人吴明辉,以及讯飞AI资源部音库产品负责人刘晨宁,科普了语音合成技术的概念、应用场景、发展状况,并...
百度世界2020大会硬核来袭!百度智能语音交互技术重磅迭代
百度智能语音交互技术重磅迭代9月15日,AI领域的行业盛会“百度世界2020”大会于线上隆重召开,一大波硬核技术袭来:百度创始人、董事长兼CEO李彦宏与总台央视主持人康辉“虚拟人”亮相、颠覆搜索形态的“度晓晓”、没有驾驶员的“全自动驾驶”、各行各业赋能案例……既有硬核技术,又有“接地气”的落地应用。
百度最新语音技术成果亮相百度世界2020 持续助力产业智能化升级
(百度世界2020央视新闻直播间)在当天的百度大脑分论坛上,百度语音首席架构师贾磊重点讲解了百度端到端语音交互技术。他表示,百度语音交互技术持续迭代升级,已发展成为基于深度学习技术的端到端的语音识别和语音合成技术。在语音识别层面,百度推出端到端信号声学一体化建模的技术,语音合成方面,最新的Meitron和单人千面合成...
云从科技研发语音识别技术 97.03%一举打破世界纪录
在技术研究的「最后一公里」,每0.1个百分点的进步都异常艰难。全新Pyramidal-FSMN语音识别模型在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率(Worderrorrate,WER)降低至2.97%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先记录。
百度发布国内首款AI输入法 语音技术实现世界级突破
百度中文输入法负责人蔡玉婷表示,相较2016年,百度输入法日均语音请求量增长了8倍,语音输入法的场景也从聊天和搜索拓展到游戏、娱乐、购物等众多场景。现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升——在线语音、离线语音、中英自由说和方言自由说。