科大讯飞语音识别首次实现全国地级市方言全覆盖,星火大模型首次...
IT之家10月24日消息,在今日上午的2024科大讯飞全球1024开发者节上,科大讯飞宣布语音识别首次实现全国地级市方言全覆盖,支持包括288个地市的202种方言。在发布会上,科大讯飞首次发布星火多语言大模型,支持英语、俄语、日语、阿语、韩语、法语、西语、葡语、德语共9种外语。科大讯飞还展示了星火...
中国电信发布创新语音识别大模型 支持30种方言混说
环球网科技综合报道在近日举办的第七届数字中国建设峰会上,中国电信人工智能研究院宣布了一项技术突破,发布了业内首个能同时识别30种方言的语音识别大模型——星辰超多方言语音识别大模型。这一创新技术打破了传统单一模型仅能识别特定方言的限制,为语言文化的传承注入了新的活力。中国是一个语言多样性极其丰富的...
Soul App自研多模态大模型 全面赋能用户社交体验
目前,Soul已先后上线了自研语言大模型SoulX,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年6月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超...
谷歌开放语音识别API 发布机器学习云平台
开发者可以借助谷歌的诸多云服务工具,训练自己的机器学习模型。今日的另一个大新闻是,谷歌开放了自己的语音识别API,即谷歌语音搜索和语音输入的支持技术。GoogleCloudSPeechAPI一开始将免费提供,以后再进行收费。这一应用包括了80多种语言,适用于各种实时语音识别与翻译应用。在语音识别领域,谷歌目前的主要竞争对手...
字节跳动自动语音识别模型Seed-ASR,各种口音和方言统统能听懂!
语音识别技术一直是人工智能发展的重点领域之一。而如今,字节跳动推出的Seed-ASR引擎,正在彻底打破语言和方言的壁垒,为这项技术注入全新活力。Seed-ASR经过了超过2000万小时的语音数据和近90万小时的配对数据训练,展现出了卓越的识别能力。不仅能精准识别普通话,还能准确转录13种中国方言以及7种外语,包括各种口音的英语...
支持30种方言!中国运营商发布语音识别大模型
参考消息网5月27日报道据新加坡《联合早报》网站5月26日报道,中国运营商发布支持粤语、上海话、四川话、温州话等30种方言混说的语音识别大模型,据称可为传承语言文化,注入全新生命力(www.e993.com)2024年10月28日。综合中国媒体报道,第七届数字中国建设峰会近日在福州举行。中国电信人工智能研究院在会上发布“星辰超多方言语音识别大模型”,是...
...方言“自由对话” 星火语音大模型破解强干扰场景下语音识别难题
支持74个语种方言“自由对话”星火语音大模型破解强干扰场景下语音识别难题---湖北日报讯6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因
数字中国建设峰会丨首个支持30种方言自由混说的语音识别大模型来了!
近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。中国电信人工智能研究院用最前沿的语音识别技术,让沟通...
科大讯飞申请语音识别模型专利,提高训练后的语音识别模型进行语音...
金融界2024年4月9日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别模型的训练方法、语音识别方法及相关设备“,公开号CN117854486A,申请日期为2023年12月。专利摘要显示,本申请公开了一种语音识别模型的训练方法、语音识别方法及相关设备。该方法包括:将第一语音样本数据和第二语音样本数据输入...
腾讯公司取得语音识别模型训练专利,能自动化形成相应的发音序列...
金融界2024年5月11日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种语音识别模型训练方法、装置、电子设备及存储介质“,授权公告号CN112185361B,申请日期为2020年9月。专利摘要显示,本发明提供了一种语音识别模型训练方法装置、电子设备及存储介质,方法包括:基于文本的目标类型对所述待识别音频...