科大讯飞申请语音识别专利,提高语音识别模型的识别准确率
对语音识别模型的训练过程包括两轮自监督预训练和一轮有监督的微调,在第二轮自监督预训练过程中,利用对应不同语义粒度的第一类伪标签计算语音识别模型的不同层的自监督损失,使得预训练的语音识别模型可以学习到不同粒度的语音内容信息,从而提高语音识别模型的识别准确率。
用活人脑细胞构建AI系统,语音识别准确率提升至78%
1、用活人脑细胞构建AI系统,语音识别准确率大幅提升;2、新型系统可以进行无监督学习,并具有类似神经网络的功能;3、系统的学习能力取决于脑类器官中神经细胞之间的连接。站长之家(ChinaZ)12月12日消息:近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着...
腾讯云ASR基于大模型全新升级 复杂场景识别率提升20%
语音识别(ASR)是AI最早的应用场景之一,业界不少方案目前仅能针对简单场景进行精准识别,一旦音频环境复杂,或者多人交错说话、声音重叠,识别准确率就会大打折扣。为了助力解决上述语音识别应用难题,腾讯云ASR自研多模态融合算法、蒸馏和半监督算法等,强化上下文理解能力,大幅减少语音数据的标记工作,更好地提升复杂识别环境的...
四连冠!科大讯飞获国际多通道语音分离与识别大赛CHiME-7冠军
科大讯飞联合中科大语音及语言信息处理国家工程研究中心(NERC-SLIP)、国家智能语音创新中心,在参与的多设备多场景远场语音识别任务(DASR)中获得全部两个赛道的第一名。继2016年以来参与CHiME-4、CHiME-5、CHiME-6三届比赛并夺冠后,讯飞联合团队坚持技术创新,此次在参与任务主赛道中语音识别错误率21%,相比赛事官方给...
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
但判断不同方言的距离还有其他方式,此次信也科技杯算法大赛也是为了在思想碰撞中寻找衡量方言距离的优秀算法方案,拓展商用ASR接口的模型适用范围,推动核心方言引擎的布局,提高方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音(MMS)模型,将文本转语音和语音转文本技术从大约100种语言扩展到...
奇富科技智能语音模型再升级,川渝方言识别准确率提升超35%
在模型结构上,QI语精灵依托全自研的Qifusion结构,突破传统方言识别模型受限于地区先验条件,需预先知晓方言种类才能准确识别的局限,无需方言种类的先验条件,便能直接进行精准的识别和转译(www.e993.com)2024年7月10日。并创新采用了多任务学习方法,在复杂的通话环境下实现了超过93%的语音识别综合准确率。此外,意图识别功能同样表现出色,准确率超过95%...
腾讯公司取得一种语音识别处理方法与装置专利,可提升语音识别的...
申请提供了一种语音识别处理方法、装置、电子设备及计算机可读存储介质;涉及基于人工智能的语音识别处理技术;方法包括:针对多个语音指令中任意两个先后接收到的第一语音指令和第二语音指令,执行以下处理:确定所述第一语音指令与所述第二语音指令的相似度;当所述相似度超过相似度阈值时,确定所述第一语音指令为错误识别...
海信视像申请电子设备、语音识别方法、装置及存储介质专利,提高...
金融界2024年4月2日消息,据国家知识产权局公告,海信视像科技股份有限公司申请一项名为“电子设备、语音识别方法、装置及存储介质“,公开号CN117809644A,申请日期为2023年8月。专利摘要显
嘈杂场景语音识别准确率怎么提?脸书:看嘴唇
WER是语音识别任务中的错误率指标,计算方法为将错误识别单词数除以总单词数,32.5%意味着大约每30个单词出现一个错误。经过433个小时TED演讲训练后,错误率可进一步降低至26.9%。另一方面,AV-HuBERT与前人方法最大不同之处在于,它采用了自监督学习方法。
探境科技发布首个离在线一体语音识别解决方案,自研AI降噪算法提高...
在对声音进行降噪处理之后,就进入到了语音识别环节。在这一环节中,神经网络模型所需的算力决定了模型的描述能力,同时也决定了模型处理能力和识别率的上限。在传统的语音识别算法里,用的最多的是全连接的操作,叫DNN/DTNN——目前,国内有多家语音识别芯片采用的都是DNN的方法。相比较于全连接操作,卷积操作能够...