科大讯飞获得发明专利授权:“一种语音识别方法、装置、设备及存储...
专利摘要:本申请提供了一种语音识别方法、装置、设备及存储介质,其中,方法包括:获取目标混合语音的语音特征以及指定说话人的说话人特征;以趋于目标语音特征为提取方向,根据目标混合语音的语音特征以及目标说话人的说话人特征,从目标混合语音的语音特征中提取目标说话人的语音特征,以得到目标说话人的提取语音特征,其中,目标...
...方法、装置、计算设备及计算机程序产品专利,可提升语音识别的...
该方法包括基于目标人物的声纹对多段音频数据分别进行语音分离,得到目标人物在至少一段音频数据中的语音数据,多段音频数据包括车辆不同部位的音频采集装置分别采集的音频数据;在得到多段语音数据的情况下,将目标语音数据确定为目标人物的待识别语音数据,目标语音数据包括:多段语音数据中语音质量最佳的一段语音数据,或者,...
美的集团获得发明专利授权:“语音识别设备及其唤醒响应方法...
多个语音识别设备分为一个中枢设备和至少一个非中枢设备;唤醒响应方法包括:中枢设备分析采集的语音信号,以获得中枢设备的距离信息;中枢设备的距离信息表示中枢设备与语音信号的信号源的距离;接收非中枢设备的距离信息,非中枢设备的距离信息由非中枢设备分析采集的语音信号而获得,表示非中枢设备与信号源的距离;比较中枢设备...
有什么音频转文字软件推荐?7种录音转文字方法助你轻松备考
??这款工具配备高准确性的语音识别技术。它能够智能识别音频文件中不同的语音特征,包括口音、语速和语调变化等,以确保转写出的文字内容准确无误。此外,它还支持多种语言和方言的音频内容识别,以适应不同的语音转写需求。它的语音转写引擎经过深度优化,能够适应复杂的音频环境,从而为大家提供高质量的转写服务。音...
科大讯飞申请语音识别方法及相关装置专利,能够准确识别混合音频中...
专利摘要显示,本申请提出一种语音识别方法及相关装置,该方法包括:获取混合音频中的各个通道音频的音频特征;通过为各个通道音频的音频特征分别添加音频通道对应的辅助特征,生成各个通道音频的增强音频特征;所述辅助特征包括通道特征和/或说话人识别特征,所述通道特征表示音频通道的特征,所述说话人识别特征用于识别说话人对应...
长城汽车申请语音降噪方法及车辆专利,提升语音识别的准确率
专利摘要显示,本申请提供一种语音降噪方法及车辆,所述方法包括:获取车辆行驶过程中用户发出的待识别语音;利用预先训练的非稳态噪声识别模型识别待识别语音,得到非稳态噪声;在待识别语音中去除非稳态噪声,得到去除非稳态噪声后的语音(www.e993.com)2024年7月10日。所述方法利用非稳态噪声识别模型识别待识别语音中的非稳态噪声,能够准确识别出待识别语音...
腾讯公司取得语音识别专利,提高文本内容的准确性
方法包括:获取待识别的语音数据对应的特征向量和目标语音识别模型,目标语音识别模型的结构包括共享嵌入式网络和前层网络,前层网络包括多专家网络层和自注意神经网络,多专家网络层包括目标路由矩阵和多个前馈神经网络,目标路由矩阵基于损失函数得到,共享嵌入式网络和目标路由矩阵用于确定多个前馈神经网络分别对应的概率系数;...
图解机器学习:演化史、方法、应用场景与发展趋势
上世纪90年代开始,贝叶斯学派发展了起来,概率论成为当时的主流思想,基于的原理是可以扩展的比较和对比,这种方法能够适用的场景比较多。到上世纪末至今,连接学派掀起热潮,神经科学和概率论的方法得到了广泛应用。神经网络可以更精准地识别图像、语音,做好机器翻译乃至情感分析(sentimentanalysis)等任务。同时,由于神经...
考研模式识别与智能系统:技术原理与发展趋势
1.光学字符识别:光学字符识别是指通过计算机对印刷体或手写体的字符进行自动识别。这项技术广泛应用于邮政编码识别、身份证号码识别、银行支票识别等领域。通过模式识别与智能系统的方法,可以实现高精度的字符识别,提高工作效率。2.语音识别:语音识别是指通过计算机对人类的语音进行自动识别和理解。这项技术在语音助手...
...未来生产力会追上人类,成为经济主要贡献,关键不是do what,而是...
它与世界上其他地方正在进行的很多学术研究有点不同,我认为我在这方面可能有些幸运,分配给我和其他人的任务就是尽可能地构建最好的语音识别系统,有很多数据可用,有很多GPU可用,所以问题以一种便于发现Scaling是解决方案的方式提出来了,这就像你是一名博士后研究员,你的工作是提出什么是最好的、什么是看似聪明...