物润船联申请基于语音识别的数字人嘴型智能驱动方法专利,旨在提高...
专利摘要显示,本申请涉及语音识别技术领域,具体涉及基于语音识别的数字人嘴型智能驱动方法,该方法包括:采集低信噪比音频数据,分解后得到各音频分信号,分析低信噪比音频数据的分形维信号及各音频分信号的分形维信号中元素的分布,得到各分信号分形维语音特征度,获取各音频分信号的分形维信号各位置的分信号分形维突变度,结合...
...方法、装置、计算设备及计算机程序产品专利,可提升语音识别的...
该方法包括基于目标人物的声纹对多段音频数据分别进行语音分离,得到目标人物在至少一段音频数据中的语音数据,多段音频数据包括车辆不同部位的音频采集装置分别采集的音频数据;在得到多段语音数据的情况下,将目标语音数据确定为目标人物的待识别语音数据,目标语音数据包括:多段语音数据中语音质量最佳的一段语音数据,或者,...
...控制方法、计算机程序产品及存储介质专利,提高语音识别模型的...
在用户利用语音控制三维扫描设备的过程中,三维扫描设备可以对用户输入的语音数据进行识别,将其转化为相应的控制指令,并控制三维扫描设备执行相应的操作。在三维扫描设备执行相应的操作的过程中,可以收集用户的反馈信息,基于该反馈信息判定用户输入的语音数据与语音识别模型基于识别到的目标控制指令是否匹配,然后可以基于匹配结...
科大讯飞公布国际专利申请:“语音识别方法、装置、设备及存储介质”
科大讯飞公布国际专利申请:“语音识别方法、装置、设备及存储介质”证券之星消息,根据企查查数据显示科大讯飞(002230)公布了一项国际专利申请,专利名为"语音识别方法、装置、设备及存储介质",专利申请号为PCT/CN2023/078636,国际公布日为2024年6月20日。专利详情如下:图片来源:世界知识产权组织(WIPO)...
Moki AI视频创作:美图短片剪辑配乐工具简介及使用方法详解
是的,Moki支持语音识别技术转换对话为文字,并且支持多语言字幕。Moki是否提供版权音乐库?是的,Moki根据视频主题自动匹配背景音乐,并提供版权音乐库。前往AIbase查找更多Moki类似产品欢迎使用AIbase产品库,AIbase拥有一个全面的国内外AI产品数据库,收录了多种出色的人工智能工具,您可以通过我们的AI产品库轻松发...
联想申请语音识别方法及装置专利,能够基于目标文本信息执行相应的...
专利摘要显示,本申请公开了一种语音识别方法及装置,其中,所述方法包括:获取至少一个对象的待识别语音信息;基于所述待识别语音信息的音频特征,确定所述至少一个对象中至少一个注册对象对应的识别文本信息,并确定所述音频特征对应的当前音区;其中,所述至少一个注册对象与至少一个注册音区具有对应关系;基于所述至少一个...
科大讯飞申请语音识别方法及相关装置专利,能够准确识别混合音频中...
专利摘要显示,本申请提出一种语音识别方法及相关装置,该方法包括:获取混合音频中的各个通道音频的音频特征;通过为各个通道音频的音频特征分别添加音频通道对应的辅助特征,生成各个通道音频的增强音频特征;所述辅助特征包括通道特征和/或说话人识别特征,所述通道特征表示音频通道的特征,所述说话人识别特征用于识别说话人对应...
科大讯飞获得发明专利授权:“一种语音识别方法、装置、设备及存储...
专利摘要:本申请提供了一种语音识别方法、装置、设备及存储介质,本申请配置有热词库,在对待识别语音进行识别过程,基于待识别语音及热词库,确定当前解码时刻所需的音频相关特征,由于音频相关特征确定过程利用了热词信息,如果当前解码时刻的语音片段中包含某个热词,则确定的音频相关特征中能够包含该热词对应的完整音频信息,...
云从科技获得发明专利授权:“语音识别方法、装置以及计算机可读...
为此目的,根据本发明实施例的方法,可以采用知识蒸馏算法使训练好的多个第一语音识别模型指导第二语音识别模型进行模型训练,使训练好的第二语音识别模型无论是对输入语音的音素识别能力还是解码能力都接近于多个第一语音识别模型的音素识别与解码能力,从而只需在计算机设备上运行一个第二语音识别模型就可以达到并行运行多个...
视频文字提取的方法有哪些?七种方法教你把视频文字提取出来
步骤2:系统将自动识别视频中的语音并生成文字。步骤3:大家可以在屏幕上查看实时转录的文字内容。??适用人群:专为移动设备设计,适合需要随时随地进行语音识别和文字转换的群体。总之,上面七种工具都提供了视频文字提取的方法,大家可以根据自己的使用习惯和实际需要进行选择,更好地进行复习。祝大家在考试中取得好...