汇纳科技申请<一种融合大语言模型和语音识别的管理方法、系统及...
所述方法包括:对原始语音数据进行预处理,以获取目标语音数据;对所述目标语音数据进行语音识别,以获取对应的文本数据;基于大语言模型对所述文本数据进行语义理解处理,以获取对应的对话文本处理结果;将所述对话文本处理结果和预设词库进行整合优化处理,以获取用户意图。
...的阵列麦克风降噪方法及装置”专利,提升语音通信和语音识别的...
并根据麦克风输入信号获取第一互相关矩阵;根据第一分离矩阵对麦克风输入信号进行信号分离和选取,得到参考语音信号;根据参考语音信号得到第一协方差矩阵和第二协方差矩阵并进行特征值分解计算,得到语音分离矩阵;将麦克风输入信号输入语音分离矩阵并进行后置滤波,输出降噪语音信号,相比原始麦克风输入...
科大讯飞获得发明专利授权:“一种语音识别方法、装置、设备及存储...
专利摘要:本申请提供了一种语音识别方法、装置、设备及存储介质,本申请配置有热词库,在对待识别语音进行识别过程,基于待识别语音及热词库,确定当前解码时刻所需的音频相关特征,由于音频相关特征确定过程利用了热词信息,如果当前解码时刻的语音片段中包含某个热词,则确定的音频相关特征中能够包含该热词对应的完整音频信息,...
阿里音频生成大模型开源!50种语言快速理解+5种语言语音生成
SenseVoice是一个基础语音理解模型,具备多种语音理解能力,涵盖了自动语音识别(ASR)、语言识别(LID)、情感识别(SER)以及音频事件检测(AED)。该模型旨在提供全面的语音处理功能,从而支持构建更复杂的语音交互系统。SenseVoice-Small是一款仅含编码器的轻量级基础语音模型,设计用于快速语音理解。它可以快速处理语音数据,并...
同花顺获得发明专利授权:“一种语音识别实时重打分的方法和系统”
专利摘要:本说明书实施例提供一种语音识别实时重打分的方法和系统,该方法包括获取语音材料中语音帧的特征;基于语音帧的特征,通过解码模型和预设重打分模型获取候选语音识别结果,其中,预设重打分模型用于对解码模型的语音识别结果的分数进行实时修正;基于候选语音识别结果确定目标语音识别结果。
青岛港获得发明专利授权:“一种基于语音识别进行资产故障智能提报...
专利摘要:本发明提供了一种基于语音识别进行资产故障智能提报的方法和系统,属于港口资产智能管理技术领域,获取语音信息,识别语音信息并生成文字信息;根据文字信息得到设备内码、设备名称和故障现象;将设备内码、设备名称和故障现象填充至单据相应的槽位;生成故障单(www.e993.com)2024年7月27日。本发明通过获取语音进行语音识别,得到相应的文字信息,对文字...
联想申请语音识别方法及装置专利,能够基于目标文本信息执行相应的...
专利摘要显示,本申请公开了一种语音识别方法及装置,其中,所述方法包括:获取至少一个对象的待识别语音信息;基于所述待识别语音信息的音频特征,确定所述至少一个对象中至少一个注册对象对应的识别文本信息,并确定所述音频特征对应的当前音区;其中,所述至少一个注册对象与至少一个注册音区具有对应关系;基于所述至少一个...
8种一键提取短视频文案的方法,详细的教程这里都有!
此软件是一款视频和语音识别工具,具备高准确度,并支持多种语言和方言。它能稳定地提供识别结果,适用于各类场景,界面设计简洁直观,用户使用起来容易上手,学习与使用轻松愉快。1、首先找到与我们视频相匹配的爆款视频,比如在某音上,我们先点击视频右侧的箭头分享按钮,再点击里面的复制链接选项把它的视频链接复制下来。
经典的9个视频文案提取在线方法,总会有一款你能用得上
阿里巴巴云知声是一家专注于语音技术的公司,其提供了视频转文字的解决方案,能够实现高质量的语音转写结果。打开网易新闻查看精彩图片第四款:百度智云语音识别:百度智云语音识别是百度推出的一款语音转写服务,可以将视频中的语音内容转换为文字,准确率较高。
格力电器获得发明专利授权:“一种语音识别故障噪音的检测方法...
专利摘要:本发明公开了一种语音识别故障噪音的检测方法、系统和装置及介质,涉及电风扇或电机的故障诊断技术领域,所述检测方法包括如下步骤:获取发生预设噪音之间的有效时长;判断相邻两个有效时长CTn和CTn+1的大小:若相差在预设阈值内,则累加计数CNT0;若相差超过预设阈值,则抛出时长CTn,并计数抛出的数量DCTx...