科大讯飞申请多说话人语音识别专利,有效提升对混合语音的识别结果...
科大讯飞申请多说话人语音识别专利,有效提升对混合语音的识别结果的准确度金融界2024年7月23日消息,天眼查知识产权信息显示,科大讯飞股份有限公司申请一项名为“多说话人语音识别方法、装置、相关设备及计算机程序产品“,公开号CN202410590383.6,申请日期为2024年5月。专利摘要显示,本申请公开了一种...
硅胶面具被滥用引出刷脸漏洞,爱签声纹识别打造签署安全声命锁
面对此类风险挑战,爱签一直积极响应国家关于网络安全的政策要求,行业首创数字语音识别技术--声纹认证,通过采集用户声纹特征,方便快捷地识别和认证用户身份主体,在安全和风险管控上为用户提供更可靠的保障。有别于人脸等生物特征,语音生物特征也即声纹,有其独特性。声纹可以认为是兼具生理特性的行为特征,“生理”...
工商银行取得语音识别验证处理方法及装置专利,能够提高语音识别...
所述方法包括:获取原始语音信号,对所述原始语音信号进行预处理,得到由二维数据表示的第一语谱图;基于预设合成语音识别模型对所述第一语谱图进行合成语音识别;若确定合成语音识别结果为非合成语音,则对非合成语音的语音信号进行声纹识别,并对声纹识别结果是否为目标人本人声音进行验证,得到验证结果。所述装置执行上述方...
广哈通信:公司目前在智能语音识别、声纹识别、图像识别等方向有...
公司关注人工智能在行业市场的应用,目前在智能语音识别、声纹识别、图像识别等方向有相关的研究开发,并在电力领域客户有相关方案实施落地。
科大讯飞获国际车载多通道语音识别挑战赛双冠军
科大讯飞一直深耕复杂场景的语音识别,继CHiME四连冠后,再次参加车载ICMC-ASR比赛,主要针对多通道车内场景下的固定说话人位置和带口音的语音识别进行攻克,并创新性地提出多种技术方法。在这些技术方案中,主要从前后端两个角度进行解决:在前端算法中,由于车内目标/非目标说话人之间的距离较近,通过最大信噪比准则会导致...
同花顺取得一种区分说话人的方法和系统专利,实现有效区分说话人的...
专利摘要显示,本申请实施例公开了区分说话人的方法,所述方法包括:获取语音文件,所述语音文件包含至少两个不同说话人的语音帧;通过语音识别模型对所述语音文件进行处理,得到至少一段有效语音帧片段;通过声纹特征提取模型对所述至少一段有效语音帧片段进行处理,得到所述至少两个不同说话人的语音帧对应的至少两个声纹特...
换脸、假语音犯罪激增,信也科技呼吁加强深度伪造识别技术,引导...
同时包含了口音、语调、方言等多种个人特征信息,语音处理也易受外界干扰。虚假语音的分析处理比二维图像更复杂、门槛更高,使得业界对语音鉴伪的关注度较低。目前,信也科技已具备语音合成能力、语音识别能力、声纹识别能力,这些算法落地金融业务,提供测算和风险辅助分析功能。为了对抗虚假语音,...
以声纹识黑产,马上消费探索反黑产科技新路径
近日,马上消费独立研发并投入使用的“慧眼识代客”黑声纹识别系统,用先进的人工智能和生物识别算法,从黑产攻击的源头预警,建立攻防上的主动优势,为金融黑产的防范和打击探索出新的路径。源头预警,掐断黑产作业链条在金融黑产中,非法代理维权问题尤为突出。这些人深谙行业规则及投诉机制,他们通过互联网平台招揽到目标...
汉王科技发布首款智能语音应用“汉王语音王”
汉王语音王支持实时语音转录和语音文件转录两种方式,具备录音速记、拍录同步(自动裁边)、语音转文字、说话人精准识别、智能总结、AI话稿整理等多种智能功能。汉王科技自研高精度语音识别模型,具备高准确率、多语言支持、动态修正和自然交流等特点。在行业广泛使用的开源中文语音识别数据集上测试,错误率低至1.94%,处于...
熵基科技2023年年度董事会经营评述
多模态生物识别技术是指纹识别、面部识别、掌纹识别、掌静脉识别、指静脉识别、虹膜识别、声纹识别等多种生物识别技术的融合应用,相较单模态生物识别系统,多模态生物识别在识别性能、准确率和可靠性等方面有明显优势。从技术应用面来看,2023年中国生物识别市场中呈现新的特征:多模态产品已逐步成为市场主流之选;非接触式...