...多模态语音识别专利,解决复杂环境下语音识别准确率下降的问题
专利摘要显示,本申请涉及一种多模态语音识别方法、装置、设备及计算机可读介质。该方法包括:获取麦克风阵列对目标空间中的至少一个说话人采集的语音数据和视觉传感器阵列对所述目标空间采集的视觉数据;确定所述语音数据的声学特征,并基于所述视觉数据确定至少一个说话人的视觉位置特征和视觉唇形特征;基于对所述声学特征和...
友杰智新申请语音识别中多发音问题处理专利,显著减少网络模型占用...
专利摘要显示,本申请涉及到语音识别技术领域,公开了语音识别中多发音问题的处理的方法、装置、设备及介质,其方法包括:构建文本语料,并将所述文本语料中包含的单词序列转为音素序列;基于所述音素序列,通过音素拼接构造伪单词;使用伪单词替换发音词典中的单词;将所有伪单词按照发音词典的格式整理成伪单词列表,并更新发音词...
2024(第四届)中国安防人工智能创新论坛丨AI驱动的安全创新:从技术...
然而,生物特征识别仍面临挑战,例如攻击者通过图像处理和动态合成技术欺骗系统,这对生物特征比对的安全性提出了更高要求。公共安全在公共安全领域,AI被用于灾害预警、人脸识别和语音识别等方面。例如,某些厂商推出的警用AI助手通过图像识别和自然语言处理技术,在各种公共安全场景中实现了精准的判断和应对。5.展望:AI...
2025年俄罗斯电动车及充电桩展E DRIVE 2025|充电站|新能源|特斯拉...
信息娱乐应用程序操作:导航系统、应用程序、显示器(LED,LCD等)、音响系统、语音识别、车载视频、车载互联网、车载电视、WiFi热点、基于位置的服务(LBS)、社交网络、游戏、免提通话、离线和混合导航、网络服务和多媒体、其他信息娱乐、其他信息娱乐技术汽车舒适性:远程诊断、礼宾服务、充电系统、按需付费(PAYD)、停...
从“愚蠢”到智能:服务机器人的技术进化之路
家庭服务机器人可能出现传感器、电池等技术故障,比如智能音箱可能会因为软件故障而语音识别失败,扫地机器人由于电池故障而无法完成清洁等,这些故障可能需要用户进行复杂的排除或维修,增加了不便。用户体验部分家庭服务机器人的操作设计相对复杂,如手机应用连接困难、操作繁琐以及智能控制系统的界面设计不直观等。提高了用户...
携程网申请语音识别专利,解决旁边人说话的干扰问题,提高了语音...
通过对音频进行声纹信息识别和场景主题相关度的识别,判断音频对应的说话人是否为主说话人,解决了旁边人说话的干扰问题,提高了语音对话中的交互舒适度(www.e993.com)2024年10月18日。
跑步进入AI时代,汽车产业呈现「三个加速」趋势
“Apollo超级座舱的很多能力在极越07上已经实现量产。如百度智能语音功能,在车速90km/h的开窗场景下,语音识别率高于多数车型在关窗静态场景下的是被准确率,这就是大模型和多模融合的力量。”李涛说道。此外,萝卜快跑第6代无人车也将搭载Apollo超级座舱。
中国人工智能人才培养存在的问题和建议
其次,企业模式存在的问题是对人才的培养缺乏体系化、系统化和可持续性。领军企业拥有丰富的行业数据、算力资源和应用场景,也为人才培养做出了重要贡献。访谈发现,企业参与人工智能人才培养主要采用以下形式:一是为全行业提供开源开放平台(如百度飞桨平台、腾讯云社区、CSDN人工智能社区),二是依托赛事开展实践实训竞技,三...
语音识别技术存在哪些隐私方面的隐患?分享四个可以参考的点
三、语音识别滥用众多智能产品及应用均配有语音识别辅助功能,为您带来更为简便快捷的使用体验。然而,这同样也给了恶意软件滥用此技术的机会,可能会导致个人隐私侵犯问题。举例来说,不良应用有可能通过偷听用户发出的语音指令,盗取重要个人信息,或模仿用户声线进行违法活动。另外,部分没有得到严格监管的企业很有...
信访无回复、年底不立案?法院信息化正在推动解决这些问题
蓝皮书指出,人工智能引擎相关能力在法院信息化系统中落地应用。2023年,最高人民法院信息中心搭建起法律法规查询、公文生成及纠错、笔录精简等大模型应用场景,在办案系统、统一工作桌面集成上线语音识别、离线转写、文本翻译、图文识别等。基于海量司法大数据资源的知识自动生成机制,司法知识服务平台上线多项智能化服务,新增...