突破性语音识别技术:FunASR推出多语种离线转录利器
FunASR的多语言支持也令人印象深刻。目前,该软件包已经支持中文、英语、日语、粤语和韩语等多种语言,展现了卓越的语音识别能力。更值得一提的是,它还能提供词级时间戳,使用户能够精确定位音频中的特定内容。为了满足用户的个性化需求,FunASR引入了自定义热词功能。用户可以定义特定的术语或专有名词,软件会据此优化识别...
盛视科技:“基于字词识别的多语种证件的全页识别方法”“试管发放...
每经AI快讯,盛视科技(SZ002990,收盘价:18.23元)7月26日晚间发布公告称,公司于近日收到国家知识产权局下发的《授予发明专利权通知书》。专利名称分别为“基于字词识别的多语种证件的全页识别方法”“试管发放组件及试管贴标设备”等。2023年1至12月份,盛视科技的营业收入构成为:软件与信息技术服务占比99.55%,其...
18家中文大模型横评:识别违规内容手段单一 英文合规检测水平待提高
英文题集由中文题集一对一翻译而来,以防范语种变换带来的内容风险。在综合评分中,抖音豆包、GLM-3、腾讯混元、海螺问问和Kimi英文和中文领域均表现出色,位列前五。然而,对于原本在中文领域表现优秀的大模型,如文心一言3.5和小悟空,由于英文能力相对不足,导致其在综合评分中未能获得理想成绩。第一轮评测显示,中文...
...模型升级:74个语种方言“自由对话”,破解强干扰场景语音识别难题
星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。科大讯飞还发布了软硬件一体化讯飞同传系统,可...
语音识别上难度 讯飞输入法免切换识别多语种多方言不迷糊!
其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。发布会现场,工作人员演示了讯飞输入法免切换识别模式下多种方言和多种外语的语音输入,让输入效率大大提高。作为中文语音输入的开创者,讯飞输入法通过语音的持续迭代,不断革新人机交互方式,从单一的普通话到方言,从方言免切换再发展到多语种...
字节推出Seed-ASR!支持复杂场景、语种、多方言超精准识别
Seed-ASR1是一种基于大型语言模型(LLM)的语音识别模型(www.e993.com)2024年11月11日。Seed-ASR是在音频条件大语言模型(AcLLM)框架上开发的,利用了大型语言模型的强大能力,将连续的语音表示和上下文信息输入到语言模型中。通过分阶段的大规模训练以及语言模型中上下文感知能力的引入,Seed-ASR在综合评估集上(涵盖多个领域、口音/方言和语言)比传统...
国奖一等奖得主再出“王炸”:发布74个语种方言“自由对话”,破解...
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。
支持74个语种方言“自由对话” 星火语音大模型破解强干扰场景下...
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAIwhisper-V3,37个方言识别效果平均提升30%。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能...
可进行多语种识别!合合信息TextPro+SAP IRPA解决方案助力企业出海
可进行多语种识别!合合信息TextPro+SAPIRPA解决方案助力企业出海在当今全球化的商业环境中,企业必须面对各种不可避免的挑战。某头部集成电路企业以往都是采用手工下载合同票据、录入SAP系统的方式开展业务,近年来由于业务向海外拓展,多语言的票据、合同等大量业务单据的处理与管理成为企业繁重而耗时的任务。
汇丰银行、新加坡风投投了港大博士的语音识别公司
专注于东南亚小语种语音辨认公开资料显示,有光科技2017年成立于香港,以香港人工智能创业孵化加速器Zeroth.ai为后盾,专注于开发中文方言处理和分析的语音识别及自然语言处理(NLP)技术。FanoLabs的人工智能系统可以分析广东话、四川话、英语和普通话,继而帮助企业呼叫中心通过分析来电进行更好的服务质量管控。