中国电信申请语音识别专利,提高粤语和普通话的识别效果准确率
其中,该方法包括:获取语音信息,并确定每一帧语音信息所属的语音类型,其中,语音类型包括:方言和普通话;根据每一帧语音信息所属的语音类型确定每一帧语音信息对应的语音识别模型,其中,语音识别模型包括:用于识别属于方言的语音信息的第一语音识别模型、用于识别属于普通话的语音信息的第二语音识别模型;采用每一帧语音信息...
小鹏G6/X9下半年进军香港市场,新车将支持粤语语音识别
据介绍,即将登陆的这批新车将配备新一代语音控制系统,可识别粤语。同样是近期,小鹏汽车宣布进入法国市场,2024款小鹏G9在法国售价区间为59990~73990欧元(IT之家备注:当前约47.1~58.1万元人民币),计划今年7月开启交付。在当天活动现场,小鹏汽车还展出了小鹏G6,并计划于下个月在法国上市。
中国电信发布语音识别大模型,支持30种方言混说
5月25日,《每日经济新闻》记者从中国电信获悉,中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。据悉,中国电信人工智能研究院已构建超30...
数字中国建设峰会丨首个支持30种方言自由混说的语音识别大模型来了!
近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。中国电信人工智能研究院用最前沿的语音识别技术,让沟通...
粤语“好打得”:粤拼输入法软件最强测评!
第四,这个粤语输入法还擅长“爆粗”。有趣的是,当你打头两个字拼音时,选字还未是粗口,但当你把粗口打完整时,它就能识别到了。值得一提的是,该输入法还有粤语语音识别功能,造福懒得打字的朋友们,操作起来跟其他普通的语音输入软件别无二致。劣势:...
"讲唔正"的广东话AI:低资源语言是否注定被边缘化?
语料缺失会深刻影响到机器的自然语言处理表现(www.e993.com)2024年7月26日。2018年的一份研究发现,如果语料库中的平行句子少于13K,机器翻译就无法实现合理的翻译结果。这也影响到机器“听写”的表现。ChatGPTVoice采用的开源Whisper语音识别模型(V2版本)性能测试,粤语字符错误率要明显高于普通话。
猛攻智能座舱,新能源车已卷无可卷
语音和脸部的识别,相比手势识别容易得多,原因其实很简单,语音识别和脸部识别的原理是系统只需要记住少数人的信息,再拿检测结果与少量的已知信息进行对比,而手势控制的原理更像高阶智能驾驶,用标准手势去适应各种不同尺寸的手势,自然会很容易出现意料之外的状况。一般来讲,生物识别只是实现功能的其中一个途径,...
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
比如在以下这个会议场景中,面对多种方言的输入,星辰超多方言语音识别大模型的识别准确率达到业界领先。首先是来自广东公司的代表,使用了粤语发言:视频链接:httpsmp.weixin.qq/s?__biz=MzA3MzI4MjgzMw==&mid=2650919383&idx=1&sn=6539211b60a7a206877c2be64d68ee01&chksm=84e415a9b3939cbf917ff6f...
首个支持30种方言混说语音大模型发布!中国电信人工智能研究院用AI...
是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输...
【行业信息】支持30种方言混说 中国电信发布语音大模型
????近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。????构建高质量方言数据库,是方言保护和研究的基础。当前,中国电信人工智能研究...