中国电信星辰语音大模型再升级:中英双语及40种方言任意混说
例如,粤语中的“八”(粤语拼音:baat3)与普通话中的“八”(汉语拼音:ba1)发音基本一致;但粤语中的“二”(粤语拼音:yi6)与普通话中的“二”(汉语拼音:er4)在发音上相差甚远,却与普通话中的“一”(汉语拼音:yi1)非常相近。另外,某些方言在单独建模时表现良好,但一旦加入多方言联合建模,识别效...
让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了
灰度测试的内容是Kimi的语音通话功能。现在进入KimiApp,就能看到底部问答框旁边多了一个电话的图标,点击即可发起语音通话。实时语音通话早已不是什么新奇功能了,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。
车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%
现在已经支持四川话、粤语、东北话等多种方言合成,甚至还支持日韩及东南亚跨语种语音合成。而且最重要的是,星睿语音模型在声音复刻能力上,最短仅需要3秒钟的样本输入,相比行业普遍的10s样本需求有了重大提升。这其实是在用户体验层面,星睿语音大模型最大的学术价值——通过创新声音合成技术和数据增强策略,改善了TTS模...
读懂广州·粤韵丨九声六调说粤语 盏鬼生猛两千年
粤语又称“粤方言”“白话”“广州话”“广府话”,是我国汉语七大方言之一,外地人称“广东话”。粤语是广府人的母语,也是广府文化最重要的基因和最具特色的符号,广泛流行于粤港澳大湾区、粤西、粤北、桂东南以及东南亚、大洋洲、美洲等华人华侨社区。目前,全球使用粤语的人数超过1.2亿,其中两广与港澳地区约占1亿。...
粤语歌词话|《活着多好》的语言学
“广东歌”“粤语歌”“粤语流行曲”会在本文中随机交替使用,但它们的背景和涵义存在细微差别,容日后再谈。粤语歌词的语言学开篇词选的是由黄伟文填词、陈奕迅主唱的《活着多好》。????《活着多好》(所属专辑TheEasyRide),作曲:胡波,填词:黄伟文,演唱:陈奕迅...
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
实际上,这件事已经有人做了:近日,中国电信人工智能研究院(TeleAI)发布了业内首个支持30种方言自由混说的「星辰超多方言语音识别大模型」,可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型(www.e993.com)2024年11月15日。比如在以下这个会议场景中,面对多种方言的输入,星辰超多方言语音识别大模型...
中国电信申请语音识别专利,提高粤语和普通话的识别效果准确率
本申请解决了由于粤语和普通话存在同形异音字造成的使用一个语音识别模型同时识别粤语和普通话的识别效果准确率低的技术问题。
中国电信人工智能研究院发布支持超多方言语音识别大模型
中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。
支持30 种方言混说,中国电信 AI 研究院发布“星辰”超多方言语音...
IT之家5月25日消息,中国电信人工智能研究院(TeleAI)日前宣布发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。据介绍,该模型可打破单一模型只能识别特定单一方言的困境,支持同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模...
AI赋能新版搜狗输入法:语音识别支持9种语言,多种外语键盘一键切换
此外,AI语音转文字功能更是支持包括粤语、东北话、四川话等10种汉语方言和包括英、日、韩、西、俄、法、德等9种外语语言转写成文字。这让搜狗输入法成为目前业内支持外语语音识别最多的输入法。4款外语键盘全新上线,联合国六种官方语言全覆盖另一方面,除了提升用户使用多种语言在语音输入场景下的体验之外,新版搜...