中国电信星辰语音大模型再升级:中英双语及40种方言任意混说
由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“预训练+微调”的模型方案与方言场景的需求能够高度契合。星辰语音大模型超多方言技术框架同时,TeleAI还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅缩减约50倍,且保障模型效果与有监督训练的方言模型水平相当。第一阶段:...
支持中英双语及40种方言任意混说,中国电信TeleAI星辰语音大模型升级
由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“预训练+微调”的模型方案与方言场景的需求能够高度契合。TeleAI还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅降低约50倍,且保障模型效果与有监督训练的方言模型水平相当。IT之家附GitHub开源地址:httpsgithub...
超拟人数字人在合肥首发
发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”相关工作人员现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就...
黄土高原上的口传艺术
方言特征词是陕北话“土”的表现,带有强烈的地方色彩,如“大”(父亲)、“老汉”(丈夫)、“婆姨”(妻子)、“姑舅”(姑表兄弟)、“两姨”(姨表兄弟)、“拜识”(结拜兄弟)、“阳婆”(太阳)、“月婆儿”(月亮)、“星宿”(星星)、“脑”(头)、“眉眼”(脸)、“眼窝”(眼睛)、“牲灵”(牲畜)、“熬”(...
中国首个支持30种方言混说语音大模型发布
中国幅员辽阔,“百里不同俗,十里不同音”。各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。构建高质量方言数据库,是方言保护和研究的基础。中国电信人工智能研究院已构建超过30种、超30万...
雷军也成了AI语音的受害者?
而自然语言处理(NLP)是让计算机理解和处理人类语言的技术,应用非常广,比如:智能客服和语音助手(www.e993.com)2024年12月20日。很多创作者在给视频配音时,为了省时省力又不想出镜,通常会先写好文字,再用AI来朗读和合成。拿我来说:一般会选择港版男普通话、广西表妹或东北话,这样让文本画面和其他地域口音结合,刚好形成了鲜明的反差感。
测试:AI能否复现录音门,卢总的醉酒、方言、脏话能生成吗?
大部分认为非AI合成的观点是:AI无法实现说话时的醉酒状态、方言、脏话、停顿等。不过,在警方发布通告后,魏某悄悄改了名,删了视频。今天,通报中涉及到AI音频公司也发布声明,确系嫌疑人王某使用公司自主研发的AI配音大模型平台,由卢某此前直播片段约30秒录音进行克隆,并通过文本生成。实测AI语音大模型三言也...
促合作、抓推广、搭平台,国家智能语音创新中心—— 解析声音奥秘...
通过与中心合作,海尔在青岛“复制”了实验环境。“今年投入使用。按一次测试20秒计算,一天可完成超4000次测试。”高孺说,有智慧无人实验室助力,如今海尔生产的空调,不仅可以进行普通话的语音交互,还可以“听懂”多地方言,部分出口产品掌握了多语种能力。
2024中国智能语音领域最具商业合作价值企业盘点
通过将语音合成技术结合虚拟形象技术,打造了讯飞AI虚拟人交互平台,该平台具备多模感知、多维表达、情感贯穿、自主定制四大关键特点,并通过了国内首批数字人系统基础能力评测,成功获得了数字人领域的权威标准认证。2024年1月,基于讯飞星火认知大模型在语义理解、指令跟随、多轮对话、情绪感知和超拟人合成方面的优异能力,...
雷军,可能有点心烦...
而自然语言处理(NLP)是让计算机理解和处理人类语言的技术,应用非常广,比如:智能客服和语音助手。很多创作者在给视频配音时,为了省时省力又不想出镜,通常会先写好文字,再用AI来朗读和合成。拿我来说:一般会选择港版男普通话、广西表妹、或东北话,这样让文本画面和其他地域口音结合,刚好形成了鲜明的反差感。