车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%
01吉利汽车自研的语音大模型HAM-TTS在发音准确性、自然度和说话人相似度上超越了SOTA成果VALL-E。02HAM-TTS模型在风格一致性、音调一致性以及整体得分上,相比VALL-E有10%左右的提升。03除此之外,吉利语音大模型还具备跨语种无缝切换能力,支持四川话、粤语、东北话等多种方言合成。04通过创新声音合成技术和数据...
AI入侵播客圈!比真人配音还逼真?实测爆火的微软AI语音角色“晓晓...
除了使用TTS语音库预设置好的声音,微软Azure还提供了声音定制服务,支持品牌或个人使用有版权的音频样本作为训练数据,创建自定义语音。AI+有声内容,进入真假难辨时代从有声书到短视频配音,再到软硬件内随处可见的文本朗读功能,AI生成的有声内容已经成为普通人日常最频繁使用的AI技术之一。以微软的语音角色“云希...
讯飞有声书评测:内置26种朗读主播 方言英语都能读
讯飞有声书支持26种朗读主播,可以满足不同用户的个性化听书需求。讯飞有声书支持11种方言:粤语女声、上海女声、四川女声、东北女声、陕西女声、山东女声、内蒙古男声、湖南男声、湖北男声、河南男声、合肥男声,还有5位外语主播:英文男声、英文女声、韩文女声、日文女声、俄文女声,还有2种童声。因为讯飞有声书采用了科...
珈乐AIGC,AI语音技术与复活虚拟偶像
存梦P说:“当时我和朋友看完电影,回家的路上就一直在探讨数字生命的可行性,以及对于数字生命的态度。朋友就随便提了一句,说你最爱的那个叫珈乐的虚拟主播,是不是也能做个数字生命。”说者无意,听者有心,存梦P当时立即向朋友科普,语音合成技术搞出来的AI是不能达到数字生命一样高度的。但存梦P也告诉朋友,...
使用PyQt GUI 写一个朗读软件
一直想找一款能朗读的软件,需支持批量朗读本地文件(如文本/PDF等).但找了半天没有发现自己满意的.所以就初次尝试使用PyQt的GUI加pyttsx3库自己用Python写了一个简单的内容朗读器.支持在不联网的情况下批量朗读内容(网页/文本/可编辑式PDF),支持调用近40种语音(包括常用的国语/粤语/英文等),能够倍速/音量/朗读...
标贝科技CTO李秀林:标贝语音合成技术升级,赋予AI语音更强表现力
在韵律方面,采用多任务的神经网络模型,利用韵律间的层次关系,在同个模型结构下对多个韵律等级进行建模,在朗读时高低音、停顿处更加自然流畅(www.e993.com)2024年11月24日。“如今,标贝科技语音合成解决方案已经实现全面支持中文普通话、中文方言、粤语、英语等多种语言。不论是温柔甜美的女声,清爽端正的男声,活波可爱的童声,标贝科技的语音合成...
方言可以用来朗读诗歌,用上海话朗读更有诗韵
在随后举行的诗歌对谈上,复旦大学中文系教授骆玉明从文学史的角度,肯定了用方言朗读诗歌的形式。他说,普通话并不是读古诗的标准语言,普通话里没有入声字。古诗讲平仄,入声字的作用非常重要,可以引起语音的明显变化,从而体现作者的情绪。如果一首古诗,他用普通话很难读出平仄,如果用上海话读,可以读出里面的韵味。
微课制作 | 一款免费的文字转语音工具(TTS):GateFace门面
④具有文字转语音功能(TTS)、多音字自助校正功能,能做文字广播、网页朗读、情景对话、添加背景音等,以及合成MP3或WAV声音。GateFace门面的简单应用举例GateFace门面的功能有很多,下面只简单介绍其中的文字转语音功能和搭建自己的空间网站功能。GateFace门面有两种文字转语音方式,一种是在空间浏览器中进行转换,另一...
【IT之家评测室】讯飞有声书使用体验:阅读爱好者的全天候伴侣
除了汉语普通话,讯飞有声书还支持粤语、上海话、四川话、东北话等11中方言读书,还有两种趣味童声读书,以及英文、韩文、日文、俄语四种外国语种读书。大家可以感受一下这些个性化语音朗读的效果:可以看到,这些个性化读书的效果同样很真实自然,特别是方言读书的效果,还带了更多地方特色的语气、腔调,听起来甚至比普通话...
广州体育学院2019年播音与主持艺术专业招生简章
播音与主持艺术专业同时招收普通话和粤语两个语种考生,2019年计划招生80名,其中普通话计划招生60名,粤语计划招生20名,具体分省计划详见我校招生办公室网站。(三)报考外语语种本校公共外语教学为英语,请非英语语种考生慎重报考。(四)考生类型艺术类文理兼招(如生源省份要求分艺术文理类编制招生计划,则计划科类按...