AI大模型支持85种语言翻译,讯飞翻译机4.0星火版上市
基于星火大模型新的能力,讯飞翻译机4.0星火版的语音识别能力得以提升,能够结合语境,从而实现更自然、更贴近日常生活场景的翻译效果。目前,讯飞翻译机4.0星火版一共支持85种语言在线翻译,包括带口音的外语和中文方言,覆盖全球近200个国家和地区。在实际应用场景中,讯飞翻译机4.0星火版还可以结合语境生产符合情境的翻译,...
数字中国建设峰会丨首个支持30种方言自由混说的语音识别大模型来了!
近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。中国电信人工智能研究院用最前沿的语音识别技术,让沟通...
大模型时代的ASR就是不一样!豆包“听力”水平现场评测,方言&小...
具体来说,豆包﹒语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持“边想边说”。豆包﹒语音识别模型,可基于更强上下文感知能力,推理得出更准确的识别结果,并支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等多种中国方言。基于语音合成、语音识别等成果,火山引擎整合了云服务的实时音...
支持30种方言混说语音大模型发布 中国电信人工智能研究院用AI守护...
????近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。中国电信人工智能研究院用最前沿的语音识别技术,...
大模型里的国家队,中国电信为何要做方言语音大模型?
语音识别已经在很多场景中被广泛使用,比如中英文翻译在各类语音助手、会议软件里帮助人们满足商务洽谈、出境旅行的需要。但方言的语音识别被关注的不多,背后有一些主客观的因素。如今,随着人工智能的新范式演进,大模型开始被用于方言语音的识别和处理,不过相比于其他的语音大模型,方言语音大模型的训练有两大难题:一...
让AI听懂方言 中国电信发布首个支持30种方言混说语音大模型
近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型(www.e993.com)2024年11月29日。
AI日报:xAI面向开发者推出API;天工AI发布AI搜索功能;Claude 3.5...
8、新开源语音识别模型Moonshine:速度比OpenAIWhisper快五倍Moonshine是一款开源语音识别模型,设计更高效处理音频数据,特别适合短音频片段,支持离线运行,消耗更少计算资源。AiBase提要:??Moonshine的处理速度比OpenAIWhisper快五倍,更经济高效。
人工智能领域最重要的50个专业术语(中英文对照)
11.语音识别SpeechRecognition-语音识别技术使计算机能够理解和转录人类的语音。智能音箱如AmazonEcho通过语音识别来执行用户的语音指令。12.图像识别ImageRecognition-图像识别是指计算机能够识别和分类图像中的物体或特征。手机相册中自动分类照片就是一个例子。
首个支持30种方言混说语音大模型发布!中国电信人工智能研究院用AI...
中国电信人工智能研究院(TeleAI)坚持自主研发创新,在中国电信CTO、人工智能研究院院长李学龙带领下,推出了星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景...
讯飞星火4.0:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
早在2024年1月30日,讯飞在星火大模型V3.5更新中,就已首次对外发布星火语音大模型,首批37个主流语种语音识别效果超过OpenAIWhisperV3。在星火V4.0的发布会上,科大讯飞宣布其语音模型能力再次重磅升级,除了37个主流语种,还增加对37种方言的识别。用户可以实现37个语种+37个方言共74种语言免切-自由交流。