大模型开发生态加速进化,源2.0全面适配百度PaddleNLP

2024年10月14日 - 网易

PaddleNLP是百度基于飞桨框架打造的大语言模型套件,聚合业界优质预训练模型并提供开箱即用的开发体验,覆盖NLP多场景的模型库,搭配产业实践范例,提供极致的训练与推理性能,可满足灵活定制的开发需求。源2.0系列基础大模型是首个全面开源的千亿参数模型,包括1026亿、518亿、21亿三种参数规模的模型,在对话问答、编程、逻辑...

详情

探索智能纪元:大模型的起源、现状与未来

2024年10月13日 - 网易

①大语言模型:专注于处理和理解自然语言文本,常用于文本生成、情感分析、问答系统等;②视觉大模型:专门用来处理和理解视觉信息(如图像和视频),用于图像识别、视频分析、图像生成等视觉领域的任务;③多模态大模型:能够处理并理解两种或两种以上不同类型的输入数据(例如文本、图像、音频等),通过融合来自不同模态的信息...

详情

对话百度云沈抖:大模型产业落地第一,百模大战终局将至?

2024年9月26日 - 网易

大会上,百度智能云带来了算力、模型、AI应用的全面重磅升级,涵盖百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI基础设施,以及代码助手、智能客服、数字人三大AI原生应用产品,并公开了一系列最新产业落地成果。在中国聊大模型,百度是个绕不过的话题。大模型究竟是遇冷还是升温?B端客户选择大模型时,关注的重点究竟是...

详情

中国电信发布语音识别大模型,支持30种方言混说

2024年5月25日 - 新浪

中国电信方面表示,星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率大幅降低。据中国电信方面透露,星辰语音大模型现已对外开源及应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。《每日经济新闻》...

详情

金融的大模型时代!技术路径是什么?海内外又有哪些应用?| 智库

2024年4月2日 - 证券时报网

AI与金融的结合主要有两条技术路径,分别是通过金融语料训练的金融大模型和金融垂类大模型。双方优劣具有相对性,而通用大模型通过金融语料训练超越金融垂类模型可能性较小。在金融垂类模型上,国外彭博BloombergGPT率先登场;国内金融垂类模型百花齐放,例如恒生电子进一步升级金融大模型LightGPT,东方财富、同花顺加大AI研发技...

详情

一周AIGC丨国内首个服装丝绸行业大模型发布,Pika上线付费计划

2024年1月10日 - 澎湃新闻

英伟达推出AI语音识别模型Parakeet,号称优于Whisper据站长之家1月8日报道,开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语(www.e993.com)2024年10月17日。英伟达宣布推出了四个Parakeet模型,这些模型基于RNNTransducer/ConnectionistTempo...

详情

大模型里的国家队,中国电信为何要做方言语音大模型?

2024年5月27日 - 百家号

早在上世纪70年代，中科院声学所就开始了计算机语音识别。随着深度学习用于语音识别声学模型训练，普通话的语音识别已经非常成熟，近场中文普通话的识别率能达到98%以上，已接近人类水平。如今的普通话水平考试，基本可以用系统评判，无需依赖人工。但方言的语音识别面临更多的挑战。一是方言差异性太大，十里不同音，即便...

详情

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

2024年5月27日 - 腾讯新闻

星辰语音识别大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过「从语音到token再到文本」的建模新范式,将推理时语音传输比特率降低了数十倍。凭借绝对领先的性能,星辰语音识别大模型此前已经在国际上斩获了多个国际权威赛事冠军。比如,在权威国际语音顶会Interspeech2024离散语音单元建模挑战赛的...

详情

中国电信发布首个支持30种方言混说语音大模型

2024年5月25日 - 百家号

近日，中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型，打破单一模型只能识别特定单一方言的困境，可同时识别理解粤语、上海话、四川话、温州话等30多种方言，是国内支持最多方言的语音识别大模型。目前，星辰语音大模型已在福建、江西、广西、北京、内蒙等地...

详情

月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进

2024年3月2日 - 华尔街见闻

杨植麟:它(当时)是用来给语音识别做排序的模型。(笑)当你识别完一段语音,有很多结果,拿语言模型看到底哪个概率更大,输出最有可能的结果,应用非常有限。但你发现它是根本问题,因为你在对这个世界概率建模。虽然语言局限,它是世界的投映;但理论上你把tokenspace(所有可能的标记组成的空间)做得更大,就可以构建一...

详情

查看更多

语音识别常用模型
语音识别的两个基本模型是什么关系
语音识别的基本原理
语音识别的两个阶段
语音识别的两个基本模型是什么意思
语音识别的范畴
语音识别一般分为两个步骤
语音识别的基本概念
语音识别体系四部分
语音识别中的语言模型