未来智能学家Roey Tzezana:为什么我们突然间发现AI无处不在?一个...
语音识别也是如此,用了大约20年的时间,人工智能才达到了普通人类的语音识别水平。图像识别更有趣,这是人工神经网络真正崛起的地方,你可以看到图像识别的进展速度更快,坡度更陡。仅仅在6年的时间里,我们就达到了人类的平均表现水平。至于阅读理解,在2016年,人工智能的表现非常差,一年后有所改进,再过一年就...
深度|李飞飞:AI十年,公众看到的是一些离散事件,而我们则看到一个...
即使是一些知识渊博的人,如果他们忽视了细微的差别,并以夸张的方式传播人工智能的消息,那对社会也是一种风险,但我们知道,如果对这项技术过于无知,我们就会错过利用它为我们带来好处的机会,如果我们对这项技术无知,就无法识别实际风险,如果我们传播无知的信息,我们也在误导公众和决策者。因此,许多问题的根源实际上在...
李沐交大演讲全文:创业的动机要么来自欲望,要么来自恐惧
坏处就是停留在打工人或者职业经理人的思维。无论是公司还是学校,它们都创造了一个相对简单的环节。学校是一个非常简单的社会,公司也是如此,公司从最上层把整个复杂的世界抽象成简单的任务,待得越久,就越觉得自己是螺丝钉,当然螺丝钉的好处就是,只要找到一个螺母钉上去就行,不用管这个机器多么复杂,外面世界多么复...
李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文
坏处就是停留在打工人或者职业经理人的思维。无论是公司还是学校,它们都创造了一个相对简单的环节。学校是一个非常简单的社会,公司也是如此,公司从最上层把整个复杂的世界抽象成简单的任务,待得越久,就越觉得自己是螺丝钉,当然螺丝钉的好处就是,只要找到一个螺母钉上去就行,不用管这个机器多么复杂,外面世界多么复...
国内的AI大模型,为什么应该做系统型超级应用?
受OpenAI刺激,很多团队都跑去干类似ChatGPT的大模型,然后自己从头搞又特别费劲,所以往往会借助开源。在这个基础上(相对通用的类似chatGPT模型)包装出行业大模型。好处是瞬间可以出好多,坏处是不解决行业深层次问题,最终很可能变成上波的赚方案的钱,然后收支失衡。(参见:《为什么说这些倒腾AI的方式会把自己搞死》)...
专访|百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升...
:百度这次利用深层卷积神经网络技术(DeepCNN)应用于语音识别声学建模中,将其与基于长短时记忆单元(LSTM)和连接时序分类(CTC)的端对端语音识别技术相结合,大幅度提升语音识别产品性能(www.e993.com)2024年11月10日。该技术相较于工业界现有的CLDNN结构(CNN+5LSTM+DNN)的语音识别产品技术,错误率相对降低10%。该技术借鉴了图像识别...
人工智能与哲学|深度学习机制对于既有人文资源的“剥削”
而深度学习技术解决此类问题的典型方式可谓“简单粗暴”:即以大量已标注的人类语音数据与语义符号之间的配对关系为素材,进行海量训练,由此使得系统能够模拟人类在特定语音与特定语义之间的配对活动。譬如,由深度学习技术支持的一个早期的自动语言识别项目——TIMIT——的做法,就从美国寻找到了来自八个美语方言区的630个...
“ChatGPT之父”阿尔特曼:“生成式人工智能”会突破资本主义吗?
另外,我们还致力于开发更加强大、更加安全的生成式人工智能。我们将继续进行开源,开源是图像生成热潮的真正基础。我们开源了CLIP(注:2021发布的视觉神经网络),最近还开源了Whisper和Triton(自动语音识别和编程语言)。总之,我们的策略是多管齐下——在平衡每一个项目的风险和收益的同时,创造新的产品。艾利克斯·...
中国AI论文数量世界居首,美国AI系统遥遥领先—新闻—科学网
自然语言处理(NLP)领域论文数量世界前十的机构分别是中国科学院、卡内基梅隆大学、微软、清华大学、卡内基梅隆大学-澳大利亚分校、谷歌、北京大学、中国科学院大学、阿里巴巴、亚马逊;语音识别领域论文数量前十机构分别为中国科学院、微软、谷歌、中国科学院大学、清华大学、中国科技大学、卡内基梅隆大学、腾讯、香港中文大学、...
面向未来的100项颠覆性技术创新!_澎湃号·政务_澎湃新闻-The Paper
9.语音识别(SpeechRecognition)第一个商业上成功的语音识别技术可以追溯到1990年,但随着计算能力和新算法的发展语音识别取得了惊人的进步。研究人员制造了一种用于自动语音识别的低功耗专用芯片,其功耗效率是手机多功能芯片的100倍。新的语音处理器支持立体声AEC(声学回声消除)和远场线性麦克风阵列,它专为支持语...