一文把财务共享中心建设讲清楚
三是在技术创新方面,通过“搭积木”模式组装各种轻应用,解决单体应用开发模式无法复用信息化建设成果的问题;借助轻量化的容器云技术搭建一站式的无人值守运维体系,提高运维效率;共建共享业务生态圈,首次在建筑行业实现OCR识别技术、知识图谱技术、流程自动化技术、语音识别等智能化技术全部微服务化,依靠能力中心对前端业...
为何诺贝尔化学奖又颁给AI?万字详解:AI重塑结构生物学
深度学习彻底变革了人工智能,让算法不仅在图像和语音识别方面表现卓越,甚至在游戏中击败了人类。2016年3月,当DeepMind的联合创始人戴米斯·哈萨比斯(DemisHassabis)在韩国首尔观看他的AI系统“阿尔法围棋”(AlphaGo)在围棋比赛中击败一位人类世界冠军时,他突然回想起自己在大学时玩蛋白质折叠游戏Foldit的经历。他不禁...
诺贝尔奖快被 AI 包圆了,这 10 个冷知识带你重新认识 AI 教父
如果你有糟糕的直觉,那你做什么其实也不重要,那还不如遵循自己的直觉。」
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
这通过Whisper的gpu模式来进行推理,模型选择medium,硬件要求是最低6G显存,更多关于whisper的配置,请移步:闻其声而知雅意,M1Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10),这里不再赘述。Whisper转写后效果:./Data\Keira\wavs\Keira_0.wav|Keira|ZH|光动嘴不如亲自做给你看....
华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用|钛...
例如语音部分就是先做语音识别,把语音转换成文字输入给大模型,然后再把大模型的输出送给语音合成模型生成音频。不要小看这种听起来很土的方案,在语音领域,目前这种方案还是最靠谱的,现有的多模态大模型在识别和合成人类说话语音方面都不太行。GoogleGemini的语音对话响应延迟只有0.5秒,这是一个真人都很难达到...
老俞闲话丨从科学家到企业家的成长之路
科大讯飞一开始就在语音领域,逐步通过语音识别、语音合成和机器翻译等关键技术的突破,将语音翻译做到了非常厉害的程度(www.e993.com)2024年10月18日。新东方做的就是特别原始的和学生面对面的语言培训,尽管也有效果,但和高科技没有半毛钱关系。一个搞高科技的,英语不一定比我好的刘庆峰同志,现在做出了在中国乃至世界上非常先进的语音翻译技术,帮助...
对话月之暗面杨植麟:向延绵而未知的雪山前进
杨植麟:它(当时)是用来给语音识别做排序的模型。(笑)当你识别完一段语音,有很多结果,拿语言模型看到底哪个概率更大,输出最有可能的结果,应用非常有限。但你发现它是根本问题,因为你在对这个世界概率建模。虽然语言局限,它是世界的投映;但理论上你把tokenspace(所有可能的标记组成的空间)做得更大,就可以构建一...
教7岁小孩搞懂ChatGPT
人工智能(AI)简单说就是让机器具备与人类相似的智能,它含义广阔,语音识别、人脸识别都算人工智能。在ChatGPT出现之前,人工智能的应用比较单一,比如用来下棋,或者用于医疗、金融等垂直领域。你可以把这些人工智能理解成职业学校毕业的中专生,有一技之长,但是能力不够通用。而ChatGPT就像一个读完本科的大学生,有很好的...
中国在这一波人工智能浪潮中处于什么位置?|薛澜|李航|周忠|张宏江...
如果一个事情是任务,能去评价完成它的好坏,AI基本都能完成。冯诺依曼说过这样一句话,意思就是告诉我一个任务,不管是多复杂,把它定义清楚,我都能给你造一个机器,专门去完成你这个任务。现在大家经常谈AGI,谈通用人工智能,“通用”确实是有很大的革命性的,这个工具不像冯诺依曼说的,专门做某一样事情。它变成很...
傅盛开年演讲:2024,我对AI的3点预测|算法|ai|大模型|爱因斯坦...
其实在2016年、2017年,大家对AI的判断是:出来就可以改变世界。我们做好了视觉识别,就可以做好语音识别,语音识别做好了,就可以理解语言,理解语言就可以自动驾驶。但事实上,在2018年、2019年,这棵树长不上去了。这时候出现一个分支,也就是GPT1、GPT2。大家可能不知道的是,在GPT2发布的时候,整个OpenAI就是硅谷...