谷歌发布人工智能大模型Gemini:包含三个版本,擅长数学和物理推理

2023-12-07 15:55:05 - 北京青年报

12月7日凌晨,谷歌宣布推出谷歌自己的人工智能模型Gemini。谷歌首席执行官桑达尔·皮查伊表示,“这是谷歌人工智能新时代的开始”。

谷歌发布人工智能大模型Gemini:包含三个版本,擅长数学和物理推理

根据皮查伊和GoogleDeepMind首席执行官DemisHassabis的描述,这是人工智能模型的巨大飞跃,最终将影响几乎所有的Google产品。据介绍,Gemini可以适配包括数据中心和移动设备等多种产品。Demini拥有三个版本:其一是GeminiNano,负责Android设备上本地离线运行,是侧端设备上最高效的模型;其二是GeminiPro,它相比与Nano更强大,它将为许多GoogleAI服务提供支持,并且Bard宣布将使用GeminiPro来进行新的升级;其三是GeminiUItra,它是Google迄今为止创建的最强大的模型,以大型语言模型(LLM)研究和开发中广泛使用的32项学术为基准,GeminiUltra的性能有30项都超过了目前最先进的水平,它适用于完成高度复杂的任务,主要是为数据中心和企业应用程序设计的。

谷歌发布人工智能大模型Gemini:包含三个版本,擅长数学和物理推理

值得注意的是,据DemisHassabis描述,Gemini从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。比如它经过训练,可以同时识别并理解文本、图像、音频等,因此它能更好地理解具有细微差别的信息,回答与复杂主题相关的问题。这就让它尤其擅长解释数学和物理等复杂科目中的推理。

据谷歌自己称,“从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的32项学术基准中,GeminiUltra的性能有30项都超过了目前最先进的水平。”

谷歌发布人工智能大模型Gemini:包含三个版本,擅长数学和物理推理

目前,Gemini1.0产品已在多种产品和平台上推出。谷歌公司计划通过GoogleCloud将Gemini授权给客户,供他们在自己的应用程序中使用。从12月13日开始,开发者和企业客户可以通过GoogleAIStudio或GoogleCloudVertexAI中的GeminiAPI访问GeminiPro。Android开发者也可以通过AICore使用端侧任务最高效的模型GeminiNano进行构建。

谷歌表示,它将在170多个国家和地区提供英语服务,并且计划在未来几个月内扩展不同的模态,并支持新的语言和地区。下一步,谷歌将进一步扩展其未来版本的各种功能,包括在规划和记忆方面取得进展,以及通过增加上下文窗口来处理更多信息并提供更好的响应。明年年初,谷歌还将推出BardAdvanced,这是一种全新的、前沿的AI体验,让用户可以从GeminiUltra开始使用模型和功能。

实习生应雨诺

文/北京青年报记者温婧

编辑/樊宏伟

今日热搜