谷歌发布人工智能大模型Gemini：包含三个版本，擅长数学和物理推理

2023-12-07 15:55:05 - 北京青年报

12月7日凌晨，谷歌宣布推出谷歌自己的人工智能模型Gemini。谷歌首席执行官桑达尔·皮查伊表示，“这是谷歌人工智能新时代的开始”。

根据皮查伊和GoogleDeepMind首席执行官DemisHassabis的描述，这是人工智能模型的巨大飞跃，最终将影响几乎所有的Google产品。据介绍，Gemini可以适配包括数据中心和移动设备等多种产品。Demini拥有三个版本：其一是GeminiNano，负责Android设备上本地离线运行，是侧端设备上最高效的模型；其二是GeminiPro，它相比与Nano更强大，它将为许多GoogleAI服务提供支持，并且Bard宣布将使用GeminiPro来进行新的升级；其三是GeminiUItra，它是Google迄今为止创建的最强大的模型，以大型语言模型（LLM）研究和开发中广泛使用的32项学术为基准，GeminiUltra的性能有30项都超过了目前最先进的水平，它适用于完成高度复杂的任务，主要是为数据中心和企业应用程序设计的。

谷歌发布人工智能大模型Gemini：包含三个版本，擅长数学和物理推理

值得注意的是，据DemisHassabis描述，Gemini从一开始就被创建为多模态的模型，这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息，包括文本、代码、音频、图像和视频。比如它经过训练，可以同时识别并理解文本、图像、音频等，因此它能更好地理解具有细微差别的信息，回答与复杂主题相关的问题。这就让它尤其擅长解释数学和物理等复杂科目中的推理。

据谷歌自己称，“从自然图像、音频和视频理解到数学推理，在被大型语言模型（LLM）研究和开发中广泛使用的32项学术基准中，GeminiUltra的性能有30项都超过了目前最先进的水平。”

谷歌发布人工智能大模型Gemini：包含三个版本，擅长数学和物理推理

目前，Gemini1.0产品已在多种产品和平台上推出。谷歌公司计划通过GoogleCloud将Gemini授权给客户，供他们在自己的应用程序中使用。从12月13日开始，开发者和企业客户可以通过GoogleAIStudio或GoogleCloudVertexAI中的GeminiAPI访问GeminiPro。Android开发者也可以通过AICore使用端侧任务最高效的模型GeminiNano进行构建。

谷歌表示，它将在170多个国家和地区提供英语服务，并且计划在未来几个月内扩展不同的模态，并支持新的语言和地区。下一步，谷歌将进一步扩展其未来版本的各种功能，包括在规划和记忆方面取得进展，以及通过增加上下文窗口来处理更多信息并提供更好的响应。明年年初，谷歌还将推出BardAdvanced，这是一种全新的、前沿的AI体验，让用户可以从GeminiUltra开始使用模型和功能。

实习生应雨诺

文/北京青年报记者温婧

编辑/樊宏伟