OpenAI要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎

2024-05-13 16:26:00 - 澎湃新闻

机器之心报道

编辑:山茶花

OpenAI真是把大家的胃口吊足了,大家再忍忍就等到了。

OpenAI有了新动向!

今日凌晨OpenAI官宣,将于美国时间13日上午10点进行一场直播。SamAltman随即转发这一消息,并表示「不是gpt-5,不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西!我感觉这就像魔法一样。」

关于即将发布的内容,OpenAI官方帖子提供的唯一细节是,此次发布将更新ChatGPT及其最新模型GPT-4。

OpenAI要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎

OpenAI员工程博文(BowenCheng)跟了个帖,「比gpt-5更酷」,不过又迅速删帖。

OpenAI要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎

OpenAI的葫芦里到底卖的什么药?据报道,OpenAI开发了一款AI语音助手,具有音频输入、音频输出功能和更好的推理能力,甚至在某些方面击败了GPT-4Turbo。该AI语音助手很可能就在周一的这场直播中公开亮相。

不管怎样,OpenAI此番举动着实吊足大众胃口。

OpenAI计划推出AI语音助手

据报道,OpenAI正在构建一款AI语音助手,它能通过声音和文本与人类对话,并能识别物体和图像。据两位接触过这项新AI的人士透露,ChatGPT的开发者已经向一些客户展示了部分功能,这些功能在逻辑推理方面超越了其现有产品。

OpenAI首席执行官SamAltman的目标是最终开发出可高度响应的人工智能,类似于电影《她》(Her)中的虚拟助手,提升苹果Siri等现有语音助手的可用程度。一名知情人士表示,这个AI语音助手可能会在OpenAI周一的直播中公开亮相,赶在谷歌发布一系列AI产品之前抢得先机。

OpenAI认为,具备视觉和音频能力的智能助手拥有与智能手机相媲美的变革性潜力。理论上它能够做到当前无法做到的事情,比如充当学生的家庭教师,辅助撰写论文或解决数学难题,或者翻译交通标识、指导解决汽车故障等。

不过,这类技术目前无法在个人设备上运行,用户可以在短期内使用基于云的版本来获取这些功能,如自动化服务Agent。知情人士表示,新语音助手的音频功能可以帮助客服人员更好地理解来电者的语气。

OpenAI已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话AI模型实现,而新的语音助手则将这些功能整合在一起,使其在图像和音频理解方面更胜一筹,并且速度更快。

目前尚不清楚OpenAI何时会将这些新功能提供给付费客户,但知情人士透露,这些功能将被纳入ChatGPT的免费版本中,旨在使其运行成本低于GPT-4Turbo。该人士还表示,AI语音助手在回答某些类型的问题上表现优于GPT-4Turbo,但仍存在「幻觉」。

对此OpenAI发言人未作回应。

OpenAI可能会在今年年底发布GPT-5

其实,利用AI开发强大的助手,谷歌早有此想法。去年12月,谷歌发布了一则Gemini的视频,它能够实时响应人的语音命令,并识别出人正在看的图像。然而,谷歌后来解释说,这些功能需要研究人员用图像和文本指令提示模型,而不是视频中演示的简单对话。而OpenAI推出语音助手主要为了「狙击」谷歌、苹果。

不得不说,OpenAI上新的速度太快了。

除了即将发布的具有音频和视觉功能的模型外,OpenAI一直计划推出AI搜索引擎,旨在与谷歌竞争。此外,OpenAI还在开发一种被称为「计算机使用Agent」的自动化软件,可以加速软件开发和其他基于计算机的任务。

更重要的是,GPT-5也在马不停蹄地研发中。据一位与OpenAI领导层讨论过此事的人士表示,OpenAI可能会在今年年底完成GPT-5并公开发布。

OpenAI还计划发布一个新的定价模型。据知情人士透露,如果客户预付费用来预订tokens,他们可能会获得高达50%的折扣。目前,OpenAI主要提供按需定价,每百万tokens的价格为几美分到120美元不等,一些较大的客户会获得批量折扣。今年4月OpenAI推出了BatchAPI,该应用程序编程接口会提供更便宜的价格。

不过,OpenAI在产品和AI模型开发上的迅猛势头也导致之前发布的一些项目备受「冷落」。例如,OpenAI曾承诺,到今年第一季度,开发者就能通过为其商店构建定制聊天机器人来赚钱,但截至目前OpenAI也未兑现承诺。

苹果计划改造Siri来应战

OpenAI的来势汹汹,让苹果有了危机感。

据报道,苹果公司计划将其虚拟助手Siri引入生成式AI。知情人士透露,新的Siri将变得更加「对话化和多功能化」,并将采用生成式AI驱动的系统,使其能够总结短信内容并进行对话,而不仅仅是逐个回应问题。Siri和苹果公司的其他AI产品预计将在6月10日的苹果年度开发者大会上亮相。

去年年初,苹果公司的高管们在把玩OpenAI的ChatGPT后,发现Siri相形见绌,于是决定对Siri进行升级。这也促使苹果进行了十多年来最重要的重组,以便在这场激烈的人工智能「军备竞赛」中迎头赶上。

但是,苹果并未选择发布一款与ChatGPT直接竞争的产品,而是决定提高Siri作为虚拟助手处理其已经能够完成的任务的能力。新Siri的宣传点在于它比其他AI工具更私密,因为用户请求将在iPhone上处理,而不是在数据中心。但是,这种做法也有其缺点,与大型AI系统相比,小型AI系统更容易产生幻觉。

苹果还计划在其新款iPhone中增加内存,以支持Siri的AI功能,并一直在与谷歌和OpenAI等竞争对手洽谈,旨在将最新的AI模型整合进下一代iPhone操作系统。

据最新报道,苹果已接近与OpenAI达成协议,将在下一代iPhone操作系统iOS18中使用ChatGPT;与谷歌尚未达成协议,但谈判仍在进行中。

今日热搜