微软开发者大会:6月上线AI版Windows,和ChatGPT共享插件

2023-05-25 08:59:49 - 第一财经周刊

转自:第一财经YiMagazine

「大公司最新动态,只在值得关注时更新」

记者:王杰夫

表格整理:张司钰

编辑:吴洋洋

KeyUpdates

Copilot登陆Windows11;

Bing成为ChatGPT默认搜索引擎;

为OpenAI开发的插件,微软的Copilot也都能用;

通过云计算平台AzureAIStudio,每家公司还能自定义Copilot。

“自从去年11月开始,一切都进化了,我们的梦想机器从自行车升级到了蒸汽机。”站在微软2023年Build开发者大会的开幕舞台上,CEOSatyaNadella这样向所有开发者宣布。

纳德拉的比喻来源于一个在科技圈常常被引用的名言,那是1980年代,SteveJobs刚刚创办苹果公司三年、个人计算机还是个极其稀罕玩意的时代,为了给计算机布道,乔布斯想到了一个绝妙的比喻。《美国科学人》杂志当时为各种生物的运动效率做了统计,秃鹰是最厉害的,远远把人类甩在后面,但当人类骑着自行车时,效率一下跃升到第一——移动每克重量每公里仅消耗大约 0.15卡路里。

人类大脑的自行车就是计算机,这是那个时代的梦想机器,乔布斯用这个比喻启发了整整一代计算机爱好者。现在,纳德拉要给这个比喻加上后半句——人类大脑的蒸汽机会是GPT,梦想机器的工业革命起始于2022年11月。

 智能副驾驶Copilot和插件Plugins, 

 这是微软的“梦想机器” 

在整个开幕演讲中,纳德拉提到最多的词就是“Copilot”。他表示在过去几个月中,微软将ChatGPT这种通过自然语言实现复杂人机交互的能力,应用到了旗下几乎所有产品中,有Microsoft365(其实就是指我们常用的Word、PPT、Excel),有GitHub(代码工具),还有最新版本的Windows11等等。

与Google时髦地给不同的AI助手起了Bard(聊天机器人)、DuetAI(代码机器人)、Tailwind(智能文档)等名字不同,微软还是延续了它一贯的朴实风格,将所有这些助手统一称作“Copilot”——Microsoft365Copilot、GithubCopilot、Dynamics365Copilot(注:Dynamics365原是一种融合了CRM和ERP的SaaS软件)、PowerPlatformCopilot(注:PowerPlatform原是一种为开发者提供的开发平台),还有WindowsCopilot。

微软开发者大会:6月上线AI版Windows,和ChatGPT共享插件

微软的Copilot全家桶

Copilot中文直译就是副驾驶员。你可以把它理解为类似于ChatGPT的AI产品,只不过它的主要功能不是随意地Chat聊天,而是通过聊天的交互方式帮你更深度地工作——写出一段有用的程序、管理商品库存、或者根据你的需求调用你电脑中的不同应用。

看得出来,微软极力在用一个人性化的“副手”概念来淡化人们对AI的抵触情绪。相较于聊天机器人ChatGPT,微软所定义的Copilots更像一个个在不同工作场景中配合用户完成各项工作的助手。当然,如你想要在做这些事的时候跟它随意聊聊天,它也能胜任。

 有了WindowsCopilot,

 还记得无人问津的Cortana小娜吗 

在下个月即将发布的预览版Windows11上,Copilot就将会成为一个横跨各个不同软件的系统级AI功能——WindowsCopilot,只要点击图标,就能够在侧边栏将其呼唤出来。

微软开发者大会:6月上线AI版Windows,和ChatGPT共享插件

如果你是Windows系统,Windows11中的Copilot就会时刻待在电脑屏幕的右方等你召唤。

-你可以向它提出这台电脑系统层面的问题,比如当你提问“能否让我的电脑变得更适合工作”,WindowsCopilot就会提议你开启专注功能和深色模式,如果你点选Yes,它就可以自动开启这些功能。

- 你还可以让它调用你电脑上已安装软件的功能,比如你可以问WindowsCopilot“有什么音乐适合工作时候听”,它就会主动打开Spotify并且搜索相关歌单。

- 你甚至可以让它帮你工作,比如当你面对一篇论文pdf或者一段Word文档里的文字时,你都可以直接让WindowsCopilot帮你总结提炼。

这已经不是微软第一次尝试用AI助手来辅助用户使用Windows,就在2014年的微软Build大会上,微软推出了当时还是主打语音交互功能的AI助手Cortana,一个以Xbox当家游戏光环中人气女角色命名的产品。虽然当时的Cortana看起来比Copilot潮流得多,但对着电脑询问天气预报或是新闻简报实在太傻了,Windows在2020年的系统更新中为用户提供了卸载它的选项。

 不同的Copilot,

 同样的Plugins插件 

上周,ChatGPT刚刚开放了Plugins(插件)功能,这周,微软就将这个功能带到了Copilot全家桶中。微软表示,Copilot将与ChatGPT采用相同的开发标准,意味着开发者只要开发一次插件,就能够在ChatGPT和所有微软Copilot上使用它。

这些插件可以简单理解为第三方应用为微软Copilot开的后门,方便其访问外部应用内的数据来回答用户的问题。微软在演示中举了两个例子:

- 当你在Bing中询问“周围可售的3套100万以内的房子有哪些”时,就可以调用Zillow(美国线上房地产公司)开发的Plugins来回复。

- 当你在WordCopilot中起草合同时,你可以直接调用PracticalLaw(法务解决方案产品)开发的Plugins来帮你撰写,并且用Westlaw(法务数据库产品)的Plugins来帮你核查最新法律条文,最后再用DocumentIntelligence(合同纠错产品,以上三款产品全部来自汤森路透公司)来帮你最终梳理整个合同需要修改的地方。

目前已经有数十款插件可供使用,而且微软还开放了自定义功能,你甚至可以开发自己的插件。“可以将插件视为一座桥梁。”微软在演示中这样解释插件的作用,“大模型是根据来自互联网的公共数据训练的,而为了商业利益,一些数据会被这些公司保护起来,插件将其与Copilot的用户连接在了一起。”

简单说,通过Copilot,微软让自己的所有办公产品、搜索引擎软件都智能了起来,用户可以通过这个个人助手更便捷地使用这些工具。而通过Plugin的插件功能,微软把这些个人助手与外部互联网连接了起来,使它们可以随时调用外部工具,弥补GPT模型原本不具备或弱小的能力,比如数学能力。

甚至,如果用户在Copilot平台内自定义的插件足够多,Copilot自身也可能变身为下一个应用平台,就像现在的AppStore一样。

在演示中,除了ChatGPT的插件可以供微软Copilot使用外,Bing搜索本身也成为了ChatGPT唯一默认的搜索引擎插件。这两家公司关系是如此之紧密,让之前纳德拉在访谈中对ElonMusk“微软控制了OpenAI”说法的辩驳显得有些苍白。

 在微软云AzureAIStudio里,

 微软让每家公司都能自定义Copilot 

最后来到了微软最擅长的企业服务环节,微软推出的AzureAIStudio可以让每个公司、每个人开发自己的Copilot。目前,它已经为超过4500家公司提供服务,包括沃尔沃和宜家。

微软提出,用户可以将OpenAI的各种GPT模型与自己的数据结合起来,构建专属的AI工具,这些数据可以是内部的或是外部的,可以是结构化的、非结构化的或是半结构化的,通过这种方式来满足用户对于数据安全性的要求。甚至微软还为用户提供了GPT模型之外的选项,例如HuggingFace及其他开源模型。

在演示中,微软CTOKevinScott还用他为自己的播客《BehindtheTech》搭建的PodcastCopilot,来强调个人开发者也能够使用AzureAI来创建AI助手提升效率。他在本地调用了Whisper和Dolly2两个模型,来生成转录文本,并提取嘉宾的姓名,之后,通过微软云Azure上的BingSearchGroundingAPI、GPT-4模型、Dell-E模型来分别搜索嘉宾的简历、撰写简介并配图,最后由LinkedIn的Plugin将帖子发布在该平台上。斯科特用这个例子说明使用微软云上的诸多模型,可以如何创建自己的AICopilot(助手)。不过对于普通人来说,这个例子的技术门槛听起来有点高。

微软开发者大会:6月上线AI版Windows,和ChatGPT共享插件

按照这个步骤,一步步自定义你的copilot。

虽然今年各大科技大厂开发者大会的主题都是AI,但相较于5月12日的GoogleI/O开发者大会,微软的Build开发者大会的侧重点有者明显的不同。

Google很大部分时间是用来介绍线上应用的变化,比如搜索、地图、邮件、图片等产品是如何被AI提升的,即使演示视频做得再新潮,也很难有让人哇一声的冲动,归根结底是这些Google最重要的产品其实已经足够好用。

而微软这一次的演示就像是军火库的装备升级,Windows、Office、Dynamics(注:一种融合了CRM和ERP的SaaS软件)、Github等等都是工作中必不可少的软件,而他们在过去很长时间里并没有深入地被AI技术改进过。

而现在,微软告诉用户,它们已经为每一个生产力工具植入了Copilot助手和Plugins插件,并且用户可以开发自己的Copilot和Plugins,梦想机器将无处不在。尤其是Windows,这将是第一个彻底被大语言模型(LargeLanguageModel,LLM)改造的操作系统。考虑到操作系统的用户界面从最早的命令行界面变革成图形界面时所产生的生产力爆发,这次,操作系统再次从图形用户界面,变革为自然语言界面,所带来的影响将难以估量。

不久后的6月6日,苹果也将举办其WWDC开发者大会,这个曾经为大脑打造自行车的科技公司,面对微软推出的蒸汽机会作何反应?是把它视作新一代梦想机器而努力追赶,还是继续摆弄HeySiri,告诉用户这就是最适合个人计算机的AI?我们半个月后就知道了。

OtherUpdates

1. 面向消费者和企业用户

1)Mediaprovenancetools(即将推出):用户可以验证视频或图片是否为AI生成;

2)MicrosoftStore更新:利用AI生成关键词和评论摘要,新功能MicrosoftStoreAIHub(即AI应用商店)即将上线。

2. 面向开发者

1)DevHome:轻松连接至GitHub安装开发者需要的工具和包,并可以在云上配置编码环境;

2)WinGet:开发者只需点击几下就可以准备好编码,跳过设置新机器或启动新项目的手动工作,缩短设置时间;

3)DevDrive:新型存储卷,适合托管项目源代码、工作文件夹和包缓存;

4)GitHubCopilotX:CopilotChat(聊天)、CopilotforPullRequests(合并修改)、AutomaticTestGeneration(自动测试生成)。

今日热搜