对话金山办公CEO章庆元:大模型带来的交互革命,会重新定义软件

2023-05-09 16:39:56 - 火讯财经

文章转载来源:AI梦工厂

文|张鹏

编辑|黎诗韵

原文标题丨对话金山办公CEO章庆元:依托大模型,重写WPS的使命

来源丨极客公园

对话金山办公CEO章庆元:大模型带来的交互革命,会重新定义软件

一家SaaS软件公司,正处在大模型范式革命的前沿,包括它在内的软件公司最终都有被大模型替代的可能。而它抬头一看,自己追赶了数十年的对手微软,正猛然成为大模型时代的最大「赢家」。后者用100亿美元投资了OpenAI,并用大模型技术重塑了软件和云。接下来该怎么办?这就是金山办公要面临的现实。

作为一家35年历史的办公软件公司,金山办公走过个人电脑时代、PC和移动互联网时代、云和协作时代。其旗下WPS是国内最接近微软Office的产品,至今仍每个月服务近6亿用户设备。而面对刚刚涌现的大模型时代,它的转身依旧迅捷、果断。今年初,金山办公决定彻底调转公司船头,转型AI,凡是跟AI无关的业务都要砍掉。

它也率先拿到了成果。4月,它推出「WPSAI」,这是国内协同办公赛道首个类ChatGPT式应用。

我对这家公司的处境与思考非常好奇,作为一家SaaS软件公司,它如何看待自己在大模型时代的命运?如何看待自己跟微软三十几年胶着的竞争?以及作为一家资历如此久的公司、它如何在组织上能这么快地完成AI转型?不久前,我跟金山办公CEO章庆元有了一次访谈。

章庆元2000年加入金山软件,或许正是程序员出身,他更敏锐地意识到了这次技术革命会带来的深远影响、并迫切想抓住它。「当我看到AI自己能写程序的时候,我知道这个世界完全变了。」他说。而更重要的是,过去金山办公紧跟每波技术浪潮的基因,才让它有这么久的生命力、这么快的反应动作。

有趣的是,当行业都在用「军备竞赛」的姿态去做大模型,金山办公却避开了这种「热闹」。它选择跟大模型公司合作,先专注自身业务、做好应用层。

而关于SaaS软件的命运,章庆元说,大模型将彻底颠覆其用户交互,简而言之,软件不再「难用」;关于竞争,他说大模型有望「统御」所有软件公司,大家的出路是更好地理解大模型、提供更好的产品、并为AI提供更好的接口;关于组织力,他说在大模型时代,哪家公司能率先改变自己的组织架构和思维方式,谁就能先活下来、甚至胜出。

金山办公的故事,无论是对SaaS软件行业、还是对于想拥抱大模型时代的创业公司来说,都是有启发的。

35年过去,技术浪潮更迭、时代斗转星移,金山办公依旧面对着强大的微软、依旧希望跻身下一个热气腾腾的时代。

以下是与金山办公CEO章庆元的对话:

大模型带来的交互革命,会重新定义软件

张鹏:感觉金山办公这次面对AI浪潮响应的速度非常快,这么迅速推出WPSAI,你们内部的决策过程是怎样的?

章庆元:金山办公过去几年一直在做AI,只不过是用传统的小模型在做。我们几年前就定下了五个词的产品战略,「多屏、云、内容、AI和协作」。不过去年接近年底的时候,我们得出一个结论,AI的路已经走到尽头了,没啥好搞的。因为技术也就这样子,AI一点也不「聪明」。

然后,特别戏剧化的事情发生了。我们刚做完这个总结,GPT3.5出现了。我们才知道它的能力有多么强大。当一个AI自己能写程序的时候,这个世界完全变了,一个新的时代已经到来。我们感觉,这将比金山办公历史上经历的所有技术变革都更猛烈、更有颠覆性。作为软件公司,我们必须积极拥抱,否则一定会被淘汰掉。

张鹏:具体来说,你觉得大模型的范式革命到底会怎么颠覆整个软件行业?

章庆元:首先,它会给用户交互带来革命性、颠覆性的变化。过去,软件行业常说「二八理论」,80%的人只用了20%的功能。因为办公软件很复杂,用户需要努力学习才能使用它。

但今天,大模型有思维链CoT(Chain-of-Throught,用于逻辑思考)的能力、Codex(编程语言预训练模型,可以帮程序员生成代码)的能力。它可以把用户的一句话,直接变成代码的调用、再满足需求。这导致用户交互完全变了。

张鹏:可不可以理解说,过去软件的底层功能很强大,但怎么跟用户交互是很大的问题。而今天,我们不需要去做用户交互了,因为AI可以直接理解用户需求,并调用功能、解决问题?

章庆元:对,比如当你要分析华南区某一个商品的销售排名情况,你不用再去学习数据透视表,而是直接跟机器说需求,它就会自动帮你调用工具、展示结果。未来,UI(UserInterface,用户交互)这个词甚至就没有了。

我们不再需要研究界面怎么布置、某些点线怎么摆放。我们只需要管好产品的底层功能、并将这些功能的API(应用程序编程接口)做好,让AI能通过API调用它们、就能满足用户的各种需求。

包括我们公司过去做文档扫描、图像识别,一直都是用传统的AI方法来在做,很辛苦。但今天你会发现,这个技术可以用多模态(指文本、图像、视频、音频等不同模态数据融合的技术,是大模型的核心技术之一)重写一遍。

张鹏:对软件公司来说,为什么交互的变化会带来产业的革命性变化?

章庆元:比如未来,我觉得Photoshop(Adobe旗下的图像处理软件)理论上可以切入「美图秀秀」这类工具的市场。

今天,Photoshop的功能虽然比C端那些美图工具强大得多,但它输在用户交互上,很多用户不会用。但到了AI时代,当用户交互的成本降为0,Photoshop的强大功能就会成为绝对优势,毕竟它能处理比美图秀秀复杂得多得多的场景,这对原有的产业格局当然就有可能产生影响。

张鹏:我看你们一直想做简化用户交互这件事,但可能用过去的AI技术很难实现?

章庆元:对,我们之前就说过,办公软件不是给正常人用的,太难用了。用户应该尽可能少地去学习功能,这是我们一直在做的努力。不过之前的技术不ready,这次我们终于可以做到了。

我们马上会上一个(WPS)新版本,第一件事就是在用户界面上尽量地做减法。过去的按钮实在是太多、太复杂了,我们要把它简化简化再简化。人要被完全地解放出来了。

这些新的范式很令人兴奋,我打个比方,今天有点像十年前移动互联网刚开始的时候,大家都在做汤姆猫这种简单应用的时代。

但其实,它(这波AI浪潮)对软件行业的改变,不仅是文字内容的生成和改写、或者加个Copilot(个人助理)这么简单。未来,它会颠覆软件行业的方方面面。在这个前提下,我们自己也是越想越兴奋,过去做的很多事情都太无聊了。

文档的未来:从提供工具到帮人类「涌现思想」

张鹏:刚才说到用户交互的变化,我好奇这会在文档这个产品上有什么表现?过去我们写文章总是开一个空白的文档,但往往脑子也是一片空白,就盯着那一个光标开始写,其实挺痛苦的。

章庆元:我也是这样。我们总感觉办公很痛苦、不是什么愉快的事,都想早点把办公软件关掉。相当于每个人我给你一张白纸,纸很好、笔很好,但是不是每个人都写得出好字、写得出好文章。

张鹏:所以未来用户创作文档的方式有没有发生变化?比如通过更智能的模板,甚至上来就给我一个写作引导,一步步帮我展开思路,而不是在一片白纸上创作?

章庆元:这个我们已经在做了,比如我们有稻壳这款产品。因为天下文章,很多格式都固定的。用户应该关注表达自己的内容,而不用去想着格式怎么弄、或者从一片空白开始写。

但之前那种模板是「死」的,你总觉得那些东西差点意思。我们现在发布的这玩意(WPSAI),它生成的模版是「活」的。比如你要写OKR,它会自动帮你生成一个,你一看还是稍微能用。

张鹏:相当于给你打了一个写作基础。

章庆元:换句话说,在我们感到陌生的领域,AI至少能够成为「比较合格的乡村启蒙老师」。它什么都略懂、又什么都不精,但它至少能给你提供一些最基本的框架、思路。你可以在这个基础上做修改和提升。

张鹏:这种「活的模板」会怎么演进?

章庆元:我认为这些AI生成的东西,只能帮助初级水平的人。但如果一个人天天完全使用AI生成的内容,他一定会被淘汰。每一篇真正的文档,应该有一个独特的思想在里面,想法要足够有价值。

但写这种高价值文档的难点是,你不知道要写什么东西、脑子里还没有涌现出创意和思想。这个核心就是要解决灵感素材的问题。以我自己为例,每年在金山董事会上的报告基本都是我自己写的。写之前,我会花一晚上时间去看各种数据,可以试想以后让AI更快速准确地调出相关数据,当我看完这些数据可能就有灵感了,后面就好写了。

张鹏:所以一方面是所谓「低价值创作」,比如可以用模版帮用户打个基础。另一方面是「高价值创作」,要解决用户的灵感素材问题,要帮用户「涌现思想」?

章庆元:对,我们的使命就叫「简单创作、轻松表达、实现价值的连接」,还有一句口号是「绽放智慧的力量」。核心就是希望帮助用户把自己的思想表达出来。

对话金山办公CEO章庆元:大模型带来的交互革命,会重新定义软件

这其实涉及另一个跟文档息息相关的交互革命。过去,WPS云上储存了差不多两千亿个文档,但过去,这些文档是「死」的,只是起了一个备份的作用。现在大模型突然能帮用户看懂这是什么东西了。这些文档突然有用了,变成了用户专属的真正的知识库。

比如当你要写一个东西的时候,你可以直接问你的云文档,请帮我把过去一年公司的应收款叠加现金流,做成折线图。你看完这些,可能就有创作灵感了。这些数据就能帮你涌现出「智慧」和「思想」。

张鹏:这让我想到过去的知识库本质是「connection」,用户只是通过搜索对应到文档。但今天是「fromconnectiontosolution」,你直接告诉我你要什么,我直接告诉你需要的。

章庆元:这才是真正的知识库,以前的知识库都是假的。以前我本来想做知识库,最后没做。因为当时我问产品经理这个东西有什么用?他说就是云文档加个目录,没啥区别,还是靠关键词搜索。

但今天,大模型靠的是向量搜索。比如你输入「手机」,它不是把「手机」相关的关键词展示给你,而是可以回答你关于「手机」的问题。只有你能问文档问题、它能反馈结果,这才是真正有价值的知识库。

张鹏:当我们可以基于企业真实的文档数据去做知识库,是不是可以从根本上提升企业的效能?

章庆元:这的确是非常有想象空间的事情。本身企业的数据分两种,一种是结构化数据,一种是非结构化数据。结构化数据是已经被处理过的数据,主要在财务系统、业务系统里面。而非结构化数据主要在文档里,过去它很难被理解,所以可能需要找人帮我梳理。但现在,我直接找AI就可以。

张鹏:你觉得文档是一个独立的东西,还是必然要融入到整个企业管理的工作流里?文档会不会往工作流走?

章庆元:其实,企业文档这么多年来一直是企业内部工作流的一部分。传统的OA(OfficeAutomation,协同办公系统)也一直支持WPS做内部流转的产品,但我们没做OA,未来也不会做。因为这里面有很多Knowhow(认知积累),我觉得我们做不了这个事情。包括微软这么多年跟我们的想法也是一样的。

张鹏:所有人都知道「AI个人助理」是大模型时代「皇冠上的明珠」,但没有人知道这个助理会在哪里出现。但今天来看,如果文档可以涌现出思想,那它有可能会涌现出真正的「AI个人助理」吗?

章庆元:今天我是一家公司的CEO,我可以聚焦在我自己想表达的观点上,很多执行的活儿有团队配合。比如财务团队帮我提供数据(灵感)、文案团队帮我写作、UI团队帮我美化。但未来,普通用户可能只用花一点钱,也能拥有一个同样强大的团队。

设想一下未来,你有一个AI助理,它既可以帮你调数据、给你创作灵感,甚至还可以帮你写作——因为他看过你所有的文章,知道你的写作风格是什么。可能你语音跟他说下要表达的观点,它就能帮你组织文字、输出属于你的文章。最后他也能帮你美化PPT。关键是他24小时待命,可靠又安全。这种体验完全是颠覆性的。

张鹏:当未来人们都直接跟机器交互的时候,我们还需要文档吗?那时候文档在人类世界中的意义是什么?

章庆元:我认为文档是不会消失的,因为它是人类思想和创意的载体。除非人类的思想和创意没有价值了,所有东西都是机器创造,文档才会消失。但那时候人类可能已经灭亡了。

张鹏:思想和创意一定要以文档的形式存在吗?有没有可能变成一堆向量?

章庆元:因为你的思想和创意最终是给人看的,所以它必须是人类能理解的形式,是文字而不是向量。除非你是向机器汇报,那一天人类就麻烦了。

但是还有一种情况,文档将会消失,就是大家都接了脑机接口。那时候人类就不用看文档了,思想和创意直接变成了向量的传输。那一天可能就是真正的MATRIX(源自电影《黑客帝国》,指的是一个控制了现实世界的计算机人工智能系统),人类也不用努力工作了,给你一个虚拟房子,你的大脑就能获得快感。

张鹏:你怎么理解最近火爆的Copilot这个概念?

章庆元:所谓用户交互革命,就是用户不用去学习各种复杂的功能了、用户的数据含义都能被理解了。只有这两个都做到了,它才是真正的Copilot。

不要低估微软+OpenAI对软件行业格局的巨大影响

张鹏:你怎么看微软的这一波的打法?

章庆元:我觉得微软这波太牛了。它跟OpenAI的这个交易(注:微软向OpenAI投资了100亿美元),应该是这两个世纪里面最成功的商业交易,没有之一。它100亿美元过去了以后,OpenAI不仅给它提供额外的服务,然后又返到了Azure(微软的云服务)上来。这个生意太好了。

未来没有AI能力的云就卖不动了,只卖CDN(内容分发网络)、卖带宽,这个是没有价值的云。而目前,只有微软的云嫁接了OpenAI的能力。可以说,微软加OpenAI,是未来商业世界的新一代「灯塔」。

微软还有个真正的大招,就是操作系统。操作系统是最大的流量入口,它会把很多东西集成了,未来很多简单的应用软件就直接被取代了。比如像做酒店预订的公司,未来AI可以直接根据用户需求,调取酒店的API完成预定、抽成比例还低,他们的产业位置可能就没有了。

张鹏:以前携程这样的公司,正是通过帮传统行业完成了信息化、数字化,才拥有平台的价值。那未来那些关于信息化、数字化的软件还会存在吗?软件的定义和目标是不是也变了?

章庆元:软件短期内还存在的,长期内就另当别论了。特别是ChatGPT有了Plugin(插件)能力之后,就好比它不擅长算数学题,但它会用Plugin去调计算器来算。说白了,我们未来软件公司干的就是计算器的活。我们最终的价值,可能就是给大模型提供action(解决方案)。比如说外卖公司,它最有价值的部分可能是给AI提供派送能力。

未来我们这些公司可能会变成一个个节点。比如开一个商业发布会,它可能先调WPS生成一个文档,然后把文档发给酒店,接着自己预定好酒店……大模型变成了真正的MATRIX,把所有软件公司都连接了起来。

张鹏:你认为微软在中国怎么做?

章庆元:我猜,它的Copilot也不会完全用OpenAI,因为成本太高了,它应该也扛不住。在中国的话,它的Copilot能力的后端可能需要在国内落地才可行。

张鹏:过去,中国的办公软件服务市场一直是很分散的,这是为什么?

章庆元:总的来说每家的思路都不一样。比如企业微信卖的是微信的价值、飞书卖的是字节的管理、钉钉卖的是一个巨大无比的SaaS平台,而金山办公一直卖的是解决方案。我们会帮客户做一个属于它自己的「飞书」,这对它来说信息是可控的。

我们一直是服务思维,你想要什么,我帮你。哪天你不想用金山办公,你的数据直接control+A、control+C、control+V就可以弄走了。

大家的客户群重叠度也没有那么高。钉钉可能卖给中小企业多一点,飞书卖给大型的民企多一点,我们主要卖给央国企、政府。

张鹏:未来有没有可能因为大模型通用的这个能力,变成更一统的江湖?

章庆元:这是有可能的。因为原来SaaS公司之所以这么多,就是因为客户需求的多样性,需要定制化开发来满足。举个例子,WPS以前有个功能「删除文字空白段」,但这种功能不用再开发了,ChatGPT可以解决。所以当大模型能解决原来SaaS定制化的问题,SaaS公司就会慢慢变得同质化。

张鹏:那未来SaaS公司还拥有的独特价值是什么?

章庆元:我觉得它们的竞争力主要还是,它们对大模型的理解,它们的产品底层是否健壮、性能是否足够好,它们的API是否足够开放、是否能为大模型做一些优化。我觉得最主要是去理解用户的需求,把工作流设计出来,AI是不会去做这件事情的。

以BI(商业智能)系统为例,再过一年这些SaaS公司主打的卖点应该就是,谁家的AI能力最强。比如当用户讲出需求之后,它可以帮用户分析各种数据,直接给出答案。这才是真正的BI,没有AI的都是假BI。

张鹏:你一直提到要做好API做好,这主要考验什么?

章庆元:这个需要积累,主要是体力活,没有什么特别好的诀窍。

我比较幸运的是,因为这么多年的竞争对手一直是微软,所以我们一直在跟微软看齐。微软做所有的产品都是先做API、再做UI,所以它的API非常强大。WPS之前提出的对微软的「三大兼容」,除了UI兼容、文件格式兼容,更重要的就是API兼容。我们的API接口跟微软一模一样,非常强大。这也变成我们的重要优势。

最近,我也把稳定金山办公的API架构定为公司的核心战略。因为只有API的架构稳定了,我们合作公司的大模型才能够调用它、用来满足用户的具体需求。

张鹏:大家都在探讨微软这波这么牛、可能要「一统天下」,金山办公怎么应对?

章庆元:包括这次发年报,我出去路演讲了38场,大家都在问我关于AI的问题。核心是两点。一是金山怎么跟微软竞争,二是怎么看国内在线文档在AI加持后的竞争格局。我的回答是,我们的竞争实力很强,因为我们的API能力和云都已经很成熟了。

张鹏:某种程度上有一个超级强大的对手对你们来说也是一种好事,亦敌亦友亦师。

章庆元:我是2000年来金山的,那时候微软也正是巅峰期。当时我们金山整个模式全部是学微软的,看《微软的秘密》那些书、也挖了很多微软的人,从微软身上学到了很多。只是后来在互联网时代,我们显得稍微落后一点,产品看着也不那么性感。但今天这个AI时代,可能又让我们有了新的机会,继续跟微软看齐、产品也可以变得性感起来。

看到方向很兴奋,但做起变革就要准备面对痛苦

张鹏:你们具体什么时候开始投入WPSAI的研发?

章庆元:大概是春节后。金山文档是我们整个公司的「先遣队」,我把很多团队的人都分配到那里去学习。我们测了国内外所有的大模型,包括第一批拿到了谷歌大模型的内测。我们看着这些大模型的能力,细思极恐、越想越可怕,太强大了。所以赶紧投入了研发。

张鹏:你怎么组织的这个金山文档「先遣队」?

章庆元:第一,在线文档做起来快、更新也快,相对传统的Office更简单,所以我们先拿出来做。第二,我们那支团队是的AI忠实的「信徒」,他们一伙人扎进去,越扎越深。他们会不停地告诉我,我们可以这样做,可以那样做。

张鹏:为什么你们没有急着一上来就自己做大模型?

章庆元:今天我自己做大模型纯粹浪费时间。因为未来在中国,BATB(百度、阿里、腾讯、字节)这四个通用的大模型一定是最好的。而且现在去做也会限制我自身核心业务的发展。

我的核心竞争力还在Office本身。所以我一定要跟进最好的大模型,谁好我就用谁。我就做大模型的应用者。

张鹏:你怎么评价目前已有的大模型?

章庆元:现在只有两种大模型,一个叫ChatGPT,一个叫其他。因为大模型最重要的是COT的能力、Codex能力,除了ChatGPT之外,其他家这块的表现差距比较大。我对中国的大模型有信心,因为我们对新技术的开放程度其实是更高的。

张鹏:今天的创业者有两种思路,一种像你一样就做大模型的应用,另一种是也必须要干大模型,不想把命握在巨头的手里。从你的角度,你很快就明确了是前者。

章庆元:首先,我是要做大模型的应用。但其次,我未来也一定要解决大模型自主可控的问题。因为如果想用单一的大模型解决所有问题,成本会很高。而且我们有自己的定制化需求,所以我们必须得有自己的优化模型。

但今天,我自己做的成本会非常高,还不如别人帮我们做。所以我们就找国内大模型创业公司这样的合作伙伴,满足我们定制化的需求。

张鹏:现在主要是投入产出比打不平。

章庆元:对,现在成本太贵了。用户的一句prompt(提示词),看起来就10个token(字节),但为了让大模型回答更准确,我们还要加一大堆的prompt进去,就变成了100个token。一个月得多少钱?现在根本不想算。但我相信很快,这个成本一定会降下来。

张鹏:现在AI团队都做什么?

章庆元:我们AI团队现在主要在干两件事情。第一,积极学习各大模型。第二,自己做个「分诊台」小模型,比如根据用户的场景、需求,给它匹配最适合的大模型,从而实现分流。这个还算简单,基本上有七八十亿参数、刚刚开始「涌现」的模型就够了。

他们的使命就是,提供外面封装好的模型、提供基础设施,让公司其他团队基于API的开发变得更容易。

张鹏:其他团队怎么跟AI团队嫁接在一起?

章庆元:一开始是我逼着其他的团队转(AI),OKR全部都要改。在内部来说,新版的所有的产品就是AINative(AI驱动),如果不是AINative的产品,应该一年内我准备都把它关了,没什么价值,不投入了。

后来发现其实团队对于这次大模型的出现都是异常兴奋的,整个产研团队很久没有这么兴奋,都带着极高热情自我驱动地学习和投入。

张鹏:这么坚决。你的OKR是怎么改的?

章庆元:我们OKR原本是去年底定的,但今年一季度全部改了。核心就是怎么把AI应用到各个团队的业务里。我们最近成立了一个产品小组,以后内部做什么产品都要先审核,不要再做一些传统的(产品)了,那就是浪费钱。多想想AI怎么做。

张鹏:创始人或者CEO往往方向感很强,但传导到整个公司需要时间、过程也很痛苦。这可能是未来整个AI时代创业公司最大的挑战。

章庆元:在AINative时代,谁率先改变了公司的架构和公司思维的方式,谁就能活下来、谁就能胜出。

我自己是程序员出身的。我很多年前就认为,如果有一天程序自己会写程序,那我们这些程序员都完蛋了。结果今天真的发生了,这件事对我的冲击非常大。我觉得都不用看它(AI)的其他能力,光这点,就能改变世界了。

张鹏:那从程序员的角度来说,你觉得以后程序员的未来在哪里?

章庆元:比如我们的程序员应届生,在进项目组之前,都有半年脱产训练和相关考试。现在,我们出的每道题都会用ChatGPT写一遍答案,那就是条及格线。包括现有的程序员,也要学会用ChatGPT来辅助写代码。

对于程序员来说,他们要重新考虑自己的技术栈。首先是去理解和学习AI,其次要想着怎么运用它。这是最重要的。

张鹏:可不可以介绍一下金山办公接下来的计划和动作?

章庆元:一方面是海外版,就是要积极跟进全球最先进的技术,对手有的东西我都要有,什么Copilot、ChatPDF、ChatDOC、ChatExcel全做一遍。另一方面国内版,可能要慢一些,要等国内合作伙伴的大模型上线。我相信在做的过程中,肯定会积累出一些经验,然后更多的思考、想法就会涌现出来。

我们碰到什么浪潮都是先干了再说。因为金山办公曾经在这方面吃过亏,从DOS操作系统到Windows操作系统就反应慢了,公司差点挂了。所以后来移动互联网起来的时候,我们也没想明白,就先干了再说。到后来云、协作、AI那一波浪潮,我们也干了。

以前那些年,有时候在新产品发布会上,我自己有时会有种「为创新而创新」的感觉。但这次AI浪潮,我觉得我们是真的在创新。其实AI的很多能力我们还没有完全释放出来,我自己都觉得未来会是蛮让人期待的。

今日热搜