邬贺铨:广州Shein公司利用基础大模型从女装公司变成54个国家购物首选APP,估值超千亿美元
《财经》年会2025:预测与战略暨2024全球财富管理论坛于12月13日-12月15日在北京举行。中国工程院院士、中国工程院原副院长邬贺铨出席并演讲。
邬贺铨谈到,智能体是一种可以接受自然语言命令,可以跟环境互动,并且具有初步思维链的软件,可以将大模型的知识转化为感悟。通常智能体是跟场景一一对应的。“如果说大模型相当于智能手机的操作系统,智能体就相当于手机里头的APPStore。我们的手机实际上仅有操作系统并不显示出它的功能,需要装载一个一个APP。”在他看来,今年大模型的重要进展就是智能体开发出来了。
邬贺铨指出,目前人形机器人还是预编程序的,去年人形机器人的关键成本下降了40%,马斯克预言未来可能只需一万美元,并且认为只要成本下来、价格下来,未来人形机器人的数量要超过全球的人口数。
他谈到,人工智能的发展得益于大数据、算力、算法,其中数据是关键。现在数据成为一个很大的挑战,自然语言的数据相对来讲可存储、可开源利用的比较少,但中国工业门类齐全,中国拥有全世界最大的工业数据,但很多大企业有很多工业数据,但是自己不会开发,不愿意跟别人分享,跟别人合作的时候担心数据泄露,而很多中小企业没有数据。“从这个角度看,尽管理论上我国拥有很多工业数据,但实际上可利用的工业数据很少。”
怎么解决这个困境?邬贺铨建议,引入可信数据空间。“把自己的数据放到这个可信数据空间,相当于一个有围栏的沙箱,数据放进去可以是加密的,邀请相关的互联网企业带着大数据的开发技术进入到可信数据空间。既然是合作方,我把相应的加密的密钥告诉你,你可以在可信数据空间里对这些数据进行解密计算,计算的结果还给数据提供方。在可信数据空间里,数据不出去,而且数据是可用不可见的,邀请进来的互联网企业不可能带走这个数据。”
邬贺铨表示,通过可信数据空间,我们提供数据源的验证和接入身份验证,提供数据目录得以检索,提供敏感数据的过滤和去标识化,提供数据格式的转换,提供数据挖掘的工具,提供数据加密和解密的计算,提供数据安全的一些工具软件和合规检查,还可以提供一些数据清算、结算的软件。通过这些(措施),既保证数据搞活,又保证数据的安全,是激活数据、发掘数据要素价值的一个很有力的工具。
另外,他还强调,进入可信数据空间的数据要脱敏,特别是政府掌握了大量的个人信息数据,包括电信运营商、金融企业都有大量的个人数据,这些数据可以运用,但是需要进行脱敏,要去标识化,也就是在传输过程中是把它扰乱的、偏置了,在传输中是不可能解释出来,接收端可以还原。真正的跨境数据要匿名化,不可能还原。除此之外,他提到,计算要进行加密计算,企业A要用企业B的数据,企业B要用企业A的数据,但实际上谁都不愿意把原始数据送出去。解决的办法是采用一个特定的密钥把这个数据加密了,以加密的数据来计算,计算的结果跟不加密是等效的,但是原始数据谁也拿不走。
但是,邬贺铨也指出,能不能接入到数据可信空间,还是需要验证的,因为只有协议的双方才能够共用这个可信数据空间。“所以,可信数据空间实际上是希望政府来投,并且一些大企业带头,建设真正可信数据空间,解决数据不会用、不敢用、成本太高的难题,同时免除提供数据的和使用数据的双方一种怕数据违规、怕数据泄密、怕违反规定登顶担心,希望通过这种方式,把我们真正的工业数据大国变成真正把工业数据用起来。”他说。
邬贺铨进一步提到,虽然行业大模型生成还是有一定的挑战,但是基础大模型本身也是可以直接用在企业的智能客服、人工培训、智能风控,打通供应链的上下游。如果用到生产线上,还需要加入很多产业的支持。
他举例到,广州Shein公司本来是一个境外销售的女装公司,现在变成一个B2C的快时尚公司。公司利用珠三角大量的服装企业,提供服装设计、品牌、采购、销售合金融、市场等服务,现在已经成为54个国家手机上边的移动购物首选app,即将上市,估值超过千亿美元。
此外,他提到,三一重工是一个供应链的龙头,它把上下游的供应链企业关联起来,关联到相关企业的生产装备,做到了整个供应链的生产自动化有序地管理,降低了库存。