从 AICon 总结大模型落地现状

2024-05-20 16:38:56 - 市场资讯

转自:嫑关注

上周五、周六参加了两天 #AICon大会,中间还主持了一场关于大模型落地的闭门会(能进门的必须已经有实际落地经验)。周日沉淀一天,今天发个总结。

先介绍下AICon,它和技术领域顶级会议QCon 同由极客邦主办,是国内AI方向在工程技术、应用技术方面的顶级会议。据极客邦创始人霍太稳说,今年AICon参会人数已经超过了QCon,可见AI已经非一般的热了。

这两个Con 邀请的主讲人几乎没有老板,甚至CTO也不多,多数都是某个具体产品、方向的技术负责人,所以内容很实战。虽然搞PR的有,也会遇到公司限制不能讲这,不能讲那的,但因为是一线技术交流场景,主讲人都不想被同行喷,都想树立自己技术大牛的形象,所以在可能的范围内,干货输出是挺多的。

我们AGIClass.ai共去了四个人参会,散开听,再交流。总结如下:

模型厂商还拿不出像样的落地案例,Killer App影都没有。产品和技术的主要精力还在追赶OpenAI,提升模型性能上。

有场景、有技术的公司,对大模型相关技术的探索已经挺深了。哪怕是套壳,也套得很厚。效果不错,但还谈不上颠覆什么的,只能说值得期待,值得继续优化。但是不排除一种可能,就是效果太好了,可不能让别人知道。

搞微调的很多,甚至有做继续预训练的。但不少项目,辛苦做出的效果,用新模型不微调,大概率也能实现。在用量没上来前,微调的性价比优势也体现不出来。

多 Agent已经是主流的构造应用方式。但这个 Agent不是学术圈追捧的那种能做强planning的,而是工业界的一条专做一件事的prompt,就可以是一个Agent。

技术上基本只有做过没做过的区别,没有水平高低的区别。大模型相关的技术确实门槛比较低。但精细打磨出的prompt,是道护城河,谁都不愿意告诉别人。

能不能拆出合理的flow,以及把每个节点Agent调到最优是关键。这个flow不是简单映射人类工作的SOP,而是可以更细。比如喜马拉雅分享的AI写作,写开头和写结尾的都分别是两个Agent。

懂不懂业务,是能不能拆出合理flow的关键。这里的认知gap,远大于技术gap。抹平它,需要业务和技术的共同努力。

可能是技术大会的原因,感觉多数项目还是技术驱动的,而不是业务驱动的,尤其面向公司内部提效的特别多。不知道行业全貌是怎样的。产品经理们,赶快支棱起来啊!

今日热搜