e993新闻网

热点新闻财经股市美股娱乐科技体育军事

e993新闻网 » 财经新闻

从 AICon 总结大模型落地现状

2024-05-20 16:38:56 - 市场资讯

转自：嫑关注

上周五、周六参加了两天 #AICon大会，中间还主持了一场关于大模型落地的闭门会（能进门的必须已经有实际落地经验）。周日沉淀一天，今天发个总结。

先介绍下AICon，它和技术领域顶级会议QCon 同由极客邦主办，是国内AI方向在工程技术、应用技术方面的顶级会议。据极客邦创始人霍太稳说，今年AICon参会人数已经超过了QCon，可见AI已经非一般的热了。

这两个Con 邀请的主讲人几乎没有老板，甚至CTO也不多，多数都是某个具体产品、方向的技术负责人，所以内容很实战。虽然搞PR的有，也会遇到公司限制不能讲这，不能讲那的，但因为是一线技术交流场景，主讲人都不想被同行喷，都想树立自己技术大牛的形象，所以在可能的范围内，干货输出是挺多的。

我们AGIClass.ai共去了四个人参会，散开听，再交流。总结如下：

模型厂商还拿不出像样的落地案例，Killer App影都没有。产品和技术的主要精力还在追赶OpenAI，提升模型性能上。

有场景、有技术的公司，对大模型相关技术的探索已经挺深了。哪怕是套壳，也套得很厚。效果不错，但还谈不上颠覆什么的，只能说值得期待，值得继续优化。但是不排除一种可能，就是效果太好了，可不能让别人知道。

搞微调的很多，甚至有做继续预训练的。但不少项目，辛苦做出的效果，用新模型不微调，大概率也能实现。在用量没上来前，微调的性价比优势也体现不出来。

多 Agent已经是主流的构造应用方式。但这个 Agent不是学术圈追捧的那种能做强planning的，而是工业界的一条专做一件事的prompt，就可以是一个Agent。

技术上基本只有做过没做过的区别，没有水平高低的区别。大模型相关的技术确实门槛比较低。但精细打磨出的prompt，是道护城河，谁都不愿意告诉别人。

能不能拆出合理的flow，以及把每个节点Agent调到最优是关键。这个flow不是简单映射人类工作的SOP，而是可以更细。比如喜马拉雅分享的AI写作，写开头和写结尾的都分别是两个Agent。

懂不懂业务，是能不能拆出合理flow的关键。这里的认知gap，远大于技术gap。抹平它，需要业务和技术的共同努力。

可能是技术大会的原因，感觉多数项目还是技术驱动的，而不是业务驱动的，尤其面向公司内部提效的特别多。不知道行业全貌是怎样的。产品经理们，赶快支棱起来啊！

今日热搜

© 2024 e993新闻网

阿里巴巴关键词排名查询