落地有声｜AI能让你更容易找到市场的“阿尔法”吗？

2024-06-24 12:46:42 - 澎湃新闻

【编者按】由ChatGPT引发的大模型热已一年有余，围绕大模型创业的公司也如雨后春笋，技术最终要为产业所用才能创造价值，当大模型落地千行百业，能够发挥怎样的价值？澎湃科技走进产业一线，访谈创始人、专家、投资人，调研大模型落地产业现状。本文为c访谈。

·大模型在金融领域成功落地的关键是选择合适的应用场景，打通大模型、垂域AI“小”模型、传统金融工程模型、行业内外部知识库和应用系统。轻量化模型的出现降低了大模型应用门槛，促进了AI平权和知识平权。选择一个适合自己的基座模型，模型不一定越大就越强，数据是决定模型效果的关键因素。

恒生聚源CEO吴震操。

大模型进入金融领域，能更顺利找到市场的“阿尔法”（超额收益）投资机遇吗？金融、产业数据资讯服务提供商恒生聚源CEO吴震操日前对澎湃科技（www.thepaper.cn）表示，不要认为大模型来了就可以直接用来做投资或者交易决策，这样是走不通的。

数据是决定大模型效果的关键因素

“金融行业最大愿望就是使用AI做投资决策，找出好的标的，寻找自己的‘阿尔法’（超额收益）。”但吴震操表示，不要认为大模型来了就可以直接用来做投资或者交易决策。

成立于2000年的恒生聚源是恒生电子（600570.SH）旗下子公司，拥有金融数据库、智能投研、金融市场终端等产品线。吴震操希望未来能发挥生成式大模型更快、更强、更高效处理信息的优势，与现有金融工程模型结合，“大模型成功落地，关键是打通大模型、垂域AI小模型、传统金融工程模型、行业内外部知识库和应用系统。其中，数据是决定大模型效果的关键因素。”

“金融数据行业靠信息、知识和生态连接赚钱。大模型出现后，对信息的抽取、整合以及知识的生成范式产生极大改变。”吴震操表示。

恒生聚源有大量的员工在负责数据采集、数据清洗、数据治理等技术和分析工作。在内部，利用AI提升数据自动化处理能力是最基本的诉求。对外销售数据和知识，让客户更精准地发现其所需的知识和信息是首要目标。

海外金融大模型兴起后，恒生聚源在2023年中旬，基于自己训练的垂域金融大模型升级了新一代的智能投研平台WarrenQ，面对金融行业的研究、投资、交易、风控、合规场景，把投资研究作为大模型的第一个落地场景，通过WarrenQ上的Chat、ChatMiner等智能产品服务买方和卖方的研究团队。

金融机构长期以来积累的业务文档、投教文案、法律法规政策文档、研究报告、投行底稿等是机构内部大模型落地的理想语料。通过“大语言模型+搜索+向量数据库”的方式将私域知识数据与大模型结合，做到私有知识库问答。举个例子：在动辄数百页的招股书、年报、半年报中，干货藏于大量模板套话和风险免责提示中。WarrenQ可以基于大语言模型+向量库的定向文档问答检索和定位溯源，从海量文档中挖掘重点信息，同时利用研究员高频重点关注的内容优化提示工程，进一步优化推荐“猜你想要”功能。

“大模型工具化越来越明显。”吴震操说，从问答工具到Copilot（辅助工具）再到智能体（Agent），大模型对于生产力的效率提升幅度越来越高。过去基于自然语言处理（NLP）等技术将研报财报分词、语义分析，但效率低下，准确率不高，仍然需要大量人工干预。基于知识图谱开展智能投研可以做到信息精准，缺点在于有多少人工就有多少智能，需要持续投入大量资源维系不停生长的图谱。大模型出现后，这些工作的效率和效果突飞猛进。“以‘AI智能客服’为例，我们用这个工具准确并高效地对各类数据产品进行解读和答疑解惑，全面提升了服务效率，让智能客服能够精准识别用户意图，从而实现金融数据的端到端实时查询。”

关键是数据和Know-How

“在金融行业，对大模型响应最快的是彭博，彭博利用自己的内部语料训练模型，在ChatGPT出现没多久就推出了BloombergGPT。行业第二大厂商伦交所走了另一条路，他们和微软合作，微软又是OpenAI的最大股东。”

大模型迭代速度快，训练成本高。“上述金融机构的大模型之路也说明脱离场景讲大模型，商业模式很难长久。”吴震操表示，自研基座大模型本身不是一条宽广的赛道，很多机构一没有充足的算力，二没有充足的算法人才，此外缺乏足够的领域数据支撑大模型业务生态。在他看来，未来大模型一定要和应用场景紧密结合。基座大模型的玩家有限，但把大模型应用在垂直场景中，市场将是无限的。

进入垂直行业解决实际问题时，必须提高大模型的可控性、可靠性、可解释、可追溯，这是吴震操最深刻的体会。金融等强监管行业对可靠性和合规性要求极高，幻觉是大模型落地面临的挑战。恒生聚源解决这个问题的方式是把大模型当作知识入口，相当于搜索引擎或图书管理员，让大模型的生成可回溯。

“我们没有用大模型本身来做知识生成，因为它是基于概率的算法，不可能百分百准确。金融行业有很多复杂金融工程模型，现在的大模型还无法超越当前所学的复杂统计学知识，生成复杂的金融工程模型，计算出一个复杂衍生品的价格波动。以现在的模型情况，再给它三五年，它也做不到，海外的模型也一样。”在吴震操看来，大模型成功落地的关键是选择合适的应用场景，打通大模型、垂域AI“小”模型、传统金融工程模型、现有知识库和应用系统。轻量级模型的出现降低了大模型应用门槛，促进了AI平权和知识平权。“没有场景的支撑都是在浪费资源。其次，选择一个适合自己的基座模型，模型不一定越大就越强。更大模型需要更多的算力，也需要算法和技术团队维系。”

吴震操认为，大模型继续往前发展，一定会改变企业内外部的知识交互，未来也一定会改变人机交互方式，Agent+知识管理是大模型赋能的最佳组合。但在金融领域，银行、交易所的历史长达四百多年，从工业时代到信息时代、人工智能时代，银行、交易所的商业模式本质上都没有发生任何改变。“大模型彻底颠覆金融机构的商业模式很难发生，但当大模型改变一些场景中的范式，就会带来新的业态，这一点在C端应用中将更加突出。”吴震操说，这就像移动支付实际上并没有改变买卖和支付这件事的本质，但给整个市场带来了新的红利和便利，创造了新生态。“大模型同样如此，大模型短期内不会彻底改变金融机构的商业模式。在B端应用当中，大模型的作用仍是降本增效；而在C端应用中，倒是可以期待大模型带来的生态变革。”