奇富科技杨剑:金融大模型拼的不只是参数
来源:财经E法
“
本文字数1748,阅读时长约5分钟
文|特约撰稿陈美拉
编辑|郭丽琴
11月24日,DataFunCon2023在深圳举办,本次大会以“大模型时代的变与不变”为主题,探讨大模型的技术变革、产业实践及未来发展趋势。作为金融科技的代表性企业,奇富科技首席算法科学家费浩峻和大模型专家杨剑受邀出席,与多位技术专家共同探讨大模型发展路径,分享奇富科技大模型的技术特性及实践成果。
奇富科技大模型专家杨剑出席DataFunCon2023
杨剑采用深入浅出的语言,把金融行业大模型比作一辆复杂构造的汽车。业务理解是这辆汽车的中控,技术储备是汽车的框架,而安全合规则是汽车的方向盘。在这辆大模型汽车上,金融行业独有数据充当燃料,逻辑推理则是发动机和动力系统,算力储备就如同汽车的轮胎,保证汽车可持续行驶。行业规范和安全隐私保护则构成了大模型汽车行驶的道路,而复杂的金融业务场景则是指示牌,引导汽车按照规律行驶。
金融行业大模型有着比其他行业大模型更高的复杂性。就像高速上行驶的汽车需要不断调整方向和车速,以适应不同时间、不同地点的道路状况,金融行业大模型也需要及时调整以适应多样化的复杂业务场景。由于金融行业大模型的容错率极低,一次错误的决策可能导致无法估量的时间和成本损耗,因此对于这辆“汽车”而言,方向的准确性至关重要。此外,考虑到金融行业的特殊性,其合规要求相对于其他行业更为严格,这使得大模型汽车必须在规范要求的道路内行驶,不能随意越线。
为了更好地处理多样化的复杂业务场景,确保金融行业大模型的安全规范应用,杨剑提出了一系列观点。
首先,他强调金融行业大模型必须要由人来驾驭,强调了人机协同的必要性。大模型作为对人的一系列反馈、帮助和建议,需要在实践中与人类合作,共同推动业务的发展。
其次,金融行业大模型容错率低的特性,也决定了其需要更高的可靠性。因此,奇富科技将大模型应用主要集中在若干领域优先尝试,如营销系统识别、AI客服、代码SQL纠错、AIGC自动化投放、风险辅助识别等几个场景,以提高大模型的可靠性和稳定性。
第三,建设金融行业大模型必须具备软硬实力。在软实力方面,需要具备深入而敏锐的业务场景洞察,以及严格的合规把控。在硬实力方面,多维度且数量充沛的数据、深厚的技术积淀、可持续调用的充足算力都必不可少。
以奇富科技为例。从业务场景洞察上看,奇富科技通过深耕业务,将金融业务流程拆分成一系列可智能化场景的能力,在业务理解、数据理解、技术拆解、技术赋能四个角度上,都具备成熟的方法论和实践经验。
在数据方面,奇富科技通过利用海量数据,如金融图谱数据、用户对话数据、金融行为数据、高频问答数据以及行业报告数据,帮助大模型理解信贷业务的场景、产品与规律。金融领域大模型不仅仅是算力、数据和参数规模的比拼,更需要进行差异化、精确化的数据筛选,以提高参与训练的数据质量。奇富科技通过低质过滤、冗余去除、质量打分、数据分类、隐私消除、数据筛选、token切分排序拼接等多个步骤,最终压缩筛选数据集合,挑选最可信可用的集合进行后续训练和优化。
在技术储备方面,奇富科技拥有多模态和NLP领域的长期技术积累。其涵盖全场景的语音机器人,专属场景的图文识别,大规模应用于风险管理、意图识别、广告营销场景的自然语言处理,以及规模化的知识图谱,都为大模型的发展提供了坚实的技术基础。通过这些经验,奇富科技在金融领域大模型建设中展现了较为完善的方法论和实践经验,为应对多样化、复杂的业务场景提供了有力的支持。
在金融大模型落地的实践中,奇富科技通过大模型的强大赋能实现了令人瞩目的业务成效。在电销系统中,语义分析和线索挖掘帮助提升电销线索识别准确率高达98%,同时将转化率提高超过5%。在智能营销环节,大约70%的图片素材由大模型生成,并通过大模型对素材进行标注和多维度评级,以实现广告投放的优化。在通话质检环节,大模型自动化质检实现了100%覆盖,将检出率提高了15%。在语音机器人话术生成场景,生成话术优质率已达70%。
奇富科技在大模型建设中所形成的方法论和实践经验,为整个金融行业提供了宝贵的参考。杨剑总结,在复杂多变的金融业务场景中,只有通过深刻理解业务、精准利用数据、不断创新技术,才能充分释放出大模型的潜力,发挥出其对于业务的巨大价值。