2024年度上市公司数字化转型最佳实践丨东兴证券:投行智能复核系统
为进一步落实党中央、国务院关于发展新质生产力、打造数字经济新优势等决策部署,坚定实施数字化转型任务,推动数字经济发展,中国上市公司协会开展了上市公司数字化转型最佳实践案例征集活动,并从技术领先、场景创新、社会价值贡献、产业链建设四个维度遴选出了40个优秀、69个典型案例入选《上市公司数字化转型典型案例》,这些案例集中反映了上市公司在数字化转型过程中的实践、挑战与成功经验,为上市公司开展数字化转型提供参考和借鉴。
一、案例简述
东兴证券投行智能复核系统是在加快推进公司投行业务转型升级的进程中,打造的智能化、数字化投行工作平台。
系统运用行业领先的人工智能、自然语言处理、深度学习等技术,建立了文档解析、公式抽取、数据校验等方面的分析算法和模型,打造了客户端到服务端的数据闭环,系统性提升了投行业务效能,完善了尽职调查工具与能力,提高了信息披露材料质量,并降低内核风险。
系统基于金融文档认知过程架构,支持从文档语义、文章段落和表格语义、语句和单元格语义等不同粒度对文档内容进行理解和信息结构化处理。搭建了面向金融文档的知识图谱,在利用机器对金融文档进行结构化和深度理解的基础上,完成语义检验、一致性校验、勾稽关系校验和指标公式校验等复核功能,实现了基于认知推理的智能复核应用,为公司投行业务场景提供数智化支持。
二、转型工作情况
(一)战略规划
公司制定了“战略引领、数字驱动、平台赋能、协同创新,共建智慧东兴”的数字化战略,公司致力于构筑数字化体系,培育数字化基因,以智能化为切入点赋能业务和管理,全面实现“智慧东兴”。
(二)业务模式
投行智能复核系统服务公司投行条线共计超五百人,审核类型覆盖全投行业务,包含上交所、深交所、北交所、交易商协会、中债登等业务链条。应用场景主要在内控审核及对外申报阶段,复核人员将投行项目的全套申报文件,以及其他中介机构出具的文件,共同导入智能复核系统进行交叉校对,识别出申报文件中数据勾稽关系错误、格式编排错误、段落描述前后不一致、公式逻辑不符、错别字等问题,再由复核人员加以校订。智能复核系统不但能提高投行项目申报文件的质量,还能用于日常办公文件的智能复核,提高全公司各类型文件的质量。系统自上线以来,截至目前已开展多个项目累计近两千次智能复核工作,合计四千五百多份文件,初筛出一百零五万处各类型问题线索。
(三)技术架构
进行金融文档智能语义分析的核心在于对文档的细粒度理解和数据结构化。系统在智能计算框架的基础上,基于自然语言处理(NLP)技术,以Bi-LSTM+DAG-LSTM模型为基础,并辅以结合了视觉特征与语义特征的卷积神经网络,针对富格式金融文档内容进行定位、识别、提取和存储,并外延到事件提取、嵌套关系处理、因果关系推理等复杂关系处理,实现快速高效地从形式多样且内容冗长的金融文档中提取出关键信息,支撑文档智能复核、检索、撰写等应用场景。
系统技术架构如下:
智能复核的核心模块:
1、文档结构识别模块。基于数千万页面的标注数据,结合计算机视觉和文本信息,研发了文档结构识别技术,攻克了无线框表格识别、表格跨页识别、复杂排版页面的结构识别等难题。系统将文档结构通过CNN(卷积神经网络)模型和RNN(循环神经网络)进行结构识别和切分,基于语义分割模型,对文字内容进行定位、深层次理解,并将非结构化数据结构化,构建知识图谱,形成能全景动态展示的结构化知识。
2、语义抽取和理解模块。基于文档结构识别的结果,通过自然语言及表格内容的信息抽取分别理解文本段落和表格,采用Foundry平台进行自然语言理解和表格理解,研发了从自然语言和表格中进行信息抽取的成熟模型,全方位支撑语义理解的各项任务。
创新点包括:
1、基于计算机视觉+深度学习模型+自然语言处理的系统,结合投行领域的知识基础,将技术与业务进行深度结合,实现了对金融领域专业文档的解析、提取、理解、复核。
2、构建闭环的模型生态,不仅可以使用模型解决业务问题,而且可以通过业务的使用不断优化模型,实现持续进化。
三、转型成效
智能复核系统有效解决了长期以来,通过人工比对方式对文件进行复核的弊端,即交叉复核难度较大,不能有效识别出所有问题。系统应用的成效在于:
撰文效率提升。项目组能通过智能复核系统,快速识别出各文件之间的勾稽问题,减少人工判断成本和人为错误,提高底稿文件及申报材料的编撰效率。
审核效率提升。通过智能复核系统,内控人员能快速形成对申报文件质量的判断,文档审核时间被大幅缩短,将内控人员从繁琐的基础复核工作中解放出来,可以将更多精力放在审核项目业务逻辑,财务分析等更深层次内容上,更有针对性地提高项目质量。
经济效益增加。业务人员与内控人员基于同一系统进行复核,导出带标识的文件进行有效沟通,降低了沟通成本。同时通过系统输入项目数量不断增多,复核模型也不断进行优化,实现持续进化,全面有效地提升系统能力,形成良性循环。
四、面临的痛点难点及建议
随着金融科技的不断发展,投行数字化转型需持续纵深发展。
(一)投行数字化创新机制亟待进一步加强
投行作为数字化原生行业,在大量电子数据处理的过程中,手工处理仍占大多数,包括尽调、底稿收集整理、申报文件协同编辑、其他中介机构资料的验证提炼等;面对海量数据,仅靠智能复核系统在复核环节发挥作用难以全面,应构建投行各环节数智化转型,全面提升投行业务竞争优势。
(二)投行数字化人才投入待加强
投行数字化是个新兴领域,复合型人才队伍尚未形成。建议在投行数字化转型中,加强整体规划布局,加强投行数字化人才培养和引进,实现针对市场环境与监管要求的快速反应、快速迭代与上线,实现投行业务数字化、智能化、精细化管理。