2024年度上市公司数字化转型最佳实践丨中信建投:证券行业湖仓一体数据平台的研究与建设

2024-08-09 15:21:27 - 中国上市公司协会

为进一步落实党中央、国务院关于发展新质生产力、打造数字经济新优势等决策部署,坚定实施数字化转型任务,推动数字经济发展,中国上市公司协会开展了上市公司数字化转型最佳实践案例征集活动,并从技术领先、场景创新、社会价值贡献、产业链建设四个维度遴选出了40个优秀、69个典型案例入选《上市公司数字化转型典型案例》,这些案例集中反映了上市公司在数字化转型过程中的实践、挑战与成功经验,为上市公司开展数字化转型提供参考和借鉴。

中信建投证券股份有限公司(601066.SH)

证券行业湖仓一体数据平台的研究与建设(优秀案例)

证券行业进入数字化转型的深水区,在宏观政策和监管层面,数字化转型的核心目标之一是推动基于数字化技术和数据资源的金融创新有序发展,这也对证券公司的数据基础设施提出了更为明确和严格的要求。针对这一挑战,中信建投证券股份有限公司(下称“中信建投”)在“科技赋能、运营升级,以数字化转型助推客户服务体系建设”的战略目标下,通过整合湖仓一体的新型数据基座架构,解决公司数字化转型过程中面临的数据供给效能低的问题,提升数据供给端的数据质量、数据资源利用效率以及数据消费端的灵活易用的数据分析能力,为业务发展提供数据支撑和决策依据。湖仓一体化平台的建设为公司的全面数字化转型奠定坚实基础,同时为证券行业数字化转型中数据基座的建设提供了新的实践参考。

一、转型工作情况

随着数字经济的崛起,科技不仅是工具,更是驱动业务、管理和服务模式全面重构的核心力量。面对这一变革,中信建投把数字化转型作为公司三大重点任务之一,持续深化推进数字化转型。在公司内部提出了树立“管用结合更求用、质量并举更讲质”的高质量数据运用理念,围绕业务发展和管理决策需要,打造数据“治理+挖掘”双轮驱动,深挖数据价值,深化数据能力和数据资产建设,夯实数字化转型基础,充分发挥组织优势、人才优势,力出一孔,形成业务、科技、数据三方面的有效协同。各部门开展建设“数字化转型抓手工程”与公司战略及数字化转型目标有机结合。

(二)业务模式

数据作为数字经济时代新的生产要素,成为推动经济高质量发展的新动能。证券业作为数据密集型行业,在企业经营和服务客户过程中会采集、存储、加工、应用大量数据,数据价值正在各业务领域的发展变革中不断释放,并持续发挥着重要作用。

中信建投沉淀了海量客户信息和经营数据,连接多种外部数据,同时,面临数据资产管理与业务发展不匹配、数据质量难以及时满足业务预期和潜在安全风险等一系列挑战和问题。在这一背景下,规划和建设敏捷高效、自主可控的前瞻性数据平台,统一整合和标准化公司沉淀的数据资源,形成公司级统一数据底座,保障数据的高效流通和共享,高效地支持全公司各个业务条线与技术条线全面开展不同层次的数据分析工作,推进数据资产价值持续提高,形成数据价值体系与文化。

(三)技术架构

中信建投在数字化建设中,早期分别基于MPP架构和Hadoop技术栈构建了数据仓库平台与企业数据湖,整合了核心业务数据源,随着数据量和数据应用的快速增长,MPP+Hadoop方案的局限性逐渐凸显:数据平台、数据集市之间的数据孤岛问题加剧,导致数据和信息难以流通,大量的数据冗余增加了存储和管理成本,数据处理性能难以满足日益增长的业务需求。通过深入剖析双架构模式,从技术视角发现无论是MPP还是Hadoop,或是MPP+Hadoop组合都存在技术局限。此外,双平台之间频繁的数据迁移和同步不仅增加了系统的复杂性,还对数据的一致性和时效性构成了严峻挑战。双架构并行往往涉及众多的技术组件,使得平台变得复杂,增加了系统出错的概率和运维成本。面临多模态的数据处理问题,存储形态的差异导致基础数据的副本数越来越多,数据冗余严重。

在这样的背景下,中信建投充分利用大数据处理领域的新技术和新架构进行湖仓一体平台的规划和建设,通过存储层、计算层、租户应用层三层,灵活应对数据规模、数据计算、数据用户的“弹性”需求。存储层转变为低成本、开放的、支持多种数据类型的存储集群,;计算层则是提供数据管理特性和高效访问性能,能够支持多样数据分析和计算。通过存算分离架构实现节点的灵活扩展,减少数据搬迁,提升数据可靠性和一致性。依托国产硬件、国产操作系统以及国产分布式数据库,构建了一个具备云原生、数据一致性、无冗余、超高并发、多类型数据支持以及实时处理能力六大特性的湖仓一体基础数据架构。打造了既符合国产信创替代战略,又能满足金融科技高度可靠、安全和稳定需求的湖仓一体基础数据服务体系,实现全量数据、全域数据服务的并行支持。

2024年度上市公司数字化转型最佳实践丨中信建投:证券行业湖仓一体数据平台的研究与建设

二、转型成效

湖仓一体数据平台作为新一代数据基座是支撑公司全面数字化变革的关键底座,充分发挥数据要素价值,助力提升公司金融服务实体经济的质效。

(1)构建“平台、数据、模型”一体化的数据供给能力

在新一代数据平台能力基础上聚焦为全公司提供完整、可信、一致、准确、及时、易用的全域数据,打造了一套端到端的数据流水线,建设企业级数据模型实现数据资源的整合与标准化,实现了数据全域入湖入仓,支持非结构化数据存储,为全行数据应用提供统一的数据基础,实现批量数据需求满足度达90%以上,实现了一份数据支撑多种应用,减少了多系统间数据冗余存储量50%以上。

(2)提升数据时效、深挖数据价值

通过不断丰富实时数据,优化数据供应链路,缩短数据入湖入仓时间,增强高频率批量数据处理能力,支撑业务需求的实时响应,提升数据供应的时效性。以“批量+实时”的服务方式和精细化运营能力为依托,保障数据的高效流通和共享,高效地支撑各个业务条线与技术条线开展不同层次的数据分析工作,推进数据资产价值持续提升。

(3)数出同源,统一数据口径、提升数据质量

“数出同源””是提升数据一致性和共享性的有效途径。以数据仓库企业级数据模型为基础,面向跨业务线统一整合不同数据源的数据,保障重要基础数据和指标的单点加工,统一提供批量数据服务和API接口形式的数据服务,将数据能力灵活、可控地嵌入业务流程。数据资源层面,汇聚整合全公司重要业务系统约万张结构化元数据库表,沉淀经纪、自营、投行、风控、财管等领域4000余项业务指标和标签。

三、面临的痛点难点及建议

有数不一定能用好数。在数字化转型过程中,大型公司内部的数据孤岛现象普遍,数据共享和利用受阻。加之数据保护法规的严格,如何在合规的前提下高效利用数据成为一大挑战。同时,数据隐私与安全问题不容忽视,确保数据在收集、存储、处理和分析的各个环节得到妥善保护至关重要。

为克服这些难题,公司需制定明确的数字化转型战略规划,明确目标、步骤和预期成果。建立完善的数据治理体系,明确数据所有权、使用权和共享规则,促进数据共享与沟通,加强对数据资产充分利用。

今日热搜