江苏银行“数据治理”实践对中小银行的启示
2023/7/13 11:59:32

2021年12月、2022年1月,人民银行、银保监会相继发布《金融科技发展规划(2022-2025年)》《关于银行业保险业数字化转型的指导意见》,指出稳妥发展金融科技,加快金融机构数字化转型,明确了“十四五”期间金融数字化、智能化的发力方向。

近年来,在监管部门的指导下,江苏银行以数字化转型为契机,坚持问题导向,依托企业级数据治理平台,统一数据标准、打破业务板块壁垒,提高数据使用率,为精准营销、智能风控和智慧经营提供有力支撑。

数据治理有两大驱动力

数据的科学有效治理是构建完善、共享、统一管理数据环境的基本保障和重要组成部分,是把数据作为资产来管理的有效手段,更是数字化转型发展的前提与数据释放出价值的关键。

企业进行数据治理有两大驱动力:一是通过提高数据质量实现更多的业务价值。二是将实现业务目标作为数据管理和服务的核心驱动力,优化数据架构,提升数据仓库和信息化系统建设,支持管理能力的提高和精细化,以及决策的科学性。

之所以长期存在各类数据质量问题,是因为全行数据散落在各个业务系统中,没有进行有效整合,形成竖井式架构,造成多个信息孤岛,且整体架构缺少一个稳定的、抗源变化的保存最细粒度历史数据的数据层,无法支撑未来共享性应用。同时,缺少统一的基础数据标准和应用分析标准,而且针对数据质量问题没有归纳总结,缺少反馈机制。

针对以上情况,江苏银行按照数据治理框架、明确目标、完善设计,健全法规,搭建企业级数据治理平台,实现跨部门的数据汇聚,奠定数据应用基础,并采用基于元数据的数据血缘关系分析方法及大数据挖掘技术进行挖掘分析,逐步优化行内数据架构,建立全行数据质量治理和管理体系。

数据治理平台的三个应用方向

江苏银行企业级数据治理平台有以下几个应用方向。

第一,监管数据质量问题。通过分析源系统表数据,从及时性、完整性、准确性、有效性、一致性方面对源系统数据进行数据校验,发现并记录数据质量问题,生成数据质量问题报告。

数据质量监管主要分三步实施:一是在源系统分析阶段,全面分析主要相关的源业务系统。二是在数据质量问题检查阶段,根据制定的检查规则编写程序,对源系统数据进行检查。三是在数据质量问题分析阶段,分析有质量问题数据对现有应用的影响并提出解决措施。

第二,数据标准统一口径。针对基础数据和指标数据制定全行统一的标准,实现业务数据信息统一定义、统一命名、统一来源。

基础数据标准。参考人民银行标准规范文档定义的基础数据标准框架,从业务属性、技术属性、管理属性三个方面对我行日常业务开展过程中所产生的基础性数据,对数据的业务表达、数据格式、数据关系等方面进行一致约定,从而规范数据在全行内外共享和使用中的一致性和准确性。实现对数据、应用过程的统一管理和规范,并明确数据的定义、格式、规则以及数据与数据间的关系,为系统开发实施提供全行统一的规范准则,为数据加工和应用提供统一来源和依据。

指标数据标准。通过对我行经营管理资料的分析,并参考同业的类似成果以及监管部门要求,梳理和筛选出直接反映我行业务经营管理状态的重要指标,并对指标的业务含义、业务规则、统计口径等内容进行标准化定义,形成全行一致的指标数据标准。从而统一全行对各项经营指标的理解和认识,促进各项经营指标在经营管理决策中的运用,解决我行取数口径不一致、业务含义不清晰、指标分类不清晰的情况,促进部门间的数据共享。

第三,数据架构优化搭建。基于数据的属性、实体、视图、主题的层次架构优化我行数据架构,建立贴源层、整合层、汇总层、应用层的数据仓库模型框架,建设稳定、可扩展的数据仓库。

整合层,即数据明细层,基于贴源层的原始数据,在数据最细粒度的基础上保证数据质量,该层采用一些维度退化手法,减少事实表和维度表的关联,从而提高数据的易用性。

整合层主要实现了以下五个功能:1.明确业务含义和数据来源,确保字段业务定义的唯一性,形成全行统一的业务视图。2.保留了业务系统中最细粒度的业务数据,保证可以支持明细级的数据查询和分析应用。3.保证模型对未来业务进行业务支持的快速响应,不需要随业务的变化而频繁调整整合层模型。4.涵盖我行主要源业务系统的业务信息,提供全面的业务数据,可以为客户、风险、绩效等各类分析应用。5.可以完整保留业务系统的历史数据,保证了对历史类查询分析的支特。

汇总层作为整合层和应用层的衔接,从业务的视角出发,提炼出对数据仓库具有共性的数据访问需求,抽取出公共指标,形成由维度和指标组成的维度模型,对符合要求的数据进行预汇总和预加工。为应用层统一提供规范的、准确的数据,完成整个汇总层的逻辑模型、物理模型的设计并全部实现物理化,并根据业务性质将业务数据划分为主题分类存放和管理。

数据治理平台的两大核心功能模块

为有效整合全行数据,防止竖井式架构和信息孤岛问题,江苏银行企业级数据治理平台建设了两大核心功能模块——基于数据血缘关系分析的元数据管理系统及数据质量检核系统,打造了大数据平台框架和数据治理生态。

元数据管理系统具备多种数据分析功能:

一是差异分析。通过对元数据对象关联的其他对象或参与加工过程的不同元数据对象之间进行分析,检测对象之间的差异和关联情况,对相似的指标从业务定义、数据生成等多个方向进行对比分析。

二是问题定位分析。直观地展示以某个元数据为起始节点,其后与其有关系的所有元数据,反映数据的流向与加工过程,分析数据流向和定位数据转换过程中出现的质量问题。

三是指标波动分析。当某个指标(如1104报表中的“个人经营性贷款”)出现较大的波动时,可进行溯源分析,判断是由哪条数据发生变化所导致的。

四是数据整体分析。判定系统和数据的健康情况,是否存在大量的冗余数据、无效数据、无来源数据、重复计算、系统资源浪费等问题。通过分析数据的血缘关系,能在每个环节注意到数据质量的检测结果和处理方式,更高效、直接地提高企业数据质量。

数据质量检核系统利用预定义的可灵活定制的质量检核规则对源系统基础业务数据进行全面的数据质量检查,并实现重要业务数据质量的周期性动态检查,对发现的数据质量问题生成数据质量报告,以便准确掌握业务系统各种数据质量问题,促进基础业务数据质量的提高。

打造数据治理生态,释放数字建设能力

在打造数据治理生态方面,江苏银行数据治理坚持“治用并举、以用促治”原则,从数据标准和数据质量入手,构建企业级数据质量治理和管理体系,推进数据资产化运营,形成从数据资产供给端到数据资产消费端的供求关系闭环管理,为精准营销、智能风控、智慧经营和监管合规赋能,实现高水平、高效率、高质量的数据质量支撑。

依托企业级数据治理平台,江苏银行统一数据标准、打破业务板块壁垒:

一是实现了数据治理过程中数据质量问题的发现、定位、下发、跟踪、解决的全流程闭环管理。

二是增强数据管理能力,加强数据质量控制,健全数据治理体系,为数据综合应用奠定坚实基础。

三是利于数据挖掘,支持各业务部门进行客户价值分析、客户行为分析、货款偿还预测分析、客户信用政策分析、业务关联分析等数据挖掘应用。

四是支撑数据应用,可提供全行级的最细粒度数据,满足未来建设决策支持系统如:客户关系管理、资产负债管理、管理会计、信用风险管理、管理驾驶舱等业务数据模型。

五是统一数据架构,对各类数据进行整合,统一数据标准,统一数据校验规则,发布标准数据目录,尽可能实现业务数据的全覆盖,保证数据架构的稳定性等。

在持续释放数字建设能力上,江苏银行紧跟监管动态,在强化数据治理能力的同时,树立以数据为核心资产的经营理念,解决“数据在哪里、数据有哪些、数据怎么用、数据怎么样”的难题。

一是梳理内部数据资产共十大主题目录,数据项近20万个;外部数据资产百余类,包括企业信息类,个人信息类,风险信息类、资源信息类、数据服务类、金融市场类,合计数据项超1万。

二是按照数据使用场景,从数据安全角度出发,制定数据分类分级保护措施,并结合隐私计算技术,形成全行数据安全体系。

三是以数据的最终价值驱动数据全链路运营过程,从价值倒推数据资产建设需要,通过数据红利推动业务部门数据治理和优化。

数据有效治理和数据质量提升是数字化转型发展的前提。以江苏银行为代表的区域性银行当前在数据治理与应用方面,仍存在源头治理不完善、业务口径不准确、存量数据待治理等问题亟待解决。

下一步,江苏银行将以实现数据价值为目标,驱动数据全链路运营过程,通过数据红利反向推动业务部门注重数据治理和整合,组织建立全行数据质量治理和管理体系,为精准营销、智能风控、智慧经营和监管合规赋能,推进金融创新与科技、数据的深度融合,为全行数字化转型做好数据支撑。

本文转载目的在于知识分享,版权归原作者和原刊所有。如有侵权,请及时联系我们删除。

展开全文
相关阅读
资讯查询取消