交行李肇宁:解析交通银行分布式数据库金融应用
金融电子化李肇宁2021/1/14 9:17:46

随着“互联网+”战略的持续深入推进,弹性可控的分布式架构深入人心。传统商业银行信息架构在转型过程中存在较大压力,核心焦点是如何选择合适的分布式数据库,在业务支撑方面承载海量数据高效存储和弹性扩展,同时具备低成本、高并发、高性能、高可靠、高可用的能力。

交通银行积极布局,从商业银行实际需求出发,自主建设面向金融业务场景的分布式数据库系统,并稳步有序推进金融应用实践。

交通银行金融科技部副总经理 李肇宁

深耕核心技术,践行自主可控

为响应国家关键技术安全可控战略,交通银行自2013年开始对国产分布式数据库产品进行调研。总体来看,当时市场上的几款产品在数据一致性、可用性、性能和容量可线性扩展等方面,可以部分解决银行海量数据存储和高并发访问的痛点,但金融应用尚处于起步阶段,且新技术本身仍存在数据一致性不足、可靠性不够、兼容性和易用性欠缺等问题。

在“底线思维、稳定生产、确保体验、重点先行、有序推进”的总体原则下,交通银行启动分布式数据库创新研制项目。以阿里Oceanbase 0.4版本为基础,自主建设分布式数据库(以下简称CBase)系统。Cbase数据库是一款以原生分布式数据库技术研发和应用实践为总体建设思路,面向商业银行交易处理特性,具有事务特性的关系型数据库系统。在应用实践中,最大程度地保护现有IT应用资产,降低架构转型的风险和成本。

目前,分布式数据库金融应用稳步有序推进,通过在交通银行12套重要业务系统中的应用实践,验证了CBase已具备独立承载大型商业银行业务系统运行的能力,同时全面提升了交行的服务研发能力、技术支撑能力。

项目践行国家自主可控战略,深耕核心技术领域,同步研发了基础能力平台和构件,探索了大型商业银行应用架构转型发展的新路径。

CBase建设的三个里程碑

CBase创新研制项目采用“应用驱动、问题导向”方式,至2020年8月已有序完成三个里程碑阶段任务。

1.2015年10月系统首次投产上线。完成首个迭代版本的研发工作,并在海量数据管理的历史库中试点成功。提供全行对私/对公客户的历史数据查询交易,日均交易量500万笔,平均响应时间低于200毫秒,替换SybaseIQ,同时验证数据库存储能力横向扩展,并具备7×24小时稳定运营能力。

2.迭代优化及规模化应用。一方面立足自主研发,依托自身科技力量完成整体架构设计,确保架构转型安全可控。2015~2019年,陆续完成SQL标准化、高可用架构、弹性伸缩、异地容灾、开发运维工具体系等多个迭代版本的研发。持续推动应用创新,先后在12套核心业务系统中规模化应用。目前网络支付场景已全链路使用CBase数据库,并从容应对2017~2020年“双十一”等“潮汐式”“爆发式”高难度业务场景。同步完善内部管理制度、业务连续性计划及运营保障流程。

3.国产体系生态建设。通过分布式数据库适配,推进不同芯片指令体系、操作系统、中间件在交通银行产品生态体系中的成熟应用。阶段性完成与国产X86芯片指令体系、国产操作系统的适配工作,具备投产能力。

项目亮点及社会经济效益

1.“双核异构”金融应用示范案例。在人民银行《金融科技(FinTech)发展规划(2019-2021年)》的指引下,为夯实后续深化改革和战略转型基础,交行稳抓时机启动“双核异构应用架构体系”(以下简称“双核异构”)项目。以大机核心业务下移为重点突破口,带动外围关键业务迁移改造,确保关键业务系统可连续运行。

“双核异构”整体架构以“集中+分布”并存的技术路线为基础,基于弹性、融合、敏捷创新的设计思路,构建开放核心业务系统。CBase数据库支撑上亿级别账户数据存储、上万TPS并发处理的业务场景,同时深化与内存数据库、消息中间件等技术产品的集成应用。首创采用“飞行中更换引擎”的方式,保持大机与开放核心之间数据、服务的对等和同步,交易可随时回切大机,对业务运营几乎无影响。

“双核异构”涵盖交通银行的核心业务处理内容及关联系统,开发测试工作量大、覆盖面广,高并发下的数据库处理能力、投产后的持续运营能力、应用系统开发人员转型等都是考验。各部门全力配合,有序完成了产品的替换和验证、重构后全部功能的测试和投产工作。

2019年3月,“双核异构”项目在首家试点行上线。研发团队攻坚克难,成功在9月完成高频核心金融交易下移至分布式架构并推广至全行。全行借记卡数据从DB2下移至CBase,借记卡网上支付场景的性能峰值提升到1万TPS。日常分流借记卡应用50%的交易量,“双十一”交易高峰期占比约90%,承载借记卡行内外支付类业务和代发类业务的全部交易。

2020年8月,完成所有借记卡类金融交易、全行核心账务系统下移,具备开放批量处理功能。计划至2021年底,完成大机上核心业务的公司类应用、公共类应用下移。

图交通银行“集中+分布”式融合架构

2.社会经济效益实现共赢。CBase数据库的金融应用不仅解决了分布式架构下数据库系统选型的痛点,同时也在逐步努力改变“核心技术受制于人”的不利局面,是金融行业应用先进技术支撑金融服务创新的成功实践。

经济效益方面,自主研发数据库替代商用产品,进一步降低了数据库产品的投入、维保以及系统运维等成本。贷记卡授权系统分流高并发时的主机应用压力,节省了上亿元的主机MIPS资源投入。“双核异构”通过自主研发的新核心应用架构和原生分布式数据库技术,按开放分布式核心替代大机借记卡应用的日常交易量占比50%估计,预计已节省了4000MIPS左右主机资源投入。随着后续各类应用交易逐渐下移,将持续发挥降本增效作用。

社会效益方面,一是提升银行核心竞争力及企业形象。在多个核心业务系统保持原有稳健服务的情况下,通过分布式数据库新技术应用,提高了核心业务系统的服务支撑能力以及自身风险管理水平,满足了客户的多元化需求。二是形成行业示范案例。交行的建设实践不仅填补了国有大型商业银行核心业务领域“准替代”方案的空白,而且在稳步推进中逐步具备“成熟产品替代”能力,具有鲜明的行业示范作用。先后获得2017年、2019年人民银行科技发展奖二等奖,2015年银行业信息科技风险管理课题二类成果,2017年银行业信息科技风险管理课题一类成果和2017年教育部科学技术进步一等奖等荣誉。三是践行国家关键技术自主可控战略。数据库的自主可控对于企业的数据安全、业务稳定具有重要意义。分布式数据库金融应用模式的创新和推广,将推动整个银行业摆脱对国外商业数据库的依赖,极大地促进国内数据库产业的蓬勃发展。

下一步重点工作

在北京金融科技产业联盟的工作框架下,交通银行将积极参与分布式数据库专委会相关任务,在行业标准制定、生态联合实验室等领域与会员单位开展合作,推动我国分布式数据库产业有序、良性、可持续发展。

同时,继续加大对现有CBase分布式数据库的研发投入,完善产品化体系及国产生态建设。通过以分布式数据库为代表的基础软件研发,分散科技供应链不可控的系统性风险。此外,有序推进分布式数据库在金融应用中的探索和实践,结合产学研合作和产业孵化,为分布式数据库产品的迁移保障规范、新型运维体系等行业难题探明方向。


展开全文
相关阅读
资讯查询取消