北京银行明立松:探索NewSQL混合型金融数据库的应用


来源:移动支付网    2020-5-30 11:47

5月28日,由北京金融科技产业联盟、移动支付网联合主办的“金融科技大讲堂”第三期准时开播,北京银行信息科技管理部副总经理明立松为大家带来了北京银行在数据库技术上的探索创新。

自主创新的探索思路

在数字经济时代,银行的数字化转型是必由之路。面对机遇和挑战,绝大部分银行做出了类似的选择:坚定不移的走金融科技道路。但是在道路的细分选择上各个银行又有一定的区别。

明立松认为,在今天这个情况下,银行面对着新的信息化建设问题:在已经有了大量存量系统的情况下,如何从架构、统筹的角度完成信息化建设,帮助银行进行数字化转型。

明立松表示,目前银行业同质化竞争非常严重,各大银行都想通过信息化建设加强竞争力,北京银行为了在细分领域形成不可复制竞争优势,选择了从底层技术入手,进行自主创新。

所谓自主创新,重要的不是碎片化的创新,而是要在统一架构之下,形成自己技术路线,将行业成熟的技术、产品有计划、有步骤的整合到现有的存量系统当中,并且融入到整体IT系统里。

基于这个思想,在部署NewSQL数据库的同时,进行了底层技术研究和产品的自主研发。明立松表示,产品方面,数据库属于关键性金融基础设施建设,银行在进行相关建设的时候,主要考虑高可用性。

一方面从单个节点考虑,产品要保证具有高效的处理能力,另一方面从单个数据中心考虑,产品要支持冗余的处理能力。此外,还要考虑是否可以支持两地三中心架构。

项目建设背景

2017年6月,人民银行发布《中国金融信息技术“十三五”发展规划》鼓励行业研究分布式架构可行性;去年8月,人民银行发布《金融科技(FinTech)发展规划(2019-2021年)》,鼓励加强分布式数据库研发与应用。

今年4月,国家发改委明确新型基础设施建设,其中就包括大数据中心。在这样的政策背景下,北京银行开始了对数据库技术的探索。

从银行自身发展需求出发,随着移动互联网的快速发展,大量可被计算、存储的数据随之产生,而且随着各行各业的信息化转型,数据量成几何增长,给银行带来了巨大的压力。不过技术的进步也给银行带来了新的处理方式、处理手段。

但是面对新的处理技术,传统的数据库已经慢慢不能满足需求。明立松认为,目前数据管理存在三大痛点:

1、集中式框架扩展困难,成本高昂;

2、数据分散,难以进行整合和统一管理;

3、数据实时分析不能满足需求。

明立松表示,银行目前面对着全新的挑战,一方面是技术革新的浪潮,另一方面是“双11”、“618”等层出不穷的多并发消费场景,想要提高数据库性能,又要面对高昂的成本和性能瓶颈。

NewSQL数据库产品的探索过程

面对痛点和挑战,新一代数据库平台技术路线非常重要。明立松表示,新数据库建设探索首先要解决数据库的拓展性问题,目前主要有两种模式解决问题;一种是纵向扩展,另一种是水平扩展。

纵向扩展主要是提升单机处理能力,有两个思路,其一,是提高单机硬件性能,选择高性能CPU和大容量硬盘;其二,是使用调整参数的方式,提高性能。但是随着业务的变化,纵向扩展出现了不足,因为硬件提升具有性能瓶颈,即使调整参数,也不能满足高并发业务场景的需求。

因此,我们选择采用水平扩展的模式,在性能不足时,通过增加服务器数量,实现线性扩展。水平拓展实现主要有两个方向,第一是在原有数据库的基础上实现分库分表,基于数据库中间件的可扩展性,从应用层面解决高并发问题。

明立松表示,这样的方式存在一定局限性。首先中间件解决方案会使SQL功能受到限制;其次,业务系统和数据库会产生高耦合,带来额外的复杂情况;另外,在极端情况下无法保证数据一致性;最后,这样的数据库结构必然会带来极高的运维成本。

因此,我们选择了第二个水平扩展方向:分布式数据库,从底层技术出发解决高并发和数据量问题。在确定了新数据库的方向之后,就要解决数据库功能要求。

明立松表示,近几年银行在数据化转型的过程中,不仅仅获得了有大量的结构化数据,半结构化、无结构化数据也越来越多。面对不同的数据结构,SQL数据库和NoSQL数据库各有用处,因此新的数据库技术要可以兼容两种数据库。

而NewSQL数据库采两者之长,作为金融级数据库,NewSQL数据库具有高可靠性,可以简单的实现水平弹性拓展,高度兼容MySQL语法,支持HTAP解决方案。

由此新一代数据库架构思路也就非常清晰了:采用NewSQL分布式数据库。

明立松表示,由于NewSQL数据库属于前沿技术,在实践过程中遇到了很高的技术门槛,要解决问题也很多。

NewSQL数据库架构讲解

明立松详细讲解了北京银行采用的分布式数据库架构。北京银行的分布式数据库分为三个部分,第一是无状态SQL处理引擎,负责接受SQL请求,通过调度集群找到存储集群地址,计算后返回数据,由于SQL引擎是无状态的,因此可以“无限制”拓展。

第二部分是调度集群,其负责存储集群元数据管理、数据调度和均衡以及事务控制;第三部分是分布式存储集群,通过一致性算法完成同步,保证数据一致性。

明立松表示,数据库在架构选取时,选择KV存储系统加上SQL、事务控制等支持金融场景能力;在性能验证时,使用了开源测试软件和定制的转账模型;在运维部署上,降低设备依赖性,实现多中心、高可控部署。

目前北京银行数据库已经进行了多次进化升级,采用了两地三中心部署,满足灾备要求。该数据库已经接入网联支付清算平台、银联无卡快捷支付平台、网贷平台等多个核心业务平台。

明立松介绍,在使用NewSQL分布式数据库之后,面对“双十一”高并发场景,实现动态调整资源就可以满足交易波峰波谷的适应。

明立松表示,在未来会继续进行研发,提升数据计算、存储能力,保证业务需求;拓宽领域,提高性能,成为银行涉足互联网的资本;进行安全升级,在设计和搭建过程中实现更高的安全级别。

在演讲的最后,明立松回答了听众提出的众多问题,如异地中心的距离有多远?在双十一期间,NewSQL数据库能够适应的最大并发率是多高?NewSQL数据库是否保留了MySQL或Nosql的同步备份机制?NewSQL的同步备份机制要如何处理?

面对众多问题明立松进行了详细的回答,具体精彩内容欢迎关注查看直播回看。

相关文章

月点击排行
关于本站    联系我们    版权声明    手机版
Copyright © 2011-2020 移动支付网    粤ICP备11061396号    粤公网安备 44030602000994号