作者:四川省农村信用社联合社 张朝辉 桂俊鸿
起源:《金融电子化》
随着四川省联社党委提出“合规银行、智慧银行、主力军银行”三大银行策略。作为四川省业务规模最大的银行业金融机构、全国农信零碎“排头兵”的四川农信积极响应,率先于 2018 年 9 月实现智慧银行 IT 架构蓝图,确定由集中式向分布式全面转型的 IT 策略方向,并翻新构建分布式架构转型的要害根底平台——“蜀信云”。
耕耘近一年,“蜀信云”平台已正式投产上线,截至 2022 年,已反对智能营销、智能柜面等近 50 个要害业务零碎的平安稳固运行。“蜀信云”平台采纳自主可控的分布式架构,原生分布式数据库 OceanBase 作为要害撑持,保障四川农信普惠金融业务不间断运行,为数字化转型降级继续提供数字化底座能力。
夯实底座,“原生”蓄势
资产规模、贷款规模位居全省同业第一的四川农信,数据规模宏大,是全国极少数采纳海内大型机的地方性金融机构,大型机尽管稳固但保护老本居高不下,技术可控性弱。随着智慧银行的推动,四川农信线上业务高速增长,尤其是助农直播带货的发展催生促销、秒杀等新的流量顶峰场景,导致系统频繁应答高并发,传统集中式数据库难堪重负。
四川农信于 2018 年启动分布式架构转型之初,针对分布式数据库畛域进行过大量的比照钻研与具体的场景测试。 总的来说,分布式数据库可归总为三条技术路线:第一条,“分布式中间件 + 单机数据库”;第二条,“通过构建分布式共享存储实现扩大,采纳非对称计算节点”,大部分私有云数据库采纳该路线;第三条,“原生分布式数据库”。
在这三条路线中,“原生分布式数据库”更合乎业内对分布式数据库倒退方向的支流抉择,“分布式中间件 + 单机数据库”只是一种过渡计划。“原生分布式数据库”在架构解耦、利用迁徙老本、分布式事务能力、扩大能力、强一致性和高可用性方面都有显著的劣势。OceanBase 原生分布式数据库凭借独创“三地五核心“城市级故障主动无损容灾新规范、间断 10 年稳固撑持“双 11“等亮眼实力,走进了四川农信的视线;同时具备撑持四川农信“多地多活单元化”指标架构实现的能力,能满足四川农信对分布式数据库的诸多严苛要求。
分布式数据库尽管是将来的倒退方向,但目前大多数分布式数据库在稳定性、SQL 兼容性、优化器成熟度等方面与传统单机数据库还有肯定差距。银行业在存量利用迁徙过程中应该做到“标准后行”,例如,事先做好评估和测试工作,标准数据库设计,在开发过程中尽量应用规范 SQL,缩小迁徙适配难度。特地是将利用从传统单机数据库迁徙至分布式数据库过程中会遇到兼容性或性能方面的问题,因而,选型分布式数据库时应优先思考 Oracle/MySQL 等传统数据库兼容性指标。OceanBase 的兼容性位居中国分布式数据库厂商前列,这也是四川农信最终抉择其作为数字化底座最重要的起因之一。
后行“蜀道”,攻坚克难
作为国内最早一批开启分布式架构转型的地方性金融机构之一,四川农信将架构转型分为“立布局”、“搭平台”、“筑中台”、“扩利用”四个阶段,预计 10 年工夫实现由集中式向分布式的全面转型。同属农村商业银行,IT 架构全面转型难度堪比攀“蜀道”,起因一方面是 IT 投入规模上的制约,一方面是人、物、技术等方面的挑战。四川农信已利用实际原生分布式数据库近 5 年,总结出以下四个阶段教训:
第一个阶段:选型测试,奠定根底。 四川农信启动全行架构转型工作后,随即启动分布式数据库的选型工作,从技术路线、ACID 反对能力、容灾指标、性能体现、开源生态、服务能力等方面综合比照后,抉择最适宜四川农信的分布式数据库软件产品。
第二个阶段:做好顶层架构设计和标准。 确定全行级业务数据单元化拆分规定和切换策略,布局全行数据库集群和部署打算,制订分布式数据库开发标准并组织标准落地查看。
第三个阶段:采纳先试点后推广策略。 后期,通过在智能贷款、智能渠道、智能营销、凋谢银行、员工核心等不同类型的利用零碎中试点应用分布式数据库,充沛验证分布式数据库能力,及时调整和优化应用形式,更新开发标准。
第四个阶段:要害利用场景,集中力量重点冲破。 外围账务零碎这类要害利用系统对数据库的要求最为严苛,其可靠性、强一致性和高可用性关乎客户资金平安和全行名誉,是数据库利用过程中“最难攻克的堡垒”。对于这类利用零碎,四川农信后期会进行大量的技术调研和可行性论证,组织多轮的内部专家评审;同时,通过设计及验证我的项目进行实在环境下的原型验证,对要害难点问题进行逐个验证,包含资金平安、端到端数据一致性、性能体现、多活容灾、弹性扩大、运维监控等方面。
目前,OceanBase 凭借数据强统一、高扩大、高可用、高性价比、高度兼容 Oracle/MySQL 等能力,已笼罩四川农信包含智能贷款业务、柜面渠道、凋谢银行、企业网银、智能营销、员工核心等银行重要业务场景,根本涵盖银行渠道、产品服务、公共根底服务、外部治理等业务畛域。
第一,在性能方面, 业务解决性能显著晋升,可撑持业务整体吞吐量达到万级 TPS;
第二,在可用方面, 业务不间断、高并发拜访能力显著晋升,原生分布式数据库的弹性伸缩、疾速程度扩大能力,四川农信可从容应对春节、“开门红”、“双 11”等业务顶峰,保障业务零碎稳固运行;
第三,在运维方面, OCP 提供的白屏化运维监控能力能够高效、便捷治理数据库,极大晋升运维管理效率和监控告警能力;
第四,在国产化降级翻新方面,OceanBase 原生分布式数据库可运行在 X86 及 ARM 架构服务器上,反对一库多芯软硬件混合部署,既能无效撑持主机下移,还具备多技术路线稳步推动国产化降级革新撑持能力,合乎四川农信国产化降级履行稳步推动,守正翻新的策略需要。
“多地多活”容灾架构,数据零失落
四川农信原有容灾架构以西信机房为主数据中心、科华机房作为灾备数据中心,灾备能力无限。 积极探索“两地三核心”,同城双机房采纳主备模式,利用拜访主数据库进行数据写入,异地机房异步复制进行数据同步,备份节点数据非强统一,实质上只能做到机房级容灾,无奈实现城市级容灾。
2022 年 5 月,四川农信开启“多地多活单元化架构”降级我的项目,目前,四川农信已按国家 A 级机房规范建成中西部银行业规模最大的石墙数据中心。
“三地四核心五节点”的“多地多活”容灾架构设计在成都、雅安、泸州部署五个逻辑 Zone:成都同城部署两个数据中心,一个石墙数据中心,一个西信数据中心;雅安同城部署两个逻辑数据中心,雅安 1 数据中心和雅安 2 数据中心;泸州黄舣作为间隔较远的灾备核心,个别不承载业务流量,“4 个逻辑核心”可能同时向外提供业务服务。待齐全建成后将具备以下能力:
- 城市级业务负载能力。“4 个逻辑核心”(即石墙、西信、雅安 1、雅安 2)各按 25% 的比例承当业务流量,黄舣节点除部署数据库选举节点外,还部署“热备”利用,一旦呈现成都、雅安同时故障的场景,可疾速、弹性的将业务流量切换至黄舣。
- 节点级多活容灾能力。 当石墙、西信、雅安 1、雅安 2 任一节点产生故障,故障节点的业务流量能够在 20 分钟内切换至另外三个节点之一,无数据失落。黄舣节点失常无流量,当其产生故障对交易和数据无影响。
- 城市级多活容灾能力。 成都、雅安任一城市产生劫难的状况下,劫难城市两个节点的业务流量可在 20 分钟内切换到另一个城市的两个节点,无数据失落。泸州失常无流量,当其产生劫难时对交易和数据无影响。
由“两地三核心”容灾架构降级至“三地四核心五节点”的“多地多活”容灾架构,原生分布式数据库劣势联合云原生负载平衡和单元化的能力,四川农信将在业务面对重大劫难(如城市级劫难)时显著晋升安全性与韧性。 以往,容灾主备切换筹备和操作过程须要数个小时,待齐全建成后,流量在不同单元不同站点间的调拨将仅需分钟级即可实现。在数据库层面实现同城 RPO=0,RTO<30s 的主动无损容灾成果,达到国家金融行业最高等级容灾规范。
目前,依靠分布式架构全面转型胜利,四川农信数字化转型已获得阶段性胜利,为贯彻落实科技倒退“十四五”布局,四川农信将持续牢牢把握数字化转型时机,紧跟金融科技发展趋势,一直深入智慧银行建设,全面晋升四川农信业务赋能程度,为四川省经济倒退奉献金融科技力量。
将来,一是放慢推动“三地四核心五节点”、“分布式外围”等信息科技根底建设,进一步晋升容灾能力、一体化运维、分布式多活、容量自动化治理能力,无效撑持疾速响应业务的需要能力。
二是依靠云计算、人工智能等技术,推动信贷、领取等十大畛域的信息系统建设,全面晋升获客、渠道、产品、风控、经营和治理六方面的数字化服务水平。
三是依靠大数据等技术,放慢推动数据能力加强我的项目建设,深入数据品质整改,增强数据分析、加工、赋能程度,充沛开掘数据价值,无效开释数据潜能,全面晋升业务办理的智能化程度。