导语:面对HTAP能力的需要与云原生时代的趋势,以及国产化的浪潮,某邮储银行携手OceanBase打造了云原生时代下的国产分布式数据库场景实际体验。以下内容整顿自某邮储银行运维方DBA的自述。

 

业务痛点

 

咱们有一套针对业务外部的经营数据归集零碎,各地的服务网点都将各类生产数据、经营数据及经营数据进行上报,还有前端用户埋点数据、各子系统生产数据表单会集,数据源的格局多样,数据聚合水平不一,计算形式简单多样。目前,咱们采纳两种形式进行数据采集。

  • 人工上报:通过员工自行制表、填表将数据上报至零碎中的固定页面,进行运算。
  • 机器抓取:一些老零碎或无奈提供接口,就须要通过RPA自动化机器人抓取数据,这是整个根底数据的起源。抓取数据后汇总,并用Java在程序中进行计算,将数据积淀至报表,以供前台实时读取。

面对每天的数据增长,而且外部经营零碎的数据不能间接实现实时剖析,须要将其汇总成特定格局进行转换计算,做成策略面板,提供顶层决策分析能力。咱们应用的数据库系统是MySQL,在公众印象中,MySQL侧重于OLTP(联机事务处理),在OLAP(在线剖析解决)方面的性能如高可用、备份等方面体现较弱,这些痛点在咱们应用MySQL的过程中也的确感触到了。而随着咱们业务并发量的进步和数据量的增长,既要求较强的OLTP能力,又须要OLAP能力的撑持,且软硬件及服务老本一直升高。面对传统关系型数据库的许多技术难题,比方海量数据下sacle in or out(弹性扩大)的算力有余、不能原生解决单点故障和全链路高可用、OLTP+OLAP场景无奈实现一体化,咱们决定摸索HTAP(混合事务剖析解决)数据库,实现降本增效的指标。

 

产品调研

 

在决定摸索HTAP数据库后,咱们最先理解到的是OceanBase。因为公司有一个我的项目正在应用阿里云的PolarDB,但PolarDB必须在云端部署,而咱们的业务需要是本地部署,所以,OceanBase成为咱们的首个钻研指标。OceanBase兼容MySQL的个性很吸引咱们,而最终抉择OceanBase是出于以下几个因素。

  • 因素1:稳固牢靠。 OceanBase十二年稳固牢靠的产品力和在支付宝全外围场景替换MySQL的实际,以及利用于泛滥行业多个大型客户外围场景,为咱们在业务场景中应用它建设了信念。
  • 因素2:AP性能优良。 在相似的OLAP场景中,咱们已经应用过GBase、PostgreSQL、Greenplum,在简单的SQL查问方面速度较慢,并且当用户量大的时候再连贯这些数据库,都会呈现各种各样的问题,也有可能是咱们本身资源有余的导致的。咱们在测试OceanBase的性能时,采纳现有环境即2核40C80线程、256GB内存的环境,测试了TPS和QPS, 以下是在3000并发量下Sysbench的读写混合测试后果。这个测试后果齐全满足了业务要求。

 

SQL statistics:    queries performed:        read:                            2405494        write:                           687284        other:                           343642        total:                           3436420    transactions:                        171821 (2859.31 per sec.)    queries:                             3436420 (57186.17 per sec.)    ignored errors:                      0      (0.00 per sec.)    reconnects:                          0      (0.00 per sec.)General statistics:    total time:                          60.0903s    total number of events:              171821Latency (ms):         min:                                   29.15         avg:                                  104.83         max:                                  414.93         95th percentile:                      155.80         sum:                             18012703.78Threads fairness:    events (avg/stddev):           572.7367/30.91    execution time (avg/stddev):   60.0423/0.02

 

因素3:运维简略。 目前的业务需要须要在AP与TP之间找到一个平衡点,如果AP场景和TP场景应用不同的数据库,势必会减少技术栈的深度,增大运维难度,而业务对于两种应用场景并不是强依赖的关系。应用混合型的HTAP产品,无疑是最好的抉择,也是一种良好的摸索与尝试。OceanBase运维简略,只需一套OCP工具就能搞定。且零碎告警提供了丰盛的扩大性能,能够与现有监控对接。运维人员每天只是关注重要数值,察看有没有报警,运维治理比拟轻松。

因素4:国产化趋势。 咱们无奈意料MySQL在将来是否会被限度,也无奈确定是否所有零碎都会逐步成Linux,但能够必定的是要防患于未然。因而,钻研齐全国产自研且开源的数据库是一条前途,将来如果真要替换全副零碎,至多到那时咱们曾经有肯定的技术积攒和积淀,可能应答引进软件限度的问题。

因素5:实用业务且容错。 OceanBase主打HTAP,具备高可用和容灾能力,十分实用于咱们的业务。同时,咱们要利用数据库的零碎不齐全是生产零碎,而是一个后盾的报表,它处于外围零碎与边缘系统之间,有肯定的容错性,因而,决定先在这个报表环境中尝试应用OceanBase。

因素6:及时响应。 OceanBase开源后社区活动与响应都很踊跃,尽管有些生态还在欠缺,然而能感觉到OceanBase开源的产品力在显著进步。

 

场景实际

 

决定应用OceanBase后,咱们开始了环境部署,表1列出部署参数。

 

图1 OceanBase三节点部署架构

 

上文提到,随着业务数据量的增大,咱们本来应用的MySQL不合乎业务要求,部署OceanBase后,咱们开始重构零碎和底层数据底座,经验了以下四个阶段。

 

第一,POC阶段。 “如果有什么问题或者和MySQL不统一,你们就间接报错,咱们看如何解决”,这是我过后对OceanBase的研发反对人员说的话,但我惊喜地发现,OceanBase可能与咱们应用的MySQL 5.7.18版本良好兼容,能够轻松实现零老本迁徙。在此过程中,咱们遇到了两个问题,一是SQLSTATE[0A000]: Feature not supported: 1235 while parameter _ob_enable_prepared_statement is disabled, prepared statement not supported,通过参数调整,轻松搞定;二是利用数据的迁徙人员在应用Navicat进行迁徙的时候,呈现了一些结构化语句不兼容的问题,咱们惊喜地发现Navicat16.1版本开始,有了OceanBase的专用驱动连贯,应用后兼容性问题完满解决。

 

第二,数据迁徙阶段。 咱们应用了OceanBase 迁徙服务(OceanBase Migration Service,OMS)实现了MySQL数据的在线无缝迁徙。

 

第三,数据库侧革新阶段。 咱们的利用测试根本不必革新,就将MySQL的分区数据、表构造等迁徙到了OceanBase,并且所有运行失常,查问性能和查问效率都超出预期。同时,对于开发人员来说,他们无需投入学习老本,在OB上操作与此前在mysql上无异。

 

第四,实际上线阶段。 在该阶段,咱们暂停了业务写入,期待零碎迁徙实现,并在新业务流量写入OceanBase集群后,察看业务稳定。割接后近一个月的试用,零碎运行稳固,剖析数据处理工夫缩短到了原来的1/3,达到了咱们的应用预期。

 

业务播种

 

以上就是咱们利用OceanBase的实际过程。从业务角度看,在此次的数据库实际中,咱们有五点播种。

 

  • 原生的高可用体系: OceanBase基于PAXOS协定高可用,防止单点故障,RPO=0。
  • 无感知的DDL: OceanBase DDL无感知,能够放慢业务迭代效率。
  • 欠缺的治理平台: OCP平台集成了部署、监控、诊断等性能,大大降低了运维与开发成本。
  • 线上扩大能力: 前期业务数据体系能够通过横向减少机器资源实现scale in or out。
  • 赋能HTAP能力: 数据读写与实时统计分析场景用一个数据产品解决。

 

当然,对于OceanBase,咱们也有三个冀望与倡议。

  • 心愿OCP实现集成性能测试。
  • 应用SATA硬盘理论测试出的TPS是官网的1/2,倡议应用SSD作为硬盘存储。
  • 冀望OceanBase能在更多场景替换MySQ,并不断完善其三地五核心等高级能力。

不得不说,随着国产化浪潮和云原生趋势的推动,企业对数据产品的要求日趋增高。面对老牌数据产品的能力,或者敢于尝试一些优良的新型产品能力找到良好的解决方案。此次对OceanBase的摸索,让咱们解决了以往在高可用、线性扩大、存储老本等方面遇到的难题,并且,在领有了HTAP能力的同时还能继续升高业务老本。