关于数据库:云溪数据库分布式存储的负载均衡

导读

云溪数据库是浪潮开源的 NewSQL 分布式数据库，领有强统一、高可用的分布式架构。在高负载的状况下，分布式数据库可能将负载压力均衡到不同的物理机节点上，充分利用不同节点的资源。本文将介绍云溪数据库在面对高负载存储过程中采纳的负载平衡策略。

负载平衡
作为分布式数据库，为了更无效利用不同物理机节点的资源，防止服务器性能的节约，在数据库高负载的状况下须要尽量将压力均衡到各个物理机节点上。这也是分布式数据库的钻研重点之一。

云溪数据库在存储上采纳三正本策略，即每份数据默认同时存在三个节点中，每个正本为一个 Replica。数据库在进行读写时，其中一份正本会取得肯定工夫内的租约，成为 lease，该 lease 的节点即为该 range 的 leaseholder。零碎的读写都是通过 leaseholder 进行的，leaseholder 会将对该正本的读写同步到其余的 Replica。

云溪数据库在启动时会创立 StoreReblancer，用于自适应的对正本进行平衡。云溪数据库通过对 Replica 以及 lease 进行迁徙以均衡数据库的压力负载。StoreReblancer 会以 10 秒的周期重复执行，如果存储的压力超过阈值，则会循环对每个 range 分两个局部进行均衡，包含租约均衡和正本均衡。

图 1-1 负载平衡根本流程图

租约均衡
云溪数据库会保护以后节点存储的正本，其中的 lease 会保护该正本的 QPS（每秒查问率），并依照 QPS 降序进行排序。压力不够阈值的 range，不进行均衡。StoreReblancer 会循环遍历一个 range 的多个正本，排除本地的，排除压力不合乎阈值的，排除不失常的，排除 zone 限度的正本，抉择剩下的正本转移租约。租期的选举和迁徙不波及到 replica 的复制和传输。

对于须要迁徙的 range 来说，StoreReblancer 对其租约迁徙的正本选取规定如下：

非本地正本。
以后 store 领有的租期是非法的。
判断租期转移后本地 range 的 QPS 能够转到阈值以内。
待迁徙的 replica 的 raftStatus 当先于候选的 replica 的 raftStatus
满足 zone（分区信息）的约束条件。一些表可能会带有租期的限度条件，规定了该数据表的正本所在的结点，以及租期所在的结点。对于固定了租期的数据表，StoreReblancer 不会迁徙其 range 的租期。

Lease 选取的根本流程如图 1-2 所示：

图1-2 待选取 lease 流程

如果当它的 QPS 大于以后的阈值范畴，数据库会将其租约转移到该存储该正本的其余节点上。因为数据库是间接对 leaseholder 进行读写，并由 leaseholder 同步到其余正本，故当节点负载过大时，只有将较大读写负载的正本租约转换到其余节点，就能够把该局部的压力平衡进来。

正本均衡
如果保留某正本的三台节点压力负载都不合乎 lease 的迁出条件时，数据库会抉择将该正本同步到三正本以外的节点，而后将 lease 迁出，以动态平衡压力。零碎会对须要均衡的 range 进行筛选，对于压力没有达到阈值的 range 或迁徙后对该 store 的 QPS 影响较小时，则不会进行均衡操作。

零碎首先设定指标 store 数量，通常等于 range 的正本数。循环一个 range 的多个正本，排除本地正本后，如果正本所在的 store 压力合乎阈值，或者不存在，将该 store 放入指标数组。

如果指标数组的指标数量有余，则持续从其余所有 store 中抉择，直到合乎指标数量。抉择 Store 指标数组的过程须要合乎 zone（分区）限度，容量限度，压力阈值限度，并排序。如果还是有余，则放弃均衡。同时，正本的迁徙应该满足多样性的限度，多样性指正本所在的多级分区的扩散水平，正本所在的多级分区越扩散，多样性分值越高。在抉择指标 store 时，须要将新的多样性分值同原来的多样性分值进行比拟，如果不如以前，则放弃均衡。

云溪数据库会循环指标数组，计算新的租约和压力值，而后抉择指标数组进行正本迁徙。迁徙过程首先用 batch 命令，正本收到命令，并发送快照。

热数据决裂
如果同时对某正本的数据进行大量的读写，压力负载是因为该正本引起时，单纯的迁徙 lease 或者 replica 都无奈较好的调节该状况。该局部性能由 splitQueue 进行治理。云溪数据库会抉择对热点数据的 range 进行决裂，从而把压力从单个 range 上离开，该步骤会导致创立新的 replica，从而扩散了压力和流量。创立新的 replica 之后的平衡仍由 store-reblancer 进行。数据库会在 range 决裂后再进行 reblance。当压力升高后，零碎会主动进行 range 的合并。

总结
以上就是云溪数据库在解决高负载存储时采纳的负载平衡策略，通过租约均衡、正本均衡与热数据决裂三种不同维度的平衡策略，防止了单个节点在高负载状况下呈现性能瓶颈，晋升了数据库系统的读写性能。

关于数据库:云溪数据库分布式存储的负载均衡

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据库:云溪数据库分布式存储的负载均衡

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复