关于华为云:华为云PB级数据库GaussDBfor-Redis揭秘第十期GaussDBfor-Redis迁移系列上

摘要：本期将具体介绍社区版Redis、kvrocks和Pika到GaussDB(for Redis)的迁徙

本文分享自华为云社区《华为云PB级数据库GaussDB(for Redis)揭秘第十期：GaussDB(forRedis)迁徙系列（上）》，原文作者：高斯Redis官网博客。

GaussDB(for Redis)是一款基于计算存储拆散架构，兼容Redis生态的云原生NoSQL数据库，基于共享存储池的多正本强统一机制，反对长久化存储。在保障数据库的高兼容、搞性价比、高牢靠、无损扩容等特点的同时，GaussDB(for Redis)团队针对不同的数据库产品，为用户提供了多种数据迁徙计划，本期将具体介绍社区版Redis、kvrocks和Pika到GaussDB(for Redis)的迁徙。

1、Redis到GaussDB (for Redis)的迁徙

社区版Redis作为十分受欢迎的内存数据库，因具备性能高，数据结构丰盛等长处，失去宽泛应用。GaussDB(forRedis)是兼容Redis生态的长久化数据库，不仅提供优良的读写性能，还提供数据长久化能力，依靠超前的零碎架构，以极低的老本保障了数据三正本强统一个性，能够防止社区版Redis须要fork、老本低等问题。

1.1 迁徙原理

应用华为云自研的迁徙工具drs-redis进行源端Redis到指标端GaussDB(for Redis)的迁徙。迁徙过程中，drs-redis伪装成源端Redis的从节点运行，与源端Redis建设连贯后，触发Redis的主从同步。源端Redis生成RDB文件，传输给drs-redis实现全量同步。而后发送缓冲区保留的所有写命令到drs-redis实现增量同步。 drs-redis迁徙工具接管并解析源端Redis的RDB文件，将解析后的数据通过redis命令的形式发送到GaussDB(for Redis)，而后以命令流传的形式将增量数据也发送到GaussDB(forRedis)，实现迁徙。

1.2 前提条件

部署迁徙工具drs-redis。
保障迁徙工具drs-redis、源端Redis和指标端GaussDB(for Redis)网络互通。

1.3 操作步骤

正确批改drs相干配置文件。
清理迁徙程序中可能的遗留数据。
启动drs，跟踪日志，确保迁徙正确进行。

1.4 应用须知

drs-redis伪装成源端Redis的从节点，只读取源端的全量数据和增量命令，无数据受损危险。
源端减少对drs-redis写数据的流程，因而性能会有轻微影响。
GaussDB(for Redis)反对多个数据库，若源端是单节点Redis，须要保留多个数据库时，能够在GaussDB(for Redis)侧开启namespace性能，防止将多个数据库的数据迁徙到同一空间，造成数据失落。
如果之前源端不存在从节点，源端会新增replication-buffer来缓存增量命令。

问题：redis主从同步的replication-buffer是ring buffer，若写入buffer太快，会笼罩掉未发送给drs-redis的数据，源端Redis为了数据一致性会被动断开连接，造成迁徙失败。

倡议：迁徙过程中，升高源端Redis写入数据的速率，在低压时间段进行迁徙。配置redis的client-output-buffer-limit参数，适量增大replication-buffer的大小。

1.5 迁徙性能参考

环境：源端单节点Redis和迁徙工具drs-redis部署在华为云8U32GB的弹性云服务器上，指标端为4U16GB，3节点GaussDB(for Redis)实例。

场景一：

− 源端replication buffer采纳默认值（slave 268435456 67108864 60），该默认值示意缓存积压数据超过268435456bytes(256MB)，或超过67108864bytes(64MB)且继续60s，源端会被动断开与从节点的连贯。

− 源端写入速率5MB/s，迁徙过程可继续进行，不会产生源端buffer满造成的同步失败。

− 迁徙工具读取数据的速率和源端写入速率统一。

场景二：

− 源端replication buffer不做限度（config set”client-output-buffer-limit” “slave 0 0 0″）。

− 源端写入速率10MB/s，容量短缺的状况下，迁徙继续进行。

− 迁徙工具读取数据的速率和源端写入速率统一。

论断：在华为云环境，应用8U32GB弹性云服务器部署迁徙工具，若源端replication buffer采纳默认值，迁徙可在源端5MB/s的写入速率下进行；若源端对replication buffer不做限度，迁徙可在源端10MB/s的写入速率下进行。

2、Kvrocks到GaussDB(for Redis)的迁徙

Kvrocks是一款开源的兼容Redis生态的NoSQL key-value数据库，底层基于RocksDB实现，提供namespace性能反对数据分区。Kvrocks集群治理性能绝对单薄，自建集群时须要与内部组件配合。Kvrocks反对的redis命令也不够全面，例如短少在音讯流和统计场景常常应用的stream及hyperloglog数据结构。

GaussDB(for Redis)以不亚于RedisCluster的兼容度，使用户在利用时无需批改代码，可间接应用，100%兼容原生接口。GaussDB(for Redis)在适配Kvrocks业务的同时，还能克服器治理能力弱、对Redis兼容度不低等毛病。

2.1 迁徙原理

应用开源工具kvrocks2redis进行Kvrocks到GaussDB(forRedis)的迁徙，在此基础上，从GaussDB(for Redis)源码层面对Kvrocks的namespace性能进行适配。

迁徙过程分为全量和增量两个阶段：迁徙开始后，先进行全量迁徙，此时对kvrocks打快照，并记录对应的数据版本（seq）。而后解析全量数据文件成redis命令写入GaussDB(for Redis)。全量迁徙实现后进入继续的增量迁徙过程，迁徙工具循环给Kvrocks发送PSYNC命令，将获取到的增量数据一直转发给GaussDB(forRedis)，实现增量迁徙。

2.2 前提条件

部署kvrocks2redis到独立主机。
确保源端、指标端、迁徙工具之间网络互通。
源端Kvrocks实例提前做好数据备份。
指标端GaussDB(forRedis)实例清空全副数据。

2.3 操作步骤

批改迁徙工具配置文件，填入源端kvrocks连贯信息、指标端GaussDB (for Redis) 连贯信息、源端kvrocks namespace到指标端GaussDB(for Redis) DB的映射关系。

确保配置文件内容正确。

启动迁徙工具。

跟踪日志，确保全量迁徙顺利完成，进入继续增量迁徙过程。

进行验证。确保数据迁徙后，指标端GaussDB (for Redis) 已正确加载全副数据。

待后续业务侧压力转移到GaussDB (for Redis) 后，进行增量迁徙，即手动进行迁徙工具的运行。

2.4 应用须知

kvrocks2redis须要从Kvrocks提取数据到本地文件，并从中解析出命令发送到指标端GaussDB(forRedis) ，该过程中可能影响源端性能，但实践上不会有数据受损危险。
迁徙工具运行过程中，若呈现问题，迁徙工具会主动进行，不便问题定位。
GaussDB(for Redis)从安全性角度登程，不提供清库语义命令，因而要在迁徙开始前确保无数据。

3、Pika到GaussDB(for Redis)的迁徙

Pika是一个可长久化的大容量Redis存储服务，解决了Redis因为存储数据量微小而导致内存不够用的容量瓶颈。但其集群治理性能较为单薄，须要应用twemproxy或者codis实现静态数据分片，数据一致性较弱。同时因为数据全副存储在磁盘中，相比于社区版Redis，性能显著降落。

GaussDB(for Redis)实现了冷热拆散，解决了缓存（cache）与数据库（Data Base，DB）之间交互拜访的问题，当用户数据量小于内存时能够达到和社区版redis相当的性能。通过proxy代理，使下层业务能够不感知内核解决扩缩容过程中的数据迁徙。

3.1 迁徙原理

应用开源迁徙工具pika-port进行Pika到GaussDB(for Redis)的迁徙。pika-port伪装成Pika的从节点运行，通过主从复制的形式进行数据迁徙。Pika主节点通过比拟pika-port和本人的binlog偏移量判断做全量迁徙还是增量迁徙。如果须要做全量迁徙，Pika主节点会将全量数据快照发送给pika-port，pika-port将解析后的快照数据发送给GaussDB(for Redis)。全量迁徙完结后进入增量迁徙，pika-port将增量数据解析后以redis命令的模式发送给GaussDB(for Redis)。

3.2 前提条件

部署迁徙工具pika-port
确保源端Pika实例、pika-port和指标端GaussDB(forRedis)实例网络互通。

3.3 操作步骤

正确批改pika-port配置文件；
启动迁徙工具pika-port;
跟踪日志，确保全量迁徙实现后停服，进入增量迁徙过程;
增量迁徙实现后，校验迁徙数据的正确性和齐备性;
校验结束将业务切到GaussDB (for Redis)。

3.4 应用须知

pika-port伪装成源端Pika的从节点，只读取全量和增量数据，无数据受损危险。
源端减少了和pika-port的主从同步流程，可能会影响源端性能。
全量和增量联合迁徙能够不停服，业务切入GaussDB(for Redis)时短暂停服。

3.5 迁徙性能参考

环境：Pika（单节点）和pika-port同时部署在华为云8U32GB的弹性云服务器上，指标端为8U16GB，3节点GaussDB(for Redis)实例。

预置数据：应用memtier_benchmark工具预置200GB数据。

迁徙性能：约50000qps。

4、结语

高斯 Redis 在社区版 Redis 的根底上，联合华为自研强统一存储DFV Pool，具备强统一、秒扩容、超可用、低成本等劣势，保障了计数的准确性、可靠性。

本文作者：华为云高斯Redis团队。

杭州西安深圳简历投递：yuwenlong4@huawei.com

更多技术文章，关注高斯Redis官网博客：

https://bbs.huaweicloud.com/community/usersnew/id_1614151726110813

点击关注，第一工夫理解华为云陈腐技术~

关于华为云:华为云PB级数据库GaussDBfor-Redis揭秘第十期GaussDBfor-Redis迁移系列上

1、Redis到GaussDB (for Redis)的迁徙

1.1 迁徙原理

1.2 前提条件

1.3 操作步骤

1.4 应用须知

1.5 迁徙性能参考

2、Kvrocks到GaussDB(for Redis)的迁徙

2.1 迁徙原理

2.2 前提条件

2.3 操作步骤

2.4 应用须知

3、Pika到GaussDB(for Redis)的迁徙

3.1 迁徙原理

3.2 前提条件

3.3 操作步骤

3.4 应用须知

3.5 迁徙性能参考

4、结语

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于华为云:华为云PB级数据库GaussDBfor-Redis揭秘第十期GaussDBfor-Redis迁移系列上

1、Redis到GaussDB (for Redis)的迁徙

1.1 迁徙原理

1.2 前提条件

1.3 操作步骤

1.4 应用须知

1.5 迁徙性能参考

2、Kvrocks到GaussDB(for Redis)的迁徙

2.1 迁徙原理

2.2 前提条件

2.3 操作步骤

2.4 应用须知

3、Pika到GaussDB(for Redis)的迁徙

3.1 迁徙原理

3.2 前提条件

3.3 操作步骤

3.4 应用须知

3.5 迁徙性能参考

4、结语

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复