关于分布式:GaussDBfor-openGauss让数据存得下算得快算得准

摘要：本文从总体架构、数据分布形式、计算下推、数据强统一等方面进行介绍GaussDB(for openGauss)。

本文分享自华为云社区《华为云GaussDB(for openGauss)专场直播第2期：让数据“存得下、算得快、算得准”》，原文作者：神思胖。

1.前言

随着云计算规模越来越大，企业业务数据量呈指数级增长，传统数据库在海量数据存储与治理方面显得力不从心，面临“存不下，算得慢、算不准”的问题。

面对挑战，华为云数据库深度交融华为在数据库畛域多年的教训，充沛联合了企业级场景需要，基于openGauss自研生态推出了企业级分布式关系型数据库GaussDB(for openGauss)。GaussDB(for openGauss)目前反对单分片和分布式两种部署状态，在撑持传统业务的根底上，继续构建竞争力个性，为企业面向数字化转型提供了有限可能。

4月9日，由华为云主办的GaussDB(for openGauss)系列技术直播第2期《华为云数据库 GaussDB(for openGauss)数据存储与拜访》于线上开启，直播具体介绍了GaussDB(for openGauss)的数据分布形式和数据读写流程，为不便大家疾速理解GaussDB(for openGauss)，本文联合第2场直播内容从总体架构、数据分布形式、计算下推、数据强统一等方面进行介绍。

2.分布式架构

GaussDB(for openGauss)是一个典型的基于数据分片的双层分布式架构(share nothing)，数据通过肯定的规定比方hash、list或者range等让数据打散散布到不同的数据节点上，计算时底层多个数据节点独特参加，下层协调节点负责执行打算生成和后果汇聚。

3.让数据“存得下、算得快、算得准”

随着5G时代的到来，繁多节点是难以应答数据规模的一直增长并确保性能的须要，业务面临“存不下、算得慢、算不准”的问题。而GaussDB(for openGauss)可横向扩大的分布式架构能够很好满足大规模海量数据的计算存储需要，让数据“存得下、算得快、算得准”。

3.1海量数据“存得下”

GaussDB(for openGauss) 反对1000+的数据节点扩大能力，数据通过肯定的规定比方hash、list或者range等让数据打散散布到不同的数据节点上，让数据“存得下”。

数据分布形式

GaussDB(for openGauss)反对hash、list、range、replication散布形式，下图以hash和replication为例，示意了数据在DN节点上的散布状况。create table通过distribute by语法指定表的数据分布形式。hash散布把数据散列存储到所有DN，适宜数据量比拟大的表；replication散布把数据复制存储到所有DN，数据更新时，会同时更新所有DN，采纳2PC(两阶段提交)保障分布式事务的一致性，适宜更新频率比拟低的小表。

一致性hash

GaussDB的hash散布采纳相似一致性hash的形式，数据通过两层映射，第一层通过hash映射把数据映射到N个hash bucket中，或者叫vnode中；第二层映射把vnode映射到物理的datanode上。扩容时，只须要调整二层映射，保证数据搬迁最小：数据只会搬迁到新节点，已有节点之间不会相互搬迁数据；

散布键的抉择

对于数据分布来讲，散布键的抉择至关重要，不适合的散布键会导致数据歪斜，导致木桶效应。散布键的抉择个别遵循如下准则：

a. 尽量抉择distinct值比拟多的列，保证数据均匀分布。散布平均是为了防止木桶效应，各个节点对等执行。

b. 尽量抉择Join列或group 列做散布列。尽量抉择Join列或group 列是为了防止数据节点之间数据流动, 进步性能。

数据歪斜

当咱们抉择了一个散布键之后，如何判断数据是否散布平均呢？GaussDB(for openGauss)提供了SQL语句能够不便的查问是否产生了数据歪斜。

通过如下办法，能够查问数据存储在那个DN，其中xc_node_id就是DN的外部标识，取值于零碎表pgxc_node的xc_node_id列。

通过如下SQL，就能够查看表在各个DN上的数据分布状况，一般来说，DN的数据量相差10%以上，则可能产生了数据歪斜，就要思考依照后面的准则调整散布列。

SELECT a.count,b.node_name 
    FROM 
        (SELECT count(*) AS count,xc_node_id FROM tablename GROUP BY xc_node_id) a,   
        pgxc_node b 
    WHERE a.xc_node_id=b.node_id ORDER BY a.count DESC;

3.2计算下推，“算得快”

GaussDB(for openGauss) 的优化器和全并行分布式执行能力，把计算下推到DN节点，缩小数据挪动，让数据“算得快”。

数据读写流程

大抵执行过程：

业务利用下发SQL给Coordinator ，SQL能够蕴含对数据的CRUD操作；
Coordinator利用数据库的优化器生成执行打算，每个DN会依照执行打算的要求去解决数据；
数据基于一致性Hash算法散布在每个DN，因而DN在解决数据的过程中，可能须要从其余DN获取数据，GaussDB提供三种stream流（播送流、聚合流和重散布流）实现数据在DN间的流动，使得join无需抽取到CN执行；
DN将后果集返回给Coordinate进行汇总；
Coordinator将汇总后的后果返回给业务利用。

华为在SQL执行优化方面有多年的积淀，即便是简单的SQL、事务剖析混合（HTAP）的场景也能失去最佳的执行，我给大家举一些列子：

基于代价的优化
基数估算：Feedback加强、AI基数加强
代价估算：行存/列存代价估算、网络通信代价估算
搜索算法：动静布局办法、遗传算法、AI搜寻
分布式执行打算能力
Light Proxy
Fast Query Shipping
Remote Query Shipping
自研Cascade优化器
对象化解决规定利用及搜寻工作
基于分支限界的剪枝技术

计算下推

优化器是GaussDB(for openGauss)关键技术之一，能够把各种简单的SQL进行下推执行，最小化数据挪动，这是GaussDB绝对于基于分库分表的中间件计划的外围劣势（对于简单查问，因为计算无奈下推，中间件很容易成为性能瓶颈，须要业务做比拟大的革新来躲避）。

以下案例的表构造为：

create table t1(a int, b int, c int) distribute by hash(a);

create table t2(a int, b int, c int) distribute by hash(a);

单表查问下推

单表查问，不论SQL的where条件是否带有分片键，优化器都能够生成下推的执行打算，包含sort/group by等简单算子，都能够下推。

1）分片键上的where条件，间接下推到DN

2）非分片键where条件，DN先计算，CN做汇总，sort/group by能够间接下推到DN

Join查问下推

1）分片键上的join条件，间接下推到DN执行

2）非分片键join条件，DN间接做数据交换，防止CN成为性能瓶颈

1，Join下推到DN执行，DN之间间接进行数据重散布，替换数据，无需CN参加；CBO优化器抉择小表t2做重散布；

2，Sort下推到DN，CN只需做归并排序，防止CN成为性能瓶颈；

3.3数据强统一，“算得准”

数据强统一是GaussDB(for openGauss)绝对于基于分库分表的中间件计划的另一个外围劣势，基于中间件的计划因为不感知事务的快照逻辑，只能做到最终一致性，局部场景须要业务做比拟大的革新来躲避陷阱。GaussDB(for openGauss)提供数据强统一能力，让数据“算得准”。

分布式强统一：

1）两阶段提交保障写的原子性。

2）两阶段提交对用户通明，写操作如果只波及一个节点，无需应用两阶段提交。

3）全局CSN保障读的强统一。

高性能事务管理：

GTM线程池、原子的CSN调配，核心节点无性能瓶颈。

4.总结

综上所述，GaussDB(for openGauss)基于可横向扩大的分布式架构，提供了海量存储、疾速响应、数据强统一的能力，能够很好满足大规模海量数据的计算存储需要，让数据“存得下、算得快、算得准”。

值得一提的是，openGauss是凋谢的生态：架构凋谢、代码凋谢、技术凋谢和社区凋谢，不便企业抉择凋谢的生态，让本人的业务具备更好的连续性。毕竟如果让企业从一个关闭的生态走向为另外一个关闭的生态，实质上并没有解决业务连续性的问题，不凋谢的生态是没有生机的，数据库软件尤甚，所以华为十分重视生态凋谢。

目前openGauss单分片版本的源代码曾经开源，社区地址为：https://opengauss.org，欢送大…

Ps：错过直播的小伙伴不要灰心，点击链接回播视频看起来：https://bbs.huaweicloud.com/l…

点击关注，第一工夫理解华为云陈腐技术~

关于分布式:GaussDBfor-openGauss让数据存得下算得快算得准

1.前言

2.分布式架构

3.让数据“存得下、算得快、算得准”

3.1海量数据“存得下”

数据分布形式

一致性hash

散布键的抉择

数据歪斜

3.2计算下推，“算得快”

数据读写流程

计算下推

单表查问下推

Join查问下推

3.3数据强统一，“算得准”

4.总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于分布式:GaussDBfor-openGauss让数据存得下算得快算得准

1.前言

2.分布式架构

3.让数据“存得下、算得快、算得准”

3.1海量数据“存得下”

数据分布形式

一致性hash

散布键的抉择

数据歪斜

3.2计算下推，“算得快”

数据读写流程

计算下推

单表查问下推

Join查问下推

3.3数据强统一，“算得准”

4.总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复