关于华为云:初识GaussDBfor-Cassandra

摘要：GaussDB(for Cassandra)是一款基于华为自主研发的计算存储拆散架构的分布式云数据库服务。

本文分享自华为云社区《华为云数据库GaussDB(for Cassandra)揭秘第一期：初识GaussDB(for Cassandra)》，原文作者：高斯Cassandra官网。

“local quorum查问某个分区键的条数，每次查问，条数都不一样。”
“按这个分区键的token修复，间接霎时修复完结。然而再查，还是每次查问条数不统一。”
“之前遇到墓碑失落的问题，单个token查问后果不统一，修复也解决不了”
…..

不必再为数据不统一苦恼，因为强统一的Cassandra来了，DBA们不必加班改数据了。

GaussDB(for Cassandra)是一款基于华为自主研发的计算存储拆散架构的分布式云数据库服务。是一个强一致性的零碎，在华为云高性能、高可用、高牢靠、高平安、可弹性伸缩的根底上，提供了一键部署、备份复原、监控报警等服务能力。高度兼容开源Cassandra接口，并提供高读写性能，具备高性价比，实用于IoT、气象、互联网、游戏等畛域。

本文将从架构、次要个性、竞争力、利用场景等方面进行介绍。

设计架构：

GaussDB(for Cassandra)基于计算存储拆散架构，该架构基于华为外部弱小且宽泛应用的自研分布式存储系统DFV（数据性能虚拟化/Data Function Virtualisation），实现了一套Share Everything的云开源架构，充分发挥了云开源的弹性伸缩、资源共享的劣势，高度兼容Cassandra协定，领有超强写入性能，同时相比社区版具备分钟级计算扩容、秒级存储扩容、数据强统一等劣势，性能更强更稳固，数据更牢靠，扩容更麻利，实用于IoT、实时举荐、金融反欺诈检测等场景。

GaussDB(for Cassandra)牛在哪？

高牢靠：数据强统一，提供企业级数据可靠性

开源Cassandra读写数据采纳最终一致性，此处用读场景举例：如果读一致性要求为ONE，会立刻返回离客户端最近的一份数据正本，那么这意味着第一次读取到的数据可能不是最新的数据。如果读一致性要求为QUORUM（即读取任一数据中心中quorum数量的节点的后果，返回合并后timestamp最新的后果），则内核会主动触发读修复，而后返回给客户端。如果此时有正本所在节点呈现坏盘，在gc_graces的周期内没有实现数据修复，局部正本属于坏盘节点的业务数据，业务查问过程中发现数据会概率性不正确。

GaussDB(for Cassandra)采纳存算拆散架构，数据的正本在DFV存储平台保障，对计算节点来说数据单正本、数据强统一，查问只须要从协调节点间接到数据节点取数据即可实现，躲避了数据不统一修复数据造成的人力老本、业务查问过程中发现数据会概率性不正确等问题。另外反对N-1个节点故障容忍，提供10倍以上的故障重构性能和备份复原性能，保证数据的可靠性。

高扩大：秒级扩容，疾速更神速

开源Cassandra采纳一致性Hash算法对数据进行分区打散，整个环代表数据从负无穷到正无穷区间。集群中每个节点会有虚构节点（Token）在环上，虚构节点的数量可配置。黄圈代表节点1，蓝圈代表要扩容的节点2，2个Token之间组成整个数据的其中一段Range区间，扩容后退出了新的Token，会产生新的Range，这些Range中的一部分会归新节点2治理。那么就须要把数据从节点1迁徙到新节点2下来。迁徙是通过读取节点1上的数据写入到节点2上，迁徙的速度能够通过配置参数调整，整体迁徙的工夫由数据量与迁徙过程中的读写速率无关。

GaussDB(for Cassandra)把多正本策略下沉到共享存储，大幅晋升弹性伸缩能力，如图右侧展现，新扩容的节点2只须要从新映射Token2到节点2，就能够实现，无需做数据的读取与写入的搬迁动作，实现分钟级计算扩容，相比开源扩容工夫晋升几十倍。随着业务的一直增长，Cassandra能够分钟级程度弹性资源扩大。在相似圣诞节等热门节日，提前1天进行弹性扩容，为业务顶峰预留资源，业务顶峰过后进行缩容，这些对业务无感知。计算节点能够通过文件系统管制集群在DFV中的数据使用量，扩容缩容磁盘时通过重新分配最大使用量，可实现秒级存储扩容，单实例反对海量数据存储。

高性能：超高写入，读性能数倍晋升

GaussDB(for Cassandra)在超强写入性能的根底上，通过应用C语言重构存储引擎，缩小零碎GC，实现了数倍读性能晋升，拓宽了应用场景的内涵，使其不仅仅实用于写密集型的业务场景，在读密集的场景中也具备了强竞争劣势，整体性能超过开源自建2~3倍。

高平安：构筑多层爱护，为数据安全保驾护航

GaussDB(for Cassandra)通过VPC、子网、平安组、DDoS防护以及SSL平安拜访等多层平安防护体系，帮忙用户抵挡网络攻击，让用户上云无忧。

为什么抉择GaussDB(for Cassandra)？

实用多种场景

工业制作&气象业

随着科技进度，采集的气象数据指数增长，须要一种系统对高空、低空、陆地、重要天气报、闪电、环境监测等卫星、雷达采集的数据可能高性能写入、查问、在线、离线剖析。

须要存储对高空、低空、陆地、重要天气报、闪电、环境监测等卫星、雷达等降雨量、湿度、温度等PB级数据量
撑持来自各气象采集点数据高并发写入到Cassandra，GaussDB(for Cassandra)集群性能高于自建2~3倍，更适宜高并发写入读取
GaussDB(for Cassandra)数据可能撑持实时在线剖析，为气象算法、天气预报做到实时精准剖析
拜访数据库进行离线数据分析，GaussDB(for Cassandra)能将离线剖析时效缩短到60%

互联网

GaussDB(for Cassandra)具备高并发写入性能和高可扩展性，保障集群高可用和业务间断稳定性，十分实用于写入规模量较大的互联网大数据场景，如记录大规模的用户行为数据等。

寄存用户画像数据，可能完满解决特色：数据量大、能够应答数据结构Scheme频繁变更
查问性能要求高；比方要买一双鞋，搜寻出的鞋子数据会依据用户画像的特色做肯定的排序展现，那么要求查问用户特色表的查问性能十分高
举荐零碎：依据用户最近浏览的数据做剖析之后，举荐相干资源给用户
点赞零碎：点赞计数零碎

实时数据分析场景

GaussDB(for Cassandra)群组明天新来了一个成员，或者yutou明天公布一篇新文章，华为云数据库官网主动向该用户收回欢送邮件。

昵称为yutou的同学明天公布了一组新照片，那么另外一个程序主动向yutou的好友发送告诉。

原生不具备的数据变更捕捉能力，GaussDB(for Cassandra)具备变更捕捉能力，能对数据的变更做实时在线剖析，提供秒级的实时推送动作做出相应解决；具备欠缺的离线剖析解决方案，能够将离线剖析时效缩短到60%，为商家争取更多的工夫做出相应决策。

购买倡议

GaussDB(for Cassandra)性能为开源2倍以上，存储空间仅需开源自建1/3，帮忙客户节省成本，举例如下：开源自建8u32g 3节点数据量：90G（三正本），购买GaussDB(for Cassandra)可抉择创立4u16g 3节点数据量：30G（DFV存储三正本）

点击关注，第一工夫理解华为云陈腐技术~

关于华为云:初识GaussDBfor-Cassandra

设计架构：

GaussDB(for Cassandra)牛在哪？

高牢靠：数据强统一，提供企业级数据可靠性

高扩大：秒级扩容，疾速更神速

高性能：超高写入，读性能数倍晋升

高平安：构筑多层爱护，为数据安全保驾护航

为什么抉择GaussDB(for Cassandra)？

实用多种场景

工业制作&气象业

互联网

实时数据分析场景

购买倡议

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于华为云:初识GaussDBfor-Cassandra

设计架构：

GaussDB(for Cassandra)牛在哪？

高牢靠：数据强统一，提供企业级数据可靠性

高扩大：秒级扩容，疾速更神速

高性能：超高写入，读性能数倍晋升

高平安：构筑多层爱护，为数据安全保驾护航

为什么抉择GaussDB(for Cassandra)？

实用多种场景

工业制作&气象业

互联网

实时数据分析场景

购买倡议

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复