关于华为云:初识GaussDBfor-Cassandra

0次阅读

共计 3013 个字符,预计需要花费 8 分钟才能阅读完成。

摘要 :GaussDB(for Cassandra) 是一款基于华为自主研发的计算存储拆散架构的分布式云数据库服务。

本文分享自华为云社区《华为云数据库 GaussDB(for Cassandra)揭秘第一期:初识 GaussDB(for Cassandra)》,原文作者:高斯 Cassandra 官网。

  • “local quorum 查问某个分区键的条数,每次查问,条数都不一样。”
  • “按这个分区键的 token 修复,间接霎时修复完结。然而再查,还是每次查问条数不统一。”
  • “之前遇到墓碑失落的问题,单个 token 查问后果不统一,修复也解决不了”
  • …..

不必再为数据不统一苦恼,因为强统一的 Cassandra 来了,DBA 们不必加班改数据了。

GaussDB(for Cassandra)是一款基于华为自主研发的计算存储拆散架构的分布式云数据库服务。是一个强一致性的零碎,在华为云高性能、高可用、高牢靠、高平安、可弹性伸缩的根底上,提供了一键部署、备份复原、监控报警等服务能力。高度兼容开源 Cassandra 接口,并提供高读写性能,具备高性价比,实用于 IoT、气象、互联网、游戏等畛域。

本文将从架构、次要个性、竞争力、利用场景等方面进行介绍。

设计架构:

GaussDB(for Cassandra)基于计算存储拆散架构,该架构基于华为外部弱小且宽泛应用的自研分布式存储系统 DFV(数据性能虚拟化 /Data Function Virtualisation),实现了一套 Share Everything 的云开源架构,充分发挥了云开源的弹性伸缩、资源共享的劣势,高度兼容 Cassandra 协定,领有超强写入性能,同时相比社区版具备分钟级计算扩容、秒级存储扩容、数据强统一等劣势,性能更强更稳固,数据更牢靠,扩容更麻利,实用于 IoT、实时举荐、金融反欺诈检测等场景。

GaussDB(for Cassandra)牛在哪?

高牢靠:数据强统一,提供企业级数据可靠性

开源 Cassandra 读写数据采纳最终一致性,此处用读场景举例:如果读一致性要求为 ONE,会立刻返回离客户端最近的一份数据正本,那么这意味着第一次读取到的数据可能不是最新的数据。如果读一致性要求为 QUORUM(即读取任一数据中心中 quorum 数量的节点的后果,返回合并后 timestamp 最新的后果),则内核会主动触发读修复,而后返回给客户端。如果此时有正本所在节点呈现坏盘,在 gc_graces 的周期内没有实现数据修复,局部正本属于坏盘节点的业务数据,业务查问过程中发现数据会概率性不正确。

GaussDB(for Cassandra)采纳存算拆散架构,数据的正本在 DFV 存储平台保障,对计算节点来说数据单正本、数据强统一,查问只须要从协调节点间接到数据节点取数据即可实现,躲避了数据不统一修复数据造成的人力老本、业务查问过程中发现数据会概率性不正确等问题。另外反对 N - 1 个节点故障容忍,提供 10 倍以上的故障重构性能和备份复原性能,保证数据的可靠性。

高扩大:秒级扩容,疾速更神速

开源 Cassandra 采纳一致性 Hash 算法对数据进行分区打散,整个环代表数据从负无穷到正无穷区间。集群中每个节点会有虚构节点(Token)在环上,虚构节点的数量可配置。黄圈代表节点 1,蓝圈代表要扩容的节点 2,2 个 Token 之间组成整个数据的其中一段 Range 区间,扩容后退出了新的 Token,会产生新的 Range,这些 Range 中的一部分会归新节点 2 治理。那么就须要把数据从节点 1 迁徙到新节点 2 下来。迁徙是通过读取节点 1 上的数据写入到节点 2 上,迁徙的速度能够通过配置参数调整,整体迁徙的工夫由数据量与迁徙过程中的读写速率无关。

GaussDB(for Cassandra)把多正本策略下沉到共享存储,大幅晋升弹性伸缩能力,如图右侧展现,新扩容的节点 2 只须要从新映射 Token2 到节点 2,就能够实现,无需做数据的读取与写入的搬迁动作,实现分钟级计算扩容,相比开源扩容工夫晋升几十倍。随着业务的一直增长,Cassandra 能够分钟级程度弹性资源扩大。在相似圣诞节等热门节日,提前 1 天进行弹性扩容,为业务顶峰预留资源,业务顶峰过后进行缩容,这些对业务无感知。计算节点能够通过文件系统管制集群在 DFV 中的数据使用量,扩容缩容磁盘时通过重新分配最大使用量,可实现秒级存储扩容,单实例反对海量数据存储。

高性能:超高写入,读性能数倍晋升

GaussDB(for Cassandra)在超强写入性能的根底上,通过应用 C 语言重构存储引擎,缩小零碎 GC,实现了数倍读性能晋升,拓宽了应用场景的内涵,使其不仅仅实用于写密集型的业务场景,在读密集的场景中也具备了强竞争劣势,整体性能超过开源自建 2~3 倍。

高平安:构筑多层爱护,为数据安全保驾护航

GaussDB(for Cassandra)通过 VPC、子网、平安组、DDoS 防护以及 SSL 平安拜访等多层平安防护体系,帮忙用户抵挡网络攻击,让用户上云无忧。

为什么抉择 GaussDB(for Cassandra)?

实用多种场景

工业制作 & 气象业

随着科技进度,采集的气象数据指数增长,须要一种系统对高空、低空、陆地、重要天气报、闪电、环境监测等卫星、雷达采集的数据可能高性能写入、查问、在线、离线剖析。

  1. 须要存储对高空、低空、陆地、重要天气报、闪电、环境监测等卫星、雷达等降雨量、湿度、温度等 PB 级数据量
  2. 撑持来自各气象采集点数据高并发写入到 Cassandra,GaussDB(for Cassandra)集群性能高于自建 2~3 倍,更适宜高并发写入读取
  3. GaussDB(for Cassandra)数据可能撑持实时在线剖析,为气象算法、天气预报做到实时精准剖析
  4. 拜访数据库进行离线数据分析,GaussDB(for Cassandra)能将离线剖析时效缩短到 60%

互联网

GaussDB(for Cassandra)具备高并发写入性能和高可扩展性,保障集群高可用和业务间断稳定性,十分实用于写入规模量较大的互联网大数据场景,如记录大规模的用户行为数据等。

  1. 寄存用户画像数据,可能完满解决特色:数据量大、能够应答数据结构 Scheme 频繁变更
  2. 查问性能要求高;比方要买一双鞋,搜寻出的鞋子数据会依据用户画像的特色做肯定的排序展现,那么要求查问用户特色表的查问性能十分高
  3. 举荐零碎:依据用户最近浏览的数据做剖析之后,举荐相干资源给用户
  4. 点赞零碎:点赞计数零碎

实时数据分析场景

GaussDB(for Cassandra)群组明天新来了一个成员,或者 yutou 明天公布一篇新文章,华为云数据库官网主动向该用户收回欢送邮件。

昵称为 yutou 的同学明天公布了一组新照片,那么另外一个程序主动向 yutou 的好友发送告诉。

原生不具备的数据变更捕捉能力,GaussDB(for Cassandra)具备变更捕捉能力,能对数据的变更做实时在线剖析,提供秒级的实时推送动作做出相应解决;具备欠缺的离线剖析解决方案,能够将离线剖析时效缩短到 60%,为商家争取更多的工夫做出相应决策。

购买倡议

GaussDB(for Cassandra)性能为开源 2 倍以上,存储空间仅需开源自建 1 /3,帮忙客户节省成本,举例如下:开源自建 8u32g 3 节点 数据量:90G(三正本),购买 GaussDB(for Cassandra)可抉择创立 4u16g 3 节点 数据量:30G(DFV 存储三正本)

点击关注,第一工夫理解华为云陈腐技术~

正文完
 0