乐趣区

阿里云HBase全新发布X-Pack 赋能轻量级大数据平台

一、八年双十一,造就国内最大最专业 HBase 技术团队
阿里巴巴集团早在 2010 开始研究并把 HBase 投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储。持续 8 年的投入,历经 8 年双十一锻炼。4 个 PMC,6 个 committer,造就了国内最大最专业的 HBase 技术团队,其中 HBase 内核中超过 200+ 重要的 feature 是阿里贡献。集团内部超过万台的规模,单集群超过千台,全球领先。
二、HBase 技术团队重磅发布 X -Pack,重新赋能轻量级大数据平台
阿里云自从 17 年 8 月提供 HBase 云服务以来,到 18 年 12 月累计服务了上千大 B 客户,已经有上千个在线的集群。是阿里云增长最为快速的数据库服务,也是大 B 客户比例最高的云服务之一。并于 6 月 6 日全球第一个推出 HBase 2.0,是 HBase 领域当之无愧的排头兵。
为了满足客户对数据库更丰富业务处理需求、更易用、强大功能的需求,我们重磅发布 X-Pack:支持 SQL、时序、时空、图、全文检索能力、及复杂分析。阿里云 HBase 从 KV 为主大数据数据库成功进化成“轻量级全托管大数据平台”数据库。
全部能力计划 12 月底全部上线。
三、深度解读“轻量级全托管大数据平台”,云 HBase 能力再上新台阶
通常一个大企业里面,数据和业务存在天然的多样性。真正称得上平台级的数据库,要至少要满足客户不同三个及以上层次的诉求,才能称的上平台级。
阿里云 HBase 从成本最优化、运维便利性、业务敏捷度三个方面将 HBase 的能力全面提升一个高度,成就轻量级全托管大数据平台,云 HBase 能力再上新台阶。
3.1 轻量级,满足 CXO 成本最优化的诉求
1)起步成本低,整体成本低,扩展性强。云 HBase 针对企业不同的使用环境,不同的 SLA 诉求,云 HBase 一共提供 3 个版本,分别满足开发环境,在线业务,以及金融级业务的诉求。单节点版本,低廉的价格用于开发测试场景,集群版本,99.9% 可用,满足企业在线业务诉求,支持最高 5000 万的 QPS 和 10P 的数据。还有支持金融级高可用的双活版本。所有版本都支持 11 个 9 的数据可靠性,无需担心数据丢失。
2)支持冷存储,助你不改代码,1/ 3 成本轻松搞定冷数据处理
大数据场景下,存储成本占比往往是大头,把存储成本降下来,整体成本才能下降。
一般随着业务的发展,HBase 中存储的数据量会逐渐变大。在这些数据中,业务最关心的,最常访问的,往往是某些特定范围的数据,比如说最近 7 天的数据,业务对这类数据访问频次高,延迟要求高,即所谓的热数据。而其他的数据,一般访问量极少,性能要求不高, 但这类数据往往数据量大,即冷数据。如果能把冷热数据分离开,把热数据存储在性能更好的介质中,而把庞大的冷数据放到成本更低的介质中,从而实现把更多优质资源用来提高热数据的读写性能,同时节省存储成本的目的。

阿里云 HBase 针对冷数据存储的场景,提供一种新的冷存储介质,其存储成本仅为高效云盘的 1 /3,写入性能与云盘相当,并能保证数据随时可读。冷存储的使用非常简单,用户可以在购买云 HBase 实例时选择冷存储作为一个附加的存储空间,并通过建表语句指定将冷数据存放在冷存储介质上面,从而降低存储成本,基本不用改代码就获得了低成本存储能力,助力企业降低整体成本。
3.2 全托管,全面解放运维,为业务稳定保驾护航
大数据时代,数据是企业最宝贵的资产,业务是企业赖以生存的基础。因此高可用和高可靠是最基本诉求。云 HBase 提供的全托管服务相比其他的半托管服务以及自建存在天然的优势。
依托持续 8 年在内核和管控平台的研究,以及大量配套的监控工具、跨可用区,跨域容灾多活方案,云 HBase 提供目前业界最高的 4 个 9 的可用性(双集群),11 个 9 的可靠性的高 SLA 的支持,满足众多企业客户对平台高可用、稳定性的诉求。
云 HBase 服务定位为全托管服务,后台自动代维和保持服务稳定性,极大的降低了客户使用门槛,让无论是 SME,还是巨头都能享受到 HBase 技术红利。选择云 HBase 就是选择了高可用、高可靠服务!
3.3 全面能力提升,源头解决业务敏捷度,真正释放数据和业务的价值
1)100% 兼容原生接口和能力,开发简单,容易上手。云 HBase 百分百兼容开源接口,并提供一系列配套开发,数据搬迁,监控工具,全面帮助用户提高开发和管理效率。
2)独家跨 Region/AZ 双活
阿里云是云 HBase 首家推出跨 Region/AZ 双活,在一个集群出现故障的时候,迅速地将业务切换至另外一个集群从而避免故障。HBase 主备之间数据的同步基于异步链路实现,遵循最终一致性协议,典型的主备同步延迟在 200ms 左右。满足金融、社交、电商、人工智能等关键领域对高可用的诉求。
3)备份恢复量级提升百倍以上,数据库领域最大我们经常会听到“某某某 DBA 误操作把整张表删了”,“某某磁盘故障,造成数据库的某个库的数据全部损坏了”。这种由于外在和内在的原因造成的数据不可靠,最终会给用户带来毁灭性的灾难。
所以一个企业级数据库,全量备份、全量恢复、增量备份、增量恢复,是基础能力。传统数据库备份恢复的能力都是 TB 级别,这在交易等场景下面是足够的,但是面向大数据场景就捉襟见肘了。云 HBase 通过垂直整合高压缩、内核级优化,分布式处理等能力,将备份恢复的量级成功推高百倍以上,做到百 TB 级别甚至更高,让客户大数据量下面也无后顾之忧。
4)支持融合多模型和融合多负载、提供开箱即用的能力
云 HBase 在 KV 的基础上,同时支持时序、时空、图、文档等多种数据模型,内置丰富处理能力,让业务开发效率提升百倍。
在线能力的基础上,融合流处理、批处理、OLAP,OLTP、高速对象存储,全文检索等能力,提供客户融合业务开箱即用的能力。
四、展望未来,持续优化服务,不负重托,成就客户
历经近 8 年的技术沉淀,阿里巴巴大数据 NoSQL 数据库处理技术的精华沉淀在 HBase 上,后者成功支撑了成功支撑了阿里经济体中最大的 NoSQL 业务体量,是阿里大数据处理技术的核心组成部分,当前将这项技术应用到广大企业中,助力企业发现数据价值。
短短 1 年间,就覆盖了社交、金融、政企、车联网、交通、物流、零售、电商等数十个个行业,帮单用户顶住千万级 QPS 的业务压力,以及百 PB 级数据高效存储和处理。

本文作者:所在 jason 阅读原文
本文为云栖社区原创内容,未经允许不得转载。

退出移动版