乐趣区

为什么选择Cassandra

cassandra 概况

为什么选择 Cassandra?cassandra 到底有那些令人印象深刻的特点呢?不防我们先来看下 cassandra 目前的大体概况。

理论扎实,师出名门

cassandra 不仅吸收了 dynamo 论文中的如何做分布式,如何做副本复制,故障容错等方面成功的经验,又吸取了 google bigtable 中的 LSM 单机引擎层面精华。理论扎实,工程实现靠谱,所以面世以来,不断受到人们的追捧。

DB-EnginesRanking 排名一骑绝尘

宽表领域第一,全部数据排名第十,可以看出广受用户认可,流行度颇高。

Nosql 主流产品性能对比

从 benchmark 可以看到 cassandra 性能是摇摇领先的,受用户认可也是有原因的,毕竟能打,有实力。
摘自:https://www.datastax.com/nosql-databases/benchmarks-cassandra-vs-mongodb-vs-hbase

为什么选择 cassandra

了解了 cassandra 概况,表现抢眼,再让我们深入看看,什么原因让我们选择 cassandra

我大致总结了如下十点:

1. 线性扩展,轻松应对速度,多样性和复杂性问题

与下一代云应用相关的许多挑战都集中在数据量和数据处理速度上。Cassandra 能否有能力应对这种具有多样性的数据流量?答案是肯定的,Cassandra 是线性扩展,可以根据前台数据流量轻松确定集群规模,处理能力不够?加一台节点试试。

2. 可以处理大量数据集

Netflix,Hulu,Instagram,eBay,Apple 和 Spotify 都在大规模使用 Cassandra,作为他们产品后端的一部分。facebook 的 instangram 一天用 cassandra 处理上亿图片,这足够说明了 cassandra 可以自如的处理大量数据集。

3. 一致化软硬件环境,易于大规模部署

不像有些分布式系统,cassandra 不依赖外部组件,所有必须的操作都集成在 cassandra 内部了,因为是 p2p 对等架构,无主,环上的节点都是对等的,所以实际部署时,只需要一种机型,一个进程,极度简化部署及后续运维工作,适合大规模部署。

4. 高度容错

Cassandra 采用了许多容错机制。由于 C * 是无主的,所以没有单点故障。可以做到不停服滚动升级。这是因为 Cassandra 可以支持多个节点的临时失效(取决于群集大小),对群集的整体性能影响可以忽略不计。

Cassandra 提供多地域容灾。Cassandra 允许您将数据复制到其他数据中心,并在多个地域保留多副本。除了作为强大的灾难恢复和业务连续性保障之外,这有助于满足许多监管,离线分析等要求。

5. 被证明过,已经在企业应用程序和许多用例中取得成功

已经有许多 Cassandra 被有效使用的例子。银行和其他金融机构正在使用 C * 存储大量金融数据。分析公司正在使用 Cassandra 来存储网络分析数据。医疗公司正在使用 Cassandra 来存储传感器数据和其他时序数据。还有许多公司利用 Cassandra 存储物联网数据。所以说 cassandra 是被证明过的。

6. 易于管理

Cassandra 简化了系统管理。由于 Cassandra 是一个无主系统,环中的所有节点都是相同的; 一个同质的系统。它具有容错能力,可以支持节点临时失效,同时对性能的影响最小。这意味着节点易于更换,并且也不要求即刻替换宕机节点。

7. 自主优化

有大量的,不同的参数让你根据自身场景不断的调优,举个例子,如果你是一个重写,读很少的场景,可以修改配置参数成重写系统。参数设置不仅仅是集群级别的,也可以是 dc 级别的,甚至客户端单个请求级别的,比如单次请求设置一致性级别,已达到更低的延时。

8. 易于集成其他开源组件

Cassandra 可以很容易的跟其他开源组件做集成。据我所知,cassandra 已经成功跟 kafka,spark,solr 做集成,打通了大数据生态上下游,成为大数据处理里面重要的一环

9. 出色的监控选项

cassandra 提供了很多的监控指标,这些监控项这可以通过 Cassandra 利用 Java MBeans 并将它们暴露给不同外部监控系统,比如 Datastax 的监控系统 Opscenter,阿里云的天象监控系统。您可以使用这些指标监控 cassandra 运行状况,再出现异常指标做出相应的决策。

10. 开源可控 & 活跃的社区

目前 apache cassandra 有 5.4K Star,并且是开源可控,不需要昂贵的 licence 费用。stackoverflow 上有数万个打了 cassandra tag 的问题,这些足以说明 cassandra 足够活跃。

一个开源软件要获得真正意义上的成功,就需要有一个围绕它发展的生态系统。对于像 Cassandra 这样的数据库,就必须有围绕它的咨询,监控和故障排查系统,插件,仪表系统和备份系统, 使得您的组织不需要重复开发上述一切能力,可以基于社区已有的内容。甚至很多云厂商提供 Cassandra 托管服务,让您只关注应用程序的开发。

总结

cassandra 功能强大,更像一个真正的数据库,以下图总结来结束本文

Cassandra 是您理想的数据库原因有很多。了解您的系统要求,工作负载和未来业务增长情况将有助于您做出正确的选择。如你所见,选择 Cassandra 是一个十分明智的选择。


本文作者:陈江 @阿里

阅读原文

本文为云栖社区原创内容,未经允许不得转载。

退出移动版