明天被朋友圈刷屏了,StarRocks开源——携手将来,星辰大海!

原文链接:StarRocks开源——携手将来,星辰大海!

可能大家对StarRocks不太熟悉,然而DorisDB想必都是据说过的。

在过来相当长的一段时间,对于ClickHouse 与 DorisDB的性能之争始终经久不息。

对于实时OLAP引擎的抉择,Doris也越来越多并企业所利用。

DorisDB是一款纯国产的高性能的, 分布式关系型列式数据库。

DorisDB脱胎于百度广告业务的实时剖析场景, 于2018奉献给Apache开源社区, 之后在美团, 小米, 字节跳动, 京东等互联网企业被实用于外围业务实时数据分析。

DorisDB致力于满足企业用户的多种数据分析场景. 反对多种数据模型(明细表, 聚合表), 多种导入形式(批量, 可整合和接入多种现有零碎(Spark, Flink, Hive, ElasticSearch)。

DorisDB个性
DorisDB的架构设计交融了MPP数据库,以及分布式系统的设计思维,具备以下个性:

架构简略
DorisDB集群的失常运行不须要依赖任何其余零碎, 易部署, 易保护. 极简的架构设计, 升高了DorisDB零碎的复杂度和保护老本, 同时也晋升了零碎的可靠性和扩展性。管理员只须要专一于DorisDB零碎,无需学习和治理任何其余内部零碎。

分布式架构
DorisDB采纳分布式架构,存储容量和计算能力可近似线性程度扩大。DorisDB集群的规模可扩大到数百节点,反对的数据规模可达到10PB级别。元数据和数据管理采纳热备保障高可用, 可能自愈, 服务和数据安全可靠。

自治零碎,治理简略
DorisDB是一个自治的零碎。节点的高低线,集群扩缩容都可通过一条简略的SQL命令来实现; 在此操作期间, DorisDB后盾主动实现数据rebalance; 用户的查问和数据导入操作可同时失常运行。

另外DorisDB表模式热变更,可通过一条简略SQL命令动静地批改表的定义, 例如减少列、缩小列、新建物化视图等。同时,处于模式变更中的表也可也失常导入和查问数据。

规范SQL
DorisDB反对规范的SQL语法,包含聚合,JOIN,排序,窗口函数,自定义函数等性能,用户能够通过规范的SQL对数据进行灵便的剖析运算。 此外,DorisDB还兼容MySQL协定语法,可应用现有的各种客户端工具、BI软件拜访DorisDB, 对DorisDB中的数据进行拖拽式剖析。

MPP(Massively Parallel Processing)执行框架
DorisDB外部通过MPP计算框架实现SQL的具体执行工作。MPP框架自身可能充沛的利用多节点、多CPU, 多核的算力,充沛地将整个查问并行执行, 从而实现很好的交互式剖析体验. DorisDB可能反对亚秒级查问,并且查问QPS可达10000以上。

流批导入
DorisDB反对实时和批量两种数据导入形式, 反对的数据源有Kafka, HDFS, 本地文件. 反对的数据格式有ORC, Parquet和CSV等. DorisDB能够实时生产Kafka数据来实现数据导入,保证数据不丢不重(exactly once)。DorisDB也能够从本地或者近程(HDFS)批量导入数据。

高可用
DorisDB的元数据和数据都是多正本存储,并且集群中服务有热备, 多实例部署,防止了单点故障。集群具备自愈能力, 可弹性复原. 节点的宕机、下线、异样都不会影响DorisDB集群服务的整体稳定性。

DorisDB能够满足企业级用户的多种剖析需要,包含OLAP多维分析,定制报表,实时数据分析,Ad-hoc数据分析等。

在企业对于大数据分析面临的越来越多的问题状况下。

DorisDB降级为StarRocks,并全面开源(Github搜寻“StarRocks”)

Github:https://github.com/StarRocks/...

另外,官网下载地址与文档,请关注上面的地址。

1.18.2社区版下载地址:
Https://www.dorisdb.com/zh-cn/download/request-download/1

发行阐明:
Https://forum.dorisdb.com/t/topic/391

文档地址:
Http://docs.dorisdb.com/

POC测试指南:
Https://www.bilibili.com/video/BV1SX4y1c7i4?share_source=copy_web

测试FAQ:https://docs.dorisdb.com/zh-c...

也心愿大家为国产开源软件奉献一份本人的力量。

获取更多StarRocks材料,欢送关注 大数据流动 回复 “StarRocks”