共计 3014 个字符,预计需要花费 8 分钟才能阅读完成。
寰球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国工夫 2022 年 6 月 16 日 发表,Apache Doris 胜利从 Apache 孵化器毕业,正式成为 Apache 顶级我的项目(Top-Level Project,TLP)。
以下内容译自 Apache Doris 官网
Apache Doris 是一个基于 MPP 的现代化、高性能、实时的剖析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应工夫即可返回海量数据下的查问后果,不仅能够反对高并发的点查问场景,也能反对高吞吐的简单剖析场景。基于此,Apache Doris 在多维报表、用户画像、即席查问、实时大屏等诸多业务畛域都能失去很好利用。
Apache Doris 最早是诞生于百度外部广告报表业务的 Palo 我的项目,2017 年正式对外开源,2018 年 7 月由百度捐献给 Apache 基金会进行孵化,之后在 Apache 导师的领导下由孵化器项目管理委员会成员进行孵化和经营。
“咱们很骄傲 Doris 可能顺利从 Apache 孵化器毕业,这是一个重要的里程碑。在整个孵化阶段,依附 Apache 理念的领导和孵化器导师的帮忙,咱们学会了如何以 Apache 的形式去倒退咱们的我的项目与社区,也在这一过程中取得了微小的成长。”Apache Doris VP 陈明雨说道。
目前 Apache Doris 社区曾经汇集了来自不同行业近百家企业的 300 余位贡献者,并且每月沉闷贡献者人数也靠近 100 位。在孵化期间,Apache Doris 一共公布了 8 个重要版本,实现了包含存储引擎降级、向量化执行引擎等诸多重大性能,并正式公布了 1.0 版本。正是依附这些来自开源贡献者的力量,才使得 Apache Doris 获得了明天的问题。
与此同时,Apache Doris 现在在中国乃至寰球范畴内都领有着宽泛的用户群体,截止目前,Apache Doris 曾经在寰球超过 500 家企业的生产环境中失去利用,在中国市值或估值排行前 50 的互联网公司中,有超过 80% 的公司长期应用 Apache Doris,包含百度、美团、小米、京东、字节跳动、腾讯、快手、网易、微博、新浪、360 等出名公司。同时在一些传统行业如金融、能源、制作、电信等畛域也有着丰盛的利用。
“你能够基于 Apache Doris 疾速构建一个简略易用并且性能弱小的数据分析平台,十分易于上手,所须要付出的学习老本非常低。并且 Apache Doris 的分布式架构十分简洁,能够极大升高零碎运维的工作量,这也是越来越多用户抉择 Apache Doris 的关键因素。”
作为一款成熟的剖析型数据库我的项目,Apache Doris 有以下劣势:
- 性能优异:自带高效的列式存储引擎,缩小数据扫描量的同时还实现了超高的数据压缩比。同时 Doris 还提供了丰盛的索引构造来减速数据读取与过滤,利用分辨别桶裁剪性能,Doris 能够反对在线服务业务的超高并发,单节点最高可反对上千 QPS。更进一步,Apache Doris 联合了向量化执行引擎来充分发挥现代化 CPU 并行计算能力,辅以智能物化视图技术实现预聚合减速,并能够通过查问优化器同时进行基于布局和基于代价的查问优化。通过上述多种形式,实现了极致的查问性能。
- 简略易用:反对规范 ANSI SQL 语法,包含单表聚合、排序、过滤和多表 Join、子查问等,还反对窗口函数、Grouping Set 等简单 SQL 语法,同时用户能够通过 UDF 和 UDAF 等自定义函数来拓展零碎性能。除此以外,Apache Doris 还实现了 MySQL 协定兼容,用户能够通过各类客户端工具来拜访 Doris,并反对与 BI 工具的无缝对接。
- 架构精简:零碎只有两个 Frontend(FE)和 Backend(BE)两个模块,其中 FE 节点负责用户申请的接入、查问打算的解析、元数据存储及集群治理等工作,BE 节点负责数据存储和查问打算的执行,本身就是一个齐备的分布式数据库管理系统,用户无需装置任何第三方管控组件即可运行起 Apache Doris 集群,并且部署和降级过程都十分繁难。同时,任一模块都能够反对横向拓展,集群最高能够拓展到数百个节点,反对存储超过 10PB 的超大规模数据。
- 稳固牢靠:反对数据多正本存储,集群具备自愈性能,本身的分布式治理框架能够主动治理数据正本的散布、修复和平衡,正本损坏时零碎能够主动感知并进行修复。节点扩容时,仅需一条 SQL 命令即可实现,数据分片会主动在节点间平衡,无需人工干预或操作。无论是扩容、缩容、单节点故障还是在降级过程中,零碎都无需进行运行,可失常提供稳固牢靠的在线服务。
- 生态丰盛:提供丰盛的数据同步形式,反对疾速加载来自本地、Hadoop、Flink、Spark、Kafka、SeaTunnel 等零碎中的数据,也能够间接拜访 MySQL、PostgreSQL、Oracle、S3、Hive、Iceberg、Elasticsearch 等零碎中的数据而无需数据复制。同时存储在 Doris 中的数据也能够被 Spark、Flink 读取,并且能够输入给上游数据利用进行展现剖析。
“毕业不是最终目标,它是新征程的终点。”陈明雨说到。
“在过来,咱们发动 Doris 的指标是为更多人提供体验更佳的数据分析工具、解决他们数据分析的难题。成为 Apache 顶级我的项目一方面是对 Apache Doris 社区过来所有贡献者始终以来辛勤工作的必定,另一方面也意味着咱们在 Apache Way 的指引下建设了一个弱小的、凋敝的、可继续倒退的开源社区。将来咱们将会持续以 Apache 形式运作社区,置信会吸引到更多优良的开源贡献者参加社区中来,社区也会在所有贡献者的帮忙下失去进一步成长。”
“Apache Doris 后续将发展更多富裕挑战且有意义的工作,包含新的查问优化器、对湖仓一体化的反对,以及面向云上基础设施的架构演进等等。欢送更多的开源技术爱好者退出 Apache Doris 的社区,携手共成长。”
“咱们再次由衷地感激所有参加建设 Apache Doris 社区的贡献者们,以及所有应用 Apache Doris 并一直提出改良倡议的用户们。同时也感激一路走来,一直激励、反对和帮忙过咱们的孵化器导师、IPMC 成员以及各个开源我的项目社区的敌人们。”
— End —
欢送大家扫码退出 Apache Doris 社区用户群 ,群内将有专职工程师为用户提供技术支持,能够和社区开发者一对一沟通,同时后续社区动静以及技术流动咱们将会在用户群向大家同步。另外咱们将在用户群举办一系列毕业庆贺流动,有许多社区周边精美礼品赠送! 赶快扫描下方海报二维码退出吧!
SelectDB 是一家开源技术公司,致力于为 Apache Doris 社区提供一个由全职工程师、产品经理和反对工程师组成的团队,凋敝开源社区生态,打造实时剖析型数据库畛域的国内工业界规范。基于 Apache Doris(incubating)研发的新一代云原生实时数仓 SelectDB,运行于多家云上,为用户和客户提供开箱即用的能力。
相干链接:
SelectDB 官方网站:
https://selectdb.com (We Are Coming Soon)
Apache Doris 官方网站:
http://doris.incubator.apache…
Apache Doris Github:
https://github.com/apache/inc…
Apache Doris 开发者邮件组:
dev@doris.apache.org