关于结构化数据存储:下一个十年我们需要一款什么样的分析型数据库
本文来自于 Doris Summit 2022 演讲实录,演讲人:陈明雨 十年对于数据库意味着什么?身处在突飞猛进的时代,咱们见惯了技术的衰亡与凋敝、变迁与衰败,甚至是朝荣夕灭。信息技术以前所未有的速度更迭,给周遭事物带来了颠覆性地变动。数据库亦是如此,有数数据库悄悄埋没在技术更迭的浪潮里,直到在浩渺如海的代码片段中都找不到些许印记。而有的则历久而弥新,禁受了工夫的考验,彰显出弱小的生命力,并以更加枯萎的姿势扎根成长。 十年对于数据库而言,可能是一段从诞生到消失的残缺软件生命周期,也可能是迈过里程碑之后的全新旅程。 所以从 MySQL 1.0 版本诞生,到具备颠覆性意义的 MySQL 5.7 版本正式公布,时间跨度刚好是十年,而十年之后的故事,大家曾经都晓得了。 所以从 Benoit、Thierry、Marcin 联结创立 Snowflake,到在纽交所胜利上市、成为软件行业有史以来最大规模的IPO,再到全面开启云数据仓库时代,时间跨度也差不多十年。 而对于 Apache Doris,十年意味着什么? 留个悬念,在答复这个问题之前,咱们无妨来回顾下社区倒退历程。 只管最早的历史能够追溯到 2008 年的百度凤巢广告零碎,但彼时非 SQL 的单机查问引擎加 KV 存储系统在产品状态上与 OLAP 还有着较大的差别。 正式确立 OLAP 数据库这一状态是在 2013 年。通过自研全列式存储引擎 OLAP Engine 并基于 Apache Impala 革新了全新的 MPP 查问引擎,自此,Doris 真正成为了具备大数据量下高效反对数据分析能力的 OLAP 数据库,并在百度外部大规模利用,成为了百度外部对立的 OLAP 剖析平台。 往往一个外部我的项目的倒退会有两种演进模式,一种是随着需要的减少零碎架构日益臃肿,当面对较为灵便的需要,常因改变老本过大而被彻底重构。另一种则是长期服务某一固定场景、需要逐步收敛乃至停滞,最终被疾速变革的内部技术彻底取代。而开源则是外部我的项目的一场新生,在更广大的利用场景、更多样的开发者群体以及更高效的研发模式加持下开启新的篇章。 于是在数个版本的迭代与优化后,2017年 Doris 的前身在 GitHub 上开源,2018 年进入 Apache 基金会孵化,并正式更名为 Apache Doris。(GitHub 地址:https://github.com/apache/doris) 时至 2022 年,正是 Apache Doris 在 OLAP 畛域深耕的十年之际。 ...