Doris Summit 2022 将于 1 月 6 -7 日在线上正式举办,本次峰会共分 2 天进行,首日上午为主论坛:核心技术解析,下午为商业与数据生态分论坛,7日全天为行业用户最佳实际案例。大会汇聚了来自寰球顶尖云厂商、一线互联网企业、明星守业公司以及开源畛域的泛滥资深技术专家,旨在探讨和洞悉 Apache Doris 最新技术趋势、行业最佳实际、以及数据上下游生态利用。
其中在首日的主论坛上,来自 Apache 基金会、SelectDB、百度、美团、字节跳动等企业的社区外围贡献者将与大家一道:
- 回顾过去,如何在 Apache Way 的指引下打造一个弱小而凋敝的开源社区;
- 立足当初,如何在用户实在业务的考验下实现核心技术个性的飞跃性提高;
- 展望未来,如何在数据分析架构的改革中探明并引领技术演进趋势;
一场精彩的技术盛宴,不容错过!
议题介绍
Doris in Apache
“作为寰球最大的开源软件基金会,Apache 基金会的使命是为公众提供收费开源软件。随着多年的倒退,以 Apache Hadoop、Apache Spark、Apache Flink 等为代表的 Apache 我的项目简直形成大数据技术畛域的事实标准,Apache Doris 也正是因而成为 Apache 大数据生态的一员,并逐步成长为 Apache 顶级我的项目,取得了寰球开发者的关注与认可。
在这次演讲中,我将以 Apache Doris 的故事为例,为大家介绍如何基于 Apache Way 打造一个弱小而凋敝的开源社区,并帮忙开源我的项目获得最终的胜利。”
新起点、新征程,Apache Doris 社区回顾与瞻望
“2022 年必然是 Apache Doris 倒退历程中至关重要的年份之一。在这一年,Apache Doris 的飞速停顿引人注目,社区贡献者和提交代码量成倍数增长,外围性能个性获得了全面进化,寰球范畴内用户企业规模超过 1000 家,并且于 6 月正式毕业成为 Apache 顶级我的项目。
在本次演讲中,我将与大家一起回顾过去一年来 Apache Doris 的里程碑时刻以及重要停顿,并揭晓 2023 年社区的重要布局以及 RoadMap。”
执行模型变迁与性能优化
“ 凭借 MPP 查问框架、向量化执行引擎以及泛滥查问优化伎俩,Apache Doris 实现了极致的查问性能,尤其是近期颁布的最新版本,无论是宽表模型或星型模型都获得了近 10 倍的性能晋升,更是在公开的数据库评测榜单中获得了极为亮眼的体现。而将来 Apache Doris 又将在哪些方向进一步实现性能的冲破?
在本次演讲中,我将为大家介绍 Apache Doris 执行模型的变迁与性能优化背地的技术实现,以及在最新版本中实现的全新内存治理框架,同时将揭秘后续性能继续冲破的方向。”
全新查问优化器的设计与实现
“从一条查问 SQL 命令的提交到最终查问打算的生成与执行,查问优化器是数据库高效运行至关重要的一环。而古代查问优化器面临着越来越简单的查问需要以及越来越多样的场景负载,对查问优化器提出更高的性能和准确性要求。在这样的背景下,Apache Doris 全新查问优化器应运而生。
在本次演讲中,咱们将为大家介绍 Apache Doris 全新查问优化器的设计思考与技术实现,并正式公开以后的开发进展以及后续的版本布局。”
多模数据分析与简单类型的设计与实现
“随着数据量的爆炸式增长,数据结构日趋简单,半结构化、非结构化数据的剖析需要快速增长。在这样的背景下,Apache Doris 在最新版本中对实现了二进制 JSON 类型 JSONB、数组类型 Array 的反对,后续并将进一步强化多模剖析能力,旨在同一数据库中实现对结构化、半结构化、非结构化数据的对立存储与剖析。
在本次演讲中,咱们将为大家介绍 Apache Doris 在多模数据分析场景获得的停顿,并一一揭晓后续在 JSON Native 反对、文本剖析以及 Array、Map、Struct 等简单数据类型上的迭代打算。”
数据湖联邦剖析个性揭秘
“依靠于弱小的并行处理能力和高性能算子,Apache Doris 在海量数据集上提供了亚秒级的交互式查问体验。而近年来,随着数据湖技术的迅猛发展,越来越多用户开始依靠数据湖技术构建其根底数据的存储架构,并利用数据湖的批流一体、事务隔离与数据更新能力,联合各类计算引擎实现湖仓一体的架构,减速海量数据的深度洞察。
在本次演讲中,我将为大家介绍湖仓一体的技术演进,并揭秘如何通过 Apache Doris 的数据湖联邦剖析能力,构建湖仓一体化的古代数据平台。”
全新 Unique Key 的设计与存储模型优化
“在实时数据仓库的业务场景中,可能敌对地反对数据实时更新是一项重要的能力,而这也是业内常见 OLAP 数据库一贯的短板之一。在 Apache Doris 最新版本中,在原 Unique Key 的根底上引入了全新的数据更新模式 Merge-on-Write,力求在实时更新和高效查问间失去对立。通过测试,在多个实在场景的模仿测试中,性能有了数倍至数十倍的晋升。
在本次演讲中,我将为大家介绍全新 Unique Key 的设计思考与实现细节,同时也将分享新版本在存储引擎上进行的诸多优化以及后续的工作布局。”
多表物化视图的设计与实现
“物化视图是一种典型的「空间换工夫」思路,通过事后计算并将定义的查问后果存储起来,以减速雷同查问的效率。目前 Apache Doris 的物化视图因为底层实现计划的缘故,在应用场景中存在着许多限度,例如不反对多表Join、聚合函数不反对表达式等,无奈彻底施展预计算带来的性能晋升。因而,在 2022 年咱们正式启动了多表物化视图的设计与开发。
在本次演讲中,我将为大家介绍以后多表物化视图个性的设计思考,并进一步同步该性能个性的研发停顿以及后续的版本打算。
”
稳定性晋升与代码质量保证
“在 Apache Doris 社区贡献者规模与提交代码量日益递增的明天,咱们势必须要一套稳固可执行的品质保障机制及相应的配套工具,保障社区贡献者工作效率的同时,也能进一步晋升贡献者所提交代码的品质。
在本次演讲中,我将为大家介绍 Apache Doris 社区在稳定性建设和代码质量保证方面作出的致力与成绩。”
主论坛议程
交换群
您可通过下方二维码退出 Doris Summit 2022 峰会交换群,关注实时峰会资讯,参加峰会直播互动! 还有机会与讲师1v1在线交换~
对于 Doris Summit
Doris Summit 是 Apache Doris 社区年度技术盛会,大会汇聚世界各地 Apache Doris 社区成员及实时剖析数据库畛域的专家。社区通过大会颁布最新动静以及年度 Roadmap,集结国内外各大厂商分享基于 Doris 的实践经验及行业将来发展趋势,更有畛域内大咖与大家在线互动交换。这是社区用户及相干畛域从业者不可多得的技术盛会,不容错过,诚邀您来加入!
对于组织方
SelectDB 是Doris Summit Asia 2022 的组织者,也是 Apache Doris 背地的商业化公司。致力于为 Apache Doris 社区提供一个由全职工程师、产品经理和反对工程师组成的团队,凋敝开源社区生态,打造实时剖析型数据库畛域的国内工业界规范。基于 Apache Doris 研发的新一代云原生实时数仓 SelectDB,运行于多家云上,为用户和客户提供开箱即用的能力。
发表回复