关于数据库:定义现代化实时数据仓库SelectDB-全新产品形态全面发布
导读:9 月 25 日,2023 飞轮科技产品发布会在线上正式召开,本次产品发布会以 “新内核、新图景” 为主题,飞轮科技 CEO 马如悦全面解析了现代化数据仓库的演进趋势,发表立足于多云之上的 SelectDB Cloud 云服务全面凋谢,减少了全新的公有仓库(BYOC)产品模式,同时公布了更加自主可控的 SelectDB Enterprise 企业版。飞轮科技联结创始人兼 COO 连林江介绍了基于 SelectDB 的多个场景解决方案以及生态单干模式,来自同盾科技、趣丸科技以及观测云的多位客户代表为大家分享了基于 SelectDB 的架构降级在实在业务场景中带来的收益,将来飞轮科技将保持以“客户价值”为出发点引领技术革新、以“凋谢共赢”为核心理念携手更多合作伙伴,为行业注入新的生机。以下内容依据飞轮科技 CEO 马如悦演讲内容整顿: 收费试用 SelectDB Cloud:https://cn.selectdb.cloud/ 间隔上一次产品发布会曾经有近一年的工夫,在这一年的工夫里,咱们对于技术趋势、对于客户服务、对于市场需求都有了更加深度的思考,因此咱们的外围产品 SelectDB 也有了更加长足的提高,因而很快乐能够给大家分享这一年咱们所获得的成绩——这就是咱们明天发布会的主题 “新内核、新图景” ,新内核指的是 SelectDB 产品内核将全面采纳最新公布的 Apache Doris 2.0 版本,新图景指的是新的产品定位与产品状态,接下来将为大家一一论述。 数据仓库的现代化趋势纵观数据仓库的倒退历程,数据仓库的演进经验了三个阶段,第一阶段即在 2010 年之前,以 Teradata、Greenplum、IBM Netezza 为代表的传统数据仓库占据支流。 2010 年前后,随着谷歌三驾马车的问世,基于 Hadoop 的大数据平台成为大数据分析的基座,成为第二阶段的事实标准。现在曾经进入第三阶段,现代化的数据仓库产品开始涌现,这些产品兼顾了传统数据仓库的可靠性和性能劣势,以及对大数据的高效解决和实时剖析能力。 总体而言,数据仓库的三大现代化趋势为实时剖析、湖仓交融以及云原生化。 实时剖析:大规模实时数据上的极速查问 随着工夫的推移,数据的利用价值逐渐降落 过来,大多数企业应用的传统数据仓库/大数据平台次要是对历史数据进行批量剖析,如果能对数据进行实时剖析并将剖析后果实时使用到业务之中,毫无疑问将会进一步利用好数据的实时价值并驱动业务提高。因而到现在时代,数据分析逐步从原来的批量解决演变到当初的实时处理。 以业务剖析需要的变动为例,越来越多的企业开始采纳实时报表和实时仪表盘展现数据,取代了传统跑批工作生成的报表。而从批量生成的动态报表到交互式剖析也是另一个典型趋势,过来咱们只须要跑一份动态报表,而现如今当初很多公司外部都有大量的数据分析师,须要与零碎进行疾速互动实时产出剖析后果。此外,数据后果不再仅限于人应用,逐步转向为机器和算法应用的实时决策零碎。这些变动清晰地展示了一个新的趋势:数据从批量解决逐步转向实时剖析已成为必然。 与此同时,过来数据分析系统次要是给外部的经营决策或数据统计来应用,而随着业务的倒退、数字化转型的深入,越来越多的数据分析开始面向业务的内部客户,次要场景包含广告营销报表、物流实时看板、保险客户剖析和交易明细查问等。这些都是数据分析需要由内到外的转换,这种转变也要求咱们的剖析零碎可能适应更多样化的业务场景。 在应答大规模数据的实时剖析时,外围挑战来自两个方面: 随着数据实时写入数据库,咱们面临的挑战之一是如何以更低的提早提供数据。咱们须要升高数据传输和解决的提早,以进步数据的新鲜度,并及时处理最新数据的变动。对于下层数据利用而言,如何提供更快的查问、升高查问耗时。咱们须要继续优化查问性能,进步查问的疾速响应度,以满足下层数据利用的性能需求。 SelectDB 实现了大规模实时数据的极速查问 那么 SelectDB 是如何解决实时剖析的难点呢?一方面是 SelectDB 实现了 大规模数据的实时导入与实时存储: 秒级的数据实时更新(主键表)与追加:SelectDB 实现了实时数据的秒级可见,在主键表和非主键表上实现了高效的实时更新和追加,相比之下,许多传统数据仓库甚至包含当初宽泛应用的 Snowflake 和 Redshift 往往只能反对批量更新、甚至没有主键表的反对,很难实现高频率的实时更新。数据库 CDC / Kafka 流式数据同步:实时数据仓库的上游数据源往往来自 TP 数据库或 Kafka 音讯队列 ,为此 SelectDB 内置了数据库的CDC(变更数据捕捉)性能以及 Kafka 的流式数据同步性能,可能实现秒级的数据同步。毫秒级轻量化表模式批改:不止数据能够实时写入和更新,对于表的模式(Schema)也须要进行疾速变更,以适应当今疾速变动的业务环境。而 SelectDB 可能毫秒级提供 Schema 批改的性能,同时 Schema 批改期间齐全不影响在线业务的运行丰盛的半结构化数据类型反对:随着不同类型的数据一直减少,半结构化数据类型也日益常见。SelectDB 通过引入 Array、Map、JSON 等数据结构,可能高效反对半结构化数据类型的存储和解决需要。在查问方面,SelectDB 实现了多种查问负载上的极速剖析性能 : ...