简介:阿里云ES全观测引擎TimeStream时序加强性能最新公布,在云原生ELK全托管根底上,通过TimeStream时序加强性能插件,可实现高性能、低成本时序数据存储和查问剖析。本文介绍TimeStream实用场景、性能劣势、性能测试后果和实际案例
Elasticsearch的全观测能力
视频介绍>>
随着企业IT零碎拓扑构造日趋简单,零碎架构从单体道分布式再到微服务,部署模式从物理服务器部署到虚拟化再到容器化利用,基础设施上云后开发模式也从传统瀑布式到DevOps开发运维联合。简单的零碎链路中多种数据源背地,是不同的数据类型,以及极高的海量非结构化数据的对立采集、加工、存储和保护老本。在传统SRE运维场景之外,企业业务场景在实时剖析、平安审计、用户行为、经营增长、交易记录场景衍生出各类利用,由此带来多套观测计划交错,保护老本大幅晋升,同一个业务组件或零碎,产生的数据不同计划中数据难互通,无奈充分发挥数据价值。
由此,各个企业也越发关注对系统可观测能力的建设,迫切需要把各类数据在对立平台进行存储、监控和检索剖析。业内公认,log、metric、trace是全观测的三大支柱,通过搭建对立的观测零碎,在运维场景帮忙运维人员在「事先」理解零碎运行状态,「事中」疾速定位故障,「预先」根因剖析,以此晋升零碎高可用,降本增效。但在全观测技术演进过程中,不仅须要跨云、跨业务零碎实现日志和时序数据的观测,而日志、时序等各类数据场景撑持的技术原子工具繁多,工具之间的连接艰难,技术组价及平台的保护老本高。
可观测作为Elastic三大外围解决方案之一,基于Elasticsearch全观测能力能够对立收集日志、指标、uptime数据、应用程序跟踪tracing数据,并将各类数据对立存储到 Elasticsearch,进行对立解决剖析并基于Kibana 实现可视化。从而可观测场景下实现了技术栈对立,SRE团队也毋庸基于多种技术组件搭建可观测平台。
在全观测场景下,阿里云Elasticsearch在基于云原生Serverless日志引擎能力,继续优化在海量日志数据的写入性能及存储老本。而在对Metric时序数据的存储和处理过程中,往往会面临以下几个问题:
TimeStream是什么?
TimeStream是阿里云Elasticsearch团队自研,并联合Elastic社区时序类产品个性共建的时序引擎。在云原生ELK全托管根底上,通过TimeStream时序加强性能插件,可实现高性能、低成本时序数据存储和查问剖析。
阿里云ES TimeStream的劣势
作为与Ali内核深度整合的阿里云ES时序场景核心技术,Timestream大幅优化了阿里云ES时序场景的老本、性能和易用性:
- 数据管理提效:基于Timestream时序数据模型及增删改查,集成Elasticsearch在时序场景的最佳实际模板,大幅升高了Elasticsearch治理时序指标数据的门槛
- 查问体验晋升:反对应用PromQL查问Elasticsearch数据,可无缝对接Prometheus+Grafana,反对DownSample采样查问和DataStream工夫分区
- 存储老本优化:通过数据压缩优化、元数据存储容量优化,TimeStream索引相比开源Elasticsearch一般索引的存储容量升高了80%以上
- 读写性能晋升:TimeStream索引相比开源Elasticsearch一般索引写入TPS晋升近40%,对于时序数据的罕用查问剖析,性能相比开源Elasticsearch晋升了5倍
与开源比照
时序场景中Elasticsearch在应用和不应用TimeStream插件状况下,场景化配置、存储、查问比照如下:
比照项 | 应用TimeStream | 不应用TimeStream |
<span class="lake-fontsize-10">场景化配置</span> | <span class="lake-fontsize-10">TimeStream引擎原生反对时序类型数据模型,</span><span class="lake-fontsize-10">主动生成_tsid,indexing sort优化</span><span class="lake-fontsize-10">等</span> | <span class="lake-fontsize-10">须要用户进行大量指标场景最佳实际,例如生成一个工夫线id字段,应用工夫线id和工夫配置indexing sorting,应用工夫线id做routing等</span> |
<span class="lake-fontsize-10">存储</span> | <ul><li><span class="lake-fontsize-10">ali-codec插件反对通过doc_values生成_source</span></li><li><span class="lake-fontsize-10">反对</span><span class="lake-fontsize-10">不存储_id</span></li><li><span class="lake-fontsize-10">ali-codec在时序场景压缩优化</span></li></ul> | <ul><li><span class="lake-fontsize-10">时序场景_id、_source等元数据字段占用</span><span class="lake-fontsize-10">70%</span><span class="lake-fontsize-10">+存储容量</span></li><li><span class="lake-fontsize-10">doc value对double类型压缩不敌对,时序场景数据类似度很高,double数据却根本没压缩</span></li></ul> |
<span class="lake-fontsize-10">查问语句</span> | <span class="lake-fontsize-10">反对</span><span class="lake-fontsize-10">PromQL查问DSL</span> | <span class="lake-fontsize-10">专门构建query DSL查问Metric数据</span> |
<span class="lake-fontsize-10">降采样</span> | <span class="lake-fontsize-10">简略配置工夫距离,即可反对</span><span class="lake-fontsize-10">降采样性能</span> | <span class="lake-fontsize-10">须要用户侧自行进行降采样解决</span> |
<span class="lake-fontsize-10">工夫分区</span> | <span class="lake-fontsize-10">依照理论数据分区,一个工夫范畴的数据会散布在确定的索引中</span> | <span class="lake-fontsize-10">按写入的程序分区,一个工夫范畴的数据可能散布在很多索引中</span> |