关于ios:块存储监控与服务压测调优利器EBS-Lens发布

47次阅读

共计 3936 个字符,预计需要花费 10 分钟才能阅读完成。

简介:SLS 团队联结 EBS 团队公布了 EBS Lens,针对块存储提供数据分析、资源监控的性能,能够帮忙用户获取云上块存储资源信息与性能监控数据、晋升云上块存储资源的管理效率、高效剖析业务稳定与资源性能耗费状况。

EBS 监控现状

块存储是阿里云为云服务器 ECS 提供的块设施产品,具备高性能和低时延的特点。邻近双十一,在大促的时候,磁盘 IO 往往是运维的重点,如果磁盘被打爆了,那么要害的业务可能会停滞甚至解体。EBS 监控目前存在几个问题:

  • 块存储提供的原生监控仅限度在单实例级别,只能查看单个云盘的性能监控,短少对全局云盘状态的监控,如果云盘数量很多,那么云盘状态的监控就十分麻烦

  • 通过 SLS Logtail, Telegraf 或者云监控 agent 等,能够实现对单个 ECS 实例所有云盘的状态的监控。然而这些监控形式都是侵入式的,agent 的装置、监控大盘的保护、云盘实例监控精细化管制、以及跨 ECS 实例的监控,对于用户来说,都有很大的学习老本和代价
  • 剖析维度繁多,以上场景下,对云盘的监控和剖析还是基于云盘 id 的,而云盘资产自身的属性也蕴含很多信息。比方用户想看到一个本人所有云盘资产的大图、各个地区的云盘散布、各个云盘类型的比例等信息,都是很难做到的。
  • 正是思考到用户对 EBS 监控的应用有如上的痛点,SLS 团队联结 EBS 团队公布了 EBS Lens(Lens, 透镜的意思,取名为 Lens 意味着洞察云产品轻微的变动),针对块存储提供数据分析、资源监控的性能,能够帮忙用户获取云上块存储资源信息与性能监控数据、晋升云上块存储资源的管理效率、高效剖析业务稳定与资源性能耗费状况。

EBS Lens 产品特点

自动化数据采集

EBS Lens 开启后,SLS 会主动从用户的 EBS 资产中拉取云盘列表。进入 APP 后首先展现的就是接入治理页面,在这个页面,能够看到 EBS 云盘全局的一个治理视图,蕴含以下信息:

  • 展现以后接入的云盘总量、数据采集的云盘数量、云盘的地区和指标存储库的数量。
  • 展现 EBS 实例信息。例如,实例 ID、标签、云盘品种、云盘类型、可用区信息、采集状态、采集操作等信息。如果用户在开启 EBS Lens 之后,对 EBS 云盘有新建、更新和删除操作的话,SLS 会自动更新这里的云盘列表

采集配置

EBS 云盘资产同步过去之后,须要用户开启云盘资产的监控数据采集。在这里,咱们提供两种采集形式,一种是供用户进行精细化治理的手动采集,还有一种是在 EBS 云盘数量过多的状况下,不便用户全局治理的自动化采集。

手动采集

  • 反对对单个实例的采集状态进行治理
  • 思考到 EBS 实例数量会比拟多,这里反对在单个分页上面进行批量开启 / 批量敞开操作

自动化采集

  • 当用户云盘有几百甚至上千个的时候,手动采集的治理形式显然不能满足需要,因而咱们还提供了一个自动化采集的性能。自动化采集提供了图形化的配置界面:
  • 能够应用地区、实例 ID、付费类型、磁盘类型、标签等属性设置采集条件。
  • 规范模式下各个条件之间为且关系。高级模式下,您能够灵便组合与嵌套条件。

配置保留之后,自动化采集立即开启。所有满足条件的云盘,都会主动关上日志采集,从而省去了手动操作的步骤,另外当实例有所增减的时候,自动化采集也可能感知实例的变动,进行相应的调整。

存储库信息展现

开启云盘监控数据采集之后,SLS 会从 EBS 云盘上拉取监控数据,而后投递到用户配置的指标存储库里,以时序数据的模式进行存储,在指标存储库这个 tab 里,反对的性能有:

  • 反对查看存储指标库的地区、数据保留工夫
  • 反对数据保留工夫的调整

点击指标库,能够进入 SLS 的 project 页面,查看原始监控数据

EBS 云盘资产同步、日志采集开启之后,EBS Lens 就有了 EBS 云盘资产和云盘的监控数据了,基于这两个数据,EBS Lens 做了两个监控大盘,资源概览和性能剖析页面。

多维度数据聚合与丰盛的数据指标类型

资源概览页面,提供一个全局的资产大盘,默认依照用户维度,提供用户账号下所有云盘的统计信息,包含:

  • 云盘总数量
  • 云盘总容量
  • 云盘实例所属地区个数
  • 云盘实例所属可用区个数
  • 启用快照云盘占比
  • 加密云盘占比
  • Top10 容量的区域
  • Top10 容量的可用区
  • 云盘类型容量散布
  • 付费类型容量散布

除了账号的维度外,还反对对地区、付费类型、磁盘类型进行筛选,充沛满足用户的各种统计需要

高精度的数据监控粒度

性能剖析页面提供了一个全局的云盘监控大盘,默认会统计用户账号下所有磁盘要害指标的监控,包含

  • 吞吐量

总的吞吐量变动曲线
读 / 写吞吐存储 Top100 的实例,以及吞吐变动曲线

  • IOPS

总的 IOPS 变动曲线
读写 IOPS Top100 的实例,以及 IOPS 变动曲线

性能剖析页面还反对对地区、付费类型、云盘类型、云盘 id 进行筛选,满足用户精细化监控的需要

云盘监控粒度为 10s,监控提早为 10s 内,对于抖动类场景能够无效进行监控

应用场景

EBS Lens 有这么便捷的治理形式以及丰盛、多维度的监控指标,上面咱们列举了几个罕用的场景,来具体阐明下 EBS Lens 的性能:

监控场景

上面咱们模仿日常常见的磁盘 IO 异样的场景,展现下 EBS Lens 的在监控场景下的利用。

环境筹备

  • 首先咱们创立一个云盘,或者应用已有的云盘,挂载到 ECS 实例上。挂载云盘的操作参见:https://help.aliyun.com/docum…,留神云盘挂载到 ECS 实例后,必须创立分区和文件系统,使云盘变为可用。
  • 将账号下所有云盘通过自动化采集配置,关上监控数据采集

  • 关上性能剖析页面,确认云盘监控数据已接入进来

异样模仿

咱们进入 ECS 实例中,应用 dd 来模仿一个对磁盘的异样写入的操作:

EBS Lens 监控后果

在 EBS Lens 性能剖析页面,从大盘里,咱们发现有一块磁盘的吞吐量和 IOPS 迅速晋升到 TOP1。为了查看磁盘的具体指标,咱们在过滤框内输出磁盘 id,能够看到这个磁盘在选定工夫范畴内吞吐量和 IOPS 的变动。而该实例 id,正是咱们模仿的写入异样的磁盘。在线上,如果呈现相似的问题,那么接下来咱们就该去进行具体的问题定位,比方异样的服务日志打印、不合理的数据落盘等。通过调整工夫范畴,对于设置 ttl 范畴内的数据,EBS Lens 都反对在该页面进行展现,对于故障的复盘和剖析也是有十分大的帮忙的。

配合 SLS 的告警性能 https://help.aliyun.com/docum…,用户齐全能够自动化的监控云盘的性能,精确定位异样云盘。

服务压测和性能调优

除了监控场景,EBS Lens 在服务压测和性能调优的场景,同样有十分大的作用。所有对于性能方面的测试,最要害的基础设施就是监控指标。EBS Lens 性能剖析大盘就能够提供云盘实时的性能指标,这能够无效的帮忙用户疾速定位云盘是否存在性能瓶颈。咱们模仿一个简略的写入场景:大量级的数据要以最快的速度写到磁盘上。

环境筹备

咱们采纳跟下面环境一样的 ECS 环境,在这个场景下咱们指定一个固定的云盘做测试

在 EBS Lens 的页面关上该云盘的监控数据采集

场景模仿

第一版本,这里应用 FIO 模仿性能比拟差的一个随机写的实现场景:

fio -filename=/mnt/test1 -direct=1 -iodepth 1 -thread -rw=randwrite -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通过 EBS Lens 的监控,咱们发现云盘的吞吐和 IO 比拟低,远远没有达到云盘的性能下限,别离为 15MB/s,900。参考块存储性能指标文档:参考 https://help.aliyun.com/docum…

因而咱们再对写入脚本进行优化,把随机写的实现改成了比拟好的程序写的实现:

fio -filename=/mnt/test2 -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通过 EBS Lens 的监控,吞吐达到了 47MB/s,而 IOPS 达到了 3000 左右。

通过块存储性能指标文档咱们得悉,SSD 云盘的性能因数据块大小而异,数据块越小,吞吐量越小,IOPS 越高。因而为了进步吞吐量,咱们思考进步单次写入的数据块大小:

fio -filename=/mnt/test2 -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=64k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest

通过 EBS Lens 的监控,吞吐达到了 143MB/s,而 IOPS 降落到了 2300 左右。由此能够看到有了 EBS Lens 之后,对于磁盘 IO 的性能测试和调优,是如许的不便。

附录

阐明

  • EBS Lens 目前处于公测期灰度凋谢中,如果有趣味要试用,能够通过工单分割咱们 https://selfservice.console.a…,试用过程中有任何问题也能够间接分割到咱们
  • EBS Lens 公测期相干性能全副收费,公测期完结前会提前进行公示,公测完结后,费用计算能够参考 https://help.aliyun.com/docum…

参考文档

  • EBS Lens 帮忙文档:https://help.aliyun.com/docum…
  • EBS Lens 前端入口:https://sls.console.aliyun.co…

  • SLS 各个云产品日志利用文档列表:https://help.aliyun.com/docum…

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0