关于运维:封神性能容量分析报告

57次阅读

共计 2295 个字符,预计需要花费 6 分钟才能阅读完成。

简介:封神 - 剖析报告 | 性能容量

1. 性能介绍

云平台各个产品的性能总览均须要登录对应的运维工具查看,在提供相干报告与总结时,会消耗较长的工夫,性能容量报告提供云平台所有产品的重要指标评估及剖析,能够帮忙运维疾速定位问题,同时能够提供相干性能离线报告,大大减少了运维老本。

1.1 数据起源

封神数据库

1.2 解决问题

①提供全产品性能剖析图表,进步问题定位速度;

②提供整个云平台容量剖析;

③反对下载离线报告。

2. 开发架构

2.1 架构阐明

性能容量报告集成在封神监控零碎中,数据来源于封神数据库的监控数据,对性能容量数据进行定时剖析打点并记录入库,前端展现与离线报告读取对应数据,以图表可视化模式展现,如下图所示。

图 1

2.2 性能特点

  1. 性能集成在封神零碎中,对生产环境无任何影响;
  2. 剖析以后云平台整体运行状况,并给出优化倡议;
  3. 可视化展现各个产品的实例状态,进步运维效率;
  4. 提供离线的数据报告,及实例性能的全量数据下载。

2.3 性能构造及产品列表

<span class=”lake-fontsize-11″> 标签页 </span><span class=”lake-fontsize-11″> 产品 </span>
<span class=”lake-fontsize-11″> 概述 </span><span class=”lake-fontsize-11″> 资源容量,实例 / 主机数量,告警数量 </span>
<span class=”lake-fontsize-11″> 根底 </span><span class=”lake-fontsize-11″> 天基,ecs,oss,slb,盘古 </span>
<span class=”lake-fontsize-11″> 中间件 </span><span class=”lake-fontsize-11″>mq</span><span class=”lake-fontsize-11″>,edas,schx</span>
<span class=”lake-fontsize-11″> 数据库 </span><span class=”lake-fontsize-11″>rds</span><span class=”lake-fontsize-11″>,drds,minirds,ots,ads</span>
<span class=”lake-fontsize-11″> 大数据 </span><span class=”lake-fontsize-11″>dataworks</span><span class=”lake-fontsize-11″>,odps</span>
<span class=”lake-fontsize-11″> 底座 </span><span class=”lake-fontsize-11″>docker</span><span class=”lake-fontsize-11″>,ops,otsinner,ftp-server,minirds,slb,vpc</span>

## 3. 性能详情

性能容量报告中依照总体概述、根底组件、中间件、数据库、大数据和底座进行展现分类(详见 2.3 节),次要展现类型有曲线图、柱状图、饼图、热力求和表格模式,并对可视化内容进行剖析,给出倡议,能够反对工夫检索或下载离线报告;

#### 3.1 饼图性能剖析

1. 图中为 ECS 产品的整体性能状况,清晰的展现了以后云平台的 ECS 资源应用状况;
2. 单击图中右上角的“搜寻”按钮,能够依据所需数据的工夫范畴进行检索;
3. 图中红色文本框为剖析倡议,大部分 ECS 性能使用率都在 30% 以下,可见以后云平台 ECS 都比拟闲暇,须要进行适当缩容回收资源。

图 2

#### 3.2 曲线性能剖析

1. 图为云平台各个产品的盘古水位应用状况,能够展现固定工夫范畴内的盘古水位趋势;
2. 如图所示以后云平台盘古水位使用率简直都未超过 30%,不须要进行优化。

图 3

#### 3.3 柱状性能剖析

1. 图为云平台所有 docker 宿主机的 CPU 资源数与已调配的 CPU 资源数比照图;
2. 如图所示,以后环境 docker 宿主机 CPU 资源超售状况比较严重。

图 4

#### 3.4 热力性能剖析

1. 图为云平台所有 docker 宿主机的单个 CPU 应用状况,能够联合图 (3-3) 进行比照剖析;
2. 方格中的数字为 x 轴对应内核的 CPU 使用率,鼠标悬浮其中一个内核便能够显示对应内核的挂载容器;
3. 当运维过程中有 CPU 迁徙工作时能够参考此热力求,抉择同组 ASW 的宿主机进行迁徙。

图 5

#### 3.5 表格容量剖析

1. 下图为以后云平台的整体资源应用状况剖析;
2. 图中展现了全副的资源数量与已应用的资源数量,以及对资源应用的预测。

图 6

上述示例是报告中几种典型可视化展现形式,每个云产品都由不同的图表组成,以及对应的剖析倡议。

咱们是阿里云智能寰球技术服务 -SRE 团队,咱们致力成为一个以技术为根底、面向服务、保障业务零碎高可用的工程师团队;提供业余、体系化的 SRE 服务,帮忙广大客户更好地应用云、基于云构建更加稳固牢靠的业务零碎,晋升业务稳定性。咱们冀望可能分享更多帮忙企业客户上云、用好云,让客户云上业务运行更加稳固牢靠的技术,您可用钉钉扫描下方二维码,退出阿里云 SRE 技术学院钉钉圈子,和更多云上人交换对于云平台的那些事。

> 版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

正文完
 0