简介: 总结下来,咱们能够统计不同类型谬误在某一个工夫范畴内的谬误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,咱们还能够用不同的维度定义监控,比方版本号。
作者:友盟 +U-APM 团队
Why? 为什么要做利用性能监控?
首先,咱们要晓得利用性能监控具体指什么?以及目标:
监控是一套残缺的“监督 + 报警”的零碎。对于像咱们这样的 App 开发者来说,利用性能监控是掂量 App 的第一道关卡,如果利用的品质不好,会给用户带来最间接的体验挫伤。App 上线后,开发者是无奈 7 *24 实时获取到用户应用及体验状况的,这时就须要一套优质的监控工具。
那么,咱们到底须要监控哪些指标?
安卓和 iOS 的客户端监控指标就有很多不同,比如说安卓须要的是 Java、Native、ANR 谬误等等,iOS 须要的是 Objective-C、Swift、C++ 层的谬误等等。
在定义谬误指标上,最根底的是不同类型的谬误数,如果思考到谬误数与整体利用使用量的比照,能够思考用比值的形式,比方能够定义错误率:
总结下来,咱们能够统计不同类型谬误在某一个工夫范畴内的谬误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,咱们还能够用不同的维度定义监控,比方版本号。
如果要关注谬误的产生次数,及谬误的影响用户数,则能够在谬误数的根底上,依据用户排重计算得来影响用户数。
如何定义独立用户呢?咱们能够思考用设施 ID 分别,比方 imei、idfa、AndroidID 等等,如果这些信息很难获取,也能够应用业务上的用户 ID,比方登录账号,会员名等。除此之外,应用第三方 SDK 提供的设施辨认定义 ID 也是个不错的抉择。在应用这类 ID 排重后,就能够失去谬误的影响用户数。
如果咱们已知谬误的影响用户数,但无奈确定它的影响范畴占比,则能够看以下这个指标:
总结下来,咱们能够统计不同类型谬误在某一个工夫范畴内的谬误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,咱们还能够用不同的维度定义监控,比方版本号。
How? 如何灵便地制订属于你的告警打算?
咱们先请您做个小测验来判断下您的监控告警类型(一共 5 道题,仅需 1.5 分钟)
规定如下:A 选项记 5 分,B 选项记 10 分,C 选项记 15 分,D 选项记 20 分
Q1: 请问您的产品目前处于什么阶段?
A:曾经上线,处于比较稳定的状态,对监控告警的需要较低
B:还在开发阶段,须要捕获一些测试中的谬误,对监控告警的需要个别
C:刚刚上线,整体来说比较稳定,对监控告警的需要较高
D:刚刚上线,成果未知,十分须要 7 *24 小时实时关注,对监控告警的需要十分高
Q2: 请问您在您的公司 / 部门的职务是什么?
A:领导者,关注利用的品质做得如何
B:运维人员,负责监控整体利用性能的线上问题监督官
C:测试人员,负责利用发版前的品质把控
D:安卓 /iOS 端的客户端开发人员
Q3: 请问您所属团队有多少人在关注利用性能品质,并参加其中呢?
A: 1,光杆司令干活靠本人
B:2~5 人,小型开发团队
C:6~25 人,互相打配合,一起优化利用品质
D:25+,超大型的开发团队,不谦虚的说算是行业龙头
Q4: 您日常关注哪些利用性能监控指标:
A: 最根本的谬误数就能够
B:思考到客户端影响的用户应用范畴,在上述的根底上须要监控影响的用户数以及占比
C:在上述的谬误数以及影响用户的根底上,还要思考各个版本的散布
D:须要制订组合型的告警规定:比方:谬误数 >100 且错误率 >1% 或者影响用户数比 1 天前多 1% 时触发告警,也要思考版本散布
Q5: 请问您对告警的告诉形式有精细化设置的要求么?
A:没什么要求,只有能收到就行
B:在工夫上有一些要求,中午不想被打搅
C:在通道上有一些要求,须要邮件或者特定的办公聊天软件
D:对工夫和触达通道都有要求
What?那么如何设置告警打算呢?
以上的分加总,请先断定下您的测验总分(A 选项记 5 分,B 选项记 10 分,C 选项记 15 分,D 选项记 20 分),来看您的 App 在上面哪个监控告警需要等级范畴内:(数据在哪个范畴?还是监控告警在哪个层级?)
热血青铜(25~50 分):您属于监控告警的初级阶段使用者,您在日常工作中无需十分精密地查看各种谬误的产生状态。可能是因为您的利用还在初始阶段,或者您位高权重,无需亲自修复告警信息,只须要整体监控就好。请查看下文中的计划 1
勇敢黄金(50~75 分):您属于监控告警的中级阶段使用者,您或者您的团队曾经有了监控告警的意识,并且在日常工作中会关注到实时的利用品质状况。您曾经能够用肯定精细化的规定设置告警了,请跳转至计划 2
光荣王者(75~100 分):您曾经属于监控告警的高能玩家了,只须要一点点疏导,就能够成为监控告警界的“超级王牌”了
根据上述测验的分值高下,您能够判断您所须要的告警设置的难易,整体分为上面几个计划,实现水平由易到难。如果您想学习最全面的告警设置性能,请间接跳转到计划 3 哦
计划 1:简易型 – 整体利用品质监控
作为最高级的告警设置,您只须要思考两个问题:
a. 我应该在什么状况下收到告警?
b. 我如何能收到利用告警音讯呢?
解决第一个问题,您能够思考最简略的状态,只有有谬误我就要收到预警,那么只有设置谬误数 >0 的条件就能够解决。如果您感觉这样被打搅的十分多,能够依据本身的利用状况,设置谬误数 >xx 个这类的告警规定
解决第二个问题,您须要有一个能够接管音讯的媒介,最简略的就是邮箱:
一个简略的监控告警打算就这样设置好了
计划 2:进阶型 – 精细化利用品质监控
您曾经能够对繁多利用设置不同的告警音讯了,能够依照监控的指标类型或者版本进行辨别。比如说,咱们对新上线的版本要求是,影响用户数 >10 则触发告警,对老版本的要求是整体错误率相比于上周增幅不超过 5% 就能够,那么咱们就能够依照如下的形式设置:
a. 新版本的告警规定:
b. 老版本的告警规定:
在这个计划中,咱们别离利用了阈值型和比照型的告警触发条件,这两种规定的定义如下;
阈值型规定
您能够抉择一种指标(谬误数、错误率、影响用户数、影响用户占比),并且抉择「大于」某值或者某百分比
比照型规定
您能够抉择一种指标(谬误数、错误率、影响用户数、影响用户占比),并且抉择「比」历史的时间段,减少多少比例,计算形式为:(过来 1 小时数值 - 历史 1 小时数值)/ 历史 1 小时数值,大于或等于所选值即发送告警
计划 3: 王者型 – 组合式指标监控
您曾经能够十分纯熟的设置监控告警了,那么通过上面的 hints,置信您能够依据您的日常工作需要,灵便制订属于您的告警打算
a. 灵便设置告警失效工夫:
您能够增加告警失效的时间段,比方每周一至周五的 9 点至 19 点,周末的一 12 点至 20 点,灵便设置您的工作工夫,不被有效信息烦扰
b. 重点谬误类型 / 单条谬误告警
您能够抉择须要您重点关注的谬误类型
或者间接针对某一条修复中的谬误进行继续关注告警
c. 组合模式的告警触发条件
您能够通过多种指标以及阈值型或者比照型的规定,以交加 / 并集的组合形式,灵便设置您想要的告警触发条件
d. 多种告警触达渠道
如果您还对监控告警的触达渠道有所要求,能够思考应用公司的办公软件进行群触达,与您同组的其余共事一起关注并修复利用问题。
在此计划中提到的所有监控告警设置性能,能够通过 U -APM 体验,2 分钟制订告警打算。
原文链接
本文为阿里云原创内容,未经容许不得转载。