关于阿里云:如何做健康码的性能压测

40次阅读

共计 4322 个字符,预计需要花费 11 分钟才能阅读完成。

作者:拂衣、风波

为什么要做压测

随着无线设施的遍及和 5G 的鼎力建设,越来越多的线上零碎、小程序成为了人们生存中必不可少的工具。对于这些工具,都会面对一个问题:零碎能接受多少用户同时拜访,面对突发的流量洪峰,是否保证系统无故障稳固运行?

为了答复这个问题,就须要在零碎上线前做多轮压力测试,提前模拟出简单的, 高仿真的线上流量来验证整体零碎的高可用性, 这也是施行零碎高可用计划的关键环节。另外, 通过不同阶段的压测,也实现对系统的容量布局、瓶颈探测,对系统整体能力进行验收,确保在突发的流量洪峰降临前,零碎的确可能接受即将来临的实在线上压力。

从某种意义上来说,压测是零碎稳定性的验证者。

如何施行一次精确的性能压测

筹备压测环境

压测的执行环境是一个陈词滥调的话题,如果间接在生产环境执行压测,会有 2 个问题:

1、会影响线上业务,对失常拜访零碎的用户造成影响

2、会净化线上数据,将压测数据写入线上数据库

为了解决这 2 个问题,个别业内采纳如下几种计划:

以上计划各有优缺点,实用场景也不尽相同,能够依据本人我的项目所处的阶段灵便抉择计划。

构建压测脚本

业内罕用的压测工具包含 JMeter、Gatling、Locust、k6、Tsung、阿里云 PTS 等。这些工具无一例外,都须要将压测业务的 API,编排为一个压测脚本。

这一步工作的重点在确认压测的 API,不要有脱漏,且 API 编排的程序要合乎用户的操作逻辑。对于衰弱码业务的压测来说,如果脚本中脱漏了登录鉴权 API,那前面的刷新衰弱码、查看核酸报告等 API 都会在权限校验这步就报错,不会执行失常的业务逻辑,也就无奈模仿实在的业务场景。

以上压测工具编排脚本都有 2 个形式:

1、手动输出脚本,这须要脚本的编写人员对业务十分相熟,保障不会脱漏 API。

2、主动录制脚本,上述开源压测工具都提供了录制申请的代理性能,开启并配置代理后,只有在页面上模仿用户的操作和点击行为,即可主动录制申请,并生成压测脚本。同时 PTS 还提供了 Chrome 录制插件[1],免代理配置,能够一键生成 JMeter 和 PTS 压测脚本。晋升了脚本编写的效率,也能保障不脱漏 API。

为了防止简单脚本中脱漏 API 的危险,举荐应用录制性能生成脚本。

确认压力模型

这一步是在配置压测中模仿的压力峰值、不同 API 的压力散布比例以及压力值递增模型。压力值指的是模仿并发用户数,或每秒发送的申请数。

施压模式

在设置之前,须要确认施压模式,业内次要有 2 种施压模式:

1、虚构用户 (VU) 模式,能够了解为一个线程模仿一个实在用户,压测时线程始终循环执行,模仿用户不停地发送申请。

2、吞吐量模式,即每秒申请数(QPS),能够间接掂量服务端的吞吐量。

在我的项目验收阶段,很重要的一个指标就是零碎的吞吐量,即可反对的 QPS。对于这种压测场景,更举荐应用吞吐量模式,能够直观的看到施压机每秒收回的申请数,并和服务端的吞吐量间接对应起来。

各 API 压力散布比例

确认了施压模式后,须要配置不同 API 的压力散布比例。比方衰弱码业务,100% 的用户会调用登录 AP 和获取衰弱码 API,但前面并不是所有用户都会调用查问核酸报告 API、查看推送信息等 API。所以每个 API 的精确压力散布比例,也是一次胜利压测中不可获取的因素。

压力值递增模型

常见有脉冲模型,阶梯递增,平均递增。

脉冲模型会模仿流量在霎时忽然增大,罕用于秒杀、抢购的业务场景。

递增模型能够模仿在肯定时间段内,用户量一直增大,罕用于模仿有预热的业务场景。

除了惯例的递增模型,最好在压测中能够实现手动调速性能,一是能够模仿一些非常规的流量递增状况,二是能够重复调整压力值,来复现和排查问题。

施压流量地区散布

确定了压力值和递增模型后,还须要确定施压流量的地区散布,应尽量拟合实在的用户散布,能力保障测试后果真实可信。

对于区域性的在线业务,施压机散布在当地的同一机房,是能够了解的。如果是全国性的在线业务,施压机也应该依照用户散布,在全国各地区部署。

执行压测,察看压测指标

压测中外围指标:申请成功率,申请响应工夫(RT),零碎吞吐量(QPS)

申请成功率不止要看全局的申请成功率,还要关注一些外围 API 的成功率,防止整体成功率达标,外围 API 成功率有余的状况。

申请响应工夫,须要关注 99、95、90、80… 等一些要害分位的指标是否合乎预期,而均匀响应工夫没有太大的参考意义,因为压测须要保障绝大部分用户的体验,在不分明离散水平的状况下,平均值容易造成误判。

零碎吞吐量是掂量零碎能接受多大访问量的指标,是压测不可短少的规范。

下面三个指标遇到拐点时,就能够认为零碎曾经呈现性能瓶颈,能够进行压测或调小压力值,筹备剖析、定位性能问题了。

除了这三个业务指标,同时还应该同时观测零碎的利用监控、中间件监控和硬件监控的一些指标,包含但不限于:

服务器:

  • 网络吞吐量
  • CPU 使用率
  • 内存使用率
  • 磁盘吞吐量
  • ……

数据库:

  • 连接数
  • SQL 吞吐量
  • 慢 SQL 数
  • 索引命中率
  • 锁等待时间
  • 锁期待次数
  • …..

中间件:

  • JVM GC 次数
  • JVM GC 耗时
  • 堆内、堆外内存使用量
  • Tomcat 线程池沉闷线程数
  • ……

更多压测时须要关注的指标,见压测指标[2]

如果零碎曾经达到预期,往往还能够能够依照 10-20% 的比例,一直加大压力值,为零碎做一次峰值“摸高”,察看零碎的极限值是多少,做到心里有底。

复盘,性能优化

压测完结,如果未达到预期,能够配合监控排定位,剖析性能问题,性能优化实现后,在下一轮压测中持续验证。

测试中问题剖析和调优的办法这里不开展形容,能够参考这篇测试问题剖析及调优[3]。

如果零碎体现曾经合乎预期,能够用压测失去的零碎吞吐量指标,配置流控、降级、零碎或隔离规定,保障系统稳定性。

阿里云 PTS – 压测大礼包,助您零碎无忧

性能测试 PTS(Performance Testing Service)是一款阿里云 SaaS 化的性能测试工具,从最早为了精准模仿双十一流量洪峰诞生,到当初曾经走过了 10 个年头。每年反对包含双十一在内的全团体范畴的几万次压测工作,是阿里外部双十一技术架构的 ” 提前验证者 ”。

技术让利 1 — 自研 PTS 压测引擎,压力模型准,性能优

PTS 齐全自研的压测引擎,在并发模型的实现上相较传统线程模型性能更优。并且反对 API 维度的吞吐量配置,比开源工具更精密,能够精确模仿流量漏斗模型。

比方实在的流量模型是 100% 用户会调用登录 API,80% 用户会调用刷新衰弱码 API,20% 用户会调用查看核酸 API,这就须要在每个 API 上配置吞吐量(QPS),如果应用并发模型,就无奈模仿此场景。

漏斗模型示例:

PTS 压测还反对多种客户端的流量录制性能,能够疾速构建压测脚本,并反对齐全白屏化的操作,让压测脚本构建的门槛大大降低。

技术让利 2 — 全面兼容 JMeter,上线 JMeter 插件

PTS 在全面兼容 JMeter 的同时,针对 JMeter 分布式压测做了很多优化:

优化点 1:寰球散布施压机,即压即用,可反对百万并发,千万 QPS 压测;

优化点 2:反对吞吐量模式,能够设置全局指标 QPS,更直观掂量服务端性能;

优化点 3:反对压测中调速,能够灵便调整并发或 QPS,一直迫近性能极限点;

优化点 4:反对浏览器插件录制,一键导出 JMeter 脚本,无需配置代理,大大降低构建脚本的工作量;

优化点 5:针对分布式压测,反对主动切分文件,反对全局失效 Timer、Controller 组件,零门槛开启分布式压测;

优化点 6:公布 JMeter PTS 插件,应用 JMeter GUI 客户端即可发动云端分布式压测,无缝连接脚本调试和执行阶段(详见 JMeter 插件应用领导[4])。

技术让利 3 — VPC 内网压测

在全面正式压测前,重点微服务利用须要在日常态做单利用的压测,摸清楚部分的性能极限。

对于部署在阿里云上的服务,单个微服务利用不会裸露公网入口,这时就须要压测工具有买通 VPC 内网的能力。

PTS 反对 VPC 内网压测,能够在压测时疾速买通施压机与用户 VPC 网络,保障内网压测的网络畅通。在压测完结后,也会即时敞开网路通道,保障网络安全。

用户只须要在压测配置中,抉择微服务利用所在的 VPC 内网、平安组、交换机,即可开启 VPC 内网压测。让您的服务无需裸露公网入口,也能够探测出性能指标。

操作示例如下:

技术让利 4 — 流量地区定制

大部分业务的用户并不是按地区均分的,相同,往往很不平均。要模仿实在流量散布,施压机须要在各地 扩散部署 ,并且反对 按地区 按量调配,在压测时,还要反对实时的对立调度。如果施压机都散布在一个 Region,甚至是一个可用区内,那是无奈模拟出来自寰球用户申请的。

应用阿里云性能测试服务(PTS)压测时,开启 流量地区定制 性能,只需简略勾选地区,即可指定施压机的地区散布,目前反对寰球 22 个地区定制。

技术让利 5 — 问题诊断工具

压测的目标是发现性能问题,在压测报告中,PTS 有异样申请状态码的统计,并提供了申请采样日志,能够直观的看到申请、响应的全副信息,对于响应工夫较长的申请,也会直观的展现申请在各个阶段的耗时。

对于 Java 利用,PTS 提供了基于 Java Agent 的问题诊断工具,只需在 Java 利用上挂载探针,即可主动获取利用、API、机器维度的秒级监控。对于报错的申请,能够间接定位到调用链上报错的办法堆栈,省去了大量排查问题的工夫,是定位问题的“利器”。

定位报错办法堆栈示例如下:

老本让利 1 — 上线 JMeter 资源包

PTS 上线了 JMeter 专属资源包,价格相比 PTS 压测资源包更加优惠。

老本让利 2 — VPC 内网压测价格更优

PTS 上线了 VPC 内网压测资源包,1 万并发压测 20 分钟,仅需 29 元起,让日常态内网压测老本更低。

老本让利 3 — 包年包月包,限时优惠 75 折

包年包月资源包,限时优惠 75 折,且在包月时间段内,不计 VUM,适宜高频压测的用户。

老本让利 4 — 定制资源池

对于高并发,须要压测工夫较长的状况,举荐应用定制资源池。20 台施压机以上,间断压测 1 小时的状况下,计费相当于失常压测的 4 折,让长时间、高并发压测的用户领取老本更低。

点击浏览原文,即可返回 PTS 资源包购买页[5],欢送大家按需选购。

相干链接

[1] Chrome 录制插件应用领导:
https://help.aliyun.com/docum…

[2] 压测指标:
https://help.aliyun.com/docum…

[3] 测试问题剖析及调优:
https://help.aliyun.com/docum…

[4] JMeter 插件应用领导:
https://help.aliyun.com/docum…

[5] PTS 产品购买页:
https://common-buy.aliyun.com…

正文完
 0