关于自动化:BUG越改越多微信团队用自动化测试化险为夷

腾小云导读

作为后盾开发 Coder，你可能会对以下场景感到似曾相识：历史上解决过的 BUG 重复横跳；版本兼容逻辑多，修复一个 BUG 触发了更多 BUG；上线时系统监控毫无异样，过段时间用户投诉某个页面无数据；改变祖传代码时如履薄冰，心智累赘极重。为此本文提出一个自动化测试零碎，它可能低成本实现 100% 的测试用例覆盖率，极大加重治理自动化测试用例的工作量并进步测试效率，保障后盾服务安稳变更。欢送浏览~

1 背景

1.1 接口自动化测试介绍

1.2 现状及痛点

1.3 为什么要自研

1.4 指标

2 自动化测试零碎实现

2.1 整体架构

2.2 对立 HTTP 和 RPC 拜访模式

2.3 接口参数传递（参数池结构）

2.4 JSON Schema 组件

2.5 JSON Path 组件

2.6 变更零碎接入与调度

3 用例自动化生成

3.1 现状以及剖析思路

3.2 整体流程

3.3 流量特征分析

3.4 用例生成

3.5 用例发现与补全

3.6 流量特色利用

4 总结

顾名思义，接口测试就是对系统或者组件之间的接口进行测试，次要校验数据的替换、传递以及零碎间的相互依赖关系等。依据测试金字塔的模型实践，测试分为三层，别离是单元测试（Unit Tests）、服务测试（Service Tests）、UI 测试（UI Tests），而咱们的接口自动化测试就是服务测试层。

单元测试会导致工作量大幅晋升，在需要疾速迭代和人力缓和的背景下，很难继续推动，本文暂不探讨。而接口自动化测试容易实现、保护成本低，且收益更高，有着更高的投入产出比。

实际上咱们有一个叫 WeJestAPITest 的自动化测试平台，它是基于 Facebook 开源的 Jest 测试框架搭建的，用于校验后盾的接口返回是否合乎预期。在这个平台此前运行了数年的测试，肯定水平上保障了后盾服务的安稳运行。

但在长期应用中咱们也发现了一些痛点：

遇到失败用例习惯性申请跳过测试，自动化测试形同虚设；版本需要迭代速度飞快，用例落后于需要变更，用例迭代老本高；开发同学很难参加到用例保护中，而测试同学对接口逻辑理解不深，编写的用例过于简略、生硬，导致覆盖率低、用例品质差，开发上线心理负担重。

咱们须要的不只是一个自动化测试零碎，而是一个更好用的、治理老本更低的自动化测试零碎。

提到接口自动化测试工具，开源有 JMeter、Postman 等，司内也有成熟的 WeTest、ITEST 等，这些都是开箱即用的，但通过调研和评估，咱们还是决定本人造一个轮子。思考的点如下：

测试工具的实现原理并不简单，实现老本不高，保护难度不大；现有工具并不合乎业务要求，例如自定义的调度计划，以及反对外部 RPC 框架；咱们须要把自动化测试与现有的零碎连接起来，比方上线零碎，用例失败告警零碎，流量剖析零碎等；当咱们须要一些非标准能力的时候，内部工具很难疾速，甚至无奈反对，拓展性弱；这个零碎次要是为了笼罩后盾接口测试，应用体验上要更贴近后盾同学的应用习惯，升高用例治理老本。

联合咱们遇到的痛点以及业务需要，自研的自动化测试零碎应该具备以下的能力：

它应该是跟实现语言无关的，甚至是无代码的，打消不同编程语言和框架带来的隔膜；编写用例应该是纯正的，用例跟测试服务拆散，变更用例不须要变更自动化测试服务；可能反对场景测试（多个用例组成场景），且能反对用例间的变量援用；提供多种调度计划，能够按全量调度、按业务模块调度、按用例组调度、按单个用例调度，充沛满足业务和调试需要；这个零碎要反对同时治理 HTTP 和 RPC 用例，能够笼罩申请的上下游链路；尽最大可能升高后盾同学编写用例的老本。

HTTP 和 RPC 申请在模式上能够被对立起来，其形容模式如下：

HTTP 拜访形式：http://host:port/urlpath + reqbody

RPC 拜访形式：rpc://ip:port/method + reqbody

通过这种对立的形容模式，再联合咱们的业务架构，就能够设计一种通用的拜访形式。后盾的零碎架构如下图所示：

从 proxy 层往下，所有的调用都是一个个后盾服务模块，HTTP 拜访的是逻辑层，RPC 拜访的是服务层。那么只须要配置用例的归属模块，通过模块名 + Client 配置就能够对 HTTP 和 RPC 申请进行辨别以及寻址。

从变更零碎的角度来看，咱们的上线变更也是按模块来的。因而把用例归属到一个个具体的模块，是最合乎后盾同学认知的做法。

因而咱们通过配置模块名这种对立的模式，为使用者提供了对立的治理形式，只须要指定模块名就能够任意拜访 HTTP 或者 RPC 申请，其流程如下：

在红色虚线框的流程中，只须要配置模块名，就能够通过模块名获取到 RPC 服务的所有信息，包含其接口定义、申请包定义、回包定义，这不是一种通用能力，须要业务基于零碎架构以及线上环境去拓展，但这带来了以下便当：

能够反对任意的业务 RPC 框架，拓展性强；只须要配置模块名就能够拜访所有的 RPC 申请，无需一一手动上传解析 proto 文件，缩小操作步骤；不须要关怀 proto 的更新，实时拉取线上 proto 的信息，协定永远是最新版本。

这里的对立蕴含两局部：第一局部是 拜访模式的对立 （模块），升高了配置用例的老本；第二局部是 数据的对立（JSON），它对立了对回包形式的校验，升高了校验老本。

很多业务场景的实现都是由多个接口组成的一条链路实现，而且这种链路型的自动化测试，通常会存在参数依赖关系，一个用例的入参，可能要依赖上游响应回包的某个字段值，因而须要提取进去并传递给下一个接口。如下图：

其解决方案是，通过正则或者 JSON Extracor 等提取的后果作为变量，而后再传递给上游用例应用，这也是很多测试工具应用的形式，然而保护起来不够不便，仍有进一步优化的空间。

于是咱们提出了参数池的概念，将每个用例可能用到的字段都放入一个池子里，这个池子的元素是一个个 key-value。key 是咱们要应用的变量，value 则是 key 对应的取值，值得注意的是，value 既能够是一个字面值，也能够是一个 JSONPointer 的门路，这个门路能够从响应回包中提取变量值。

在这种形式下，不同用例间的参数依赖不再是从上一个“传递”到下一个，而变成了一个随取随用的池子，因而咱们把它称为参数池。同时咱们通过自定义的语法，实现了一个简略的模板引擎，将咱们援用的变量替换为池子里的 value 值。参数池结构以及应用图示如下：

上面贴一段代码看看现有 WeJestAPITest 框架是如何对返回值做校验的，并剖析一下它可能存在的问题：

function bookInfoBaseCases(bookInfoObject) {it('预期 bookInfo.bookId 非空，且为字符串，且等于 12345', () => {expect(bookInfo.bookId).not.toBeNull();
        expect(typeof bookInfo.bookId).toEqual('string');
        expect(bookInfo.bookId).toEqual('12345');
    });
}

这种校验形式存在以下几个问题：

这是针对单个字段进行校验，如果一个回包里有几十上百个字段，这种手工形式不可能实现全量字段校验；编写一个用例须要有 js 根底，对其余编程语言的使用者不敌对；断言规定都是一条条散落在代码文件中，展现和治理有难度；调试须要变更测试服务，调试老本高。

现有框架的不便导致了用例治理上的种种问题，而咱们依据这些不便之处去反向思考，咱们到底须要什么样的校验形式，这种状况下咱们找到了 JSON Schema。

JSON Schema 是形容 JSON 数据格式的工具，Schema 能够了解为模式或者规定，它能够束缚 JSON 数据应该合乎哪些模式、有哪些字段、其值是如何体现的。JSON Schema 自身用 JSON 编写，且须要遵循 JSON 自身的语法标准。

上面以 bookInfo 的校验为例，写一份 JSON Schema 的校验规定：

// bookInfo 信息
{
    "bookId":"123456",
    "title":"书名 123",
    "author":"作者 123",
    "cover":"https://abc.com/cover/123456.jpg",
    "format":"epub",
    "price":100
}

// 对应的 JsonSchema 校验规定
{
    "type": "object",
    "required": ["bookId", "title", "author", "cover", "format", "price"],
    "properties": {
    "bookId": {
        "type": "string",
        "const": "123456"
    },
    "title": {
        "type": "string",
        "minLength": 1
    },
    "author": {
        "type": "string",
        "minLength": 1
    },
    "cover": {
        "type": "string",
        "format": "uri"
    },
    "format": {
        "type": "string",
        "enum": ["epub", "txt", "pdf", "mobi"]
    },
    "price": {
        "type": "number",
        "exclusiveMinimum": 0
    }
  }
}

通过比照，JSON Schema 的长处十分不言而喻：

可读性高，其构造跟 JSON 数据齐全对应；所有规定都处在一个 Schema 中，治理和展现清晰易懂；它自身是一个 JSON，对于任何编程语言的使用者都没有额定学习老本；此外，咱们能够通过一个现有的 JSON 反向生成 JSON Schema，而后在这个 JSON Schema 的根底上进行简略的批改，就能失去最终的校验规定，极大升高了咱们编辑用例的工作量和工夫老本。

有了 JSON Schema 之后，咱们校验形式看似曾经十分完满了。它既能够低成本的笼罩全量字段校验，还能够很不便的进行字段类型、数值的校验。

但理论应用中咱们发现有些测试场景是 JSON Schema 笼罩不到的，比方：一条用户评论有 createtime 和 updatetime 两个字段，须要校验 updatetime >= createtime。这是 JSON Schema 的短板，它能够束缚 JSON 的字段，然而它没方法对两个字段进行比照；同时 JSON Schema 跟 JSON 是一对一的，如果咱们须要比拟两个不同 JSON 的同一个字段，它同样无能为力。这就引出了咱们须要的第二个工具 —— JSONPath。

JSONPath 是一个 JSON 的信息抽取工具，能够从 JSON 数据中抽取指定特定的值、对象或者数组，以及进行过滤、排序和聚合等操作。而 JSONPath 只是一个 JSON 字段的提取工具，要利用它来实现一个断言判断还须要进一步封装。

在这里咱们用一个 JSONPath 表达式来示意一个断言，上面是一些简略的应用示例：

// 校验 updateTime > createTime
$.updateTime > $.createTime

// 返回的 bookId 必须为某个固定值
$.bookId == ["123456"]

// datas 数组不能为空
$.datas.length > [0]

// datas 数组中必须蕴含某本书，且价格要大于 0
$.datas[?(@.bookId=='123456')] > [0]

值得注意的是，JSON Schema 和 JSON Path 断言校验并非二选一，既能够同时校验，也能够依据场景抉择任意一种校验形式。与此同时，如果我的项目前后端交互的协定是 XML、proto 或者其余协定，能够将其对立转为 JSON 格局，JSON 更容易了解且工具链更多更成熟，否则咱们将要为每一种序列化的协定都开发一套相似的工具，重复劳动。

在这里，咱们应用异步 MQ 去调度测试工作，它有三个次要的特点：

多触发源	任意粒度	指定环境
反对变更零碎、治理平台、例行任务调度等多个起源的工作触发信号。	反对按全量用例调度、按变更模块调度、按用例组调度、按单用例调度。	反对调度到现网环境和测试环境，甚至能够指定 IP 对某台机器定向测试。

在领有了一个接口自动化测试平台之后，咱们面临一个新的问题：如何疾速晋升自动化测试的覆盖率？

这个问题有一个隐含的前提，咱们须要一个能够掂量覆盖率的指标，接下来将介绍咱们如何结构这个指标，并分享一些晋升覆盖率的计划。

要掂量覆盖率，第一反馈必然是基于前后端约定的协定进行剖析。然而沿着这条思路去剖析咱们遇到了以下几个难点：

协定治理不标准，散落在 git 文档、yapi、wiki 等多处中央，且格局不对立；文档落后于理论接口协议，且可靠性有待讲究；协定参数并非都是正交的，应用协定计算出来的参数组合不符合实际状况；因而，应用前后端协定进行剖析这条路是行不通的。因而咱们打算从线上流量动手，对流量的参数特色进行剖析，并应用线上流量来生成自动化测试用例。

一个 HTTP 申请，咱们通常须要剖析的是以下局部：申请办法、URL、申请包、返回包。而联合咱们的业务场景，咱们还须要一些额定的信息：用户 ID、平台（安卓、IOS、网页等）、客户端版本号等。咱们调研过一些流量采集剖析并生成用例的零碎，大多只能对通用信息进行剖析，并不能很好的联合业务场景进行剖析，拓展性有余。

咱们有一个申请，其 url 参数为 listType=1&listMode=2、vid 为 10000、平台为 android、版本号为 7.2.0，其申请体如下:

{
  "bookId":"12345",
  "filterType":1,
  "filterTags":["abc","def"],
  "commOptions":{
    "ops1":"testops1",
    "ops2":"testops2"
  }
}

其中 url 和 header 里的参数都很容易解析，不再赘言，上面讲一下 JSON 申请中的参数提取办法。这里咱们用 JSONPointer 来示意一个参数的门路，作为这个参数的 key 值，那么能够提取取得以下参数：

// url 和 header 中提取的参数
listType=1
listMode=2
vid=10000
platform=android
appver=7.2.0

// JSON 中提取的参数
/bookId=12345
/filterType=1
/filterTags=["abc", "def"]
/commOptions/opts1=testops1
/commOptions/opts2=testops2

如此一来，参数的表现形式能够对立为 key-value 的模式，咱们调研的工具也根本止步于此，接下来要么是用正交计算用例的形式辅助人工编辑用例，要么就是对大量流量生成的用例进行去重。

但这达不到咱们预设的指标，咱们无妨更进一步，通过大量的线上流量结构出接口参数的特色，在这里咱们提出一个定义，接口参数的特色包含五局部：

参数个数；参数类型；参数取值范畴；参数可枚举性；参数可组合性。

咱们的工作次要集中在参数的可枚举性剖析，这也是参数剖析的突破点。假如咱们从线上对某个接口进行采样，采样条数为 1W 条，将失去以下的参数：

listType=[1, 2, 3, 4]
listMode=[1, 2]
vid=[10000, 10001, 10002, 10003, ...] // 3000+
platform=[android, ios, web]
appver=[7.2.0, 7.1.0, 7.3.0, ...] // 20
/bookId=[12345, 23456, 34567, 56779, ...] // 4000+
/filterType=[1, 2]
/filterTags=[abc, def, efg]
/commOptions/opts1=[testops1, testops1_]
/commOptions/opts2=[testops2]

有了以上提取到的参数枚举值，咱们设定一个正当的阈值（比方 30），就能够判断哪些参数是可枚举的，很显著 vid 和 /bookId 并不是可枚举的参数，在笼罩用例时不须要对这两个参数进行笼罩。

在实践中，咱们发现固定阈值并不能精准辨认到无效的枚举参数，阈值须要追随采样的数据动静调整。不同接口申请量可能从几十到几十万不等，如果一个接口申请条数只有 30 条，每一个参数的枚举值都小于设定的阈值，所有参数都是无效参数，这不符合实际状况。因而阈值要随着采样条数的变动而变动，能够按申请数量阶梯变动，也能够按申请数量成比例变动。对于特定参数，还要提供人工配置疾速染指，指定参数是否可枚举。

在咱们晓得哪些参数是可枚举的无效参数后，接下来能够对参数的可组合性进行剖析。实际上咱们并不需要剖析任意两个参数两两是否可组合，基于线上流量去剖析即可。咱们简略给一个例子：

listType=1&listMode=1&platform=android&appver=7.2.0
listType=1&listMode=1&platform=ios&appver=7.2.0
listType=1&listMode=1&platform=web&appver=7.2.0
listType=2&listMode=1&platform=android&appver=7.2.0
listType=2&listMode=1&platform=ios&appver=7.2.0
listType=2&listMode=1&platform=web&appver=7.2.0
listType=3&listMode=2&platform=android&appver=7.2.0
listType=3&listMode=2&platform=ios&appver=7.2.0
listType=3&listMode=2&platform=web&appver=7.2.0

那么在笼罩用例时咱们须要笼罩这 9 个组合，通过组合分析咱们甚至能够发现线上是否有谬误应用的参数组合，需要是否产生了变更产生了新的组合参数。

要晋升覆盖率，实质上就是笼罩所有可枚举参数的枚举类型以及组合，这就是咱们在下面提到过的覆盖率指标。有了这个指标，咱们就能够对覆盖率提出以下计算公式：

全局覆盖率 = 已笼罩的接口数 / 全副接口数 * 100%

接口无效用例 = 全副可枚举参数的可枚举值 + 全副可枚举参数的组合

接口覆盖率 = 已笼罩的无效用例数 / 接口无效用例数 * 100%

PS：当接口覆盖率达 100% 时视为接口已实现用例笼罩

通过上面对流量的特征分析以及筛选，咱们失去了一批无效流量，接下来就能够应用这些流量来自动化生成用例，其中最次要的工作是为用例生成校验的 JSON Schema 规定。其生成过程如下图所示：

如上图所示，任何 JSON Schema 的生成工具所生成的 Schema 都不可能百分百满足业务需要，咱们依然要依据业务场景对 Schema 进行微调。比方在搜寻场景下，咱们用一个 results 数组来承载返回后果，生成器生成的 Schema 只约定了 results 字段必须要存在，并且字段类型为数组类型。如果有一天返回了一个空的 results 数组，那么默认生成的 Schema 是查看不出这个问题的，咱们能够为 results 数组减少 minItems = 1 的规定，要求 results 数组必须大于等于 1，下次校验时遇到空数组就可能告警进去。

同时，在用例执行时遇到校验不通过的状况，咱们也设计了一套自动化 promote 用例的流程，不须要手工对用例进行改变。其流程如下：

其中用例优化分为三种状况：

移除用例：用例已生效，间接删除用例；替换用例：用例不合乎预期，从线上依据同样的参数选取申请从新生成一个用例；优化 Schema：用例中某些字段并非必须字段，或者属于预期内的变动（比方用户的未购变已购导致某些字段被替换）。

咱们应用的 Schema 生成工具是 genson，它能够为一个 JSON 生成对应的 JSON Schema。这个工具有个很重要的个性：它是一个多输出的 JSON Schema 生成工具，能够接管多个 JSON 或者 Schema 作为输出参数，生成一个合乎所有输出要求的 Schema，这一点正是咱们自动化的要害，使得咱们不须要手动编辑校验规定。上面简略展现一下咱们当初的零碎是如何优化失败用例的：

用例的自动化发现分为两个离线工作：一个是新接口的发现，一个是新用例的发现。

新接口是指咱们有新的性能上线，当线上有流量拜访时，咱们应该及时发现这个新的申请，并将这个申请纳入咱们的自动化测试治理范畴。

新用例是指通过对流量剖析，发现了新加的可枚举参数，或者之前用例未曾笼罩的参数组合，咱们通过比照线上流量和曾经采集落库的用例进行 diff 剖析，失去并生成新的用例。

下图是对用例的自动化发现与补全的简略示例：

基于下面提到的流量特征分析以及用例生成，咱们的用例个数从 150+ 晋升到 8000+，实现了读接口 100% 用例笼罩，覆盖率有了一个质的飞跃。

对于写接口实现了覆盖率统计以及用例举荐，极大升高了在编辑用例时的心智累赘，不须要本人去结构参数以及遍历所有的参数组合，跟随着举荐的用例去补全即可。

同时针对咱们后面提到的前后端协定扩散在各个中央，且接口与文档不统一的问题，咱们通过线上流量对申请参数和申请回包的 Schema 进行继续的迭代，而后再将 Schema 反向生成 JSON，就能够失去一份最全、最新的接口协议，同时这份协定还能够提供给客户端同学用来结构参数进行 mock 联调。

至此，咱们曾经实现了整个后盾接口自动化测试零碎的搭建，并实现了预设的全副指标：

集成 JSON Schema 和 JSONPath 这两个组件，实现了一个无代码以及用例跟测试服务拆散的自动化测试零碎；通过用例的组合以及参数池结构实现了场景测试和用例间变量援用；反对了多种定制化的调度计划，并接入到上线零碎流程中；买通 HTTP 和 RPC 接口拜访，联合业务架构极大升高了接入 RPC 用例的老本；通过用例自动化生成进一步升高用例治理老本，疾速进步了自动化测试的覆盖率。

对于旧用例零碎上的数据，咱们破费了将近两周，将数千行测试代码、将近一千条校验规定全副迁徙到新的自动化测试平台上，失去了 150+ 的新用例，并且校验的规定变成了 150+ 的 JSON Schema，不须要保护任何一行代码，就失去了比之前更欠缺的全字段校验规定笼罩。

此外，咱们通过用例发现和用例生成，生成了 8000+ 的用例，实现了读接口 100% 用例笼罩，并屡次辅助发现线上异样数据问题，在用户还未感知前就曾经将问题扼杀在摇篮之中。

笔者认为，本文最重要的并不是对各种工具的集成和应用，100% 的用例笼罩也并非本文的最终目标。各种开源和付费工具不可胜数，只有舍得投入人力 100% 的用例笼罩也并非难事。本文真正重要的是提出了一种 通用的测试框架架构 ，以及基于线上流量剖析失去了一种 测试覆盖率的度量计划。

秉持着这种思路，上文中咱们提到的 调度零碎、用例执行 MQ、校验工具、测试告警零碎、流量采集零碎、用例生成零碎，都能够基于业务灵便调整，低成本实现大规模用例笼罩。以上是本次分享的全部内容，如果感觉内容有用，欢送分享转发。

-End-

原创作者|柯宗言

技术责编|许阳寅、罗国佳

各位开发者都遇到过什么样头疼的 BUG，欢送在腾讯云开发者公众号评论区分享探讨。咱们将选取 1 则最有意义的分享，送出腾讯云开发者 - 手段垫 1 个（见下图）。6 月 26 日中午 12 点开奖。

关于自动化:BUG越改越多微信团队用自动化测试化险为夷

01、背景

1.1 接口自动化测试介绍

1.2 现状及痛点

1.3 为什么要自研

1.4 指标

02、自动化测试零碎实现

2.1 整体架构

2.2 对立 HTTP 和 RPC 拜访模式

2.3 接口参数传递（参数池结构）

2.4 JSON Schema 组件

2.5 JSON Path 组件

2.6 变更零碎接入与调度

03、自动化测试零碎实现

3.1 变更零碎接入与调度

3.2 整体流程

3.3 流量特征分析

3.4 用例生成

3.5 用例发现与补全

3.6 流量特色利用

04、总结

Just My Socks（注册教程内含优惠码）

关于自动化:BUG越改越多微信团队用自动化测试化险为夷

01、背景

1.1 接口自动化测试介绍

1.2 现状及痛点

1.3 为什么要自研

1.4 指标

02、自动化测试零碎实现

2.1 整体架构

2.2 对立 HTTP 和 RPC 拜访模式

2.3 接口参数传递（参数池结构）

2.4 JSON Schema 组件

2.5 JSON Path 组件

2.6 变更零碎接入与调度

03、自动化测试零碎实现

3.1 变更零碎接入与调度

3.2 整体流程

3.3 流量特征分析

3.4 用例生成

3.5 用例发现与补全

3.6 流量特色利用

04、总结

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）