关于前端:小程序依赖分析实践

用过 webpack 的同学必定晓得 webpack-budle-analyzer ，能够用来剖析以后我的项目 js 文件的依赖关系。

因为最近始终在做小程序业务，而且小程序对包体大小特地敏感，所以就想着能不能做一个相似的工具，用来查看以后小程序各个主包与分包之间的依赖关系。通过几天的折腾终于做进去了，成果如下：

明天的文章就带大家来实现这个工具。

小程序入口

小程序的页面通过 app.json 的 pages 参数定义，且 pages 内的每个页面，小程序都会去寻找对应的 .json, .js, .wxml, .wxss 四个文件进行解决。

为了不便演示，咱们想到 fork 一份小程序的官网demo，而后新建一个文件 depend.js,依赖剖析相干的工作就在这个文件外面实现。

$ git clone git@github.com:wechat-miniprogram/miniprogram-demo.git$ cd miniprogram-demo$ touch depend.js

其大抵的目录构造如下：

以 app.json 为入口，咱们能够获取所有主包下的页面。

const fs = require('fs')const path = require('path')const root = process.cwd()class Depend {  constructor() {    this.context = path.join(root, 'miniprogram')  }  // 获取相对地址  getAbsolute(file) {    return path.join(this.context, file)  }  run() {    const appPath = this.getAbsolute('app.json')    const appFile = fs.readFileSync(appPath, 'utf-8')    const appJson = JSON.parse(appFile)    const { pages } = appJson // 主包的所有页面  }}

每个页面会对应 .json, .js, .wxml, .wxss 四个文件：

const Extends = ['.js', '.json', '.wxml', '.wxss']class Depend {  constructor() {    // 存储文件    this.files = new Set()    this.context = path.join(root, 'miniprogram')  }  // 批改文件后缀  replaceExt(filePath, ext = '') {    const dirName = path.dirname(filePath)    const extName = path.extname(filePath)    const fileName = path.basename(filePath, extName)    return path.join(dirName, fileName + ext)  }  run() {    // 省略获取 pages 过程    pages.forEach(page => {      // 获取相对地址      const absPath = this.getAbsolute(page)      Extends.forEach(ext => {        // 每个页面都须要判断 js、json、wxml、wxss 是否存在        const filePath = this.replaceExt(absPath, ext)        if (fs.existsSync(filePath)) {          this.files.add(filePath)        }      })    })  }}

当初 pages 内页面相干的文件都放到 files 字段存起来了。

结构树形构造

拿到文件后，咱们须要根据各个文件结构一个树形构造的文件树，用于后续展现依赖关系。

假如咱们有一个 pages 目录，pages 目录下有两个页面：detail、index ，这两个页面文件夹下有四个对应的文件。

pages├── detail│   ├── detail.js│   ├── detail.json│   ├── detail.wxml│   └── detail.wxss└── index    ├── index.js    ├── index.json    ├── index.wxml    └── index.wxss

根据下面的目录构造，咱们结构一个如下的文件树结构，size 用于示意以后文件或文件夹的大小，children 寄存文件夹下的文件，如果是文件则没有 children 属性。

pages = {  "size": 8,  "children": {    "detail": {      "size": 4,      "children": {        "detail.js": { "size": 1 },        "detail.json": { "size": 1 },        "detail.wxml": { "size": 1 },        "detail.wxss": { "size": 1 }      }    },    "index": {      "size": 4,      "children": {        "index.js": { "size": 1 },        "index.json": { "size": 1 },        "index.wxml": { "size": 1 },        "index.wxss": { "size": 1 }      }    }  }}

咱们先在构造函数结构一个 tree 字段用来存储文件树的数据，而后咱们将每个文件都传入 addToTree 办法，将文件增加到树中。

class Depend {  constructor() {    this.tree = {      size: 0,      children: {}    }    this.files = new Set()    this.context = path.join(root, 'miniprogram')  }    run() {    // 省略获取 pages 过程    pages.forEach(page => {      const absPath = this.getAbsolute(page)      Extends.forEach(ext => {        const filePath = this.replaceExt(absPath, ext)        if (fs.existsSync(filePath)) {          // 调用 addToTree          this.addToTree(filePath)        }      })    })  }}

接下来实现 addToTree 办法：

class Depend {  // 省略之前的局部代码  // 获取绝对地址  getRelative(file) {    return path.relative(this.context, file)  }  // 获取文件大小，单位 KB  getSize(file) {    const stats = fs.statSync(file)    return stats.size / 1024  }  // 将文件增加到树中  addToTree(filePath) {    if (this.files.has(filePath)) {      // 如果该文件曾经增加过，则不再增加到文件树中      return    }    const size = this.getSize(filePath)    const relPath = this.getRelative(filePath)    // 将文件门路转化成数组    // 'pages/index/index.js' =>    // ['pages', 'index', 'index.js']    const names = relPath.split(path.sep)    const lastIdx = names.length - 1    this.tree.size += size    let point = this.tree.children    names.forEach((name, idx) => {      if (idx === lastIdx) {        point[name] = { size }        return      }      if (!point[name]) {        point[name] = {          size, children: {}        }      } else {        point[name].size += size      }      point = point[name].children    })    // 将文件增加的 files    this.files.add(filePath)  }}

咱们能够在运行之后，将文件输入到 tree.json 看看。

 run() {   // ...   pages.forEach(page => {     //...   })   fs.writeJSONSync('tree.json', this.tree, { spaces: 2 }) }

获取依赖关系

下面的步骤看起来没什么问题，然而咱们短少了重要的一环，那就是咱们在结构文件树之前，还须要失去每个文件的依赖项，这样输入的才是小程序残缺的文件树。文件的依赖关系须要分成四局部来讲，别离是 .js, .json, .wxml, .wxss 这四种类型文件获取依赖的形式。

获取 .js 文件依赖

小程序反对 CommonJS 的形式进行模块化，如果开启了 es6，也能反对 ESM 进行模块化。咱们如果要取得一个 .js 文件的依赖，首先要明确，js 文件导入模块的三种写法，针对上面三种语法，咱们能够引入 Babel 来获取依赖。

import a from './a.js'export b from './b.js'const c = require('./c.js')

通过 @babel/parser 将代码转化为 AST，而后通过 @babel/traverse 遍历 AST 节点，获取下面三种导入形式的值，放到数组。

const { parse } = require('@babel/parser')const { default: traverse } = require('@babel/traverse')class Depend {  // ...    jsDeps(file) {    const deps = []    const dirName = path.dirname(file)    // 读取 js 文件内容    const content = fs.readFileSync(file, 'utf-8')    // 将代码转化为 AST    const ast = parse(content, {      sourceType: 'module',      plugins: ['exportDefaultFrom']    })    // 遍历 AST    traverse(ast, {      ImportDeclaration: ({ node }) => {        // 获取 import from 地址        const { value } = node.source        const jsFile = this.transformScript(dirName, value)        if (jsFile) {          deps.push(jsFile)        }      },      ExportNamedDeclaration: ({ node }) => {        // 获取 export from 地址        const { value } = node.source        const jsFile = this.transformScript(dirName, value)        if (jsFile) {          deps.push(jsFile)        }      },      CallExpression: ({ node }) => {        if (          (node.callee.name && node.callee.name === 'require') &&          node.arguments.length >= 1        ) {          // 获取 require 地址          const [{ value }] = node.arguments          const jsFile = this.transformScript(dirName, value)          if (jsFile) {            deps.push(jsFile)          }        }      }    })    return deps  }}

在获取依赖模块的门路后，还不能立刻将门路增加到依赖数组内，因为依据模块语法 .js 后缀是能够省略的，另外 require 的门路是一个文件夹的时候，默认会导入该文件夹下的 index.js 。

class Depend {  // 获取某个门路的脚本文件  transformScript(url) {    const ext = path.extname(url)    // 如果存在后缀，示意以后曾经是一个文件    if (ext === '.js' && fs.existsSync(url)) {      return url    }    // a/b/c => a/b/c.js    const jsFile = url + '.js'    if (fs.existsSync(jsFile)) {      return jsFile    }    // a/b/c => a/b/c/index.js    const jsIndexFile = path.join(url, 'index.js')    if (fs.existsSync(jsIndexFile)) {      return jsIndexFile    }    return null  }    jsDeps(file) {...}}

咱们能够创立一个 .js，看看输入的 deps 是否正确：

// 文件门路：/Users/shenfq/Code/fork/miniprogram-demo/import a from './a.js'export b from '../b.js'const c = require('../../c.js')

获取 .json 文件依赖

.json 文件自身是不反对模块化的，然而小程序能够通过 .json 文件导入自定义组件。

自定义组件与小程序页面一样，也会对应四个文件，所以咱们须要获取 .json 中 usingComponents 内的所有依赖项，并判断每个组件对应的那四个文件是否存在，而后增加到依赖项内。

class Depend {  // ...  jsonDeps(file) {    const deps = []    const dirName = path.dirname(file)    const { usingComponents } = fs.readJsonSync(file)    if (usingComponents && typeof usingComponents === 'object') {      Object.values(usingComponents).forEach((component) => {        component = path.resolve(dirName, component)        // 每个组件都须要判断 js/json/wxml/wxss 文件是否存在        Extends.forEach((ext) => {          const file = this.replaceExt(component, ext)          if (fs.existsSync(file)) {            deps.push(file)          }        })      })    }    return deps  }}

获取 .wxml 文件依赖

wxml 提供两种文件援用形式 import 和 include。

<import src="a.wxml"/><include src="b.wxml"/>

wxml 文件实质上还是一个 html 文件，所以能够通过 html parser 对 wxml 文件进行解析，对于 html parser 相干的原理能够看我之前写过的文章《Vue 模板编译原理》。

const htmlparser2 = require('htmlparser2')class Depend {  // ...    wxmlDeps(file) {    const deps = []    const dirName = path.dirname(file)    const content = fs.readFileSync(file, 'utf-8')    const htmlParser = new htmlparser2.Parser({      onopentag(name, attribs = {}) {        if (name !== 'import' && name !== 'require') {          return        }        const { src } = attribs        if (src) {          return        }          const wxmlFile = path.resolve(dirName, src)        if (fs.existsSync(wxmlFile)) {            deps.push(wxmlFile)        }      }    })    htmlParser.write(content)    htmlParser.end()    return deps  }}

获取 .wxss 文件依赖

最初 wxss 文件导入款式和 css 语法统一，应用 @import 语句能够导入外联样式表。

@import "common.wxss";

能够通过 postcss 解析 wxss 文件，而后获取导入文件的地址，然而这里咱们偷个懒，间接通过简略的正则匹配来做。

class Depend {  // ...  wxssDeps(file) {    const deps = []    const dirName = path.dirname(file)    const content = fs.readFileSync(file, 'utf-8')    const importRegExp = /@import\s*['"](.+)['"];*/g    let matched    while ((matched = importRegExp.exec(content)) !== null) {      if (!matched[1]) {        continue      }      const wxssFile = path.resolve(dirName, matched[1])      if (fs.existsSync(wxmlFile)) {        deps.push(wxssFile)      }    }    return deps  }}

将依赖增加到树结构中

当初咱们须要批改 addToTree 办法。

class Depend {  addToTree(filePath) {    // 如果该文件曾经增加过，则不再增加到文件树中    if (this.files.has(filePath)) {      return    }    const relPath = this.getRelative(filePath)    const names = relPath.split(path.sep)    names.forEach((name, idx) => {      // ... 增加到树中    })    this.files.add(filePath)    // ===== 获取文件依赖，并增加到树中 =====    const deps = this.getDeps(filePath)    deps.forEach(dep => {      this.addToTree(dep)          })  }}

获取分包依赖

相熟小程序的同学必定晓得，小程序提供了分包机制。应用分包后，分包内的文件会被打包成一个独自的包，在用到的时候才会加载，而其余的文件则会放在主包，小程序关上的时候就会加载。

所以咱们在运行的时候，除了要拿到 pages 下的所有页面，还需拿到 subpackages 中所有的页面。因为之前只关怀主包的内容，this.tree 上面只有一颗文件树，当初咱们须要在 this.tree 下挂载多颗文件树，咱们须要先为主包创立一个独自的文件树，而后为每个分包创立一个文件树。

class Depend {  constructor() {    this.tree = {}    this.files = new Set()    this.context = path.join(root, 'miniprogram')  }  createTree(pkg) {    this.tree[pkg] = {      size: 0,      children: {}    }  }  addPage(page, pkg) {    const absPath = this.getAbsolute(page)    Extends.forEach(ext => {      const filePath = this.replaceExt(absPath, ext)      if (fs.existsSync(filePath)) {        this.addToTree(filePath, pkg)      }    })  }  run() {    const appPath = this.getAbsolute('app.json')    const appJson = fs.readJsonSync(appPath)    const { pages, subPackages, subpackages } = appJson        this.createTree('main') // 为主包创立文件树    pages.forEach(page => {      this.addPage(page, 'main')    })    // 因为 app.json 中 subPackages、subpackages 都能失效    // 所以咱们两个属性都获取，哪个存在就用哪个    const subPkgs = subPackages || subpackages    // 分包存在的时候才进行遍历    subPkgs && subPkgs.forEach(({ root, pages }) => {      root = root.split('/').join(path.sep)      this.createTree(root) // 为分包创立文件树      pages.forEach(page => {        this.addPage(`${root}${path.sep}${page}`, pkg)      })    })    // 输入文件树    fs.writeJSONSync('tree.json', this.tree, { spaces: 2 })  }}

addToTree 办法也须要进行批改，依据传入的 pkg 来判断将以后文件增加到哪个树。

class Depend {  addToTree(filePath, pkg = 'main') {    if (this.files.has(filePath)) {      // 如果该文件曾经增加过，则不再增加到文件树中      return    }    let relPath = this.getRelative(filePath)    if (pkg !== 'main' && relPath.indexOf(pkg) !== 0) {      // 如果该文件不是以分包名结尾，证实该文件不在分包内，      // 须要将文件增加到主包的文件树内      pkg = 'main'    }    const tree = this.tree[pkg] // 根据 pkg 取到对应的树    const size = this.getSize(filePath)    const names = relPath.split(path.sep)    const lastIdx = names.length - 1    tree.size += size    let point = tree.children    names.forEach((name, idx) => {      // ... 增加到树中    })    this.files.add(filePath)    // ===== 获取文件依赖，并增加到树中 =====    const deps = this.getDeps(filePath)    deps.forEach(dep => {      this.addToTree(dep)          })  }}

这里有一点须要留神，如果 package/a 分包下的文件依赖的文件不在 package/a 文件夹下，则该文件须要放入主包的文件树内。

通过 EChart 画图

通过下面的流程后，最终咱们能够失去如下的一个 json 文件：

接下来，咱们利用 ECharts 的画图能力，将这个 json 数据以图表的模式展示进去。咱们能够在 ECharts 提供的实例中看到一个 Disk Usage 的案例，很合乎咱们的预期。

ECharts 的配置这里就不再赘述，依照官网的 demo 即可，咱们须要把 tree. json 的数据转化为 ECharts 须要的格局就行了，残缺的代码放到 codesandbod 了，去上面的线上地址就能看到成果了。

线上地址：https://codesandbox.io/s/cold...

总结

这篇文章比拟偏实际，所以贴了很多的代码，另外本文对各个文件的依赖获取提供了一个思路，尽管这里只是用文件树结构了一个这样的依赖图。

在业务开发中，小程序 IDE 每次启动都须要进行全量的编译，开发版预览的时候会期待较长的工夫，咱们当初有文件依赖关系后，就能够只选取目前正在开发的页面进行打包，这样就能大大提高咱们的开发效率。如果有对这部分内容感兴趣的，能够另外写一篇文章介绍下如何实现。