揭秘webpack插件的工作原理

51次阅读

共计 14153 个字符,预计需要花费 36 分钟才能阅读完成。

  1. webpack 系列 1:常见 loader 源码简析,以及动手实现一个 md2html-loader
  2. webpack 系列 2:揭秘 webpack 插件工作原理
  3. webpack 系列 3:webpack 主流程源码阅读以及实现一个 webpack

前言

通过插件我们可以扩展 webpack,在合适的时机通过Webpack 提供的 API 改变输出结果,使 webpack 可以执行更广泛的任务,拥有更强的构建能力。
本文将尝试探索 webpack 插件的工作流程,进而去揭秘它的工作原理。同时需要你对 webpack 底层和构建流程的一些东西有一定的了解。

想要了解 webpack 的插件的机制,需要弄明白以下几个知识点:

  1. 一个简单的插件的构成
  2. webpack构建流程
  3. Tapable是如何把各个插件串联到一起的
  4. compiler以及 compilation 对象的使用以及它们对应的事件钩子。

插件基本结构

plugins是可以用自身原型方法 apply 来实例化的对象。apply只在安装插件被 Webpack compiler 执行一次。apply方法传入一个 webpck compiler 的引用,来访问编译器回调。

一个简单的插件结构:

class HelloPlugin {
  // 在构造函数中获取用户给该插件传入的配置
  constructor(options) {}
  // Webpack 会调用 HelloPlugin 实例的 apply 方法给插件实例传入 compiler 对象
  apply(compiler) {
    // 在 emit 阶段插入钩子函数,用于特定时机处理额外的逻辑;compiler.hooks.emit.tap('HelloPlugin', (compilation) => {// 在功能流程完成后可以调用 webpack 提供的回调函数;})
    // 如果事件是异步的,会带两个参数,第二个参数为回调函数,在插件处理完任务时需要调用回调函数通知 webpack,才会进入下一个处理流程。compiler.plugin('emit', function (compilation, callback) {
      // 支持处理逻辑
      // 处理完毕后执行 callback 以通知 Webpack
      // 如果不执行 callback,运行流程将会一直卡在这不往下执行
      callback()})
  }
}

module.exports = HelloPlugin

安装插件时, 只需要将它的一个实例放到Webpack config plugins 数组里面:

const HelloPlugin = require('./hello-plugin.js')
var webpackConfig = {plugins: [new HelloPlugin({ options: true})],
}

先来分析一下 webpack Plugin 的工作原理

  1. 读取配置的过程中会先执行 new HelloPlugin(options) 初始化一个 HelloPlugin 获得其实例。
  2. 初始化 compiler 对象后调用 HelloPlugin.apply(compiler) 给插件实例传入 compiler 对象。
  3. 插件实例在获取到 compiler 对象后,就可以通过 compiler.plugin(事件名称, 回调函数) 监听到 Webpack 广播出来的事件。
    并且可以通过 compiler 对象去操作 Webpack

webapck 构建流程

在编写插件之前,还需要了解一下 Webpack 的构建流程,以便在合适的时机插入合适的插件逻辑。

Webpack 的基本构建流程如下:

  1. 校验配置文件:读取命令行传入或者 webpack.config.js 文件,初始化本次构建的配置参数
  2. 生成 Compiler 对象:执行配置文件中的插件实例化语句 new MyWebpackPlugin(),为webpack 事件流挂上自定义hooks
  3. 进入 entryOption 阶段:webpack开始读取配置的Entries,递归遍历所有的入口文件
  4. run/watch:如果运行在 watch 模式则执行 watch 方法,否则执行 run 方法
  5. compilation:创建 Compilation 对象回调 compilation 相关钩子,依次进入每一个入口文件 (entry),使用 loader 对文件进行编译。通过compilation 我可以可以读取到 moduleresource(资源路径)、loaders(使用的 loader)等信息。再将编译好的文件内容使用 acorn 解析生成 AST 静态语法树。然后递归、重复的执行这个过程,
    所有模块和和依赖分析完成后,执行 compilationseal 方法对每个 chunk 进行整理、优化、封装 __webpack_require__ 来模拟模块化操作.
  6. emit:所有文件的编译及转化都已经完成,包含了最终输出的资源,我们可以在传入事件回调的 compilation.assets 上拿到所需数据,其中包括即将输出的资源、代码块 Chunk 等等信息。
// 修改或添加资源
compilation.assets['new-file.js'] = {source() {return 'var a=1'},
  size() {return this.source().length
  },
}
  1. afterEmit:文件已经写入磁盘完成
  2. done:完成编译
    奉上一张滴滴云博客的 WebPack 编译流程图, 不喜欢看文字讲解的可以看流程图理解记忆

原图出自:https://blog.didiyun.com/inde…

看完之后,如果还是看不懂或者对缕不清 webpack 构建流程的话,建议通读一下全文,再回来看这段话,相信一定会对 webpack 构建流程有很更加深刻的理解。

理解事件流机制 tapable

webpack本质上是一种事件流的机制,它的工作流程就是将各个插件串联起来,而实现这一切的核心就是 Tapable。

WebpackTapable 事件流机制保证了插件的有序性,将各个插件串联起来,Webpack 在运行过程中会广播事件,插件只需要监听它所关心的事件,就能加入到这条 webapck 机制中,去改变 webapck 的运作,使得整个系统扩展性良好。

Tapable也是一个小型的 library,是 Webpack 的一个核心工具。类似于 node 中的 events 库,核心原理就是一个订阅发布模式。作用是提供类似的插件接口。

webpack 中最核心的负责编译的 Compiler 和负责创建 bundles 的 Compilation 都是 Tapable 的实例,可以直接在 CompilerCompilation 对象上广播和监听事件,方法如下:

/**
 * 广播事件
 * event-name 为事件名称,注意不要和现有的事件重名
 */
compiler.apply('event-name', params)
compilation.apply('event-name', params)
/**
 * 监听事件
 */
compiler.plugin('event-name', function (params) {})
compilation.plugin('event-name', function (params) {})

Tapable类暴露了 taptapAsynctapPromise方法,可以根据钩子的同步 / 异步方式来选择一个函数注入逻辑。

tap 同步钩子

compiler.hooks.compile.tap('MyPlugin', (params) => {console.log('以同步方式触及 compile 钩子。')
})

tapAsync 异步钩子,通过 callback 回调告诉 Webpack 异步执行完毕
tapPromise 异步钩子,返回一个Promise 告诉 Webpack 异步执行完毕

compiler.hooks.run.tapAsync('MyPlugin', (compiler, callback) => {console.log('以异步方式触及 run 钩子。')
  callback()})

compiler.hooks.run.tapPromise('MyPlugin', (compiler) => {return new Promise((resolve) => setTimeout(resolve, 1000)).then(() => {console.log('以具有延迟的异步方式触及 run 钩子')
  })
})

Tabable 用法

const {
  SyncHook,
  SyncBailHook,
  SyncWaterfallHook,
  SyncLoopHook,
  AsyncParallelHook,
  AsyncParallelBailHook,
  AsyncSeriesHook,
  AsyncSeriesBailHook,
  AsyncSeriesWaterfallHook,
} = require('tapable')

简单实现一个 SyncHook

class Hook {constructor(args) {this.taps = []
    this.interceptors = [] // 这个放在后面用
    this._args = args
  }
  tap(name, fn) {this.taps.push({ name, fn})
  }
}
class SyncHook extends Hook {call(name, fn) {
    try {this.taps.forEach((tap) => tap.fn(name))
      fn(null, name)
    } catch (error) {fn(error)
    }
  }
}

tapable是如何将 webapck/webpack 插件关联的?

Compiler.js

const {AsyncSeriesHook ,SyncHook} = require("tapable");
// 创建类
class Compiler {constructor() {
        this.hooks = {run: new AsyncSeriesHook(["compiler"]), // 异步钩子
           compile: new SyncHook(["params"]),// 同步钩子
        };
    },
    run(){
      // 执行异步钩子
      this.hooks.run.callAsync(this, err => {this.compile(onCompiled);
      });
    },
    compile(){
      // 执行同步钩子 并传参
      this.hooks.compile.call(params);
    }
}
module.exports = Compiler

MyPlugin.js

const Compiler = require('./Compiler')

class MyPlugin {apply(compiler) {
    // 接受 compiler 参数
    compiler.hooks.run.tap('MyPlugin', () => console.log('开始编译...'))
    compiler.hooks.complier.tapAsync('MyPlugin', (name, age) => {setTimeout(() => {console.log('编译中...')
      }, 1000)
    })
  }
}

// 这里类似于 webpack.config.js 的 plugins 配置
// 向 plugins 属性传入 new 实例

const myPlugin = new MyPlugin()

const options = {plugins: [myPlugin],
}
let compiler = new Compiler(options)
compiler.run()

想要深入了解 tapable 的文章可以看看这篇文章:

webpack4核心模块 tapable 源码解析:
https://www.cnblogs.com/tugen…

理解 Compiler(负责编译)

开发插件首先要知道 compilercompilation 对象是做什么的

Compiler 对象包含了当前运行 Webpack 的配置,包括 entry、output、loaders 等配置,这个对象在启动 Webpack 时被实例化,而且是全局唯一的。Plugin可以通过该对象获取到 Webpack 的配置信息进行处理。

如果看完这段话,你还是没理解 compiler 是做啥的,不要怕,接着看。
运行 npm run build,把compiler 的全部信息输出到控制台上console.log(Compiler)

// 为了能更直观的让大家看清楚 compiler 的结构,里面的大量代码使用省略号(...)代替。Compiler {
  _pluginCompat: SyncBailHook {...},
  hooks: {
    shouldEmit: SyncBailHook {...},
    done: AsyncSeriesHook {...},
    additionalPass: AsyncSeriesHook {...},
    beforeRun: AsyncSeriesHook {...},
    run: AsyncSeriesHook {...},
    emit: AsyncSeriesHook {...},
    assetEmitted: AsyncSeriesHook {...},
    afterEmit: AsyncSeriesHook {...},
    thisCompilation: SyncHook {...},
    compilation: SyncHook {...},
    normalModuleFactory: SyncHook {...},
    contextModuleFactory: SyncHook {...},
    beforeCompile: AsyncSeriesHook {...},
    compile: SyncHook {...},
    make: AsyncParallelHook {...},
    afterCompile: AsyncSeriesHook {...},
    watchRun: AsyncSeriesHook {...},
    failed: SyncHook {...},
    invalid: SyncHook {...},
    watchClose: SyncHook {...},
    infrastructureLog: SyncBailHook {...},
    environment: SyncHook {...},
    afterEnvironment: SyncHook {...},
    afterPlugins: SyncHook {...},
    afterResolvers: SyncHook {...},
    entryOption: SyncBailHook {...},
    infrastructurelog: SyncBailHook {...}
  },
  ...
  outputPath: '',// 输出目录
  outputFileSystem: NodeOutputFileSystem {...},
  inputFileSystem: CachedInputFileSystem {...},
  ...
  options: {
    //Compiler 对象包含了 webpack 的所有配置信息,entry、module、output、resolve 等信息
    entry: [
      'babel-polyfill',
      '/Users/frank/Desktop/fe/fe-blog/webpack-plugin/src/index.js'
    ],
    devServer: {port: 3000},
    output: {...},
    module: {...},
    plugins: [MyWebpackPlugin {} ],
    mode: 'production',
    context: '/Users/frank/Desktop/fe/fe-blog/webpack-plugin',
    devtool: false,
    ...
    performance: {
      maxAssetSize: 250000,
      maxEntrypointSize: 250000,
      hints: 'warning'
    },
    optimization: {...},
    resolve: {...},
    resolveLoader: {...},
    infrastructureLogging: {level: 'info', debug: false}
  },
  context: '/Users/frank/Desktop/fe/fe-blog/webpack-plugin',// 上下文,文件目录
  requestShortener: RequestShortener {...},
  ...
  watchFileSystem: NodeWatchFileSystem {
    // 监听文件变化列表信息
     ...
  }
}

Compiler 源码精简版代码解析

源码地址(948 行):https://github.com/webpack/we…

const {SyncHook, SyncBailHook, AsyncSeriesHook} = require('tapable')
class Compiler {constructor() {
    // 1. 定义生命周期钩子
    this.hooks = Object.freeze({
      // ... 只列举几个常用的常见钩子,更多 hook 就不列举了,有兴趣看源码
      done: new AsyncSeriesHook(['stats']), // 一次编译完成后执行,回调参数:stats
      beforeRun: new AsyncSeriesHook(['compiler']),
      run: new AsyncSeriesHook(['compiler']), // 在编译器开始读取记录前执行
      emit: new AsyncSeriesHook(['compilation']), // 在生成文件到 output 目录之前执行,回调参数:compilation
      afterEmit: new AsyncSeriesHook(['compilation']), // 在生成文件到 output 目录之后执行
      compilation: new SyncHook(['compilation', 'params']), // 在一次 compilation 创建后执行插件
      beforeCompile: new AsyncSeriesHook(['params']),
      compile: new SyncHook(['params']), // 在一个新的 compilation 创建之前执行
      make: new AsyncParallelHook(['compilation']), // 完成一次编译之前执行
      afterCompile: new AsyncSeriesHook(['compilation']),
      watchRun: new AsyncSeriesHook(['compiler']),
      failed: new SyncHook(['error']),
      watchClose: new SyncHook([]),
      afterPlugins: new SyncHook(['compiler']),
      entryOption: new SyncBailHook(['context', 'entry']),
    })
    // ... 省略代码
  }
  newCompilation() {
    // 创建 Compilation 对象回调 compilation 相关钩子
    const compilation = new Compilation(this)
    //... 一系列操作
    this.hooks.compilation.call(compilation, params) //compilation 对象创建完成
    return compilation
  }
  watch() {
    // 如果运行在 watch 模式则执行 watch 方法,否则执行 run 方法
    if (this.running) {return handler(new ConcurrentCompilationError())
    }
    this.running = true
    this.watchMode = true
    return new Watching(this, watchOptions, handler)
  }
  run(callback) {if (this.running) {return callback(new ConcurrentCompilationError())
    }
    this.running = true
    process.nextTick(() => {this.emitAssets(compilation, (err) => {if (err) {
          // 在编译和输出的流程中遇到异常时,会触发 failed 事件
          this.hooks.failed.call(err)
        }
        if (compilation.hooks.needAdditionalPass.call()) {
          // ...
          // done:完成编译
          this.hooks.done.callAsync(stats, (err) => {
            // 创建 compilation 对象之前
            this.compile(onCompiled)
          })
        }
        this.emitRecords((err) => {this.hooks.done.callAsync(stats, (err) => {})
        })
      })
    })

    this.hooks.beforeRun.callAsync(this, (err) => {this.hooks.run.callAsync(this, (err) => {this.readRecords((err) => {this.compile(onCompiled)
        })
      })
    })
  }
  compile(callback) {const params = this.newCompilationParams()
    this.hooks.beforeCompile.callAsync(params, (err) => {this.hooks.compile.call(params)
      const compilation = this.newCompilation(params)
      // 触发 make 事件并调用 addEntry,找到入口 js,进行下一步
      this.hooks.make.callAsync(compilation, (err) => {process.nextTick(() => {compilation.finish((err) => {
            // 封装构建结果(seal),逐次对每个 module 和 chunk 进行整理,每个 chunk 对应一个入口文件
            compilation.seal((err) => {this.hooks.afterCompile.callAsync(compilation, (err) => {
                // 异步的事件需要在插件处理完任务时调用回调函数通知 Webpack 进入下一个流程,// 不然运行流程将会一直卡在这不往下执行
                return callback(null, compilation)
              })
            })
          })
        })
      })
    })
  }
  emitAssets(compilation, callback) {const emitFiles = (err) => {
      //... 省略一系列代码
      // afterEmit:文件已经写入磁盘完成
      this.hooks.afterEmit.callAsync(compilation, (err) => {if (err) return callback(err)
        return callback()})
    }

    // emit 事件发生时,可以读取到最终输出的资源、代码块、模块及其依赖,并进行修改(这是最后一次修改最终文件的机会)
    this.hooks.emit.callAsync(compilation, (err) => {if (err) return callback(err)
      outputPath = compilation.getPath(this.outputPath, {})
      mkdirp(this.outputFileSystem, outputPath, emitFiles)
    })
  }
  // ... 省略代码
}

apply方法中插入钩子的一般形式如下:

// compiler 提供了 compiler.hooks,可以根据这些不同的时刻去让插件做不同的事情。compiler.hooks. 阶段.tap 函数('插件名称', (阶段回调参数) => {})
compiler.run(callback)

理解 Compilation(负责创建 bundles)

Compilation对象代表了一次资源版本构建。当运行 webpack 开发环境中间件时,每当检测到一个文件变化,就会创建一个新的 compilation,从而生成一组新的编译资源。一个 Compilation 对象表现了当前的模块资源、编译生成资源、变化的文件、以及被跟踪依赖的状态信息,简单来讲就是把本次打包编译的内容存到内存里。Compilation 对象也提供了插件需要自定义功能的回调,以供插件做自定义处理时选择使用拓展。

简单来说,Compilation的职责就是构建模块和 Chunk,并利用插件优化构建过程。

Compiler 用法相同,钩子类型不同,也可以在某些钩子上访问 tapAsynctapPromise。

控制台输出console.log(compilation)

通过 Compilation 也能读取到 Compiler 对象。

源码 2000 多行,看不动了 - -,有兴趣的可以自己看看。
https://github.com/webpack/we…

介绍几个常用的 Compilation Hooks

钩子 类型 什么时候调用
buildModule SyncHook 在模块开始编译之前触发,可以用于修改模块
succeedModule SyncHook 当一个模块被成功编译,会执行这个钩子
finishModules AsyncSeriesHook 当所有模块都编译成功后被调用
seal SyncHook 当一次 compilation 停止接收新模块时触发
optimizeDependencies SyncBailHook 在依赖优化的开始执行
optimize SyncHook 在优化阶段的开始执行
optimizeModules SyncBailHook 在模块优化阶段开始时执行,插件可以在这个钩子里执行对模块的优化,回调参数:modules
optimizeChunks SyncBailHook 在代码块优化阶段开始时执行,插件可以在这个钩子里执行对代码块的优化,回调参数:chunks
optimizeChunkAssets AsyncSeriesHook 优化任何代码块资源,这些资源存放在compilation.assets 上。一个 chunk 有一个 files 属性,它指向由一个 chunk 创建的所有文件。任何额外的 chunk 资源都存放在 compilation.additionalChunkAssets 上。回调参数:chunks
optimizeAssets AsyncSeriesHook 优化所有存放在 compilation.assets 的所有资源。回调参数:assets

Compiler 和 Compilation 的区别

Compiler 代表了整个 Webpack 从启动到关闭的生命周期,而 Compilation 只是代表了一次新的编译,只要文件有改动,compilation就会被重新创建。

常用 API

插件可以用来修改输出文件、增加输出文件、甚至可以提升 Webpack 性能、等等,总之插件通过调用 Webpack 提供的 API 能完成很多事情。由于 Webpack 提供的 API 非常多,有很多 API 很少用的上,又加上篇幅有限,下面来介绍一些常用的 API。

读取输出资源、代码块、模块及其依赖

有些插件可能需要读取 Webpack 的处理结果,例如输出资源、代码块、模块及其依赖,以便做下一步处理。
在 emit 事件发生时,代表源文件的转换和组装已经完成,在这里可以读取到最终将输出的资源、代码块、模块及其依赖,并且可以修改输出资源的内容。
插件代码如下:

class Plugin {apply(compiler) {compiler.plugin('emit', function (compilation, callback) {
      // compilation.chunks 存放所有代码块,是一个数组
      compilation.chunks.forEach(function (chunk) {
        // chunk 代表一个代码块
        // 代码块由多个模块组成,通过 chunk.forEachModule 能读取组成代码块的每个模块
        chunk.forEachModule(function (module) {
          // module 代表一个模块
          // module.fileDependencies 存放当前模块的所有依赖的文件路径,是一个数组
          module.fileDependencies.forEach(function (filepath) {})
        })

        // Webpack 会根据 Chunk 去生成输出的文件资源,每个 Chunk 都对应一个及其以上的输出文件
        // 例如在 Chunk 中包含了 CSS 模块并且使用了 ExtractTextPlugin 时,// 该 Chunk 就会生成 .js 和 .css 两个文件
        chunk.files.forEach(function (filename) {
          // compilation.assets 存放当前所有即将输出的资源
          // 调用一个输出资源的 source() 方法能获取到输出资源的内容
          let source = compilation.assets[filename].source()})
      })

      // 这是一个异步事件,要记得调用 callback 通知 Webpack 本次事件监听处理结束。// 如果忘记了调用 callback,Webpack 将一直卡在这里而不会往后执行。callback()})
  }
}

监听文件变化

Webpack 会从配置的入口模块出发,依次找出所有的依赖模块,当入口模块或者其依赖的模块发生变化时,就会触发一次新的 Compilation

在开发插件时经常需要知道是哪个文件发生变化导致了新的 Compilation,为此可以使用如下代码:

// 当依赖的文件发生变化时会触发 watch-run 事件
compiler.hooks.watchRun.tap('MyPlugin', (watching, callback) => {
  // 获取发生变化的文件列表
  const changedFiles = watching.compiler.watchFileSystem.watcher.mtimes
  // changedFiles 格式为键值对,键为发生变化的文件路径。if (changedFiles[filePath] !== undefined) {// filePath 对应的文件发生了变化}
  callback()})

默认情况下 Webpack 只会监视入口和其依赖的模块是否发生变化,在有些情况下项目可能需要引入新的文件,例如引入一个 HTML 文件。由于 JavaScript 文件不会去导入 HTML 文件,Webpack 就不会监听 HTML 文件的变化,编辑 HTML 文件时就不会重新触发新的 Compilation。为了监听 HTML 文件的变化,我们需要把 HTML 文件加入到依赖列表中,为此可以使用如下代码:

compiler.hooks.afterCompile.tap('MyPlugin', (compilation, callback) => {
  // 把 HTML 文件添加到文件依赖列表,好让 Webpack 去监听 HTML 模块文件,在 HTML 模版文件发生变化时重新启动一次编译
  compilation.fileDependencies.push(filePath)
  callback()})

修改输出资源

有些场景下插件需要修改、增加、删除输出的资源,要做到这点需要监听 emit 事件,因为发生 emit 事件时所有模块的转换和代码块对应的文件已经生成好,需要输出的资源即将输出,因此 emit 事件是修改 Webpack 输出资源的最后时机。

所有需要输出的资源会存放在 compilation.assets 中,compilation.assets 是一个键值对,键为需要输出的文件名称,值为文件对应的内容。

设置 compilation.assets 的代码如下:

// 设置名称为 fileName 的输出资源
compilation.assets[fileName] = {
  // 返回文件内容
  source: () => {
    // fileContent 既可以是代表文本文件的字符串,也可以是代表二进制文件的 Buffer
    return fileContent
  },
  // 返回文件大小
  size: () => {return Buffer.byteLength(fileContent, 'utf8')
  },
}
callback()

判断 webpack 使用了哪些插件

// 判断当前配置使用使用了 ExtractTextPlugin,// compiler 参数即为 Webpack 在 apply(compiler) 中传入的参数
function hasExtractTextPlugin(compiler) {
  // 当前配置所有使用的插件列表
  const plugins = compiler.options.plugins
  // 去 plugins 中寻找有没有 ExtractTextPlugin 的实例
  return (
    plugins.find((plugin) => plugin.__proto__.constructor === ExtractTextPlugin
    ) != null
  )
}

以上 4 种方法来源于文章:
[Webpack 学习-Plugin] :http://wushaobin.top/2019/03/…

管理 Warnings 和 Errors

做一个实验,如果你在 apply函数内插入 throw new Error("Message"),会发生什么,终端会打印出 Unhandled rejection Error: Message。然后 webpack 中断执行。
为了不影响 webpack 的执行,要在编译期间向用户发出警告或错误消息,则应使用 compilation.warnings 和 compilation.errors。

compilation.warnings.push('warning')
compilation.errors.push('error')

文章中的案例 demo 代码展示

https://github.com/6fedcom/fe-blog/tree/master/webpack/plugin

webpack 打包过程或者插件代码里该如何调试?

  1. 在当前 webpack 项目工程文件夹下面,执行命令行:
node --inspect-brk ./node_modules/webpack/bin/webpack.js --inline --progress

其中参数 –inspect-brk 就是以调试模式启动 node:

终端会输出:

Debugger listening on ws://127.0.0.1:9229/1018c03f-7473-4d60-b62c-949a6404c81d
For help, see: https://nodejs.org/en/docs/inspector
  1. 谷歌浏览器输入 chrome://inspect/#devices

  1. 然后点一下 Chrome 调试器里的“继续执行”,断点就提留在我们设置在插件里的 debugger 断点了。

正文完
 0