深入Parcel–架构与流程篇

38次阅读

共计 13067 个字符,预计需要花费 33 分钟才能阅读完成。

本篇文章是对 Parce 的源码解析,代码基本架构与执行流程,在这之前你如果对 parcel 不熟悉可以先到 Parcel 官网 了解
介绍
下面是偷懒从官网抄下来的介绍:
极速零配置 Web 应用打包工具
极速打包
Parcel 使用 worker 进程去启用多核编译。同时有文件系统缓存,即使在重启构建后也能快速再编译。
将你所有的资源打包
Parcel 具备开箱即用的对 JS, CSS, HTML, 文件 及更多的支持,而且不需要插件。
自动转换
如若有需要,Babel, PostCSS, 和 PostHTML 甚至 node_modules 包会被用于自动转换代码.
零配置代码分拆
使用动态 import() 语法, Parcel 将你的输出文件束 (bundles) 分拆,因此你只需要在初次加载时加载你所需要的代码。
热模块替换
Parcel 无需配置,在开发环境的时候会自动在浏览器内随着你的代码更改而去更新模块。
友好的错误日志
当遇到错误时,Parcel 会输出 语法高亮的代码片段,帮助你定位问题。

打包工具
时间

browserify
22.98s

webpack
20.71s

parcel
9.98s

parcel – with cache
2.64s

打包工具
我们常用的打包工具大致功能:

模块化(代码的拆分,合并,Tree-Shaking 等)
编译(es6,7,8 sass typescript 等)
压缩(js, css, html 包括图片的压缩)
HMR(热替换)

version
parcel-bundler 版本:
“version”: “1.11.0”
文件架构
|– assets 资源目录 继承自 Asset.js
|– builtins 用于最终构建
|– packagers 打包
|– scope-hoisting 作用域提升 Tree-Shake
|– transforms 转换代码为 AST
|– utils 工具
|– visitors 遍历 js AST 树 收集依赖等

|– Asset.js 资源
|– Bundle.js 用于构建 bundle 树
|– Bundler.js 主目录
|– FSCache.js 缓存
|– HMRServer.js HMR 服务器提供 WebSocket
|– Parser.js 根据文件扩展名获取对应 Asset
|– Pipeline.js 多线程执行方法
|– Resolver.js 解析模块路径
|– Server.js 静态资源服务器
|– SourceMap.js SourceMap
|– cli.js cli 入口 解析命令行参数
|– worker.js 多线程入口
流程
说明
Parcel 是面向资源的,JavaScript,CSS,HTML 这些都是资源,并不是 webpack 中 js 是一等公民,Parcel 会自动的从入口文件开始分析这些文件 和 模块中的依赖,然后构建一个 bundle 树,并对其进行打包输出到指定目录
一个简单的例子
我们从一个简单的例子开始了解 parcel 内部源码与流程
index.html
|– index.js
|– module1.js
|– module2.js
上面是我们例子的结构,入口为 index.html, 在 index.html 中我们用 script 标签引用了 src/index.js,在 index.js 中我们引入了 2 个子模块
执行
npx parcel index.html 或者 ./node_modules/.bin/parcel index.html,或者使用 npm script
cli
“bin”: {
“parcel”: “bin/cli.js”
}
查看 parcel-bundler 的 package.json 找到 bin/cli.js,在 cli.js 里又指向 ../src/cli
const program = require(‘commander’);

program
.command(‘serve [input…]’) // watch build

.action(bundle);

program.parse(process.argv);

async function bundle(main, command) {
const Bundler = require(‘./Bundler’);

const bundler = new Bundler(main, command);

if (command.name() === ‘serve’ && command.target === ‘browser’) {
const server = await bundler.serve();

if (server && command.open) {… 启动自动打开浏览器}
} else {
bundler.bundle();
}
}
在 cli.js 中利用 commander 解析命令行并调用 bundle 方法有 serve, watch, build 3 个命令来调用 bundle 函数,执行 pracel index.html 默认为 serve,所以调用的是 bundler.serve 方法
进入 Bundler.js
bundler.serve
async serve(port = 1234, https = false, host) {
this.server = await Server.serve(this, port, host, https);
try {
await this.bundle();
} catch (e) {}
return this.server;
}
bundler.serve 方法 调用 serveStatic 起了一个静态服务指向 最终打包的文件夹下面就是重要的 bundle 方法
bundler.bundle
async bundle() {
// 加载插件 设置 env 启动多线程 watcher hmr
await this.start();

if (isInitialBundle) {
// 创建 输出目录
await fs.mkdirp(this.options.outDir);

this.entryAssets = new Set();
for (let entry of this.entryFiles) {
let asset = await this.resolveAsset(entry);
this.buildQueue.add(asset);
this.entryAssets.add(asset);
}
}

// 打包队列中的资源
let loadedAssets = await this.buildQueue.run();

// findOrphanAssets 获取所有资源中独立的没有父 Bundle 的资源
let changedAssets = […this.findOrphanAssets(), …loadedAssets];

// 因为接下来要构建 Bundle 树,先对上一次的 Bundle 树 进行 clear 操作
for (let asset of this.loadedAssets.values()) {
asset.invalidateBundle();
}

// 构建 Bundle 树
this.mainBundle = new Bundle();
for (let asset of this.entryAssets) {
this.createBundleTree(asset, this.mainBundle);
}

// 获取新的最终打包文件的 url
this.bundleNameMap = this.mainBundle.getBundleNameMap(
this.options.contentHash
);
// 将代码中的旧文件 url 替换为新的
for (let asset of changedAssets) {
asset.replaceBundleNames(this.bundleNameMap);
}

// 将改变的资源通过 websocket 发送到浏览器
if (this.hmr && !isInitialBundle) {
this.hmr.emitUpdate(changedAssets);
}

// 对资源打包
this.bundleHashes = await this.mainBundle.package(
this,
this.bundleHashes
);

// 将独立的资源删除
this.unloadOrphanedAssets();

return this.mainBundle;
}
我们一步步先从 this.start 看
start
if (this.farm) {
return;
}

await this.loadPlugins();

if (!this.options.env) {
await loadEnv(Path.join(this.options.rootDir, ‘index’));
this.options.env = process.env;
}

if (this.options.watch) {
this.watcher = new Watcher();
this.watcher.on(‘change’, this.onChange.bind(this));
}

if (this.options.hmr) {
this.hmr = new HMRServer();
this.options.hmrPort = await this.hmr.start(this.options);
}

this.farm = await WorkerFarm.getShared(this.options, {
workerPath: require.resolve(‘./worker.js’)
});
start:

开头的判断 防止多次执行,也就是说 this.start 只会执行一次

loadPlugins 加载插件,找到 package.json 文件 dependencies, devDependencies 中 parcel-plugin- 开头的插件进行调用

loadEnv 加载环境变量,利用 dotenv, dotenv-expand 包将 env.development.local, .env.development, .env.local, .env 扩展至 process.env

watch 初始化监听文件并绑定 change 回调函数,内部 child_process.fork 起一个子进程,使用 chokidar 包来监听文件改变

hmr 起一个服务,WebSocket 向浏览器发送更改的资源

farm 初始化多进程并指定 werker 工作文件,开启多个 child_process 去解析编译资源

接下来回到 bundle,isInitialBundle 是一个判断是否是第一次构建 fs.mkdirp 创建输出文件夹遍历入口文件,通过 resolveAsset,内部调用 resolver 解析路径,并 getAsset 获取到对应的 asset(这里我们入口是 index.html,根据扩展名获取到的是 HTMLAsset)将 asset 添加进队列然后启动 this.buildQueue.run() 对资源从入口递归开始打包
PromiseQueue
这里 buildQueue 是一个 PromiseQueue 异步队列 PromiseQueue 在初始化的时候传入一个回调函数 callback,内部维护一个参数队列 queue,add 往队列里 push 一个参数,run 的时候 while 遍历队列 callback(…queue.shift()),队列全部执行完毕 Promise 置为完成(resolved)(可以将其理解为 Promise.all)这里定义的回调函数是 processAsset,参数就是入口文件 index.html 的 HTMLAsset
async processAsset(asset, isRebuild) {
if (isRebuild) {
asset.invalidate();
if (this.cache) {
this.cache.invalidate(asset.name);
}
}

await this.loadAsset(asset);
}
processAsset 函数内先判断是否是 Rebuild,是第一次构建,还是 watch 监听文件改变进行的重建,如果是重建则对资源的属性重置,并使其缓存失效之后调用 loadAsset 加载资源编译资源
loadAsset
async loadAsset(asset) {
if (asset.processed) {
return;
}

// Mark the asset processed so we don’t load it twice
asset.processed = true;

// 先尝试读缓存,缓存没有在后台加载和编译
asset.startTime = Date.now();
let processed = this.cache && (await this.cache.read(asset.name));
let cacheMiss = false;
if (!processed || asset.shouldInvalidate(processed.cacheData)) {
processed = await this.farm.run(asset.name);
cacheMiss = true;
}

asset.endTime = Date.now();
asset.buildTime = asset.endTime – asset.startTime;
asset.id = processed.id;
asset.generated = processed.generated;
asset.hash = processed.hash;
asset.cacheData = processed.cacheData;

// 解析和加载当前资源的依赖项
let assetDeps = await Promise.all(
dependencies.map(async dep => {
dep.parent = asset.name;
let assetDep = await this.resolveDep(asset, dep);
if (assetDep) {
await this.loadAsset(assetDep);
}
return assetDep;
})
);

if (this.cache && cacheMiss) {
this.cache.write(asset.name, processed);
}
}
loadAsset 在开始有个判断防止重复编译之后去读缓存,读取失败就调用 this.farm.run 在多进程里编译资源编译完就去加载并编译依赖的文件最后如果是新的资源没有用到缓存,就重新设置一下缓存下面说一下这里吗涉及的两个东西:缓存 FSCache 和 多进程 WorkerFarm
FSCache
read 读取缓存,并判断最后修改时间和缓存的修改时间 write 写入缓存

缓存目录为了加速读取,避免将所有的缓存文件放在一个文件夹里,parcel 将 16 进制 两位数的 256 种可能创建为文件夹,这样存取缓存文件的时候,将目标文件路径 md5 加密转换为 16 进制,然后截取前两位是目录,后面几位是文件名
WorkerFarm
在上面 start 里初始化 farm 的时候,workerPath 指向了 worker.js 文件,worker.js 里有两个函数,init 和 runWorkerFarm.getShared 初始化的时候会创建一个 new WorkerFarm,调用 worker.js 的 init 方法,根据 cpu 获取最大的 Worker 数,并启动一半的子进程 farm.run 会通知子进程执行 worker.js 的 run 方法,如果进程数没有达到最大会再次开启一个新的子进程,子进程执行完毕后将 Promise 状态更改为完成 worker.run -> pipeline.process -> pipeline.processAsset -> asset.processAsset.process 处理资源:
async process() {
if (!this.generated) {
await this.loadIfNeeded();
await this.pretransform();
await this.getDependencies();
await this.transform();
this.generated = await this.generate();
}

return this.generated;
}
将上面的代码内部扩展一下:
async process() {
// 已经有就不需要编译
if (!this.generated) {
// 加载代码
if (this.contents == null) {
this.contents = await this.load();
}
// 可选。在收集依赖之前转换。
await this.pretransform();
// 将代码解析为 AST 树
if (!this.ast) {
this.ast = await this.parse(this.contents);
}
// 收集依赖
await this.collectDependencies();
// 可选。在收集依赖之后转换。
await this.transform();
// 生成代码
this.generated = await this.generate();
}

return this.generated;
}

// 最后处理代码
async postProcess(generated) {
return generated
}
processAsset 中调用 asset.process 生成 generated 这个 generated 不一定是最终代码,像 html 里内联的 script ,vue 的 html, js, css,都会进行二次或多次递归处理,最终调用 asset.postProcess 生成代码
Asset
下面说几个实现 HTMLAsset:

pretransform 调用 posthtml 将 html 解析为 PostHTMLTree(如果没有设置 posthtmlrc 之类的不会走)
parse 调用 posthtml-parser 将 html 解析为 PostHTMLTree

collectDependencies 用 walk 遍历 ast,找到 script, img 的 src,link 的 href 等的地址,将其加入到依赖
transform htmlnano 压缩代码
generate 处理内联的 script 和 css

postProcess posthtml-render 生成 html 代码

JSAsset:

pretransform 调用 @babel/core 将 js 解析为 AST,处理 process.env

parse 调用 @babel/parser 将 js 解析为 AST

collectDependencies 用 babylon-walk 遍历 ast,如 ImportDeclaration,import xx from ‘xx’ 语法,CallExpression 找到 require 调用,import 被标记为 dynamic 动态导入,将这些模块加入到依赖
transform 处理 readFileSync,__dirname, __filename, global 等,如果没有设置 scopeHoist 并存在 es6 module 就将代码转换为 commonjs,terser 压缩代码
generate @babel/generator 获取 js 与 sourceMap 代码

VueAsset:

parse @vue/component-compiler-utils 与 vue-template-compiler 对 .vue 文件进行解析
generate 对 html, js, css 处理,就像上面说到会对其分别调用 processAsset 进行二次解析
postProcess component-compiler-utils 的 compileTemplate, compileStyle 处理 html,css,vue-hot-reload-api HMR 处理,压缩代码

回到 bundle 方法:
let loadedAssets = await this.buildQueue.run() 就是上面说到的 PromiseQueue 和 WorkerFarm 结合起来:buildQueue.run —> processAsset -> loadAsset -> farm.run -> worker.run -> pipeline.process -> pipeline.processAsset -> asset.process,执行之后所有资源编译完毕,并返回入口资源 loadedAssets 就是 index.html 对应的 HTMLAsset 资源
之后是 let changedAssets = […this.findOrphanAssets(), …loadedAssets] 获取到改变的资源
findOrphanAssets 是从所有资源中查找没有 parentBundle 的资源,也就是独立的资源,这个 parentBundle 会在等会的构建 Bundle 树中被赋值,第一次构建都没有 parentBundle,所以这里会重复入口文件,这里的 findOrphanAssets 的作用是在第一次构建之后,文件 change 的时候,在这个文件 import 了新的一个文件,因为新文件没有被构建过 Bundle 树,所以没有 parentBundle,这个新文件也被标记物 change
invalidateBundle 因为接下来要构建新的树所以调用重置所有资源上一次树的属性
createBundleTree 构建 Bundle 树:首先一个入口资源会被创建成一个 bundle,然后动态的 import() 会被创建成子 bundle,这引发了代码的拆分。
当不同类型的文件资源被引入,兄弟 bundle 就会被创建。例如你在 JavaScript 中引入了 CSS 文件,那它会被放置在一个与 JavaScript 文件对应的兄弟 bundle 中。
如果资源被多于一个 bundle 引用,它会被提升到 bundle 树中最近的公共祖先中,这样该资源就不会被多次打包。
Bundle:

type:它包含的资源类型 (例如:js, css, map, …)

name:bundle 的名称 (使用 entryAsset 的 Asset.generateBundleName() 生成)

parentBundle:父 bundle,入口 bundle 的父 bundle 是 null

entryAsset:bundle 的入口,用于生成名称 (name) 和聚拢资源(assets)

assets:bundle 中所有资源的集合(Set)

childBundles:所有子 bundle 的集合(Set)

siblingBundles:所有兄弟 bundle 的集合(Set)

siblingBundlesMap:所有兄弟 bundle 的映射 Map<String(Type: js, css, map, …), Bundle>

offsets:所有 bundle 中资源位置的映射 Map<Asset, number(line number inside the bundle)>,用于生成准确的 sourcemap。

我们的例子会被构建成:
html (index.html)
|– js (index.js, module1.js, module2.js)
|– map (index.js, module1.js, module2.js)
module1.js 和 module2.js 被提到了与 index.js 同级,map 因为类型不同被放到了 子 bundle
一个复杂点的树:
// 资源树
index.html
|– index.css
|– bg.png
|– index.js
|– module.js
// mainBundle
html (index.html)
|– js (index.js, module.js)
|– map (index.map, module.map)
|– css (index.css)
|– js (index.css, css-loader.js bundle-url.js)
|– map (css-loader.js, bundle-url.js)
|– png (bg.png)
因为要对 css 热更新,所以新增了 css-loader.js, bundle-url.js 两个 js
replaceBundleNames 替换引用:生成树之后将代码中的文件引用替换为最终打包的文件名,如果是生产环境会替换为 contentHash 根据内容生成 hash
hmr 更新:判断启用 hmr 并且不是第一次构建的情况,调用 hmr.emitUpdate 将改变的资源发送给浏览器
Bundle.package 打包
unloadOrphanedAssets 将独立的资源删除
package
package 将 generated 写入到文件有 6 种打包:CSSPackager,HTMLPackager,SourceMapPackager,JSPackager,JSConcatPackager,RawPackager 当开启 scopeHoist 时用 JSConcatPackager 否则 JSPackager 图片等资源用 RawPackager
最终我们的例子被打包成 index.html, src.[hash].js, src.[hash].map 3 个文件
index.html 里的 js 路径被替换成立最终打包的地址
我们看一下打包的 js:
parcelRequire = (function (modules, cache, entry, globalName) {
// Save the require from previous bundle to this closure if any
var previousRequire = typeof parcelRequire === ‘function’ && parcelRequire;
var nodeRequire = typeof require === ‘function’ && require;

function newRequire(name, jumped) {
if (!cache[name]) {
localRequire.resolve = resolve;
localRequire.cache = {};

var module = cache[name] = new newRequire.Module(name);

modules[name][0].call(module.exports, localRequire, module, module.exports, this);
}

return cache[name].exports;

function localRequire(x){
return newRequire(localRequire.resolve(x));
}

function resolve(x){
return modules[name][4][x] || x;
}
}
for (var i = 0; i < entry.length; i++) {
newRequire(entry[i]);
}
// Override the current require with this new one
return newRequire;
})({“src/module1.js”:[function(require,module,exports) {
“use strict”;

},{}],”src/module2.js”:[function(require,module,exports) {
“use strict”;

},{}],”src/index.js”:[function(require,module,exports) {
“use strict”;

var _module = require(“./module”);

var _module2 = require(“./module1”);

var _module3 = require(“./module2”);
console.log(_module.m);
},{“./module”:”src/module.js”,”./module1″:”src/module1.js”,”./module2″:”src/module2.js”,”fs”:”node_modules/parcel-bundler/src/builtins/_empty.js”}]
,{}]},{},[“node_modules/parcel-bundler/src/builtins/hmr-runtime.js”,”src/index.js”], null)
//# sourceMappingURL=/src.a2b27638.map
可以看到代码被拼接成了对象的形式,接收参数 module, require 用来模块导入导出,实现了 commonjs 的模块加载机制,一个更加简化版:
parcelRequire = (function (modules, cache, entry, globalName) {
function newRequire(id){
if(!cache[id]){
let module = cache[id] = {exports: {} }
modules[id][0].call(module.exports, newRequire, module, module.exports, this);
}
return cache[id]
}
for (var i = 0; i < entry.length; i++) {
newRequire(entry[i]);
}
return newRequire;
})()
代码被拼接起来:
`(function(modules){
//…newRequire
})({` +
asset.id +
‘:[function(require,module,exports) {\n’ +
asset.generated.js +
‘\n},’ +
‘})’
(function(modules){
//…newRequire
})({
“src/index.js”:[function(require,module,exports){
// code
}]
})
hmr-runtime
上面打包的 js 中还有个 hmr-runtime.js 太长被我省略了 hmr-runtime.js 创建一个 WebSocket 监听服务端消息修改文件触发 onChange 方法,onChange 将改变的资源 buildQueue.add 加入构建队列,重新调用 bundle 方法,打包资源,并调用 emitUpdate 通知浏览器更新当浏览器接收到服务端有新资源更新消息时新的资源就会设置或覆盖之前的模块 modules[asset.id] = new Function(‘require’, ‘module’, ‘exports’, asset.generated.js)对模块进行更新:
function hmrAccept(id){
// dispose 回调
cached.hot._disposeCallbacks.forEach(function (cb) {
cb(bundle.hotData);
});

delete bundle.cache[id]; // 删除之前缓存
newRequire(id); // 重新此加载

// accept 回调
cached.hot._acceptCallbacks.forEach(function (cb) {
cb();
});

// 递归父模块 进行更新
getParents(global.parcelRequire, id).some(function (id) {
return hmrAccept(global.parcelRequire, id);
});
}
至此整个打包流程结束
总结
parcle index.html 进入 cli,启动 Server 调用 bundle,初始化配置(Plugins, env, HMRServer, Watcher, WorkerFarm),从入口资源开始,递归编译(babel, posthtml, postcss, vue-template-compiler 等),编译完设置缓存,构建 Bundle 树,进行打包如果没有 watch 监听,结束关闭 Watcher, Worker, HMR 有 watch 监听:文件修改,触发 onChange,将修改的资源加入构建队列,递归编译,查找缓存(这一步缓存的作用就提醒出来了),编译完设置新缓存,构建 Bundle 树,进行打包,将 change 的资源发送给浏览器,浏览器接收 hmr 更新资源
最后
通过此文章希望你对 parcel 的大致流程,打包工具原理有更深的了解了解更多请关注专栏,后续 深入 Parcel 同系列文章,对 Asset,Packager,Worker,HMR,scopeHoist,FSCache,SourceMap,import 更加 详细讲解与代码实现

正文完
 0