JavaScript 是如何工作的:模块的构建以及对应的打包工具

40次阅读

共计 16679 个字符,预计需要花费 42 分钟才能阅读完成。

这是专门探索 JavaScript 及其所构建的组件的系列文章的第 20 篇。
如果你错过了前面的章节,可以在这里找到它们:

JavaScript 是如何工作的:引擎,运行时和调用堆栈的概述!
JavaScript 是如何工作的:深入 V8 引擎 & 编写优化代码的 5 个技巧!
JavaScript 是如何工作的:内存管理 + 如何处理 4 个常见的内存泄漏!
JavaScript 是如何工作的:事件循环和异步编程的崛起 + 5 种使用 async/await 更好地编码方式!
JavaScript 是如何工作的:深入探索 websocket 和 HTTP/ 2 与 SSE + 如何选择正确的路径!
JavaScript 是如何工作的:与 WebAssembly 比较 及其使用场景!
JavaScript 是如何工作的:Web Workers 的构建块 + 5 个使用他们的场景!
JavaScript 是如何工作的:Service Worker 的生命周期及使用场景!
JavaScript 是如何工作的:Web 推送通知的机制!
JavaScript 是如何工作的:使用 MutationObserver 跟踪 DOM 的变化!
JavaScript 是如何工作的:渲染引擎和优化其性能的技巧!
JavaScript 是如何工作的:深入网络层 + 如何优化性能和安全!
JavaScript 是如何工作的:CSS 和 JS 动画底层原理及如何优化它们的性能!
JavaScript 是如何工作的:解析、抽象语法树(AST)+ 提升编译速度 5 个技巧!
JavaScript 是如何工作的:深入类和继承内部原理 +Babel 和 TypeScript 之间转换!
JavaScript 是如何工作的:存储引擎 + 如何选择合适的存储 API!
JavaScript 是如何工作的:Shadow DOM 的内部结构 + 如何编写独立的组件!
JavaScript 是如何工作的:WebRTC 和对等网络的机制!
JavaScript 是如何工作的:编写自己的 Web 开发框架 + React 及其虚拟 DOM 原理!

如果你是 JavaScript 的新手,一些像“module bundlers vs module loaders”、“Webpack vs Browserify”和“AMD vs.CommonJS”这样的术语,很快让你不堪重负。
JavaScript 模块系统可能令人生畏,但理解它对 Web 开发人员至关重要。
在这篇文章中,我将以简单的言语(以及一些代码示例)为你解释这些术语。希望这对你有会有帮助!
什么是模块?
好作者能将他们的书分成章节,优秀的程序员将他们的程序划分为模块。
就像书中的章节一样,模块只是文字片段 (或代码,视情况而定) 的集群。然而,好的模块是高内聚低松耦的,具有不同的功能,允许在必要时对它们进行替换、删除或添加,而不会扰乱整体功能。
为什么使用模块?
使用模块有利于扩展、相互依赖的代码库,这有很多好处。在我看来,最重要的是:
1)可维护性: 根据定义,模块是高内聚的。一个设计良好的模块旨在尽可能减少对代码库部分的依赖,这样它就可以独立地增强和改进,当模块与其他代码片段解耦时,更新单个模块要容易得多。
回到我们的书的例子,如果你想要更新你书中的一个章节,如果对一个章节的小改动需要你调整每一个章节,那将是一场噩梦。相反,你希望以这样一种方式编写每一章,即可以在不影响其他章节的情况下进行改进。
2)命名空间:在 JavaScript 中,顶级函数范围之外的变量是全局的(这意味着每个人都可以访问它们)。因此,“名称空间污染”很常见,完全不相关的代码共享全局变量。
在不相关的代码之间共享全局变量在开发中是一个大禁忌。正如我们将在本文后面看到的,通过为变量创建私有空间,模块允许我们避免名称空间污染。
3)可重用性:坦白地说:我们将前写过的代码复制到新项目中。例如,假设你从之前项目编写的一些实用程序方法复制到当前项目中。
这一切都很好,但如果你找到一个更好的方法来编写代码的某些部分,那么你必须记得回去在曾经使用过的其他项目更新它。
这显然是在浪费时间。如果有一个我们可以一遍又一遍地重复使用的模块,不是更容易吗?
如何创建模块?
有多种方法来创建模块,来看几个:
模块模式
模块模式用于模拟类的概念(因为 JavaScript 本身不支持类),因此我们可以在单个对象中存储公共和私有方法和变量——类似于在 Java 或 Python 等其他编程语言中使用类的方式。这允许我们为想要公开的方法创建一个面向公共的 API,同时仍然将私有变量和方法封装在闭包范围中。
有几种方法可以实现模块模式。在第一个示例中,将使用匿名闭包,将所有代码放在匿名函数中来帮助我们实现目标。(记住: 在 JavaScript 中,函数是创建新作用域的唯一方法。)
例一:匿名闭包
(function () {
// 将这些变量放在闭包范围内实现私有化

var myGrades = [93, 95, 88, 0, 55, 91];

var average = function() {
var total = myGrades.reduce(function(accumulator, item) {
return accumulator + item}, 0);

return ‘ 平均分 ‘ + total / myGrades.length + ‘.’;
}

var failing = function(){
var failingGrades = myGrades.filter(function(item) {
return item < 70;});

return ‘ 挂机科了 ‘ + failingGrades.length + ‘ 次。’;
}

console.log(failing()); // 挂机科了次

}());

使用这个结构,匿名函数就有了自己的执行环境或“闭包”,然后我们立即执行。这让我们可以从父 (全局) 命名空间隐藏变量。
这种方法的优点是,你可以在这个函数中使用局部变量,而不会意外地覆盖现有的全局变量,但仍然可以访问全局变量,就像这样:
var global = ‘ 你好,我是一个全局变量。)’;

(function () {
// 将这些变量放在闭包范围内实现私有化

var myGrades = [93, 95, 88, 0, 55, 91];

var average = function() {
var total = myGrades.reduce(function(accumulator, item) {
return accumulator + item}, 0);

return ‘ 平均分 ‘ + total / myGrades.length + ‘.’;
}

var failing = function(){
var failingGrades = myGrades.filter(function(item) {
return item < 70;});

return ‘ 挂机科了 ‘ + failingGrades.length + ‘ 次。’;
}

console.log(failing()); // 挂机科了次
onsole.log(global); // 你好,我是一个全局变量。

}());

注意,匿名函数的圆括号是必需的,因为以关键字 function 开头的语句通常被认为是函数声明(请记住,JavaScript 中不能使用未命名的函数声明)。因此,周围的括号将创建一个函数表达式,并立即执行这个函数,这还有另一种叫法 立即执行函数(IIFE)。如果你对这感兴趣,可以在这里了解到更多。
例二:全局导入
jQuery 等库使用的另一种流行方法是全局导入。它类似于我们刚才看到的匿名闭包,只是现在我们作为参数传入全局变量:
(function (globalVariable) {

// 在这个闭包范围内保持变量的私有化
var privateFunction = function() {
console.log(‘Shhhh, this is private!’);
}

// 通过 globalVariable 接口公开下面的方法
// 同时将方法的实现隐藏在 function() 块中

globalVariable.each = function(collection, iterator) {
if (Array.isArray(collection)) {
for (var i = 0; i < collection.length; i++) {
iterator(collection[i], i, collection);
}
} else {
for (var key in collection) {
iterator(collection[key], key, collection);
}
}
};

globalVariable.filter = function(collection, test) {
var filtered = [];
globalVariable.each(collection, function(item) {
if (test(item)) {
filtered.push(item);
}
});
return filtered;
};

globalVariable.map = function(collection, iterator) {
var mapped = [];
globalUtils.each(collection, function(value, key, collection) {
mapped.push(iterator(value));
});
return mapped;
};

globalVariable.reduce = function(collection, iterator, accumulator) {
var startingValueMissing = accumulator === undefined;

globalVariable.each(collection, function(item) {
if(startingValueMissing) {
accumulator = item;
startingValueMissing = false;
} else {
accumulator = iterator(accumulator, item);
}
});

return accumulator;

};

}(globalVariable));

在这个例子中,globalVariable 是唯一的全局变量。与匿名闭包相比,这种方法的好处是可以预先声明全局变量,使得别人更容易阅读代码。
例三:对象接口
另一种方法是使用立即执行函数接口对象创建模块,如下所示:
var myGradesCalculate = (function () {

// 将这些变量放在闭包范围内实现私有化
var myGrades = [93, 95, 88, 0, 55, 91];

// 通过接口公开这些函数,同时将模块的实现隐藏在 function()块中

return {
average: function() {
var total = myGrades.reduce(function(accumulator, item) {
return accumulator + item;
}, 0);

return’ 平均分 ‘ + total / myGrades.length + ‘.’;
},

failing: function() {
var failingGrades = myGrades.filter(function(item) {
return item < 70;
});

return ‘ 挂科了 ’ + failingGrades.length + ‘ 次.’;
}
}
})();

myGradesCalculate.failing(); // ‘ 挂科了 2 次.’
myGradesCalculate.average(); // ‘ 平均分 70.33333333333333.’

正如您所看到的,这种方法允许我们通过将它们放在 return 语句中(例如算平均分和挂科数方法)来决定我们想要保留的变量 / 方法(例如 myGrades)以及我们想要公开的变量 / 方法。
例四:显式模块模式
这与上面的方法非常相似,只是它确保所有方法和变量在显式公开之前都是私有的:
var myGradesCalculate = (function () {

// 将这些变量放在闭包范围内实现私有化
var myGrades = [93, 95, 88, 0, 55, 91];

var average = function() {
var total = myGrades.reduce(function(accumulator, item) {
return accumulator + item;
}, 0);

return’ 平均分 ‘ + total / myGrades.length + ‘.’;
};

var failing = function() {
var failingGrades = myGrades.filter(function(item) {
return item < 70;
});

return ‘ 挂科了 ’ + failingGrades.length + ‘ 次.’;
};

// Explicitly reveal public pointers to the private functions
// that we want to reveal publicly

return {
average: average,
failing: failing
}
})();

myGradesCalculate.failing(); // ‘ 挂科了 2 次.’
myGradesCalculate.average(); // ‘ 平均分 70.33333333333333.’

这可能看起来很多,但它只是模块模式的冰山一角。以下是我在自己的探索中发现有用的一些资源:

Learning JavaScript Design Patterns:作者是 Addy Osmani,一本简洁又令人印象深刻的书籍,蕴藏着许多宝藏。

Adequately Good by Ben Cherry:包含模块模式的高级用法示例。

Blog of Carl Danley:模块模式概览,也是 JavaScript 许多设计模式的资源库。

CommonJS 和 AMD
所有这些方法都有一个共同点: 使用单个全局变量将其代码包装在函数中,从而使用闭包作用域为自己创建一个私有名称空间。
虽然每种方法都有效且都有各自特点,但却都有缺点。
首先,作为开发人员,你需要知道加载文件的正确依赖顺序。例如,假设你在项目中使用 Backbone,因此你可以将 Backbone 的源代码 以 <script> 脚本标签的形式引入到文件中。
但是,由于 Backbone 对 Underscore.js 有很强的依赖性,因此 Backbone 文件的脚本标记不能放在 Underscore.js 文件之前。
作为一名开发人员,管理依赖关系并正确处理这些事情有时会令人头痛。
另一个缺点是它们仍然会导致名称空间冲突。例如,如果两个模块具有相同的名称怎么办? 或者,如果有一个模块的两个版本,并且两者都需要,该怎么办?
幸运的是,答案是肯定的。
有两种流行且实用的方法:CommonJS 和 AMD。
CommonJS
CommonJS 是一个志愿者工作组,负责设计和实现用于声明模块的 JavaScript API。
CommonJS 模块本质上是一个可重用的 JavaScript,它导出特定的对象,使其可供其程序中需要的其他模块使用。如果你已经使用 Node.js 编程,那么你应该非常熟悉这种格式。
使用 CommonJS,每个 JavaScript 文件都将模块存储在自己独立的模块上下文中(就像将其封装在闭包中一样)。在此范围内,我们使用 module.exports 导出模块,或使用 require 来导入模块。
在定义 CommonJS 模块时,它可能是这样的:
function myModule() {
this.hello = function() {
return ‘hello!’;
}

this.goodbye = function() {
return ‘goodbye!’;
}
}

module.exports = myModule;

我们使用特殊的对象模块,并将函数的引用放入 module.exports 中。这让 CommonJS 模块系统知道我们想要公开什么,以便其他文件可以使用它。
如果想使用 myModule,只需要使用 require 方法就可以,如下:
var myModule = require(‘myModule’);

var myModuleInstance = new myModule();
myModuleInstance.hello(); // ‘hello!’
myModuleInstance.goodbye(); // ‘goodbye!’

与前面讨论的模块模式相比,这种方法有两个明显的好处:

避免全局命名空间污染
依赖关系更加明确

另外需要注意的是,CommonJS 采用服务器优先方法并同步加载模块。这很重要,因为如果我们需要三个其他模块,它将逐个加载它们。
现在,它在服务器上运行良好,但遗憾的是,在为浏览器编写 JavaScript 时使用起来更加困难。可以这么说,从网上读取模块比从磁盘读取需要更长的时间。只要加载模块的脚本正在运行,它就会阻止浏览器运行其他任何内容,直到完成加载,这是因为 JavaScript 是单线程且 CommonJS 是同步加载的。
AMD
CommonJS 一切都很好,但是如果我们想要异步加载模块呢?答案是 异步模块定义,简称 AMD。
使用 AMD 的加载模块如下:
define([‘myModule’, ‘myOtherModule’], function(myModule, myOtherModule) {
console.log(myModule.hello());
});

define 函数的第一个参数是一个数组,数组中是依赖的各种模块。这些依赖模块在后台(以非阻塞的方式)加载进来,一旦加载完毕,define 函数就会调用第二个参数,即回调函数执行操作。
接下来,回调函数接收参数,即依赖模块 – 示例中就是 myModule 和 myOtherModule – 允许函数使用这些依赖项,最后,所依赖的模块本身也必须使用 define 关键字来定义。例如,myModule 如下所示:
define([], function() {

return {
hello: function() {
console.log(‘hello’);
},
goodbye: function() {
console.log(‘goodbye’);
}
};
});

因此,与 CommonJS 不同,AMD 采用浏览器优先的方法和异步行为来完成工作。(注意,有很多人坚信在开始运行代码时动态加载文件是不利的,我们将在下一节关于模块构建的内容中探讨更多内容)。
除了异步性,AMD 的另一个好处是模块可以是对象,函数,构造函数,字符串,JSON 和许多其他类型,而 CommonJS 只支持对象作为模块。
也就是说,和 CommonJS 相比,AMD 不兼容 io、文件系统或者其他服务器端的功能特性,而且函数包装语法与简单的 require 语句相比有点冗长。
UMD
对于同时支持 AMD 和 CommonJS 特性的项目,还有另一种格式: 通用模块定义(Universal Module Definition, UMD)。
UMD 本质上创造了一种使用两者之一的方法,同时也支持全局变量定义。因此,UMD 模块能够同时在客户端和服务端同时工作。
简单看一下 UMD 是怎样工作的:
(function (root, factory) {
if (typeof define === ‘function’ && define.amd) {
// AMD
define([‘myModule’, ‘myOtherModule’], factory);
} else if (typeof exports === ‘object’) {
// CommonJS
module.exports = factory(require(‘myModule’), require(‘myOtherModule’));
} else {
// Browser globals (Note: root is window)
root.returnExports = factory(root.myModule, root.myOtherModule);
}
}(this, function (myModule, myOtherModule) {
// Methods
function notHelloOrGoodbye(){}; // A private method
function hello(){}; // A public method because it’s returned (see below)
function goodbye(){}; // A public method because it’s returned (see below)

// Exposed public methods
return {
hello: hello,
goodbye: goodbye
}
}));

Github 上 enlightening repo 里有更多关于 UMD 的例子。
Native JS
你可能已经注意到,上面的模块都不是 JavaScript 原生的。相反,我们已经创建了通过使用模块模式、CommonJS 或 AMD 来模拟模块系统的方法。
幸运的是,TC39(定义 ECMAScript 的语法和语义的标准组织)一帮聪明的人已经引入了 ECMAScript 6(ES6)的内置模块。
ES6 为导入导出模块提供了很多不同的可能性,已经有许多其他人花时间解释这些,下面是一些有用的资源:

jsmodules.io
exploringjs.com

与 CommonJS 或 AMD 相比,ES6 模块最大的优点在于它能够同时提供两方面的优势: 简明的声明式语法和异步加载,以及对循环依赖项的更好支持。
也许我个人最喜欢的 ES6 模块功能是它的导入模块是导出时模块的实时只读视图。(相比起 CommonJS,导入的是导出模块的拷贝副本,因此也不是实时的)。
下面是一个例子:
// lib/counter.js

var counter = 1;

function increment() {
counter++;
}

function decrement() {
counter–;
}

module.exports = {
counter: counter,
increment: increment,
decrement: decrement
};

// src/main.js

var counter = require(‘../../lib/counter’);

counter.increment();
console.log(counter.counter); // 1

在这个例子中,我们基本上创建了两个模块的对象:一个用于导出它,一个在我们需要的时候引入。
此外,在 main.js 中的对象目前是与原始模块是相互独立的,这就是为什么即使我们执行 increment 方法,它仍然返回 1,因为引入的变量和最初导入的变量是毫无关联的。需要改变你引入的对象唯一的方式是手动执行增加:
counter.counter++;
console.log(counter.counter); // 2

另一方面,ES6 创建了我们导入的模块的实时只读视图:
// lib/counter.js
export let counter = 1;

export function increment() {
counter++;
}

export function decrement() {
counter–;
}

// src/main.js
import * as counter from ‘../../counter’;

console.log(counter.counter); // 1
counter.increment();

console.log(counter.counter); // 2
超酷?我发现这一点是因为 ES6 允许你可以把你定义的模块拆分成更小的模块而不用删减功能,然后你还能反过来把它们合成到一起,完全没问题。
什么是模块打包?
总体上看,模块打包只是将一组模块(及其依赖项)以正确的顺序拼接到一个文件(或一组文件)中的过程。正如 Web 开发的其它方方面面,棘手的问题总是潜藏在具体的细节里。
为什么需要打包?
将程序划分为模块时,通常会将这些模块组织到不同的文件和文件夹中。有可能,你还有一组用于正在使用的库的模块,如 Underscore 或 React。
因此,每个文件都必须以一个 <script> 标签引入到主 HTML 文件中,然后当用户访问你的主页时由浏览器加载进来。每个文件使用 <script> 标签引入,意味着浏览器不得不分别逐个的加载它们。
这对于页面加载时间来说简直是噩梦。
为了解决这个问题,我们将所有文件打包或“拼接”到一个大文件(或视情况而定的几个文件),以减少请求的数量。当你听到开发人员谈论“构建步骤”或“构建过程”时,这就是他们所谈论的内容。
另一种加速构建操作的常用方法是“缩减”打包代码。缩减是从源代码中移除不必要的字符(例如,空格,注释,换行符等)的过程,以便在不改变代码功能的情况下减少内容的整体大小。
较少的数据意味着浏览器处理时间会更快,从而减少了下载文件所需的时间。如果你见过具有“min”扩展名的文件,如“underscore-min.js”,可能会注意到与完整版相比,缩小版本非常小(不过很难阅读)。
除了捆绑和 / 或加载模块之外,模块捆绑器还提供了许多其他功能,例如在进行更改时生成自动重新编译代码或生成用于调试的源映射。
构建工具(如 Gulp 和 Grunt)能为开发者直接进行拼接和缩减,确保为开发人员提供可读代码,同时有利于浏览器执行的代码。
打包模块有哪些不同的方法?
当你使用一种标准模块模式(上部分讨论过)来定义模块时,拼接和缩减文件非常有用。你真正在做的就是将一堆普通的 JavaScript 代码捆绑在一起。
但是,如果你坚持使用浏览器无法解析的非原生模块系统(如 CommonJS 或 AMD(甚至是原生 ES6 模块格式)),则需要使用专门工具将模块转换为排列正确、浏览器可解析的代码。这就是 Browserify,RequireJS,Webpack 和其他“模块打包工具”或“模块加载工具”的用武之地。
除了打包和 / 或加载模块之外,模块打包器还提供了许多其他功能,例如在进行更改时生成自动重新编译代码或生成用于调试的源映射。
下面是一些常见的模块打包方法:
打包 CommonJS
正如前面所知道的,CommonJS 以同步方式加载模块,这没有什么问题,只是它对浏览器不实用。我提到过有一个解决方案——其中一个是一个名为 Browserify 的模块打包工具。Browserify 是一个为浏览器编译 CommonJS 模块的工具。
例如,有个 main.js 文件,它导入一个模块来计算一组数字的平均值:
var myDependency = require(‘myDependency’);

var myGrades = [93, 95, 88, 0, 91];

var myAverageGrade = myDependency.average(myGrades);

在这种情况下,我们有一个依赖项(myDependency),使用下面的命令,Browserify 以 main.js 为入口把所有依赖的模块递归打包成一个文件:
browserify main.js -o bundle.js

Browserify 通过跳入文件分析每一个依赖的 抽象语法树(AST),以便遍历项目的整个依赖关系图。一旦确定了依赖项的结构,就把它们按正确的顺序打包到一个文件中。然后,在 html 里插入一个用于引入“bundle.js”的 <script> 标签,从而确保你的源代码在一个 HTTP 请求中完成下载。
类似地,如果有多个文件且有多个依赖时,只需告诉 Browserify 的入口文件路径即可。最后打包后的文件可以通过 Minify-JS 之类的工具压缩打包后的代码。
打包 AMD
如果你正在使用 AMD,你需要使用像 RequireJS 或者 Curl 这样的 AMD 加载器。模块加载器 (与模块打包工具不同) 会动态加载程序需要运行的模块。
提醒一下,AMD 与 CommonJS 的主要区别之一是它以异步方式加载模块。从这个意义上说,对于 AMD,从技术上讲,实际上并不需要构建步骤,因为异步加载模块意味着在运行过程中逐步下载那些程序所需要的文件,而不是用户刚进入页面就一下把所有文件都下载下来。
但实际上,对于每个用户操作而言,随着时间的推移,大容量请求的开销在生产中没有多大意义。大多数 Web 开发人员仍然使用构建工具打包和压缩 AMD 模块以获得最佳性能,例如使用 RequireJS 优化器,r.js 等工具。
总的来说,AMD 和 CommonJS 在打包方面的区别在于:在开发期间,AMD 可以省去任何构建过程。当然,在代码上线前,要使用优化工具(如 r.js)进行优化。
Webpack
就打包工具而言,Webpack 是一个新事物。它被设计成与你使用的模块系统无关,允许开发人员在适当的情况下使用 CommonJS、AMD 或 ES6。
你可能想知道,为什么我们需要 Webpack,而我们已经有了其他打包工具了,比如 Browserify 和 RequireJS,它们可以完成工作,并且做得非常好。首先,Webpack 提供了一些有用的特性,比如“代码分割”(code splitting)—— 一种将代码库分割为“块(chunks)”的方式,从而能实现按需加载。
例如,如果你的 Web 应用程序,其中只需要某些代码,那么将整个代码库都打包进一个大文件就不是很高效。在这种情况下,可以使用代码分割,将需要的部分代码抽离在 ” 打包块 ”,在执行按需加载,从而避免在最开始就遇到大量负载的麻烦。
代码分割只是 Webpack 提供的众多引人注目的特性之一,网上有很多关于“Webpack 与 Browserify 谁更好”的激烈讨论。以下是一些客观冷静的讨论,帮助我稍微理清了头绪:

https://gist.github.com/subst…
http://mattdesl.svbtle.com/br…
http://blog.namangoel.com/bro…

ES6 模块
当前 JS 模块规范(CommonJS, AMD) 与 ES6 模块之间最重要的区别是 ES6 模块的设计考虑到了静态分析。这意味着当你导入模块时,导入的模块在编译阶段也就是代码开始运行之前就被解析了。这允许我们在运行程序之前移,移除那些在导出模块中不被其它模块使用的部分。移除不被使用的模块能节省空间,且有效地减少浏览器的压力。
一个常见的问题,使用一些工具,如 Uglify.js,缩减代码时,有一个死码删除的处理,它和 ES6 移除没用的模块又有什么不同呢?只能说“视情况而定”。
死码消除(Dead codeelimination)是一种编译器原理中编译最优化技术,它的用途是移除对程序运行结果没有任何影响的代码。移除这类的代码有两种优点,不但可以减少程序的大小,还可以避免程序在运行中进行不相关的运算行为,减少它运行的时间。不会被运行到的代码(unreachable code)以及只会影响到无关程序运行结果的变量(Dead Variables),都是死码(Dead code)的范畴。
有时,在 UglifyJS 和 ES6 模块之间死码消除的工作方式完全相同,有时则不然。如果你想验证一下,Rollup’s wiki 里有个很好的示例。
ES6 模块的不同之处在于死码消除的不同方法,称为“tree shaking”。“tree shaking”本质上是死码消除反过程。它只包含包需要运行的代码,而非排除不需要的代码。来看个例子:
假设有一个带有多个函数的 utils.js 文件,每个函数都用 ES6 的语法导出:
export function each(collection, iterator) {
if (Array.isArray(collection)) {
for (var i = 0; i < collection.length; i++) {
iterator(collection[i], i, collection);
}
} else {
for (var key in collection) {
iterator(collection[key], key, collection);
}
}
}

export function filter(collection, test) {
var filtered = [];
each(collection, function(item) {
if (test(item)) {
filtered.push(item);
}
});
return filtered;
}

export function map(collection, iterator) {
var mapped = [];
each(collection, function(value, key, collection) {
mapped.push(iterator(value));
});
return mapped;
}

export function reduce(collection, iterator, accumulator) {
var startingValueMissing = accumulator === undefined;

each(collection, function(item) {
if(startingValueMissing) {
accumulator = item;
startingValueMissing = false;
} else {
accumulator = iterator(accumulator, item);
}
});

return accumulator;
}

接着,假设我们不知道要在程序中使用什么 utils.js 中的哪个函数,所以我们将上述的所有模块导入 main.js 中,如下所示:
import * as Utils from‘./utils.js’;

最终,我们只用到的 each 方法:
import * as Utils from‘./utils.js’;

Utils.each([1, 2, 3], function(x) {console.log(x) });

“tree shaken”版本的 main.js 看起来如下(一旦模块被加载后):
function each(collection, iterator) {
if (Array.isArray(collection)) {
for (var i = 0; i < collection.length; i++) {
iterator(collection[i], i, collection);
}
} else {
for (var key in collection) {
iterator(collection[key], key, collection);
}
}
};

each([1, 2, 3], function(x) {console.log(x) });

注意:只导出我们使用的 each 函数。
同时,如果决定使用 filte r 函数而不是每个函数,最终会看到如下的结果:
import * as Utils from‘./utils.js’;

Utils.filter([1, 2, 3], function(x) {return x === 2});

tree shaken 版本如下:
function each(collection, iterator) {
if (Array.isArray(collection)) {
for (var i = 0; i < collection.length; i++) {
iterator(collection[i], i, collection);
}
} else {
for (var key in collection) {
iterator(collection[key], key, collection);
}
}
};

function filter(collection, test) {
var filtered = [];
each(collection, function(item) {
if (test(item)) {
filtered.push(item);
}
});
return filtered;
};

filter([1, 2, 3], function(x) {return x === 2});

此时,each 和 filter 函数都被包含进来。这是因为 filter 在定义时使用了 each。因此也需要导出该函数模块以保证程序正常运行。
构建 ES6 模块
我们知道 ES6 模块的加载方式与其他模块格式不同,但我们仍然没有讨论使用 ES6 模块时的构建步骤。
遗憾的是,因为浏览器对 ES6 模 块的原生支持还不够完善,所以现阶段还需要我们做一些补充工作。

下面是几个在浏览器中 构建 / 转换 ES6 模块的方法,其中第一个是目前最常用的方法:

使用转换器 (例如 Babel 或 Traceur) 以 CommonJS、AMD 或 UMD 格式将 ES6 代码转换为 ES5 代码,然后再通过 Browserify 或 Webpack 一类的构建工具来进行构建。
使用 Rollup.js,这其实和上面差不多,只是 Rollup 捎带 ES6 模块的功能,在打包之前静态分析 ES6 代码和依赖项。它利用“tree shaking”技术来优化你的代码。总言,当您使用 ES6 模块时,Rollup.js 相对于 Browserify 或 Webpack 的主要好处是 tree shaking 能让打包文件更小。需要注意的是,Rollup 提 供了几种格式来的打包代码,包括 ES6,CommonJS,AMD,UMD 或 IIFE。IIFE 和 UMD 捆绑包可以直接在浏览器中工作,但如果你选择打包 AMD,CommonJS 或 ES6,需需要寻找能将代码转成浏览器能理解运行的代码的方法(例如,使用 Browserify,Webpack,RequireJS 等)。

小心踩坑
作为 web 开发人员,我们必须经历很多困难。转换语法优雅的 ES6 代码以便在浏览器里运行并不总是容易的。
问题是,什么时候 ES6 模块可以在浏览器中运行而不需要这些开销?
答案是:“尽快”。
ECMAScript 目前有一个解决方案的规范,称为 ECMAScript 6 module loader API。简而言之,这是一个纲领性的、基于 Promise 的 API,它支持动态加载模块并缓存它们,以便后续导入不会重新加载模块的新版本。
它看起来如下:
// myModule.js

export class myModule {
constructor() {
console.log(‘Hello, I am a module’);
}

hello() {
console.log(‘hello!’);
}

goodbye() {
console.log(‘goodbye!’);
}
}

// main.js
System.import(‘myModule’).then(function(myModule) {
new myModule.hello();
});

//‘hello!’

你亦可直接对 script 标签指定“type=module”来定义模块,如:
<script type=”module”>
// loads the ‘myModule’ export from ‘mymodule.js’
import {hello} from ‘mymodule’;

new Hello(); // ‘Hello, I am a module!’
</script>

更加详细的介绍也可以在 Github 上查看:es-module-loader
此外,如果您想测试这种方法,请查看 SystemJS,它建立在 ES6 Module Loader polyfill 之上。SystemJS 在浏览器和 Node 中动态加载任何模块格式(ES6 模块,AMD,CommonJS 或 全局脚本)。
它跟踪“模块注册表”中所有已加载的模块,以避免重新加载先前已加载过的模块。更不用说它还会自动转换 ES6 模块(如果只是设置一个选项)并且能够从任何其他类型加载任何模块类型!
有了原生的 ES6 模块后,还需要模块打包吗?
对于日益普及的 ES6 模块,下面有一些有趣的观点:
HTTP/2 会让模块打包过时吗?
对于 HTTP/1,每个 TCP 连接只允许一个请求。这就是为什么加载多个资源需要多个请求。有了 HTTP/2,一切都变了。HTTP/2 是完全多路复用的,这意味着多个请求和响应可以并行发生。因此,我们可以在一个连接上同时处理多个请求。
由于每个 HTTP 请求的成本明显低于 HTTP/1,因此从长远来看,加载一组模块不会造成很大的性能问题。一些人认为这意味着模块打包不再是必要的,这当然有可能,但这要具体情况具体分析了。
例如,模块打包还有 HTTP/2 没有好处,比如移除冗余的导出模块以节省空间。如果你正在构建一个性能至关重要的网站,那么从长远来看,打包可能会为你带来增量优势。也就是说,如果你的性能需求不是那么极端,那么通过完全跳过构建步骤,可以以最小的成本节省时间。
总的来说,绝大多数网站都用上 HTTP/2 的那个时候离我们现在还很远。我预测构建过程将会保留,至少在近期内。
CommonJS、AMD 与 UMD 会被淘汰吗?
一旦 ES6 成为模块标准,我们还需要其他非原生模块规范吗?
我觉得还有。
Web 开发遵守一个标准方法进行导入和导出模块,而不需要中间构建步骤——网页开发长期受益于此。但 ES6 成为模块规范需要多长时间呢?
机会是有,但得等一段时间。
再者,众口难调,所以“一个标准的方法”可能永远不会成为现实。
总结
希望这篇文章能帮你理清一些开发者口中的模块和模块打包的相关概念,共进步。
原文:
https://medium.freecodecamp.o…
https://medium.freecodecamp.o…
你的点赞是我持续分享好东西的动力,欢迎点赞!
一个笨笨的码农,我的世界只能终身学习!
更多内容请关注公众号《大迁世界》!

正文完
 0