JS-口袋书第-4-章JS-引擎底层的工作原理

34次阅读

共计 8724 个字符,预计需要花费 22 分钟才能阅读完成。

作者:valentinogagliardi
译者:前端小智
来源:github


阿里云最近在做活动,低至 2 折,有兴趣可以看看:
https://promotion.aliyun.com/…


为了保证的可读性,本文采用意译而非直译。

有没有想过浏览器如何读取和运行 JS 代码?这看起来很神奇,我们可以通过浏览器提供的控制台来了解背后的一些原理。

在 Chrome 中打开浏览器控制台,然后查看 Sources 这栏,在右侧可以到一个 Call Stack 盒子。

JS 引擎是一个可以编译和解释我们的 JS 代码强大的组件。最受欢迎的 JS 引擎是 V8,由 Google Chrome 和 Node.j s 使用,SpiderMonkey 用于 Firefox,以及 Safari/WebKit 使用的 JavaScriptCore。

虽然现在 JS 引擎不是帮我们处理全面的工作。但是每个引擎中都有一些较小的组件为我们做繁琐的的工作。

其中一个组件是 调用堆栈(Call Stack),与全局内存和执行上下文一起运行我们的代码。

Js 引擎和全局内存(Global Memory)

JavaScript 是编译语言同时也是解释语言。信不信由你,JS 引擎在执行代码之前只需要几微秒就能编译代码。

这听起来很神奇,对吧? 这种神奇的功能称为 JIT(及时编译)。这个是一个很大的话题,一本书都不足以描述 JIT 是如何工作的。但现在,我们午饭可以跳过编译背后的理论, 将重点放在执行阶段,尽管如此,这仍然很有趣。

考虑以下代码:

var num = 2;
function pow(num) {return num * num;}

如果问你如何在浏览器中处理上述代码? 你会说些什么?你可能会说“浏览器读取代码”或“浏览器执行代码”。

现实比这更微妙。首先,读取这段代码的不是浏览器,是 JS 引擎。JS 引擎读取代码 ,一旦遇到第一行,就会将几个引用放入 全局内存

全局内存(也称为堆)JS 引擎保存变量和函数声明的地方。因此,回到上面示例,当 JS 引擎读取上面的代码时,全局内存中放入了两个绑定。

即使示例只有变量和函数,也要考虑你的 JS 代码在更大的环境中运行:在浏览器中或在 Node.js 中。在这些环境中,有许多预定义的函数和变量,称为 全局变量。全球记忆将比 num 和 pow 更多。

上例中,没有执行任何操作,但是如果我们像这样运行函数会怎么样呢:

var num = 2;
function pow(num) {return num * num;}
pow(num);

现在事情变得有趣了。当函数被调用时,JavaScript 引擎会为 全局执行上下文 调用栈 腾出空间。

JS 引擎: 它们是如何工作的? 全局执行上下文和调用堆栈

刚刚了解了 JS 引擎如何读取变量和函数声明,它们最终被放入了全局内存 (堆) 中。

但现在我们执行了一个 JS 函数,JS 引擎必须处理它。怎么做?每个 JS 引擎中都有一个基本组件,叫 调用堆栈

调用堆栈是一个堆栈数据结构:这意味着元素可以从顶部进入,但如果它们上面有一些元素,它们就不能离开,JS 函数就是这样的。

一旦执行,如果其他函数仍然被阻塞,它们就不能离开调用堆栈。请注意,这个有助于你理解“JavaScript 是单线程的”这句话。

回到我们的例子,当函数被调用时,JS 引擎将该函数推入调用堆栈

同时,JS 引擎还分配了一个 全局执行上下文,这是运行 JS 代码的全局环境,如下所示

想象全局执行上下文是一个海洋,其中全局函数像鱼一样游动,多美好!但现实远非那么简单,如果我函数有一些嵌套变量或一个或多个内部函数怎么办?

即使是像下面这样的简单变化,JS 引擎也会创建一个 本地执行上下文:

var num = 2;
function pow(num) {
    var fixed = 89;
    return num * num;
}
pow(num);

注意,我在 pow 函数中添加了一个名为 fixed 的变量。在这种情况下,pow 函数中会创建一个本地执行上下文,fixed 变量被放入 pow 函数中的本地执行上下文中。

对于嵌套函数的每个嵌套函数,引擎都会创建更多的本地执行上下文。

JavaScript 是单线程和其他有趣的故事

JavaScript 是单线程的,因为只有一个调用堆栈处理我们的函数。也就是说,如果有其他函数等待执行,函数就不能离开调用堆栈。

在处理同步代码时,这不是问题。例如,两个数字之间的和是同步的,以微秒为单位。但如果涉及异步的时候,怎么办呢?

幸运的是,默认情况下 JS 引擎是异步的。即使它一次执行一个函数,也有一种方法可以让外部(如:浏览器)执行速度较慢的函数,稍后探讨这个主题。

当浏览器加载某些 JS 代码时,JS 引擎会逐行读取并执行以下步骤:

  • 将变量和函数的声明放入全局内存 (堆) 中
  • 将函数的调用放入调用堆栈
  • 创建全局执行上下文,在其中执行全局函数
  • 创建多个本地执行上下文(如果有内部变量或嵌套函数)

到目前为止,对 JS 引擎的同步机制有了基本的了解。在接下来的部分中,讲讲 JS 异步工作原理。

异步 JS,回调队列和事件循环

全局内存(堆),执行上下文和调用堆栈解释了同步 JS 代码在浏览器中的运行方式。然而,我们遗漏了一些东西,当有一些异步函数运行时会发生什么?

请记住,调用堆栈一次可以执行一个函数,甚至一个阻塞函数也可以直接冻结浏览器。幸运的是 JavaScript 引擎是聪明的,并且在浏览器的帮助下可以解决问题。

当我们运行一个异步函数时,浏览器接受该函数并运行它。考虑如下代码:

setTimeout(callback, 10000);
function callback(){console.log('hello timer!');
}

setTimeout 大家都知道得用得很多次了,但你可能不知道它不是 内置的 JS 函数。也就是说,当 JS 出现,语言中没有内置的setTimeout

setTimeout浏览器 API(Browser API)的一部分,它是浏览器免费提供给我们的一组方便的工具。这在实战中意味着什么? 由于 setTimeout 是一个浏览器的一个 Api,函数由浏览器直接运行(它会在调用堆栈中出现一会儿,但会立即删除)。

10 秒后,浏览器接受我们传入的回调函数并将其移动到 回调队列 (Callback Queu) 中。。考虑以下代码

var num = 2;
function pow(num) {return num * num;}
pow(num);
setTimeout(callback, 10000);
function callback(){console.log('hello timer!');
}

示意图如下:

如你所见,setTimeout在浏览器上下文中运行。10 秒后,计时器被触发,回调函数准备运行。但首先它必须通过 回调队列(Callback Queue)。回调队列是一个队列数据结构,回调队列是一个有序的函数队列。

每个异步函数在被放入调用堆栈之前必须通过回调队列 ,但这个工作是谁做的呢,那就是 事件循环(Event Loop)。

事件循环只有一个任务: 它检查调用堆栈是否为空 。如果回 调队列中 (Callback Queue) 有某个函数,并且调用堆栈是空闲的,那么就将其放入调用堆栈中。

完成后,执行该函数。以下是用于处理异步和同步代码的 JS 引擎的图:

想象一下,callback() 已准备好执行,当 pow() 完成时,调用堆栈 (Call Stack) 为空, 事件循环(Event Look) 将 callback() 放入调用堆中。大概就是这样,如果你理解了上面的插图,那么你就可以理解所有的 JavaScript 了。

回调地狱和 ES6 中的 Promises

JS 中回调函数无处不在,它们用于同步和异步代码。考虑如下 map 方法:

function mapper(element){return element * 2;}
[1, 2, 3, 4, 5].map(mapper);

mapper是一个在 map 内部传递的回调函数。上面的代码是同步的,考虑异步的情况:

function runMeEvery(){console.log('Ran!');
}
setInterval(runMeEvery, 5000);

该代码是异步的,我们在 setInterval 中传递回调 runMeEvery。回调在 JS 中无处不在,因此就会出现了一个问题: 回调地狱

JavaScript 中的回调地狱指的是一种编程风格,其中回调嵌套在回调函数中,而回调函数又嵌套在其他回调函数中。由于 JS 异步特性,js 程序员多年来陷入了这个陷阱。

说实话,我从来没有遇到过极端的回调金字塔,这可能是因为我重视可读代码,而且我总是坚持这个原则。如果你在遇到了回调地狱的问题,说明你的函数做得太多。

这里不会讨论回调地狱,如果你好奇,有一个网站,callbackhell.com,它更详细地探索了这个问题,并提供了一些解决方案。

我们现在要关注的是 ES6 的 Promises。ES6 Promises 是 JS 语言的一个补充,旨在解决可怕的回调地狱。但什么是 Promises 呢?

JS 的 Promise 是未来事件的表示 。Promise 可以以成功结束:用行话说我们已经解决了resolved(fulfilled)。但如果 Promise 出错,我们会说它处于 拒绝 (rejected) 状态。Promise 也有一个默认状态:每个新的 Promise 都以 挂起 (pending) 状态开始。

创建和使用 JavaScript 的 Promises

要创建一个新的 Promise,可以通过传递回调函数来调用 Promise 构造函数。回调函数可以接受两个参数:resolvereject。如下所示:

const myPromise = new Promise(function(resolve){setTimeout(function(){resolve()
    }, 5000)
});

如下所示,resolve 是一个函数,调用它是为了使 Promise 成功,别外也可以使用 reject 来表示调用失败。

const myPromise = new Promise(function(resolve, reject){setTimeout(function(){reject()
    }, 5000)
});

注意,在第一个示例中可以省略reject,因为它是第二个参数。但是,如果打算使用reject,则不能忽略resolve,如下所示,最终将得到一个resolved 的承诺,而非 reject

// 不能忽略 resolve !
const myPromise = new Promise(function(reject){setTimeout(function(){reject()
    }, 5000)
});

现在,Promises 看起来并不那么有用,我们可以向它添加一些数据,如下所示:

const myPromise = new Promise(function(resolve) {resolve([{ name: "Chris"}]);
});

但我们仍然看不到任何数据。要从 Promise 中提取数据,需要链接一个名为 then 的方法。它需要一个回调来接收实际数据:

const myPromise = new Promise(function(resolve, reject) {resolve([{ name: "Chris"}]);
});
myPromise.then(function(data) {console.log(data);
});

Promises 的错误处理

对于同步代码而言,JS 错误处理大都很简单,如下所示:

function makeAnError() {throw Error("Sorry mate!");
}
try {makeAnError();
} catch (error) {console.log("Catching the error!" + error);
}

将会输出:

Catching the error! Error: Sorry mate!

现在尝试使用异步函数:

function makeAnError() {throw Error("Sorry mate!");
}
try {setTimeout(makeAnError, 5000);
} catch (error) {console.log("Catching the error!" + error);

由于setTimeout,上面的代码是异步的,看看运行会发生什么:

  throw Error("Sorry mate!");
  ^
Error: Sorry mate!
    at Timeout.makeAnError [as _onTimeout] (/home/valentino/Code/piccolo-javascript/async.js:2:9)

这次的输出是不同的。错误没有通过 catch 块,它可以自由地在堆栈中向上传播。

那是因为 try/catch 仅适用于同步代码。如果你很好奇,Node.js 中的错误处理会详细解释这个问题。

幸运的是,Promise 有一种处理异步错误的方法,就像它们是同步的一样:

const myPromise = new Promise(function(resolve, reject) {reject('Errored, sorry!');
});

在上面的例子中,我们可以使用 catch 处理程序处理错误:

const myPromise = new Promise(function(resolve, reject) {reject('Errored, sorry!');
});
myPromise.catch(err => console.log(err));

我们也可以调用 Promise.reject()来创建和拒绝一个 Promise

Promise.reject({msg: 'Rejected!'}).catch(err => console.log(err));

Promises 组合:Promise.all,Promise.allSettled,Promise.any

Promise API 提供了许多将 Promise 组合在一起的方法。其中最有用的是Promise.all,它接受一个 Promises 数组并返回一个 Promise。如果参数中 promise 有一个失败(rejected),此实例回调失败(reject),失败原因的是第一个失败 promise 的结果。

Promise.race(iterable) 方法返回一个 promise,一旦迭代器中的某个 promise 解决或拒绝,返回的 promise就会解决或拒绝。

较新版本的 V8 也将实现两个新的组合:Promise.allSettledPromise.anyPromise.any 仍然处于提案的早期阶段:在撰写本文时,仍然没有浏览器支持它。

Promise.any可以表明任何 Promise 是否 fullfilled。与 Promise.race 的区别在 于 Promise.any不会拒绝即使其中一个 Promise 被拒绝。

无论如何,两者中最有趣的是 Promise.allSettled,它也是 Promise 数组,但如果其中一个 Promise 拒绝,它不会短路 。当你想要检查Promise 数组是否全部已解决时,它是有用的,无论最终是否拒绝,可以把它想象成Promise.all 的反对者。

异步进化:从 Promises 到 async/await

ECMAScript 2017 (ES8)的出现,推出了新的语法诞生了 async/await

async/await 只是 Promise 语法糖。它只是一种基于 Promises 编写异步代码的新方法,async/await 不会以任何方式改变 JS,请记住,JS 必须向后兼容旧浏览器,不应破坏现有代码。

来个例子:

const myPromise = new Promise(function(resolve, reject) {resolve([{ name: "Chris"}]);
});
myPromise.then((data) => console.log(data))

使用 async/await, 我们可以将 Promise 包装在标记为async 的函数中,然后等待结果的返回:

const myPromise = new Promise(function(resolve, reject) {resolve([{ name: "Chris"}]);
});
async function getData() {
  const data = await myPromise;
  console.log(data);
}
getData();

有趣的是,async 函数也会返回 Promise,你也可以这样做:

async function getData() {
  const data = await myPromise;
  return data;
}
getData().then(data => console.log(data));

那如何处理错误?async/await提一个好处就是可以使用 try/catch。再看一下 Promise,我们使用catch 处理程序来处理错误:

const myPromise = new Promise(function(resolve, reject) {reject('Errored, sorry!');
});
myPromise.catch(err => console.log(err));

使用 async 函数,我们可以重构以上代码:

async function getData() {
  try {
    const data = await myPromise;
    console.log(data);
    // or return the data with return data
  } catch (error) {console.log(error);
  }
}
getData();

并不是每个人都喜欢这种风格。try/catch会使代码变得冗长,在使用 try/catch 时,还有另一个怪异的地方需要指出,如下所示:

async function getData() {
  try {if (true) {throw Error("Catch me if you can");
    }
  } catch (err) {console.log(err.message);
  }
}
getData()
  .then(() => console.log("I will run no matter what!"))
  .catch(() => console.log("Catching err"));

运行结果:

以上两个字符串都会打印。请记住,try/catch 是一个同步构造,但我们的异步函数产生一个 Promise。 他们在两条不同的轨道上行驶,比如两列火车。但他们永远不会见面,也就是说,throw 抛出的错误永远不会触发 getData()catch方法。

实战中,我们不希望 throwthen的处理程序。一种的解决方案是从函数返回Promise.reject()

async function getData() {
  try {if (true) {return Promise.reject("Catch me if you can");
    }
  } catch (err) {console.log(err.message);
  }
}

现在按预期处理错误

getData()
  .then(() => console.log("I will NOT run no matter what!"))
  .catch(() => console.log("Catching err"));
"Catching err" // 输出

除此之外,async/await 似乎是在 JS 中构建异步代码的最佳方式。我们可以更好地控制错误处理,代码看起来也更清晰。

总结

JS 是一种用于 Web 的脚本语言,具有先编译然后由引擎解释的特性。在最流行的 JS 引擎中,有谷歌 Chrome 和 Node.js 使用的 V8,有 Firefox 构建的SpiderMonkey,以及 Safari 使用的JavaScriptCore

JS 引擎包含很有组件: 调用堆栈、全局内存(堆)、事件循环、回调队列。所有这些组件一起工作,完美地进行了调优,以处理 JS 中的同步和异步代码。

JS 引擎是单线程的 ,这意味着运行函数只有一个调用堆栈。这一限制是 JS 异步本质的基础: 所有需要时间的操作都必须由外部实体(例如浏览器) 或回调函数负责。

为了简化异步代码流,ECMAScript 2015 给我们带来了 Promise。Promise 是一个异步对象,用于表示任何异步操作的失败或成功。但改进并没有止步于此。在 2017 年,async/ await 诞生了 :它是Promise 的一种风格弥补,使得编写异步代码成为可能,就好像它是同步的一样。

思考

  • 浏览器如何理解 JS 代码?
  • 调用堆栈的主要任务是什么?
  • 你能描述一下 JS 引擎的主要组件以及它们是如何协同工作的吗?
  • 微任务队列是做什么的?
  • Promise 是什么?
  • 是否可以处理异步代码中的错误?如果可以,怎么做?
  • 你能说出浏览器 API 的几个方法吗

代码部署后可能存在的 BUG 没法实时知道,事后为了解决这些 BUG,花了大量的时间进行 log 调试,这边顺便给大家推荐一个好用的 BUG 监控工具 Fundebug。

原文:https://github.com/valentinog…

交流

阿里云最近在做活动,低至 2 折,有兴趣可以看看:https://promotion.aliyun.com/…

干货系列文章汇总如下,觉得不错点个 Star,欢迎 加群 互相学习。

https://github.com/qq449245884/xiaozhi

因为篇幅的限制,今天的分享只到这里。如果大家想了解更多的内容的话,可以去扫一扫每篇文章最下面的二维码,然后关注咱们的微信公众号,了解更多的资讯和有价值的内容。

每次整理文章,一般都到 2 点才睡觉,一周 4 次左右,挺苦的,还望支持,给点鼓励

正文完
 0