架构

过程和线程

过程能够被形容为是一个利用的执行程序。

线程存在于过程并执行程序任意局部。

启动利用时会创立一个过程。程序兴许会创立一个或多个线程来帮忙它工作，这是可选的。

操作系统为过程提供了一个能够应用的“一块”内存，所有应用程序状态都保留在该公有内存空间中。

敞开应用程序时，相应的过程也会隐没，操作系统会开释内存。

过程能够申请操作系统启动另一个过程来执行不同的工作。

此时，内存中的不同局部会分给新过程。如果两个过程须要对话，他们能够通过过程间通信（IPC）来进行。

许多利用都是这样设计的，所以如果一个工作过程失去响应，该过程就能够在不进行应用程序不同局部的其余过程运行的状况下重新启动。

浏览器架构

那么如何通过过程和线程构建 web 浏览器呢？它可能由一个领有很多线程的过程，或是一些通过 IPC 通信的不同线程的过程。

在2016年，Chrome官网团队应用“面向服务的架构”（Services Oriented Architecture，简称SOA）的思维设计了新的Chrome架构。

如果在资源受限的设施上（如下图），Chrome会将很多服务整合到一个过程中，从而节俭内存占用。

过程	管制
浏览器过程	次要负责界面显示、用户交互、子过程治理，同时提供存储等性能。
渲染过程	外围工作是将 HTML、CSS 和 JavaScript 转换为用户能够与之交互的网页，排版引擎Blink和JavaScript引擎V8都是运行在该过程中，默认状况下，Chrome会为每个Tab标签创立一个渲染过程。出于平安思考，渲染过程都是运行在沙箱模式下。
插件过程	次要是负责插件的运行，因插件易解体，所以须要通过插件过程来隔离，以保障插件过程解体不会对浏览器和页面造成影响。
网络过程	次要负责页面的网络资源加载，之前是作为一个模块运行在浏览器过程外面的，直至最近才独立进去，成为一个独自的过程。
GPU过程	在独立的过程中解决GPU工作。之所以放到独立的过程，是因为GPU要解决来自多个利用的申请，但要在同一个界面上绘制图形。

SOA架构的长处

稳固且晦涩

因为过程是互相隔离的，所以当一个页面或者插件解体时，影响到的仅仅是以后的页面过程或者插件过程，并不会影响到浏览器和其余页面，这就完满地解决了页面或者插件的解体会导致整个浏览器解体，也就是不稳固的问题。

同理，JavaScript也是运行在渲染过程中的，所以即便JavaScript阻塞了渲染过程，影响到的也只是以后的渲染页面，而并不会影响浏览器和其余页面。
平安沙箱

SOA架构还有助于平安和隔离。因为操作系统有限度过程特权的机制，浏览器能够借此限度某些过程的能力。

比方，Chrome会限度解决任意用户输出的渲染器过程，不让它任意拜访文件。
更内聚，松耦合，易于保护和扩大

原来的各种模块被重形成独立的服务（Service），每个服务（Service）都能够在独立的过程中运行，拜访服务（Service）必须应用定义好的接口，通过IPC来通信，从而构建一个更内聚、松耦合、易于保护和扩大的零碎，更好实现 Chrome 简略、稳固、高速、平安的指标。

站点隔离

站点隔离(Site Isolation for web developers)是早先引入Chrome的一个里程碑式个性，即每个跨站点iframe都运行一个独立的渲染器过程。

即使像后面说的那样，每个标签页单开一个渲染器过程，但容许跨站点的iframe运行在同一个渲染器过程中并共享内存空间，那平安攻打依然有可能绕开同源策略，而且有人发现在古代CPU中，过程有可能读取任意内存( Meltdown/Spectre )。

过程隔离是隔离站点、确保上网平安最无效的形式。

Chrome 默认采纳站点隔离。站点隔离是多年工程化致力的后果，它并非多开几个渲染器过程那么简略。

比方，不同的iframe运行在不同过程中，开发工具在后盾依然要做到无缝切换，而且即使简略地Ctrl+F查找也会波及在不同过程中搜寻。

通常状况下，关上新的页面都会应用独自的渲染过程；
如果从A页面关上B页面，且A和B都属于同一站点的话，那么B页面复用A页面的渲染过程；如果是其余状况，浏览器过程则会为B创立一个新的渲染过程。
- 具体地讲，咱们将“同一站点”定义为根域名（例如，baidu.com）加上协定（例如，https:// 或者http://），还蕴含了该根域名下的所有子域名和不同的端口。
```
https://WWW.baidu.com
https://WWW.baidu.com:8080
```

因为网络申请可能要花几百毫秒能力拿到响应，这里还会利用一个优化策略。第二步UI线程要求网络线程发送申请后，曾经晓得可能要导航到哪个网站去了。因而在发送网络申请的同时，UI线程会提前分割或并行启动一个渲染器过程。这样在网络线程收到数据后，就曾经有渲染器过程原地待命了。如果产生了重定向，这个待命过程可能用不上，而是换作其余过程去解决。

第五步：提交导航。

数据和渲染器过程都有了，就能够通过IPC从浏览器过程向渲染器过程提交导航。渲染器过程也会同时接管到不间断的HTML数据流。

当浏览器过程收到渲染器过程的确认音讯后，导航实现，文档加载阶段开始。

此时，地址栏会更新，平安批示图标和网站设置UI也会反映新页面的信息。

以后标签页面的会话历史会更新，后退/后退按钮起作用。为便于标签页/会话在敞开标签页或窗口后复原，会话历史会写入磁盘。

最初一步：初始加载实现。

提交导航之后，渲染器过程将负责加载资源和渲染页面（具体细节前面介绍）。

而在“实现”渲染后（在所有iframe中的onload事件触发且执行实现后），渲染器过程会通过IPC给浏览器过程发送一个音讯。此时，UI线程进行标签页上的旋转图标。

初始加载实现后，客户端JavaScript依然可能加载额定资源并从新渲染页面。

如果此时用户在地址又输出了其余URL呢？浏览器过程还会反复上述步骤，导航到新站点。不过在此之前，须要确认已渲染的网站是否关注beforeunload事件。因为标签页中的所有，包含JavaScript代码都由渲染器过程解决，所以浏览器过程必须与以后的渲染器过程确认后再导航到新站点。

如果导航申请来自以后渲染器过程（用户点击了链接或JavaScript运行了window.location = "https://newsite.com"），渲染器过程首先会查看beforeunload处理程序。而后，它会走一遍与浏览器过程触发导航同样的过程。惟一的区别在于导航申请是由渲染器过程提交给浏览器过程的。

导航到不同的网站时，会有一个新的独立渲染器过程负责解决新导航，而老的渲染器过程要负责解决unload之类的事件。

更多细节，能够参考【译】页面生命周期API以及Web 页面生命周期。

另外，导航阶段还可能波及【中】Service Worker，即网页利用中的网络代理服务，开发者能够通过它管制什么缓存在本地，何时从网络获取新数据。

Service Worker说到底也是须要渲染器过程运行的JavaScript代码。如果网站注册了Server Worker，那么导航申请到来时，网络线程会依据URL将其匹配进去，此时UI线程就会分割一个渲染器过程来执行Service Worker的代码：可能只有从本地缓存读取数据，也可能须要发送网络申请。

如果Service Worker最终决定从网络申请数据，浏览器过程与渲染器过程间的这种往返通信会导致提早。

因而，这里会有一个“导航预加载”的优化Speed up Service Worker with Navigation Preloads，即在Service Worker启动同时事后加载资源，加载申请通过HTTP头部与服务器沟通，服务器决定是否齐全更新内容。

渲染

渲染是渲染器过程外部的工作，波及Web性能的诸多方面（具体内容能够参考这里Why does speed matter?）。

标签页中的所有都由渲染器过程负责解决，其中主线程负责运行大多数客户端JavaScript代码，大量代码可能会由工作线程解决（如果用到了Web Worker或Service Worker）。

合成器（compositor）线程和栅格化（raster）线程负责高效、平滑地渲染页面。

渲染器过程的外围工作是把HTML、CSS和JavaScript转换成用户能够交互的网页接下来，咱们从整体上过一遍渲染器过程解决Web内容的各个阶段。

解析HTML

构建DOM

渲染器过程收到导航的提交音讯后，开始接管HTML，其主线程开始解析文本字符串（HTML），并将它转换为DOM（Document Object Model，文档对象模型）。

DOM是浏览器外部对页面的示意，也是JavaScript与之交互的数据结构和API。

如何将HTML解析为DOM由HTML规范定义。HTML规范要求浏览器兼容谬误的HTML写法，因而浏览器会“饮泣吞声”，绝不报错。详情能够看看“解析器错误处理及怪异情景简介”。

加载子资源

网站都会用到图片、CSS和JavaScript等内部资源。浏览器须要从缓存或网络加载这些文件。主线程能够在解析并构建DOM的过程中发现一个加载一个，但这样效率太低。

为此，Chrome会在解析同时并发运行“预加载扫描器”，当发现HTML文档中有<img>或<link>时，预加载扫描器会将申请提交给浏览器过程中的网络线程。

JavaScript可能阻塞解析

如果HTML解析器碰到<script>标签，会暂停解析HTML文档并加载、解析和执行JavaScript代码。

因为JavaScript有可能通过document.write()批改文档，进而扭转DOM构造（HTML规范的“解析模型”有一张图能够高深莫测）。所以HTML解析器必须停下来执行JavaScript，而后再复原解析HTML。至于执行JavaScript的细节，大家能够关注V8团队相干的分享：【译】 JavaScript 引擎根底：Shapes 和 Inline Caches。

提醒浏览器你要加载资源

为了更好地加载资源，能够通过很多形式通知浏览器。如果JavaScript没有用到document.write()，能够在<script>标签上增加async或defer属性。这样浏览器就会异步运行JavaScript代码，不会阻塞解析。适合的话，能够思考应用JavaScript modules。再比方，<link rel="preload">通知浏览器该资源对于以后导航相对必要，应该尽快下载。对于资源加载优先级，能够参考这里：【译】Fast load times。

计算款式（Recalculate style）

光有DOM还不行，因为并不知道页面应该长啥样。所以接下来，主线程要解析CSS并计算每个DOM节点的款式。这个过程就是依据CSS选择符，确定每个元素要利用什么款式。在Chrome开发工具“计算的款式”（computed）中能够看每个元素计算后的款式。

1.把CSS转换为浏览器可能了解的构造

CSS款式起源次要有三种：

通过link援用的内部CSS文件；
<style>标记内的 CSS；
元素的style属性内嵌的CSS。
和HTML文件一样，浏览器也是无奈间接了解这些纯文本的CSS款式，所以当渲染引擎接管到CSS文本时，会执行一个转换操作，将CSS文本转换为浏览器能够了解的构造——styleSheets。
为了加深了解，你能够在Chrome控制台中查看其构造，只须要在控制台中输出document.styleSheets，而后就看到如下图所示的构造，该数据结构同时具备了查问和批改性能。

2.转换样式表中的属性值，使其标准化

3.计算出DOM树中每个节点的具体款式

这就波及到CSS的继承规定和层叠规定了。

首先是CSS继承。

首先，能够抉择要查看的元素的款式（位于图中的区域2中），在图中的第1个区域中点击对应的元素元素，就能够了上面的区域查看该元素的款式了。比方这里咱们抉择的元素是<p>标签，位于html.body.div.这个门路上面。
其次，能够从款式起源（位于图中的区域3中）中查看款式的具体起源信息，看看是来源于款式文件，还是来源于UserAgent样式表。这里须要特地提下UserAgent款式，它是浏览器提供的一组默认款式，如果你不提供任何款式，默认应用的就是UserAgent款式。
最初，能够通过区域2和区域3来查看款式继承的具体过程。

款式计算过程中的第二个规定是款式层叠。层叠是CSS的一个基本特征，它是一个定义了如何合并来自多个源的属性值的算法。

布局（Layout）

到这一步，渲染器过程晓得了文档的构造，也晓得了每个节点的款式。但基于这些信息依然不足以渲染页面。

布局，就是要找到元素间的几何地位关系。主线程会遍历DOM元素及其计算款式，而后结构一棵布局树，这棵树的每个节点将带有坐标和大小信息。

布局树与DOM树的构造相似，但只蕴含页面中可见元素的信息。如果元素被利用了display: none，则布局树中不会蕴含它（visibility: hidden的元素会蕴含在内）。相似地，通过伪类p::before{content: 'Hi!'}增加的内容会蕴含在布局树中，但DOM树中却没有。

为了构建布局树，浏览器大体上实现了上面这些工作：

遍历DOM树中的所有可见节点，并把这些节点加到布局中；
而不可见的节点会被布局树疏忽掉，如head标签上面的全部内容，再比方body.p.span这个元素，因为它的属性蕴含 dispaly:none，所以这个元素也没有被包进布局树。

确定页面的布局要思考很多很多因素，并不简略。比方，字体大小、文本换行都会影响段落的形态，进而影响后续段落的布局。CSS可让元素浮动到一边、暗藏溢出边界的内容、扭转文本显示方向。可想而知，布局阶段的工作是十分艰巨的。Chrome有一个工程师团队专司布局，感兴起的话，能够看看他们这个分享：BlinkOn 8: Block Layout Deep Dive（在YouTube上）。

更新了元素的几何属性（重排）

从上图能够看出，如果你通过JavaScript或者CSS批改元素的几何地位属性，例如扭转元素的宽度、高度等，那么浏览器会触发从新布局，解析之后的一系列子阶段，这个过程就叫重排。无疑，重排须要更新残缺的渲染流水线，所以开销也是最大的

分层（Layer）

因为页面中有很多简单的成果，如一些简单的3D变换、页面滚动，或者应用z-indexing做z轴排序等，为了更加不便地实现这些成果，渲染引擎还须要为特定的节点生成专用的图层，并生成一棵对应的图层树（LayerTree）。

要想直观地了解什么是图层，你能够关上Chrome的“开发者工具”，抉择“Layers”标签（开发者工具 -> More tools ->Layers），就能够可视化页面的分层状况。

通常状况下，并不是布局树的每个节点都蕴含一个图层，如果一个节点没有对应的层，那么这个节点就从属于父节点的图层。

那么须要满足什么条件，渲染引擎才会为特定的节点创立新的层呢？

第一点，领有层叠上下文属性的元素会被晋升为独自的一层。

从图中能够看出，明确定位属性的元素、定义通明属性的元素、应用CSS滤镜的元素等，都领有层叠上下文属性。

第二点，须要剪裁（clip）的中央也会被创立为图层。

<style>
      div {
            width: 200;
            height: 200;
            overflow:auto;
            background: gray;
        } 
</style>
<body>
    <div >
        <p>所以元素有了层叠上下文的属性或者须要被剪裁，那么就会被晋升成为独自一层，你能够参看下图：</p>
        <p>从上图咱们能够看到，document层上有A和B层，而B层之上又有两个图层。这些图层组织在一起也是一颗树状构造。</p>
        <p>图层树是基于布局树来创立的，为了找出哪些元素须要在哪些层中，渲染引擎会遍历布局树来创立层树（Update LayerTree）。</p> 
    </div>
</body>

在这里咱们把div的大小限定为200 200像素，而div外面的文字内容比拟多，文字所显示的区域必定会超出200 200的面积，这时候就产生了剪裁。

呈现这种裁剪状况的时候，渲染引擎会为文字局部独自创立一个层，如果呈现滚动条，滚动条也会被晋升为独自的层。

如果页面某些局部应该独立一层（如滑入的菜单）但却没有，那你能够在CSS中给它加上will-change属性来揭示浏览器。

分层并不是越多越好，合成过多的层有可能还不如每帧都对页面中的一小部分执行一次栅格化更快。对于这里边的衡量，能够参考：保持仅合成器的属性和管理层计数。

图层绘制（Paint）

在实现图层树的构建之后，渲染引擎会对图层树中的每个图层进行绘制，那么接下来咱们看看渲染引擎是怎么实现图层绘制的？

渲染引擎实现图层的绘制，会把一个图层的绘制拆分成很多小的绘制指令，而后再把这些指令依照程序组成一个待绘制列表，如下图所示：

从图中能够看出，绘制列表中的指令其实非常简单，就是让其执行一个简略的绘制操作，比方绘制粉色矩形或者彩色的线等。

而绘制一个元素通常须要好几条绘制指令，因为每个元素的背景、前景、边框都须要独自的指令去绘制。所以在图层绘制阶段，输入的内容就是这些待绘制列表。

更新元素的绘制属性（重绘）

从图中能够看出，如果批改了元素的背景色彩，那么布局阶段将不会被执行，因为并没有引起几何地位的变换，所以就间接进入了绘制阶段，而后执行之后的一系列子阶段，这个过程就叫重绘。相较于重排操作，重绘省去了布局和分层阶段，所以执行效率会比重排操作要高一些。

栅格化（raster）

绘制列表只是用来记录绘制程序和绘制指令的列表，而实际上绘制操作是由渲染引擎中的合成线程来实现的。

当图层的绘制列表筹备好之后，主线程会把该绘制列表提交（commit）给合成线程。

通常一个页面可能很大，然而用户只能看到其中的一部分，咱们把用户能够看到的这个局部叫做视口（viewport）。
有些状况下，图层很大，然而通过视口，用户只能看到页面的很小一部分。所以这种状况下，要绘制出所有图层内容的话，没有必要。

基于这个起因，合成线程会将图层划分为图块（tile），这些图块的大小通常都是256 x 256 或者 512 x 512。

合成器线程会安顿栅格化线程优先转换视口（及左近）的图块。而形成一层的图块也会转换为不同分辨率的版本，以便在用户缩放时应用。

所谓栅格化，是指将图块转换为位图。而图块是栅格化执行的最小单位。渲染过程保护了一个栅格化的线程池，所有的图块栅格化都是在线程池内执行的。

通常，栅格化过程都会应用GPU来减速生成，应用GPU生成位图的过程叫疾速栅格化，或者GPU栅格化，生成的位图被保留在GPU内存中。

置信你还记得，GPU操作是运行在GPU过程中，如果栅格化操作应用了GPU，那么最终生成位图的操作是在GPU中实现的，这就波及到了跨过程操作。

合成

什么是合成？合成（composite）是将页面不同局部先分层并别离栅格化，而后再通过独立的合成器线程合成页面。

这样当用户滚动页面时，因为层都曾经栅格化，所以浏览器惟一要做的就是合成一个新的帧。而动画也能够用同样的形式实现：先挪动层，再合成帧。

所有小片都栅格化当前，合成器线程会收集叫做“绘制方块”（draw quad）的图块信息，以创立合成器帧。

绘制方块：蕴含小片的内存地址、页面地位等合成页面相干的信息。
合成器帧：由从多绘制方块拼成的页面中的一帧。

创立好的合成器帧会通过IPC提交给浏览器过程。浏览器过程外面有一个叫viz的组件，用来接管合成线程发过来的DrawQuad命令，而后依据DrawQuad命令，将其页面内容绘制到内存中，最初再将内存显示在屏幕上。

与此同时，为更新浏览器界面，UI线程可能还会增加另一个合成器帧；或者因为有扩大，其余渲染器过程也可能增加额定的合成器帧。

所有这些合成器帧都会发送给GPU，以便最终显示在屏幕上。如果产生滚动事件，合成器线程会再创立新的合成器帧并发送给GPU。

应用合成的益处是不必牵扯主线程。合成器线程不必期待款式计算或JavaScript执行。

这也是为什么“只需合成的动画”（【中】High Performance Animations）被认为性能最佳的起因。因为如果布局和绘制须要再次计算，那还得用到主线程。

用一张图来展现：

渲染流水线大总结

好了，咱们当初曾经剖析完了整个渲染流程，从HTML到DOM、款式计算、布局、图层、绘制、光栅化、合成和显示。上面我用一张图来总结下这整个渲染流程：

渲染过程将HTML内容转换为可能读懂的DOM树结构。
渲染引擎将CSS样式表转化为浏览器能够了解的styleSheets，计算出DOM节点的款式。
创立布局树，并计算元素的布局信息。
对布局树进行分层，并生成分层树。
为每个图层生成绘制列表，并将其提交到合成线程。
合成线程将图层分成图块，并在光栅化线程池中将图块转换成位图。
合成线程发送绘制图块命令DrawQuad给浏览器过程。
浏览器过程依据DrawQuad音讯生成页面，并显示到显示器上。

参考：

深刻了解古代浏览器

浏览器工作原理与实际

[[译] 古代浏览器外部揭秘（第一局部）](https://juejin.cn/post/684490…

关于前端:浏览器工作原理

架构

过程和线程

浏览器架构

SOA架构的长处

站点隔离

导航

渲染

解析HTML

构建DOM

加载子资源

JavaScript可能阻塞解析

计算款式（Recalculate style）

布局（Layout）

更新了元素的几何属性（重排）

分层（Layer）

图层绘制（Paint）

更新元素的绘制属性（重绘）

栅格化（raster）

合成

渲染流水线大总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于前端:浏览器工作原理

架构

过程和线程

浏览器架构

SOA架构的长处

站点隔离

导航

渲染

解析HTML

构建DOM

加载子资源

JavaScript可能阻塞解析

计算款式（Recalculate style）

布局（Layout）

更新了元素的几何属性（重排）

分层（Layer）

图层绘制（Paint）

更新元素的绘制属性（重绘）

栅格化（raster）

合成

渲染流水线大总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复