乐趣区

一文看透浏览器架构

本文由云 + 社区发表作者:廖彩明
在从事前端开发过程中,浏览器作为最重要的开发环境,浏览器基础是是前端开发人员必须掌握的基础知识点,它贯穿着前端的整个网络体系。对浏览器原理的了解,决定着编写前端代码性能的上限。浏览器作为 JS 的运行环境,学习总结下现代浏览器的相关知识
前言
经常听说浏览器内核,浏览器内核究竟是什么,以及它做了什么。我们将来了解下浏览器的主要组成部分、现代浏览器的主要架构、浏览器内核、浏览器内部是如何工作的
1 浏览器
现代浏览器结构如下:
The browser’s main component
The User Interface
主要提供用户与 Browser Engine 交互的方法。其中包括:地址栏 (address bar)、向前 / 退后按钮、书签菜单等等。浏览器除了渲染请求页面的窗口外的所有地方都属于 The User Interface
The Browser Engine
协调(主控)UI 和 the Rendering Engine,在他们之间传输指令。提供对 The Rendering Engine 的高级接口,一方面它提供初始化加载 Url 和其他高级的浏览器动作(如刷新、向前、退后等)方法。另一方面 Browser Engine 也为 User Interface 提供各种与错误、加载进度相关的消息。
The Rendering Engine
为给定的 URL 提供可视化的展示。它解析 JavaScript、Html、Xml,并且 User Interface 中展示的 layout。其中关键的组件是 Html 解析器,它可以让 Rendering Engine 展示差乱的 Html 页面。值得注意:不同的浏览器使用不同的 Rendering Engine。例如 IE 使用 Trident,Firefox 使用 Gecko,Safai 使用 Webkit。Chrome 和 Opera 使用 Webkit(以前是 Blink)
The Networking
基于互联网 HTTP 和 FTP 协议,处理网络请求。网络模块负责 Internet communication and security,character set translations and MIME type resolution。另外网络模块还提供获得到文档的缓存,以减少网络传输。为所有平台提供底层网络实现,其提供的接口与平台无关
The JavaScript Interpreter
解释和运行网站上的 js 代码,得到的结果传输到 Rendering Engine 来展示。
The UI Backend
用于绘制基本的窗口小部件,比如组合框和窗口。而在底层使用操作系统的用户界面方法,并公开与平台无关的接口。
The Data Storage
管理用户数据,例如书签、cookie 和偏好设置等。
2 主流浏览器的架构
2.1 FireFox
FireFox 的架构
可以看到火狐浏览器的渲染引擎(Rendering Engine)使用的是 Gecko;XML Parser 解析器是 Expat;Java Script 解释器是 Spider-Monkey(c 语言实现)
2.2 Chrome
Chrome 的架构
渲染引擎 Rendering Engine 使用的是 WebKit
XML Parser:libXML 解析 XML,libXSLT 处理 XSLT
JS 解释器使用 C ++ 实现的 V8 引擎,
2.3 IE
IE 的架构
渲染引擎主要是 Trident
Scripting Engine 有 JScript 和 VBScript
3 浏览器内核
浏览器最重要或者说核心的部分是“Rendering Engine”,可大概译为“渲染引擎”,不过我们一般习惯将之称为“浏览器内核”。主要包括以下线程:
3.1 浏览器 GUI 渲染线程,主要包括:
 HTML Parser 解析 HTML 文档,将元素转换为树结构 DOM 节点,称之为 Content Tree CSS Parser 解析 Style 数据,包括外部的 CSS 文件以及在 HTML 元素中的样式,用于创建另一棵树,调用“Render Tree”
 Layout 过程 为每个节点计算出在屏幕中展示的准确坐标
 Painting 遍历 Render Tree,调用 UI Backend 提供的接口绘制每个节点

3.2 JavaScript 引擎线程
JS 引擎线程负责解析 Javascript 脚本,运行代码 JS 引擎一直等待着任务队列中任务的到来,然后加以处理,一个 Tab 页(renderer 进程)中无论什么时候都只有一个 JS 线程在运行 JS 程序
GUI 渲染线程与 JS 引擎线程是互斥的,所以如果 JS 执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞
a) 减少 JavaScript 加载对 DOM 渲染的影响(将 JavaScript 代码的加载逻辑放在 HTML 文件的尾部,减少对渲染引擎呈现工作的影响;
b) 避免重排,减少重绘(避免白屏,或者交互过程中的卡顿;
c) 减少 DOM 的层级(可以减少渲染引擎工作过程中的计算量;
d) 使用 requestAnimationFrame 来实现视觉变化(一般来说我们会使用 setTimeout 或 setInterval 来执行动画之类的视觉变化,但这种做法的问题是,回调将在帧中的某个时点运行,可能刚好在末尾,而这可能经常会使我们丢失帧,导致卡顿)
3.3 浏览器定时触发器线程
浏览器定时计数器并不是由 JavaScript 引擎计数的, 因为 JavaScript 引擎是单线程的, 如果处于阻塞线程状态就会影响记计时的准确, 因此通过单独线程来计时并触发定时是更为合理的方案
3.4 浏览器事件触发线程
当一个事件被触发时该线程会把事件添加到待处理队列的队尾,等待 JavaScript 引擎的处理。这些事件可以是当前执行的代码块如定时任务、也可来自浏览器内核的其他线程如鼠标点击、AJAX 异步请求等,但由于 JavaScript 的单线程关系所有这些事件都得排队等待 JavaScript 引擎处理。
3.5 浏览器 http 异步请求线程
在 XMLHttpRequest 在连接后是通过浏览器新开一个线程请求,将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件放到 JavaScript 引擎的处理队列中等待处理。
4 以 Chrome 浏览器为例,演示浏览器内部如何工作
上面铺垫了这么多理论,下面结合 Chrome 讲解当用户在地址栏上输入 URL 后,浏览器内部都做了写什么
4.1 Chrome 浏览器中的多进程
打开 Chrome 任务管理器,可以看到
Chrome 运行的进程
各个进程的功能
• Browser 进程
功能:Controls “chrome” part of the application including address bar, bookmarks, back and forward buttons. Also handles the invisible, privileged parts of a web browser such as network requests and file access.
• GPU 进程
功能:Handles GPU tasks in isolation from other processes. It is separated into different process because GPUs handles requests from multiple apps and draw them in the same surface.
• 第三方插件进程
功能:Controls any plugins used by the website, for example, flash. 每个插件对应一个进程,当插件运行时创建
• 浏览器渲染进程
功能:Controls anything inside of the tab where a website is displayed. 默认每个标签页创建一个渲染引擎实例。
• V8 Proxy resolver
关于 V8 Proxy resolver 可查看
code.google.com
group.google.com https://groups.google.com/a/c…!topic/net-dev/73f9B5vFphI
doc.google.com
Chrome 支持使用代理脚本为给定的网址选择代理服务器,包含使用操作系统提供的代理解析程序的多个平台的回退实现。但默认情况下(iOS 除外),它使用内置的解析 V8 执行代理脚本(V8 pac)。今天(截至 2015 年 1 月),V8 pac 在浏览器进程中运行。这意味着浏览器进程包含一个 V8 实例,这是一个潜在的安全漏洞。在浏览器进程中允许 V8 还需要浏览器进程允许写入 – 执行页面。
我们关于将 V8 pac 迁移到单独进程的建议包括为解析器创建 Mojo 服务,从实用程序进程导出该服务,以及从浏览器进程创建 / 连接到该进程。
浏览器进程之间主要通过 IPC (Inter Process Communication) 通信
4.2 Per-frame renderer processes – Site Isolation
Site Isolation is a recently introduced feature in Chrome that runs a separate renderer process for each cross-site iframe. We’ve been talking about one renderer process per tab model which allowed cross-site iframes to run in a single renderer process with sharing memory space between different sites. Running a.com and b.com in the same renderer process might seem okay. The Same Origin Policy is the core security model of the web; it makes sure one site cannot access data from other sites without consent. Bypassing this policy is a primary goal of security attacks. Process isolation is the most effective way to separate sites. With Meltdown and Spectre, it became even more apparent that we need to separate sites using processes. With Site Isolation enabled on desktop by default since Chrome 67, each cross-site iframe in a tab gets a separate renderer process.
每个 iframe 是单独的渲染进程
此文已由腾讯云 + 社区在各渠道发布
获取更多新鲜技术干货,可以关注我们腾讯云技术社区 - 云加社区官方号及知乎机构号

退出移动版