远离浏览器卡顿,提高用户体验,提升代码运行效率,使用多线程编程方法。
浏览器端 JavaScript 是以单线程的方式执行的,也就是说 JavaScript 和 UI 渲染占用同一个主线程,那就意味着,如果 JavaScript 进行高负载的数据处理,UI 渲染就很有可能被阻断,浏览器就会出现卡顿,降低了用户体验。
为此,JavaScript 提供了异步操作,比如定时器 (setTimeout、setInterval) 事件、Ajax 请求、I/ O 回调等。我们可以把高负载的任务使用异步处理,它们将会被放入浏览器的事件任务队列(event loop)中去,等到 JavaScript 运行时执行线程空闲时候,事件队列才会按照先进先出的原则被一一执行。
通过类似定时器,回调函数等异步编程方式在平常的工作中已经足够,但是如果做复杂运算,这种方式的不足就逐渐体现出来,比如 settimeout 拿到的值并不正确,或者页面有复杂运算的时候很容易触发假死状态,异步代码会影响主线程的代码执行,异步终究还是单线程,不能从根本上解决问题。
多线程(Web Worker)就应运而生,它是 HTML5 标准的一部分,这一规范定义了一套 API,允许一段 JavaScript 程序运行在主线程之外的另外一个线程中。将一些任务分配给后者运行。在主线程运行的同时,Worker(子)线程在后台运行,两者互不干扰。等到 Worker 线程完成计算任务,再把结果返回给主线程。这样的好处是,一些计算密集型或高延迟的任务,被 Worker 线程负担了,主线程(通常负责 UI 交互)就会很流畅,不会被阻塞或拖慢。
什么是 web worker
worker 是 window 对象的一个方法,就是用它来创建多线程。可以通过以下方式来检测你的浏览器是否支持 worker
if (window.Worker) {…… your code ……}
一个 worker 是使用一个构造函数(Worker())创建的一个对象,这个构造函数需要传入一个的 JavaScript 文件,这个文件包含将在工作线程中运行的代码。类似于这样:
let myWorker = new Worker(‘worker.js’);
主线程和子线程的数据不是共享的,worker 通过 postMessage() 方法和 onmessage 事件进行数据通信。主线程和子线程是双向的,都可以发送和监听事件。向一个 worker 发送消息需要这样做(main.js):
myWorker.postMessage(‘hello, world’); // 发送
worker.onmessage = function (event) {// 接收
console.log(‘Received message ‘ + event.data);
doSomething();
}
postMessage 所传的数据都是拷贝传递(ArrayBuffer 类型除外),所以子线程也是类似传递(worker.js)
addEventListener(‘message’, function (e) {
postMessage(‘You said: ‘ + e.data);
}, false);
当子线程运行结束后,使用完毕,为了节省系统资源,可以手动关闭子线程。如果 worker 没有监听消息,那么当所有任务执行完毕(包括计数器)后,它就会自动关闭。
// 在主线程中关闭
worker.terminate();
// 在子线程里线程
close();
Worker 也提供了错误处理机制,当出错时会触发 error 事件。
// 监听 error 事件
worker.addEventListener(‘error’, function (e) {
console.log(‘ERROR’, e);
});
web worker 本身很简单,但是它的限制特别多。
使用的问题
1、同源限制
分配给 Worker 线程运行的脚本文件(worker.js),必须与主线程的脚本文件 (main.js) 同源。这里的同源限制包括协议、域名和端口,不支持本地地址(file://)。这会带来一个问题,我们经常使用 CDN 来存储 js 文件,主线程的 worker.js 的域名指的是 html 文件所在的域,通过 new Worker(url)加载的 url 属于 CDN 的域,会带来跨域的问题,实际开发中我们不会吧所有的代码都放在一个文件中让子线程加载,肯定会选择模块化开发。通过工具或库把代码合并到一个文件中,然后把子线程的代码生成一个文件 url。解决方法:(1)将动态生成的脚本转换成 Blob 对象。(2)然后给这个 Blob 对象创建一个 URL。(3)最后将这个创建好的 URL 作为地址传给 Worker 的构造函数。
let script = ‘console.log(“hello world!”);’
let workerBlob = new Blob([script], {type: “text/javascript”});
let url = URL.createObjectURL(workerBlob);
let worker = new Worker(url);
2、访问限制
Worker 子线程所在的全局对象,与主线程不在同一个上下文环境,无法读取主线程所在网页的 DOM 对象,也无法使用 document、window、parent 这些对象,global 对象的指向有变更,window 需要改写成 self,不能执行 alert()方法和 confirm()等方法,只能读取部分 navigator 对象内的数据。另外 chrome 的 console.log()倒是可以使用,也支持 debugger 断点,增加调试的便利性。
3、使用异步
Worker 子线程中可以使用 XMLHttpRequest 对象发出 AJAX 请求,可以使用 setTimeout() setInterval()方法,也可使用 websocket 进行持续链接。也可以通过 importScripts(url)加载另外的脚本文件,但是仍然不能跨域。
应用场景:
1、使用专用线程进行数学运算
Web Worke 设计的初衷就是用来做计算耗时任务,大数据的处理,而这种计算放在 worker 中并不会中断前台用户的操作,避免代码卡顿带来不必要的用户体验。例如处理 ajax 返回的大批量数据,读取用户上传文件,计算 MD5,canvas 的位图的过滤,分析视频和声频文件等。worker 中除了缺失了 DOM 和 BOM 操作能力以外,还是拥有非常强大的 js 逻辑运算处理的能力的,相当于 nodejs 一个级别的的运行环境。
2、高频的用户交互
高频的用户交互适用于根据用户的输入习惯、历史记录以及缓存等信息来协助用户完成输入的纠错、校正功能等类似场景,用户频繁输入的响应处理同样可以考虑放在 web worker 中执行。例如,我们可以 做一个像 Word 一样的应用:当用户打字时,后台立即在词典中进行查找,帮助用户自动纠错等等。
3、数据的预取
对于一些有大量数据的前后台交互产品,可以新开一个线程专门用来进行数据的预取和缓冲数据,worker 可以用在本地 web 数据库的行写入和更改,长时间持续的运行,不会被主线程上的活动(比如用户点击按钮、提交表单)打断,也有利于随时响应主线程的通信。也可以配合 XMLHttpRequest 和 websocket 进行不断开的通信,实现守卫进程。
兼容性
总体来说,兼容性还是不错的,移动端可以放心使用,桌面端要求不高的话,也可以使用。
superWorker
为了更方便快捷的使用 web worker,我们封装了一个工具,可以通过模块化的方式编写运行在 web worker 中的脚本,避免同源策略,减少服务端发送一个额外的 url 请求,无需了解 web worker,就像使用 setTimeout 一样,快速使用 superWorker,提升你的编码效率和运行效率,它有以下优点:1、原生 JS 实现,无任何依赖库。2、简单快速,摈弃繁琐的创建文件、绑定事件,实现无侵入、无感知运行新线程的代码。3、返回 Promise 类型的数据,支持链式调用,清晰明了。4、支持多种方式新建 worker,包括匿名函数、函数列表、文本文件、html 片段、url、类,方便快捷。5、gzipped 压缩后仅仅 1.2kb。
使用教程:
import superWorker from ‘superWorker’
let worker = superWorker(function (a, b) {
// 子线程中要运行的代码
return a + b;
});
worker.start(1, 2).then((r)=>console.log(r)); // 3
用法
superWorker(code,[type])
参数
code:运行的代码,type(非必须):代码类型,目前支持 0、1、2、3、4。
实现原理:
先进行源代码转文件:
let workerBlob = new Blob(code, { type: “text/javascript”});
let url = URL.createObjectURL(workerBlob);
对类型拆分,code 参数支持传入匿名函数、函数列表、文本文件、url、HTML 内嵌标签、类等功能,首先对传入的代码进行分类匹配,字符串化,然后进行拼接运行
code = `(${Function.prototype.toString.call(code)})(${exportsObjName})`;
对于传入的方法,分别在主线程中的 exports 对象进行标记,和 worker 子线程中的 exportsObjName 对象中进行赋值。对于 ES6 模块化的代码,进行过滤转译。
// 处理 \nexport default function xxx(){} => exports.default = true; exportsObjName.default = function xx(){}
code = code.replace(/^(\s*)export\s+default\s+/m, (s, before) => {
exports.default = true;
return `${before}${exportsObjName}.default=`;
});
形成主线程 exports 和子线程 exportsObjName 中的方法进行一一对应。
worker 主线程与主线程进行通讯则是仍然需要通过 postMessage 方法和 onmessage 回调事件来进行,这个我们统一进行了双向绑定,分别对主线程和子线程执行 setup。
function setup(ctx, pmMethods, callbacks) {
ctx.addEventListener(‘message’, ({ data}) => {
// ……
})
}
在主线程中对 worker 封装了一些快捷的方法,比如关闭线程:
worker.terminate = () => {
URL.revokeObjectURL(url);
term.call(this);
};
并把子线程拥有的方法、属性,暴露出来,方便主线程通过传递参数调用。
worker.expose = methodName => {
worker[i] = function () {
return worker[‘call’](methodName, [].slice.call(arguments));
};
};
大致如下图:
欢迎小伙伴们使用以及批评指正。有问题多多反馈,多多交流。
小结
对于 web worker 这项新技术,无论在 PC 还是在移动 web,都很实用,腾讯新闻前端组进行了广泛的尝试,Web Worker 的实现为前端程序带来了后台计算的能力,实现了主 UI 线程与复杂计运算线程的分离,从而极大减轻了因计算量大而造成 UI 阻塞而出现的界面渲染卡、掉帧的情况,并且更大程度地利用了终端硬件的性能。superWorker 能解决掉事件绑定,同源策略等繁琐的问题,它目前最大的问题在于不兼容 IE9,在兼容性要求不是那么严格的地方,尽可能的使用吧!