node实现分片下载

jiezi

6 年前

本文基于 http Range Requests 协议，实现了分片下载的功能。
使用场景包括基于浏览器的流文件片段传输、基于客户端的分片下载等。
原理
http 通过 Range Requests 相关的 header，可以与服务器进行协商，实现分部分的请求。
这里就不细说具体协议内容了，具体可以参考这两篇文章，解释的非常详细：

https://tools.ietf.org/html/rfc7233
https://www.oschina.net/translate/http-partial-content-in-node-js

下面贴一下实现过程，代码可以在 git 查看：https://github.com/keller35/partial。
服务端代码
服务端用 node 实现：
const fs = require(‘fs’);
const path = require(‘path’);
const Koa = require(‘koa’);

const app = new Koa();
const PATH = ‘./resource’;

app.use(async ctx => {
const file = path.join(__dirname, `${PATH}${ctx.path}`);
// 1、404 检查
try {
fs.accessSync(file);
} catch (e) {
return ctx.response.status = 404;
}
const method = ctx.request.method;
const {size} = fs.statSync(file);
// 2、响应 head 请求，返回文件大小
if (‘HEAD’ == method) {
return ctx.set(‘Content-Length’, size);
}
const range = ctx.headers[‘range’];
// 3、通知浏览器可以进行分部分请求
if (!range) {
return ctx.set(‘Accept-Ranges’, ‘bytes’);
}
const {start, end} = getRange(range);
// 4、检查请求范围
if (start >= size || end >= size) {
ctx.response.status = 416;
return ctx.set(‘Content-Range’, `bytes */${size}`);
}
// 5、206 分部分响应
ctx.response.status = 206;
ctx.set(‘Accept-Ranges’, ‘bytes’);
ctx.set(‘Content-Range’, `bytes ${start}-${end ? end : size – 1}/${size}`);
ctx.body = fs.createReadStream(file, { start, end});
});

app.listen(3000, () => console.log(‘partial content server start’));

对请求的资源做检查，不存在则响应 404
对于 HEAD 请求，返回资源大小
如果 GET 请求没有告知 range，返回 Content-Length，告知浏览器可以进行分片请求
如果请求设置了 range，则检查 range 是否合法，不合法返回合法的 rangge
一切正常，获取文件 range 范围部分，做流响应

代码很简单，把 Range Requests 协议对应实现一遍就 ok 了，当然这里没有完全实现协议的内容，但已经满足了这里演示的需求。
服务端代码 ok 了，用一个浏览器的 demo 来检验一下。
浏览器例子
现代浏览器基本都实现了 Range Requests，这里用 audio 标签作为例子。
<html>
<head>
<title> 分片流传输 </title>
<script type=”text/javascript”>
function jump() {
const player = document.getElementById(‘musicPlayer’);
// 从 30s 开始播放
player.currentTime = 30;
}
</script>
</head>
<body>
<audio id=”musicPlayer” src=”http:127.0.0.1:3000/source.mp3″ controls></audio>
<button onclick=”jump()”> 切到 30s</button>
</body>
</html>
最终的效果是这样的：

对比两张图，当 html 加载完成，浏览器自动请求资源，此时 header 有 Range: bytes=0-，表示从第 0 byte 开始加载资源；当点击跳到 30s 处播放时，此时 header 变成了 Range: bytes=3145728-。
同样用这个服务端代码，还可以实现一个客户端，模拟一下分包下载。
node 分包下载
这个例子演示了，对一个资源，并发的实现分部分的下载，然后再合并成一个文件。
这里也是用 node 实现：
import request from ‘request’;
import path from ‘path’;
import fs from ‘fs’;

const SINGLE = 1024 * 1000;
const SOURCE = ‘http://127.0.0.1:3000/source.mp3’;

request({
method: ‘HEAD’,
uri: SOURCE,
}, (err, res) => {
if (err) return console.error(err);
const file = path.join(__dirname, ‘./download/source.mp3’);
try {
fs.closeSync(fs.openSync(file, ‘w’));
} catch (err) {
return console.error(err);
}
const size = Number(res.headers[‘content-length’]);
const length = parseInt(size / SINGLE);
for (let i=0; i<length; i++) {
let start = i * SINGLE;
let end = i == length ? (i + 1) * SINGLE – 1 : size – 1;
request({
method: ‘GET’,
uri: SOURCE,
headers: {
‘range’: `bytes=${start}-${end}`
},
}).on(‘response’, (resp) => {
const range = resp.headers[‘content-range’];
const match = /bytes ([0-9]*)-([0-9]*)/.exec(range);
start = match[1];
end = match[2];
}).pipe(fs.createWriteStream(file, {start, end}));
}
});
代码比较简单，就是开启多个 http 请求，并发的下载资源，然后根据响应的 content-range，写到文件的对应位置。
参考文章：

https://www.oschina.net/translate/http-partial-content-in-node-js
https://tools.ietf.org/html/rfc7233