乐趣区

node实现分片下载

本文基于 http Range Requests 协议,实现了分片下载的功能。
使用场景包括基于浏览器的流文件片段传输、基于客户端的分片下载等。
原理
http 通过 Range Requests 相关的 header,可以与服务器进行协商,实现分部分的请求。
这里就不细说具体协议内容了,具体可以参考这两篇文章,解释的非常详细:

https://tools.ietf.org/html/rfc7233
https://www.oschina.net/translate/http-partial-content-in-node-js

下面贴一下实现过程,代码可以在 git 查看:https://github.com/keller35/partial。
服务端代码
服务端用 node 实现:
const fs = require(‘fs’);
const path = require(‘path’);
const Koa = require(‘koa’);

const app = new Koa();
const PATH = ‘./resource’;

app.use(async ctx => {
const file = path.join(__dirname, `${PATH}${ctx.path}`);
// 1、404 检查
try {
fs.accessSync(file);
} catch (e) {
return ctx.response.status = 404;
}
const method = ctx.request.method;
const {size} = fs.statSync(file);
// 2、响应 head 请求,返回文件大小
if (‘HEAD’ == method) {
return ctx.set(‘Content-Length’, size);
}
const range = ctx.headers[‘range’];
// 3、通知浏览器可以进行分部分请求
if (!range) {
return ctx.set(‘Accept-Ranges’, ‘bytes’);
}
const {start, end} = getRange(range);
// 4、检查请求范围
if (start >= size || end >= size) {
ctx.response.status = 416;
return ctx.set(‘Content-Range’, `bytes */${size}`);
}
// 5、206 分部分响应
ctx.response.status = 206;
ctx.set(‘Accept-Ranges’, ‘bytes’);
ctx.set(‘Content-Range’, `bytes ${start}-${end ? end : size – 1}/${size}`);
ctx.body = fs.createReadStream(file, { start, end});
});

app.listen(3000, () => console.log(‘partial content server start’));

function getRange(range) {
var match = /bytes=([0-9]*)-([0-9]*)/.exec(range);
const requestRange = {};
if (match) {
if (match[1]) requestRange.start = Number(match[1]);
if (match[2]) requestRange.end = Number(match[2]);
}
return requestRange;
}
代码实现的功能逻辑大致是:

对请求的资源做检查,不存在则响应 404
对于 HEAD 请求,返回资源大小
如果 GET 请求没有告知 range,返回 Content-Length,告知浏览器可以进行分片请求
如果请求设置了 range,则检查 range 是否合法,不合法返回合法的 rangge
一切正常,获取文件 range 范围部分,做流响应

代码很简单,把 Range Requests 协议对应实现一遍就 ok 了,当然这里没有完全实现协议的内容,但已经满足了这里演示的需求。
服务端代码 ok 了,用一个浏览器的 demo 来检验一下。
浏览器例子
现代浏览器基本都实现了 Range Requests,这里用 audio 标签作为例子。
<html>
<head>
<title> 分片流传输 </title>
<script type=”text/javascript”>
function jump() {
const player = document.getElementById(‘musicPlayer’);
// 从 30s 开始播放
player.currentTime = 30;
}
</script>
</head>
<body>
<audio id=”musicPlayer” src=”http:127.0.0.1:3000/source.mp3″ controls></audio>
<button onclick=”jump()”> 切到 30s</button>
</body>
</html>
最终的效果是这样的:

对比两张图,当 html 加载完成,浏览器自动请求资源,此时 header 有 Range: bytes=0-,表示从第 0 byte 开始加载资源;当点击跳到 30s 处播放时,此时 header 变成了 Range: bytes=3145728-。
同样用这个服务端代码,还可以实现一个客户端,模拟一下分包下载。
node 分包下载
这个例子演示了,对一个资源,并发的实现分部分的下载,然后再合并成一个文件。
这里也是用 node 实现:
import request from ‘request’;
import path from ‘path’;
import fs from ‘fs’;

const SINGLE = 1024 * 1000;
const SOURCE = ‘http://127.0.0.1:3000/source.mp3’;

request({
method: ‘HEAD’,
uri: SOURCE,
}, (err, res) => {
if (err) return console.error(err);
const file = path.join(__dirname, ‘./download/source.mp3’);
try {
fs.closeSync(fs.openSync(file, ‘w’));
} catch (err) {
return console.error(err);
}
const size = Number(res.headers[‘content-length’]);
const length = parseInt(size / SINGLE);
for (let i=0; i<length; i++) {
let start = i * SINGLE;
let end = i == length ? (i + 1) * SINGLE – 1 : size – 1;
request({
method: ‘GET’,
uri: SOURCE,
headers: {
‘range’: `bytes=${start}-${end}`
},
}).on(‘response’, (resp) => {
const range = resp.headers[‘content-range’];
const match = /bytes ([0-9]*)-([0-9]*)/.exec(range);
start = match[1];
end = match[2];
}).pipe(fs.createWriteStream(file, {start, end}));
}
});
代码比较简单,就是开启多个 http 请求,并发的下载资源,然后根据响应的 content-range,写到文件的对应位置。
参考文章:

https://www.oschina.net/translate/http-partial-content-in-node-js
https://tools.ietf.org/html/rfc7233

退出移动版