下载文件并使用JavaScript将其压缩在浏览器中

与其生成zip文件并从您的服务器进行传输，不如下载数据并将其压缩在浏览器中呢？

我最近从事一个副我的项目，该我的项目可依据用户的申请生成报告。对于每个申请，咱们的后端将生成一个报告，将其上传到Amazon S3存储，而后将其URL返回给客户端。因为生成报告须要一些工夫，因而将存储输入文件，并且服务器将通过申请参数来缓存其URL。如果用户订购雷同的商品，则后端将返回现有文件的URL。

几天前，我有一个新要求，我须要下载一个蕴含数百个报告的zip文件，而不是单个文件。我想到的第一个解决方案是：

在服务器上筹备压缩文件
上传到Amazon S3存储
给客户端提供下载URL

然而此解决方案有一些毛病：

生成zip文件的逻辑非常复杂。我须要思考为每个申请生成所有文件，或者在重用现有文件和生成新文件之间进行组合。两种办法仿佛都很简单。他们将破费一些工夫来解决，并且稍后须要大量的编码，测试和保护。
它无奈利用我曾经构建的性能。只管zip文件是不同的报告集，但很可能大多数单个报告都是由较早的申请生成的。因而，尽管zip文件自身不太可能可重用，但单个文件却能够重用。应用上述办法，我须要始终重做整个过程，这并不是很无效。
生成一个zip文件须要很长时间。因为我的后端是一个单线程过程，因而此操作可能会阻止其余申请一段时间，并且在此期间可能会超时。
在客户端跟踪流程十分艰难，我喜爱在网站上搁置进度栏。如果一切都在后端解决，我须要找到其余办法向前端报告状态。这并不容易。
我想节俭基础设施的老本。如果咱们能够将一些计算转移到前端并升高基础架构的老本，那就太好了。我的客户不介意他们再等几秒钟，还是在笔记本电脑上破费额定的MB RAM。

我想出的最终解决方案是：将所有文件下载到浏览器中，而后将其压缩。在这篇文章中，我将介绍如何做。

免责申明：在这篇文章中，我假如你曾经具备无关Javascript和Promise的基本知识。如果你没有，我倡议你先理解他们，而后再回到这里:)

下载单个文件

在利用新解决方案之前，我的零碎容许下载一个报告文件。有很多办法能够做到这一点，后端能够间接通过HTTP申请响应原始文件的内容，也能够将文件上传到另一个存储设备并返回文件URL。我抉择第二种办法，因为我想缓存所有生成的文件。

一旦有了文件URL，在客户端上的工作就非常简单：在新选项卡中关上此URL。浏览器将实现剩下的工作以下载文件。

const downloadViaBrowser = url => {
    window.open(url, ‘_blank’);
}

下载多个文件并存储在内存中

当下载和压缩多个文件时，咱们不能再应用下面的简略办法。

如果一个JS脚本试图同时关上许多链接，浏览器会狐疑它是否是一个平安威逼，并正告用户阻止这些行为。尽管用户能够确认持续，但这不是一个好的体验
你无法控制下载的文件，浏览器管理文件内容和地位

解决此问题的另一种办法是应用 fetch 来下载文件并将数据作为Blob存储在内存中。而后，咱们能够将其写入文件或将这些Blob数据合并为zip文件。

const download = url => {
  return fetch(url).then(resp => resp.blob());
};

这个函数返回一个被解析为blob的promise。咱们能够联合 Promise.all() 来下载多个文件。Promise.all() 将一次性实现所有的promise，如果所有的子promise都被解析，或者其中一个Promise呈现谬误，则进行解析。

const downloadMany = urls => {
  return Promise.all(urls.map(url => download(url))
}

按X文件组下载

然而，如果咱们须要一次下载大量文件怎么办？假如有1000个文件？应用 Promise.all() 可能不再是一个好主见，你的代码将一次发送一千个申请。这种办法有很多问题：

操作系统和浏览器反对的并发连接数是无限的。因而，浏览器一次只能解决几个申请。其余申请放入队列，并且超时计数。后果是，你的大多数申请在发送之前都会超时。
一次发送大量申请也会使后端过载

我思考过的解决方案是将文件分成多个组。假如我有1000个文件可供下载。而不是通过 Promise.all() 立刻开始一次下载所有文件，我将每次下载5个文件。在实现这5个之后，我将开始另一个包，我总共会下载250个包。

要实现这个性能，咱们能够做一个自定义逻辑。或者我倡议一个更简略的办法，就是利用第三方库bluebirdjs。该库实现了许多有用的Promise函数。在这个用例中，我将应用 Promise.map()。留神这里的Promise当初是库提供的自定义Promise，而不是内置的Promise。

import Promise from 'bluebird';
const downloadByGroup = (urls, files_per_group=5) => {
  return Promise.map(
    urls, 
    async url => {
      return await download(url);
    },
    {concurrency: files_per_group}
  );
}

通过下面的实现，该函数将接管一个URL数组并开始下载所有URL，每次都具备最大 files_per_group。该函数返回一个Promise，它将在下载所有URL时解析，并在其中任何一个失败时回绝。

创立zip文件

当初我曾经把所有的内容都下载到内存中了。正如我下面提到的，下载的内容被存储为Blob。下一步是应用这些Blob数据创立一个压缩文件。

import JsZip from 'jszip';
import FileSaver from 'file-saver';
const exportZip = blobs => {
  const zip = JsZip();
  blobs.forEach((blob, i) => {
    zip.file(`file-${i}.csv`, blob);
  });
  zip.generateAsync({type: 'blob'}).then(zipFile => {
    const currentDate = new Date().getTime();
    const fileName = `combined-${currentDate}.zip`;
    return FileSaver.saveAs(zipFile, fileName);
  });
}

最终代码

让咱们在这里实现我为此实现的所有代码。

import Promise from 'bluebird';
import JsZip from 'jszip';
import FileSaver from 'file-saver';
const download = url => {
  return fetch(url).then(resp => resp.blob());
};
const downloadByGroup = (urls, files_per_group=5) => {
  return Promise.map(
    urls, 
    async url => {
      return await download(url);
    },
    {concurrency: files_per_group}
  );
}
const exportZip = blobs => {
  const zip = JsZip();
  blobs.forEach((blob, i) => {
    zip.file(`file-${i}.csv`, blob);
  });
  zip.generateAsync({type: 'blob'}).then(zipFile => {
    const currentDate = new Date().getTime();
    const fileName = `combined-${currentDate}.zip`;
    return FileSaver.saveAs(zipFile, fileName);
  });
}
const downloadAndZip = urls => {
  return downloadByGroup(urls, 5).then(exportZip);
}

总结

利用客户端的性能有时对于缩小后端的工作量和复杂性十分有用。

不要一次发送大量的申请。你会在前端和后端都遇到麻烦。相同，将作品分成小块。

介绍一些第三方库bluebird，jszip和file-saver。他们为我工作得很好，也可能对您有帮忙：)

本文首发于公众号 《前端全栈开发者》 ID：by-zhangbing-dev，第一工夫浏览最新文章，会优先两天发表新文章。关注后私信回复：大礼包，送某网精品视频课程网盘材料，准能为你节俭不少钱！

下载文件并使用JavaScript将其压缩在浏览器中

下载单个文件

下载多个文件并存储在内存中

按X文件组下载

创立zip文件

最终代码

总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

下载文件并使用JavaScript将其压缩在浏览器中

下载单个文件

下载多个文件并存储在内存中

按X文件组下载

创立zip文件

最终代码

总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复