乐趣区

关于linux:通过12个实例掌握-linux-wget-命令的使用

Linux 下的 wget 命令用于通过 HTTP、HTTPS 和 FTP 协定从 web 上下载文件。换句话说,咱们能够说 wget 是 Linux 零碎的非交互式命令行下载工具。它还反对通过 HTTP 代理下载文件。

这里的非交互式意味着它能够在后盾工作,而用户没有登录。当咱们进行 Linux 发行版的最小装置时,并没有装置 wget 命令,运行如下命令装置:

$ sudo yum install -y wget     // CentOS 7 / RHEL 7
$ sudo dnf install -y wget     // CentOS 8/ RHEL 8/ Rocky Linux 8
$ sudo apt install -y wget     // Ubuntu / Debian
$ sudo pacman -S wget          // Arch Linux
$ sudo zypper install wget     // OpenSUSE

在本教程中,咱们将介绍 12 个有用的 wget 命令示例,这些示例将帮忙您像业余人员一样应用 wget 命令。

1) 下载单个文件

要下载文件,只需键入 wget 命令后跟文件的绝对路径,示例如下

$ wget https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.4-x86_64-minimal.iso

备注: 该命令将在用户当前工作目录下载 Rocky Linux 8 ISO 文件

2) 断点续传 (-c)

在某些状况下,咱们下载一个大文件,但在两头网络被断开连接,应用 wget 命令中的 -c 选项,咱们能够从断开连接的中央持续下载。示例如下

$ wget -c https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.4-x86_64-minimal.iso

3) 在后盾下载文件 (-b)

应用 wget 命令中的 -b 选项在后盾下载文件。当文件太大而你想应用终端执行其余工作时,这个选项十分有用。

$ wget -b https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.4-x86_64-dvd1.iso
Continuing in background, pid 4505.
Output will be written to‘wget-log’.

As we can see above that downloading progress is capture in‘wget-log’file in user’s current directory. Use tail command to view status of download.

下载进度被记录在当前目录的 wget-log 文件中,应用 tail 命令查看下载状态。

$ tail -f wget-log
2300K .......... .......... .......... .......... .......... 0% 48.1K 18h5m
2350K .......... .......... .......... .......... .......... 0% 53.7K 18h9m
2400K .......... .......... .......... .......... .......... 0% 52.1K 18h13m
2450K .......... .......... .......... .......... .......... 0% 58.3K 18h14m
2500K .......... .......... .......... .......... .......... 0% 63.6K 18h14m
2550K .......... .......... .......... .......... .......... 0% 63.4K 18h13m
2600K .......... .......... .......... .......... .......... 0% 72.8K 18h10m
2650K .......... .......... .......... .......... .......... 0% 59.8K 18h11m
2700K .......... .......... .......... .......... .......... 0% 52.8K 18h14m
2750K .......... .......... .......... .......... .......... 0% 58.4K 18h15m
2800K .......... .......... .......... .......... .......... 0% 58.2K 18h16m
2850K .......... .......... .......... .......... .......... 0% 52.2K 18h20m

4) 限度下载速度

默认状况下,wget 命令尝试应用全带宽,但某些状况下,您正在应用共享互联网,所以如果您尝试应用 wget 下载大文件,这可能会减慢其余用户的网络连接。如果您应用 –limit-rate 选项限度下载速度,则能够防止这种状况。

$ wget --limit-rate=100k https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.4-x86_64-dvd1.iso

5) 下载多个文件

如果您想应用 wget 命令下载多个文件,那么首先创立一个文本文件,并在该文本文件中增加所有下载地址,示例如下

$ cat download-list.txt
https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.4-x86_64-dvd1.iso
https://releases.ubuntu.com/20.04.2.0/ubuntu-20.04.2.0-desktop-amd64.iso
https://download.opensuse.org/distribution/leap/15.3/iso/openSUSE-Leap-15.3-DVD-x86_64-Current.iso

运行如下命令,wget 命令将开始按程序下载 ISO 文件

$ wget -i download-list.txt

6) 减少重试次数

默认状况下,wget 命令会重试 20 次,能够应用 –tries 选项来减少重试次数。

$ wget --tries=75 https://download.opensuse.org/distribution/leap/15.3/iso/openSUSE-Leap-15.3-DVD-x86_64-Current.iso

7) 重定向输入到日志文件

咱们能够应用 -o 选项将 wget 命令输入重定向到日志文件,示例如下

$ wget -o download.log https://releases.ubuntu.com/20.04.2.0/ubuntu-20.04.2.0-desktop-amd64.iso

8) 下载整站

应用 wget 命令,咱们能够下载残缺的网站以供本地查看,语法如下

$ wget --mirror -p --convert-links -P ./<Local-Folder> website-URL

选项如下

  • –mirror : 关上适宜镜像的选项
  • -p : 下载正确显示给定 HTML 页面所需的所有文件
  • –convert-links : 转换文档中的链接以供本地查看
  • -P ./Local-Folder : 将所有文件和目录保留到指定目录下

9) 下载时回绝文件类型

当下载整站时,咱们能够应用 –reject 选项强制不下载图片。

$ wget --reject=png <Website-To-Be-Downloaded>

10) 设置下载配额

应用 -Q 选项设置下载配额,当下载大小超标时,强制 wget 命令进行下载。

$ wget -Q10m -i download-list.txt

留神 :配额永远不会影响下载单个文件,即便在命令行上指定了几个 URL,也是如此。仅在递归检索或从输出文件中检索配额能力起作用,因而 wget -Q10m -i download-list.txt 在超过配额时下载将被停止。

11) 从密码保护网站下载文件

语法如下

$ wget --ftp-user=<user-name> --ftp-password=<password> Download-URL
or 
$ wget --user <user_name> --password <password> http://<url-path>/file_to_be_downloaded

Another way to specify username and password is in the URL itself.

也能够在 URL 中指定用户名和明码

为了避免明码被看到,将它们存储在 .wgetrc 或 .netrc 文件中,并确保用 chmod 爱护这些文件不受其余用户的影响。如果明码真的很重要,不要把它们放在这些文件中,或者在 wget 开始下载后编辑文件并删除它们。

12) 跳过证书查看下载文件

在某些状况下,咱们心愿从 https 端口下载文件,并心愿跳过证书查看,因而能够应用 wget 命令中的 no-check-certificate 选项来实现

$ wget https://about.gitlab.com/ --no-check-certificate

应用 wget 命令从 https 门户下载 Oracle Java,跳过证书查看

$ wget --header "Cookie: oraclelicense=accept-securebackup-cookie" https://download.oracle.com/otn-pub/java/jdk/12.0.1+12/69cfe15208a647278a19ef0990eea691/jdk-12.0.1_linux-x64_bin.rpm --no-check-certificate

通过代理下载文件

有一些状况下,咱们的零碎运行在代理服务器之后,所以在这种状况下,咱们首先须要设置代理,而后咱们能够应用 wget 命令从互联网下载文件。要在命令行上设置代理,请应用以下变量和 export 命令

$ export http_proxy=http://<Your-Proxy-IP>:<Proxy-Port>
$ export https_proxy=http://<Your-Proxy-IP>:<Proxy-Port>
$ export ftp_proxy=http://<Your-Proxy-IP>:<Proxy-Port>

如果代理工作须要用户名和明码,则应用以下办法

$ export http_proxy=http://<user-name>:<password>@<Your-Proxy-IP>:<Proxy-Port>
$ export https_proxy=http://<user-name>:<password>@<Your-Proxy-IP>:<Proxy-Port>
$ export ftp_proxy=http://<user-name>:<password>@<Your-Proxy-IP>:<Proxy-Port>

应用单个 wget 命令下载并提取 tar 文件

Let’s suppose we want to download latest version of WordPress tar
file and want to extract it under specific folder like /var/www/html,
so to accomplish this task using below wget command,

假如咱们要下载最新版本的 WordPress tar 文件并心愿在特定文件夹中提取它,例如 /var/www/html,能够应用以下命令来实现此工作

# wget -q -O - http://wordpress.org/latest.tar.gz | tar -xzf - --strip-components=1 -C /var/www/html

我的开源我的项目

  • course-tencent-cloud(酷瓜云课堂 – gitee 仓库)
  • course-tencent-cloud(酷瓜云课堂 – github 仓库)
退出移动版