关于tar:targzipzipjar是什么怎么查看

26次阅读

共计 3577 个字符,预计需要花费 9 分钟才能阅读完成。

原创:扣钉日记(微信公众号 ID:codelogs),欢送分享,转载请保留出处。

简介

如果你是后端程序员,我想你肯定见过 *.tar.gz*.zip*.jar 后缀的文件吧,这些都是压缩文件,那这些文件都是怎么生成的,又有哪些要害区别呢?本文将带你一起理解这些文件和配套的操作命令,以及其常常应用的场景。

tar 与 gzip

Linux 上最常见的压缩文件就是 *.tar.gz 了,各种开源软件常以这种格局公布源码或程序,所以作为一名后端开发,还是很有必要理解一下的。

首先,能够发现这个文件后缀名有两段,即 .tar.gz,取这个名称也是有起因的,因为它的制作过程就分为两个局部,如下:

  1. 应用 tar 将目录打包成单个 .tar 文件

    # 将 applogs 目录打包为 applogs.tar 文件
    # 其中 - c 代表打包、- f 指定打包文件名
    $ tar -cf applogs.tar applogs/
    
    # 能够发现,打包文件大小与目录占用大小差不多,因为 tar 仅仅是把目录中文件拼成单个文件,默认并不压缩  
    $ du -sh applogs/ applogs.tar
    177M    applogs/
    175M    applogs.tar
  2. 应用 gzip 将 .tar 文件压缩为 .gz 文件

    # 应用 gzip 压缩,会生成 applogs.tar.gz 文件
    $ gzip -k applogs.tar
    
    # 能够发现压缩后文件体积显著变小
    $ du -sh applogs.tar applogs.tar.gz
    175M    applogs.tar
    8.8M    applogs.tar.gz

    这就是 *.tar.gz 文件的制作过程,其实这两步应用 tar 命令能够简化为一步,如下:

    # 打包并压缩,其中 - z 代表打包后再应用 gzip 压缩
    $ tar -czf applogs.tar.gz applogs/
    
    # 解压到当前目录
    $ tar -xzf applogs.tar.gz -C ./

压缩日志文件
另外,因为日志文件内容个别都有很高反复率,这导致 Linux 上常常会将后端系统产生的历史日志文件压缩后存储起来,这样能够大幅减低磁盘空间占用。

基于这种状况,Linux 上又诞生了一批查看压缩日志文件的命令,如 zcat、zgrep、zless 等,如下:

# 主动解压文件,并将其中文件内容输入
$ zcat applogs.tar.gz

# 主动解压文件,并在其中搜寻,用法和 grep 相似
$ zgrep -a 'error' applogs.tar.gz

这比傻乎乎地先解压文件,再在文件中搜寻要高效多了。

tar 与其它压缩算法
另外,除了 gzip 外,tar 其实也能够搭配其它压缩算法,像 bzip2、xz 等等,如下:

  -j, --bzip2                filter the archive through bzip2
  -J, --xz                   filter the archive through xz
      --lzip                 filter the archive through lzip
      --lzma                 filter the archive through xz
      --lzop                 filter the archive through lzop
  -z, --gzip, --gunzip, --ungzip   filter the archive through gzip
      --zstd                 filter the archive through zstd
  -Z, --compress, --uncompress   filter the archive through compress

zip 与 jar

zip 同样是一种常见的压缩文件格式,后缀是 *.zip,与下面 tar、gzip 不同的是,zip 将打包与压缩两个过程交融在一起了,在 Linux 下对应的操作命令是zipunzip,如下:

# 创立 zip 压缩文件
$ zip -r applogs.zip applogs/

# 查看 zip 压缩文件中有哪些文件
$ unzip -l applogs.zip
Archive:  applogs.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  2022-09-17 12:58   applogs/
    99166  2022-09-16 18:20   applogs/demo.2022-09-16.0.log
 13177092  2022-09-17 13:37   applogs/demo.2022-09-17.0.log
      948  2022-08-09 15:08   applogs/demo.log
...
---------                     -------
203039002                     140 files

# 解压 zip 文件,- d 指定解压目录
$ unzip applogs.zip -d ./

与 gzip 相似的是,zip 也配套了一批不便特定场景应用的命令工具,如 zipinfo、zipgrep 等,如下:

# zipinfo 查看 zip 文件蕴含哪些文件
$ zipinfo applogs.zip
Archive:  applogs.zip
Zip file size: 9573195 bytes, number of entries: 140
drwxrwxrwx  3.0 unx        0 bx stor 22-Sep-17 12:58 applogs/
-rwxrwxrwx  3.0 unx    99166 tx defN 22-Sep-16 18:20 applogs/demo.2022-09-16.0.log
-rwxrwxrwx  3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log
-rwxrwxrwx  3.0 unx      948 tx defN 22-Aug-09 15:08 applogs/demo.log
...
140 files, 203039002 bytes uncompressed, 9546235 bytes compressed:  95.3%

# zipgrep 主动解压文件,并在其中搜寻,用法和 grep 相似
$ zipgrep 'error' applogs.zip

查看 jar 文件
目前,绝大多数 java 我的项目都是基于 spingboot 的,家喻户晓,spingboot 会将我的项目打包成单个 jar 文件来部署,但其实 jar 文件实质上就是 zip 格局,它相比 zip 文件只是多了一个 META-INF/MANIFEST.MF 文件而已,如下:

$ unzip -p app.jar META-INF/MANIFEST.MF
Manifest-Version: 1.0
Spring-Boot-Classpath-Index: BOOT-INF/classpath.idx
Implementation-Version: 0.0.1-SNAPSHOT
Spring-Boot-Layers-Index: BOOT-INF/layers.idx
Start-Class: com.example.demo.DemoApplication
Spring-Boot-Classes: BOOT-INF/classes/
Spring-Boot-Lib: BOOT-INF/lib/
Build-Jdk-Spec: 1.8
Spring-Boot-Version: 2.4.0
Created-By: Maven Jar Plugin 3.2.0
Main-Class: org.springframework.boot.loader.JarLauncher

如上所示,MANIFEST.MF文件指定了 jar 包的 Main-Class,这样当执行java -jar app.jar 时,java 就晓得去哪个类找 main 办法了,而 spingboot 打包的 jar,无非就是将启动类换成了本人的而已。

而很多时候,咱们须要确认下 jar 文件外面的内容,比方我想看一下 app.jar 里被 spingboot 内嵌的 tomcat 的线程池配置大小,可如下查看:

$ zipgrep 'max-thread' app.jar 
BOOT-INF/classes/application.yml:    max-threads: 500

这可比 jdk 自带的 jar 命令不便多了,如果你是 java 开发同学,这个命令应该成为你开发工具箱中的一员。

总结

ok,压缩文件与命令介绍得差不多了,简略总结一下:

  1. tar、gzip:用于打包或解压 *.tar.gz 文件的命令,尽管它们是两个命令,但简直都是一起应用的。
  2. zip、unzip:用于打包或解压 *.zip 文件的命令,值得注意的是,它们同样可解决 *.jar 文件,且在搜寻场景中,应用 zipgrep 更不便。

less 命令其实能够间接关上这些压缩文件,它甚至能够关上 png、pdf 等狭义上的压缩文件!

另外,Linux 平台上其实还有一些其它的压缩命令,如 bzip2、xz、7z、rar 等,就不一一介绍了,感兴趣可查看 Linux man 文档。

往期内容

密码学入门
接口偶然超时,竟又是 JVM 进展的锅!
耗时几个月,终于找到了 JVM 进展十几秒的起因
mysql 的 timestamp 会存在时区问题?
真正了解可反复读事务隔离级别
字符编码解惑

正文完
 0