原创:扣钉日记(微信公众号ID:codelogs),欢送分享,转载请保留出处。
简介
如果你是后端程序员,我想你肯定见过*.tar.gz
、*.zip
、*.jar
后缀的文件吧,这些都是压缩文件,那这些文件都是怎么生成的,又有哪些要害区别呢?本文将带你一起理解这些文件和配套的操作命令,以及其常常应用的场景。
tar与gzip
Linux上最常见的压缩文件就是*.tar.gz
了,各种开源软件常以这种格局公布源码或程序,所以作为一名后端开发,还是很有必要理解一下的。
首先,能够发现这个文件后缀名有两段,即.tar
和.gz
,取这个名称也是有起因的,因为它的制作过程就分为两个局部,如下:
应用tar将目录打包成单个
.tar
文件# 将applogs目录打包为applogs.tar文件# 其中-c代表打包、-f指定打包文件名$ tar -cf applogs.tar applogs/# 能够发现,打包文件大小与目录占用大小差不多,因为tar仅仅是把目录中文件拼成单个文件,默认并不压缩 $ du -sh applogs/ applogs.tar177M applogs/175M applogs.tar
应用gzip将
.tar
文件压缩为.gz
文件# 应用gzip压缩,会生成applogs.tar.gz文件$ gzip -k applogs.tar# 能够发现压缩后文件体积显著变小$ du -sh applogs.tar applogs.tar.gz175M applogs.tar8.8M applogs.tar.gz
这就是
*.tar.gz
文件的制作过程,其实这两步应用tar命令能够简化为一步,如下:# 打包并压缩,其中-z代表打包后再应用gzip压缩$ tar -czf applogs.tar.gz applogs/# 解压到当前目录$ tar -xzf applogs.tar.gz -C ./
压缩日志文件
另外,因为日志文件内容个别都有很高反复率,这导致Linux上常常会将后端系统产生的历史日志文件压缩后存储起来,这样能够大幅减低磁盘空间占用。
基于这种状况,Linux上又诞生了一批查看压缩日志文件的命令,如zcat、zgrep、zless等,如下:
# 主动解压文件,并将其中文件内容输入$ zcat applogs.tar.gz# 主动解压文件,并在其中搜寻,用法和grep相似$ zgrep -a 'error' applogs.tar.gz
这比傻乎乎地先解压文件,再在文件中搜寻要高效多了。
tar与其它压缩算法
另外,除了gzip外,tar其实也能够搭配其它压缩算法,像bzip2、xz等等,如下:
-j, --bzip2 filter the archive through bzip2 -J, --xz filter the archive through xz --lzip filter the archive through lzip --lzma filter the archive through xz --lzop filter the archive through lzop -z, --gzip, --gunzip, --ungzip filter the archive through gzip --zstd filter the archive through zstd -Z, --compress, --uncompress filter the archive through compress
zip与jar
zip同样是一种常见的压缩文件格式,后缀是*.zip
,与下面tar、gzip不同的是,zip将打包与压缩两个过程交融在一起了,在Linux下对应的操作命令是zip
与unzip
,如下:
# 创立zip压缩文件$ zip -r applogs.zip applogs/# 查看zip压缩文件中有哪些文件$ unzip -l applogs.zipArchive: applogs.zip Length Date Time Name--------- ---------- ----- ---- 0 2022-09-17 12:58 applogs/ 99166 2022-09-16 18:20 applogs/demo.2022-09-16.0.log 13177092 2022-09-17 13:37 applogs/demo.2022-09-17.0.log 948 2022-08-09 15:08 applogs/demo.log...--------- -------203039002 140 files# 解压zip文件,-d指定解压目录$ unzip applogs.zip -d ./
与gzip相似的是,zip也配套了一批不便特定场景应用的命令工具,如zipinfo、zipgrep等,如下:
# zipinfo查看zip文件蕴含哪些文件$ zipinfo applogs.zipArchive: applogs.zipZip file size: 9573195 bytes, number of entries: 140drwxrwxrwx 3.0 unx 0 bx stor 22-Sep-17 12:58 applogs/-rwxrwxrwx 3.0 unx 99166 tx defN 22-Sep-16 18:20 applogs/demo.2022-09-16.0.log-rwxrwxrwx 3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log-rwxrwxrwx 3.0 unx 948 tx defN 22-Aug-09 15:08 applogs/demo.log...140 files, 203039002 bytes uncompressed, 9546235 bytes compressed: 95.3%# zipgrep主动解压文件,并在其中搜寻,用法和grep相似$ zipgrep 'error' applogs.zip
查看jar文件
目前,绝大多数java我的项目都是基于spingboot的,家喻户晓,spingboot会将我的项目打包成单个jar文件来部署,但其实jar文件实质上就是zip格局,它相比zip文件只是多了一个META-INF/MANIFEST.MF
文件而已,如下:
$ unzip -p app.jar META-INF/MANIFEST.MFManifest-Version: 1.0Spring-Boot-Classpath-Index: BOOT-INF/classpath.idxImplementation-Version: 0.0.1-SNAPSHOTSpring-Boot-Layers-Index: BOOT-INF/layers.idxStart-Class: com.example.demo.DemoApplicationSpring-Boot-Classes: BOOT-INF/classes/Spring-Boot-Lib: BOOT-INF/lib/Build-Jdk-Spec: 1.8Spring-Boot-Version: 2.4.0Created-By: Maven Jar Plugin 3.2.0Main-Class: org.springframework.boot.loader.JarLauncher
如上所示,MANIFEST.MF
文件指定了jar包的Main-Class
,这样当执行java -jar app.jar
时,java就晓得去哪个类找main办法了,而spingboot打包的jar,无非就是将启动类换成了本人的而已。
而很多时候,咱们须要确认下jar文件外面的内容,比方我想看一下app.jar里被spingboot内嵌的tomcat的线程池配置大小,可如下查看:
$ zipgrep 'max-thread' app.jar BOOT-INF/classes/application.yml: max-threads: 500
这可比jdk自带的jar命令不便多了,如果你是java开发同学,这个命令应该成为你开发工具箱中的一员。
总结
ok,压缩文件与命令介绍得差不多了,简略总结一下:
- tar、gzip:用于打包或解压
*.tar.gz
文件的命令,尽管它们是两个命令,但简直都是一起应用的。 - zip、unzip:用于打包或解压
*.zip
文件的命令,值得注意的是,它们同样可解决*.jar
文件,且在搜寻场景中,应用zipgrep更不便。
less命令其实能够间接关上这些压缩文件,它甚至能够关上png、pdf等狭义上的压缩文件!
另外,Linux平台上其实还有一些其它的压缩命令,如bzip2、xz、7z、rar等,就不一一介绍了,感兴趣可查看Linux man文档。
往期内容
密码学入门
接口偶然超时,竟又是JVM进展的锅!
耗时几个月,终于找到了JVM进展十几秒的起因
mysql的timestamp会存在时区问题?
真正了解可反复读事务隔离级别
字符编码解惑