利用命令行工具pdfimages来提取PDF中的图片

pdfimages是一个非常简便好用的PDF图片提取工具，很简单的一个命令就可以提取出PDF指定页面里的所有图片。但是，
注意：pdfimages只能提取PDF中的图片，和imagemagick的生成图片有本质上的不同！也就是说，如果PDF中的内容不是图片的话，那么就提取不出来。
安装：pdfimage是poppler-utils工具的一个子集，所以需要安装poppler-utils或poppler才能使用。Mac上，直接homebrew：
$ brew install poppler
安装好后就可以用pdfimages命令了，用法如下：
# 提取出来的图片保存为默认的. ppm格式文件 (图片文件巨大，会比pdf文件大23倍左右）
$ pdfimages sample.pdf img_name

# 设定提取的图片保存为png格式 (图片大小是3倍左右）
$ pdfimages -png sample.pdf img_name

# 提取某一页的图片 (last one page)
$ pdfimages -l 3 sample.pdf img_name

# 提取前几页的图片(first number of pages)
$ pdfimages -f 2 sample.pdf img_name
提取的图片，会按照指定的位置和名字生成如img_name-000.jpg, img_name-001.jpg, img_name-002.jpg这样的文件，每一个图片都对应着PDF中原始的图片。
如果没有图片，则不输出。

利用命令行工具pdfimages来提取PDF中的图片

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

利用命令行工具pdfimages来提取PDF中的图片

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复