PDF文件可能在不同的平台上出现各种内容而不扭转其外观,包含文字、图片、表格、动图等在内的内容都能够通过PDF文件进行保留、传输及展现。而HTML文件对于PDF文件展现的内容有比拟好的反对,能够说领有不输PDF文件的内容包容能力,且HTML文件可能进行在线利用,次要用于传输和出现网页内容。因而,如果须要将PDF文件的内容出现于网页中,能够将PDF文件转换成HTML文件。本文将教大家如何编程将PDF文件转换为HTML文件。
本文所介绍的办法须要用到收费Office库Free Spire.PDF for Java。首先须要引入Jar文件。
1. 应用Maven
复制以下代码到我的项目文件夹下的“pom.xml“文件中,即可引入JAR文件。
<repositories> <repository> <id>com.e-iceblue</id> <name>e-iceblue</name> <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url></repository></repositories><dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.pdf.free</artifactId> <version>5.1.0</version> </dependency></dependencies>
2. 手动增加
在Spire.Doc for Java免费版官网下载免费版,解压后,在“Project Structure“中,找到”Modules“,而后在其中的“Dependencies”中,增加解压出的“lib”文件夹下的Spire.Doc.jar文件。
将PDF文件转为HTML文件
转换操作非常简单,仅需三步,具体步骤如下:
- 创立PdfDocument类的对象。
- 用PdfDocument.loadFromFile()办法从磁盘加载PDF文档。
- 用PdfDocument.saveToFile()办法将PDF文件转换为HTML文件并保留。
代码示例:
Java
import com.spire.pdf.*;public class PDFToHTML { public static void main(String[] args) { //创立Document类的对象 PdfDocument pdf = new PdfDocument(); //从磁盘加载PDF文档 pdf.loadFromFile(data/Sample.pdf"); //将PDF文档转换为HTML文件并保留 pdf.saveToFile("output/PDFToHTML.html", FileFormat.HTML); }}
转换成果:
以上援用的是收费的Free Spire.PDF for Java中的JAR文件。