尽管 Word DOCX 格局是创立文本文档的首选,但当咱们进入基于 Web 的畛域时,它可能是不够的。

正如咱们在之前的文章中所探讨的,尽管 Word DOCX 格局是创立文本文档的首选,但当咱们进入基于 Web 的畛域时,它可能是不够的。在思考格式化在线文档时,超文本标记语言 (HTML) 成为应用程序和网站的显著赢家之一。这种动静语言利用设置提醒或元素来构建能够传输到浏览器并作为可读网页出现给最终用户的文档。HTML 的构造甚至容许集成图像、交互式表单和其余更难用简略的 Word 文档创立的对象。

Word DOCX 格局实际上基于不同的标记语言 XML(可扩大标记语言)。微软在 2000 年代中期将其最受欢迎的程序——Word、Excel 和 PowerPoint——转变为凋谢规范、基于 XML 的格局。此举旨在改良文件大小、图像压缩和安全性,并放弃当先于竞争对手的劣势。尽管因为与其余平台兼容,一些用户依然更喜爱旧的 DOC 版本,但 DOCX 格局通常是以后文字处理我的项目的更好抉择。

因为每种格局的细微差别,如果您尝试从 Word 文档中起草 HTML 代码,则与文件格式相干的附加格局和款式可能会妨碍其应用。除此之外,DOCX 设计的复杂性使得解析信息成为一项令人不快的工作。在本教程中,咱们将演示如何应用 Java 中的 API 将任何 DOCX 文件主动转换为 HTML,从而即时改良兼容性和产品质量。

首先,咱们将通过在 pom.xml 中增加对存储库的援用来装置 Maven:

<repositories>    <repository>        <id>jitpack.io</id>        <url>https://jitpack.io</url>    </repository></repositories>

而后,咱们能够在 pom.xml 中增加对依赖项的援用:

<dependencies><dependency>    <groupId>com.github.Cloudmersive</groupId>    <artifactId>Cloudmersive.APIClient.Java</artifactId>    <version>v3.90</version></dependency></dependencies>

装置实现后,咱们筹备将导入增加到咱们的控制器顶部并应用以下代码调用转换函数:

// Import classes://import com.cloudmersive.client.invoker.ApiClient;//import com.cloudmersive.client.invoker.ApiException;//import com.cloudmersive.client.invoker.Configuration;//import com.cloudmersive.client.invoker.auth.*;//import com.cloudmersive.client.ConvertDocumentApi;ApiClient defaultClient = Configuration.getDefaultApiClient();// Configure API key authorization: ApikeyApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");Apikey.setApiKey("YOUR API KEY");// Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null)//Apikey.setApiKeyPrefix("Token");ConvertDocumentApi apiInstance = new ConvertDocumentApi();File inputFile = new File("/path/to/inputfile"); // File | Input file to perform the operation on.try {    byte[] result = apiInstance.convertDocumentDocxToHtml(inputFile);    System.out.println(result);} catch (ApiException e) {    System.err.println("Exception when calling ConvertDocumentApi#convertDocumentDocxToHtml");    e.printStackTrace();}

为确保流程正确运行,您须要输出几个参数:

文件 - 要对其执行操作的 DOCX 文件。
API 密钥 – 您的集体 API 密钥。如果您须要获取API key,您能够拜访Cloudmersive网站注册一个收费账号;这在咱们的 API 库中每月提供 800 次调用。
该过程将返回一个 HTML 文档,该文档可轻松用于实用的网站和/或应用程序。

参考:《2020最新Java根底精讲视频教程和学习路线!》