XML 是一种次要用于贮存和传输数据的标记语言。 XML 与 HTML 类似,都是标记语言,但也有很多不同之处。 HTML 次要用于在浏览器中展现网页内容,而XML 文件则能够用于贮存和传输任意数据。 XML 具备简洁、广泛、易用等特点,应用宽泛,尤其是在网络服务器中。如果要将Word文档作为 XML 文件进行贮存或传输,能够将 Word 文档转换为 XML 文件。本文将展现将 Word 文档转换为 XML 文件的具体操作。
引入DLL
一、 通过NuGet装置
可右键单击解决方案中的依赖项,找到“治理NuGet包”,在其中搜寻“FreeSpire.Doc”并增加到援用项中。
复制以下内容到控制台装置
PM> Install-Package FreeSpire.Doc
二、 手动增加DLL
可在在FreeSpire.Doc for .NET官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到增加援用项,找到Spire.Doc.dll并增加到援用项中。
转换操作步骤
用Spire.Doc转换 Word 文档为 XML 文档的操作非常简略,次要步骤如下:
• 为 Document 类创建对象。
• 利用 Document.LoadFromFile() 办法加载 Word 文档。
• 利用 Document.SaveToFile() 办法将 Word 文档转换为 XML 文件并保留。
C# 代码
using System;using Spire.Doc;using Spire.Doc.Documents;namespace ConvertHTMLtoWord{ internal class Program { static void Main(string[] args) { //创立 Document 对象 Document document = new Document(); //从磁盘加载 HTML 文件 document.LoadFromFile(@"D:\testp\示例.html"); //将 HTML 文件转为 Word 并保留 String result = "HtmltoWord.docx"; document.SaveToFile(result, FileFormat.Html); } }}
VB.NET 代码
Imports SystemImports Spire.DocImports Spire.Doc.DocumentsModule Program Sub Main(args As String()) '创立 Document 对象 Dim document As New Document() '从磁盘加载 HTML 文件 document.LoadFromFile("D:\testp\示例.html") '将 HTML 文件转为 Word 并保留 Dim result As String = "Html转Word.docx" document.SaveToFile(result, FileFormat.Docx2013) End SubEnd Module
转换成果:
以上代码中引入的是收费Word库Free Spire.Doc for .NET版本中的dll。