乐趣区

关于.net:NET-Word-文档转换为-XML-文件

XML 是一种次要用于贮存和传输数据的标记语言。XML 与 HTML 类似,都是标记语言,但也有很多不同之处。HTML 次要用于在浏览器中展现网页内容,而 XML 文件则能够用于贮存和传输任意数据。XML 具备简洁、广泛、易用等特点,应用宽泛,尤其是在网络服务器中。如果要将 Word 文档作为 XML 文件进行贮存或传输,能够将 Word 文档转换为 XML 文件。本文将展现 将 Word 文档转换为 XML 文件 的具体操作。

引入 DLL

一、通过 NuGet 装置

可右键单击解决方案中的依赖项,找到“治理 NuGet 包”,在其中搜寻“FreeSpire.Doc”并增加到援用项中。
复制以下内容到控制台装置
PM> Install-Package FreeSpire.Doc

二、手动增加 DLL

可在在 FreeSpire.Doc for .NET 官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到增加援用项,找到 Spire.Doc.dll 并增加到援用项中。

转换操作步骤

用 Spire.Doc 转换 Word 文档为 XML 文档的操作非常简略,次要步骤如下:
• 为 Document 类创建对象。
• 利用 Document.LoadFromFile() 办法加载 Word 文档。
• 利用 Document.SaveToFile() 办法将 Word 文档转换为 XML 文件并保留。
C# 代码

using System;
using Spire.Doc;
using Spire.Doc.Documents;

namespace ConvertHTMLtoWord
{
    internal class Program
    {static void Main(string[] args)
        {
            // 创立 Document 对象
            Document document = new Document();

            // 从磁盘加载 HTML 文件
            document.LoadFromFile(@"D:\testp\ 示例.html");
            

            // 将 HTML 文件转为 Word 并保留
            String result = "HtmltoWord.docx";
            document.SaveToFile(result, FileFormat.Html);
        }
    }
}

VB.NET 代码

Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents

Module Program
    Sub Main(args As String())
        ' 创立 Document 对象
        Dim document As New Document()

        ' 从磁盘加载 HTML 文件
        document.LoadFromFile("D:\testp\ 示例.html")

        ' 将 HTML 文件转为 Word 并保留
        Dim result As String = "Html 转 Word.docx"
        document.SaveToFile(result, FileFormat.Docx2013)
    End Sub
End Module

转换成果:

以上代码中引入的是收费 Word 库 Free Spire.Doc for .NET 版本中的 dll。

退出移动版