关于html:CVBNET如何将HTML文件转为Word文档

7次阅读

共计 1248 个字符,预计需要花费 4 分钟才能阅读完成。

HTML 是创立网页的规范标记语言,而 HTML 文件则是用于浏览器中展现各种内容的网页文件格式。HTML 文件中通常蕴含有 HTML 标签、层叠样式表、JavaScript 等 Word 文件无奈兼容的内容,因而 HTML 文件通常无奈间接准确转换为 Word 文档,只有非常简单的网页能力达到较好的成果。如果想要将 HTML 文件转为 Word 文档并且保留原始排版布局,就须要更改 HTML 代码,缩小或去除 Word 不反对的内容。本文向大家介绍一个简略的办法将 HTML 文件转换为 Word 文档。

引入 DLL

一、通过 NuGet 装置

  1. 可右键单击解决方案中的依赖项,找到“治理 NuGet 包”,在其中搜寻“FreeSpire.Doc”并增加到援用项中。
  2. 复制以下内容到控制台装置
    PM> Install-Package FreeSpire.Doc

二、手动增加 DLL
可在在 FreeSpire.Doc for .NET 官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到增加援用项,找到 Spire.Doc.dll 并增加到援用项中。
用 Spire.Doc 转换 HTML 文件为 Word 文档的操作非常简略,次要步骤如下:

  • 创立 Document 对象。
  • Document.LoadFormFile() 从磁盘加载 HTML 文件。
  • Document.SaveToFile() 办法将 HTML 文件转为 Word 并保留。

C#

using System;
using Spire.Doc;
using Spire.Doc.Documents;

namespace ConvertHTMLtoWord
{
    internal class Program
    {static void Main(string[] args)
        {
            // 创立 Document 对象
            Document document = new Document();

            // 从磁盘加载 HTML 文件
            document.LoadFromFile(@"D:\testp\ 示例.html");
            

            // 将 HTML 文件转为 Word 并保留
            String result = "HtmltoWord.docx";
            document.SaveToFile(result, FileFormat.Html);
        }
}
}

VB.NET

Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents

Module Program
    Sub Main(args As String())
        ' 创立 Document 对象
        Dim document As New Document()

        ' 从磁盘加载 HTML 文件
        document.LoadFromFile("D:\testp\ 示例.html")

        ' 将 HTML 文件转为 Word 并保留
        Dim result As String = "Html 转 Word.docx"
        document.SaveToFile(result, FileFormat.Docx2013)
    End Sub
End Module

转换成果展现:

以上代码中引入的是收费 Word 库 Free Spire.Doc for .NET 版本中的 dll。

正文完
 0