HTML是创立网页的规范标记语言,而HTML文件则是用于浏览器中展现各种内容的网页文件格式。HTML文件中通常蕴含有HTML标签、层叠样式表、JavaScript等Word文件无奈兼容的内容,因而HTML文件通常无奈间接准确转换为Word文档,只有非常简单的网页能力达到较好的成果。如果想要将HTML文件转为Word文档并且保留原始排版布局,就须要更改HTML代码,缩小或去除Word不反对的内容。本文向大家介绍一个简略的办法将HTML文件转换为Word文档。

引入DLL

一、 通过NuGet装置

  1. 可右键单击解决方案中的依赖项,找到“治理NuGet包”,在其中搜寻“FreeSpire.Doc”并增加到援用项中。
  2. 复制以下内容到控制台装置
    PM> Install-Package FreeSpire.Doc

二、 手动增加DLL
可在在FreeSpire.Doc for .NET官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到增加援用项,找到Spire.Doc.dll并增加到援用项中。
用Spire.Doc转换HTML文件为Word文档的操作非常简略,次要步骤如下:

  • 创立 Document 对象。
  • Document.LoadFormFile() 从磁盘加载 HTML 文件。
  • Document.SaveToFile() 办法将HTML文件转为Word并保留。

C#

using System;using Spire.Doc;using Spire.Doc.Documents;namespace ConvertHTMLtoWord{    internal class Program    {        static void Main(string[] args)        {            //创立 Document 对象            Document document = new Document();            //从磁盘加载 HTML 文件            document.LoadFromFile(@"D:\testp\示例.html");                        //将 HTML 文件转为 Word 并保留            String result = "HtmltoWord.docx";            document.SaveToFile(result, FileFormat.Html);        }}}

VB.NET

Imports SystemImports Spire.DocImports Spire.Doc.DocumentsModule Program    Sub Main(args As String())        '创立 Document 对象        Dim document As New Document()        '从磁盘加载 HTML 文件        document.LoadFromFile("D:\testp\示例.html")        '将 HTML 文件转为 Word 并保留        Dim result As String = "Html转Word.docx"        document.SaveToFile(result, FileFormat.Docx2013)    End SubEnd Module

转换成果展现:

以上代码中引入的是收费Word库Free Spire.Doc for .NET版本中的dll。