关于后端:Go如何自动解压缩包如何读取docxdoc文件内容

48次阅读

共计 3553 个字符,预计需要花费 9 分钟才能阅读完成。

在开发过程中,咱们经常须要解决压缩包和文档文件。本文将介绍如何应用 Go 语言主动解压缩包和读取 docx/doc 文件。

一、解压缩包

压缩包格局

常见的压缩包格局有 zip、gzip、bzip2 等。在 Go 语言中,应用 archive/zip、compress/gzip、compress/bzip2 包能够轻松地解决这些格局的文件。

解压 zip 文件

应用 archive/zip 包中的函数,咱们能够轻松地操作 zip 文件。首先,咱们须要关上 zip 文件:

zipFile, err := zip.OpenReader(zipPath)
if err != nil {return err}
defer zipFile.Close()

下面的代码应用 zip.OpenReader 函数关上一个 zip 文件,并返回一个 *zip.ReadCloser 类型的对象,示意 zip 文件内容的读取器和敞开器。留神:在读取完 zip 文件后,记得应用 defer 语句敞开该文件。

接着,咱们能够应用 Read() 函数来解压 zip 文件中的每一个文件,并将其写入到本地磁盘:

for _, zipFileInfo := range zipFile.Reader.File {dstPath := filepath.Join(outputDir, zipFileInfo.Name)
    dstDir := filepath.Dir(dstPath)
    err = os.MkdirAll(dstDir, 0755)
    if err != nil {return err}

    dstFile, err := os.OpenFile(dstPath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, zipFileInfo.Mode())
    if err != nil {return err}

    srcFile, err := zipFileInfo.Open()
    if err != nil {dstFile.Close()
        return err
    }

    _, err = io.Copy(dstFile, srcFile)
    dstFile.Close()
    srcFile.Close()

    if err != nil {return err}
}

下面的代码中,咱们首先拼接出本地文件门路,并创立其所在的目录构造。接着,应用 os.OpenFile() 函数以写入模式关上本地文件,并应用 zipFileInfo.Mode() 函数获取 zip 文件中该文件的权限信息。应用 zipFileInfo.Open() 函数将 zip 文件中的文件关上,并应用 io.Copy() 函数将其写入到本地文件中。如果呈现任何谬误,记得敞开本地文件和 zip 文件中的文件,以便资源得以正确开释。

解压 gzip 文件

应用 compress/gzip 包,咱们也能够轻松地解压 gzip 文件。具体方法如下:

gzipFile, err := os.Open(gzipPath)
if err != nil {return err}
defer gzipFile.Close()

gzipReader, err := gzip.NewReader(gzipFile)
if err != nil {return err}
defer gzipReader.Close()

dstPath := filepath.Join(outputDir, filepath.Base(gzipPath))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {return err}
defer dstFile.Close()

_, err = io.Copy(dstFile, gzipReader)
if err != nil {return err}

下面的代码首先关上 gzip 文件,并应用 gzip.NewReader() 函数创立一个 gzip.Reader 类型的对象,示意 gzip 文件内容的读取器。记得在读取完该文件之后敞开相干文件(即:gzip 文件和读取器文件)。而后,通过应用 os.OpenFile() 函数以写入模式关上指标文件,并将 gzip 读取器中的内容复制到指标文件中即可。记得在操作完指标文件后敞开相干文件,以便资源胜利开释。

解压 bzip2 文件

应用 compress/bzip2 包,能够轻松地解压 bzip2 文件。办法如下:

bzip2File, err := os.Open(bzip2Path)
if err != nil {return err}
defer bzip2File.Close()

bzip2Reader := bzip2.NewReader(bzip2File)

dstPath := filepath.Join(outputDir, filepath.Base(bzip2Path))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {return err}
defer dstFile.Close()

_, err = io.Copy(dstFile, bzip2Reader)
if err != nil {return err}

下面的代码中,咱们应用 bzip2.NewReader() 函数创立一个 bzip2.Reader 类型的对象,示意 bzip2 文件内容的读取器。而后,以写入模式关上指标文件,将读取器中的内容复制到指标文件中,并在实现后敞开相干文件,开释资源。

二、读取 docx/doc 文件

docx/doc 文件是一种二进制文件格式,咱们能够应用第三方库来读取其中的内容。Word 文档通常应用.doc 或.docx 格局保留,其中.doc 是二进制格局,而.docx 则是 XML 格局的文件。接下来,咱们将别离介绍如何读取这两种文件格式的内容。

读取.doc 格式文件

咱们能够应用 github.com/LopPay/office-parser/ole、github.com/LopPay/office-parser/common 和 github.com/LopPay/office-parser/msdoc 别离来解决 ole 文件、解析 doc 文件和读取 doc 文件中的数据。该库曾经封装了所有的文本、图片、表格等元素的解析和转换。

上面是一个简略的读取 doc 文件的程序:

docFile, err := os.Open(docPath)
if err != nil {return err}
defer docFile.Close()

docData, err := msdoc.ParseDocFile(docFile)
if err != nil {return err}

for _, para := range docData.Paragraphs {
    for _, run := range para.Runs {fmt.Print(run.Text)
    }
    fmt.Println()}

下面的代码中,咱们首先应用 os.Open() 函数关上 doc 文件,并应用 msdoc.ParseDocFile() 函数解析该文件。该函数返回一个 msdoc.Document 类型的对象,该对象包含文本、图片、表格等信息。上面的代码将遍历每一个段落和其中的 Run 实例,并将其内容输入到控制台。

读取.docx 格式文件

咱们能够应用第三方库 github.com/unidoc/unioffice 来读取.docx 格局的文件。该库反对读取和写入单个文件、读取和写入多个文件、转换和操作表格、图像、段落、款式等操作。

上面是一个简略的读取.docx 文件的程序:

docFile, err := os.Open(docxPath)
if err != nil {return err}
defer docFile.Close()

doc, err := document.Open(docFile)
if err != nil {return err}

for _, para := range doc.Paragraphs() {for _, run := range para.Runs() {fmt.Print(run.Text())
    }
    fmt.Println()}

下面的代码中,咱们首先应用 os.Open() 函数关上 docx 文件,并应用 document.Open() 函数解析该文件。该函数返回一个 document.Document 类型的对象,该对象包含文本、图片、表格等信息。上面的代码将遍历每一个段落和其中的 Run 实例,并将其内容输入到控制台。

三、总结

本文介绍了如何应用 Go 语言主动解压缩包和读取 docx/doc 文件。具体来说,咱们应用了相应的第三方库和 Go 语言内置库中的代码。

上述代码运行起来比较简单,适宜初学者学习和实际。心愿对大家有帮忙,大家能够自行依据需要进行批改和扩大。

一起学习

欢送大家关注我,点赞、留言、转发。

你的反对,是我更文的最大能源!

正文完
 0