共计 3553 个字符,预计需要花费 9 分钟才能阅读完成。
在开发过程中,咱们经常须要解决压缩包和文档文件。本文将介绍如何应用 Go 语言主动解压缩包和读取 docx/doc 文件。
一、解压缩包
压缩包格局
常见的压缩包格局有 zip、gzip、bzip2 等。在 Go 语言中,应用 archive/zip、compress/gzip、compress/bzip2 包能够轻松地解决这些格局的文件。
解压 zip 文件
应用 archive/zip 包中的函数,咱们能够轻松地操作 zip 文件。首先,咱们须要关上 zip 文件:
zipFile, err := zip.OpenReader(zipPath)
if err != nil {return err}
defer zipFile.Close()
下面的代码应用 zip.OpenReader 函数关上一个 zip 文件,并返回一个 *zip.ReadCloser 类型的对象,示意 zip 文件内容的读取器和敞开器。留神:在读取完 zip 文件后,记得应用 defer 语句敞开该文件。
接着,咱们能够应用 Read() 函数来解压 zip 文件中的每一个文件,并将其写入到本地磁盘:
for _, zipFileInfo := range zipFile.Reader.File {dstPath := filepath.Join(outputDir, zipFileInfo.Name)
dstDir := filepath.Dir(dstPath)
err = os.MkdirAll(dstDir, 0755)
if err != nil {return err}
dstFile, err := os.OpenFile(dstPath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, zipFileInfo.Mode())
if err != nil {return err}
srcFile, err := zipFileInfo.Open()
if err != nil {dstFile.Close()
return err
}
_, err = io.Copy(dstFile, srcFile)
dstFile.Close()
srcFile.Close()
if err != nil {return err}
}
下面的代码中,咱们首先拼接出本地文件门路,并创立其所在的目录构造。接着,应用 os.OpenFile() 函数以写入模式关上本地文件,并应用 zipFileInfo.Mode() 函数获取 zip 文件中该文件的权限信息。应用 zipFileInfo.Open() 函数将 zip 文件中的文件关上,并应用 io.Copy() 函数将其写入到本地文件中。如果呈现任何谬误,记得敞开本地文件和 zip 文件中的文件,以便资源得以正确开释。
解压 gzip 文件
应用 compress/gzip 包,咱们也能够轻松地解压 gzip 文件。具体方法如下:
gzipFile, err := os.Open(gzipPath)
if err != nil {return err}
defer gzipFile.Close()
gzipReader, err := gzip.NewReader(gzipFile)
if err != nil {return err}
defer gzipReader.Close()
dstPath := filepath.Join(outputDir, filepath.Base(gzipPath))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {return err}
defer dstFile.Close()
_, err = io.Copy(dstFile, gzipReader)
if err != nil {return err}
下面的代码首先关上 gzip 文件,并应用 gzip.NewReader() 函数创立一个 gzip.Reader 类型的对象,示意 gzip 文件内容的读取器。记得在读取完该文件之后敞开相干文件(即:gzip 文件和读取器文件)。而后,通过应用 os.OpenFile() 函数以写入模式关上指标文件,并将 gzip 读取器中的内容复制到指标文件中即可。记得在操作完指标文件后敞开相干文件,以便资源胜利开释。
解压 bzip2 文件
应用 compress/bzip2 包,能够轻松地解压 bzip2 文件。办法如下:
bzip2File, err := os.Open(bzip2Path)
if err != nil {return err}
defer bzip2File.Close()
bzip2Reader := bzip2.NewReader(bzip2File)
dstPath := filepath.Join(outputDir, filepath.Base(bzip2Path))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {return err}
defer dstFile.Close()
_, err = io.Copy(dstFile, bzip2Reader)
if err != nil {return err}
下面的代码中,咱们应用 bzip2.NewReader() 函数创立一个 bzip2.Reader 类型的对象,示意 bzip2 文件内容的读取器。而后,以写入模式关上指标文件,将读取器中的内容复制到指标文件中,并在实现后敞开相干文件,开释资源。
二、读取 docx/doc 文件
docx/doc 文件是一种二进制文件格式,咱们能够应用第三方库来读取其中的内容。Word 文档通常应用.doc 或.docx 格局保留,其中.doc 是二进制格局,而.docx 则是 XML 格局的文件。接下来,咱们将别离介绍如何读取这两种文件格式的内容。
读取.doc 格式文件
咱们能够应用 github.com/LopPay/office-parser/ole、github.com/LopPay/office-parser/common 和 github.com/LopPay/office-parser/msdoc 别离来解决 ole 文件、解析 doc 文件和读取 doc 文件中的数据。该库曾经封装了所有的文本、图片、表格等元素的解析和转换。
上面是一个简略的读取 doc 文件的程序:
docFile, err := os.Open(docPath)
if err != nil {return err}
defer docFile.Close()
docData, err := msdoc.ParseDocFile(docFile)
if err != nil {return err}
for _, para := range docData.Paragraphs {
for _, run := range para.Runs {fmt.Print(run.Text)
}
fmt.Println()}
下面的代码中,咱们首先应用 os.Open() 函数关上 doc 文件,并应用 msdoc.ParseDocFile() 函数解析该文件。该函数返回一个 msdoc.Document 类型的对象,该对象包含文本、图片、表格等信息。上面的代码将遍历每一个段落和其中的 Run 实例,并将其内容输入到控制台。
读取.docx 格式文件
咱们能够应用第三方库 github.com/unidoc/unioffice 来读取.docx 格局的文件。该库反对读取和写入单个文件、读取和写入多个文件、转换和操作表格、图像、段落、款式等操作。
上面是一个简略的读取.docx 文件的程序:
docFile, err := os.Open(docxPath)
if err != nil {return err}
defer docFile.Close()
doc, err := document.Open(docFile)
if err != nil {return err}
for _, para := range doc.Paragraphs() {for _, run := range para.Runs() {fmt.Print(run.Text())
}
fmt.Println()}
下面的代码中,咱们首先应用 os.Open() 函数关上 docx 文件,并应用 document.Open() 函数解析该文件。该函数返回一个 document.Document 类型的对象,该对象包含文本、图片、表格等信息。上面的代码将遍历每一个段落和其中的 Run 实例,并将其内容输入到控制台。
三、总结
本文介绍了如何应用 Go 语言主动解压缩包和读取 docx/doc 文件。具体来说,咱们应用了相应的第三方库和 Go 语言内置库中的代码。
上述代码运行起来比较简单,适宜初学者学习和实际。心愿对大家有帮忙,大家能够自行依据需要进行批改和扩大。
一起学习
欢送大家关注我,点赞、留言、转发。
你的反对,是我更文的最大能源!