关于python:Python全景系列4-史上最全文件类型读写库大盘点什么还包括音频视频

欢送来到咱们的系列博客《Python 全景系列》！在这个系列中，咱们将率领你从 Python 的基础知识开始，一步步深刻到高级话题，帮忙你把握这门弱小而灵便的编程语言！

本文系列第四篇，介绍史上最全 PYTHON 文件类型读写库大盘点！蕴含罕用和不罕用的大量文件格式！文本、音频、视频包罗万象！废话不多说！走起来！
先给大家快捷总结：

文件格式	Python 库
文件格式	Python 库
文本文件	内置 open 函数
CSV 文件	csv
JSON 文件	json
XML 文件	xml.etree.ElementTree
二进制文件	内置 open 函数
图片文件	PIL (Python Imaging Library)
Word 文件	python-docx
XLSX 文件	openpyxl
PDF 文件	PyPDF2
SQLite 数据库文件	sqlite3
音频文件	pydub
视频文件	moviepy
HTML 文件	BeautifulSoup
YAML 文件	pyyaml
ZIP 文件	zipfile

注释开始！

在 Python 中，解决文本文件是最根底的文件操作，咱们应用内置的 open 函数关上一个文件，而后应用文件对象的 read 或 write 办法进行读写操作。

# 写入文本文件
with open('example.txt', 'w') as f:
    f.write('Hello, Python!')

# 读取文本文件
with open('example.txt', 'r') as f:
    print(f.read())

在这里，open 函数的第一个参数是文件名，第二个参数是文件模式，其中 ’r’ 代表读模式，’w’ 代表写模式。应用 ’with’ 语句能够确保文件在操作实现后被正确敞开。这是一个规范的文件操作模式，也实用于其余类型的文件。

CSV（Comma-Separated Values）文件是一种罕用的数据交换格局，每行示意一条记录，各字段之间由逗号分隔。Python 的 csv 模块提供了用于读写 CSV 文件的工具。

import csv

# 写入 CSV 文件
with open('example.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerow(['name', 'age'])
    writer.writerow(['Alice', 20])
    writer.writerow(['Bob', 25])

# 读取 CSV 文件
with open('example.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

这里，csv.writer 和 csv.reader 函数别离返回一个写入器和读取器对象，咱们能够应用这些对象进行 CSV 文件的读写操作。

JSON（JavaScript Object Notation）是一种轻量级的数据交换格局，易于浏览和编写，同时也易于机器解析和生成。Python 的 json 模块提供了用于读写 JSON 文件的工具。

import json

# 写入 JSON 文件
data = {
    'name': 'Alice',
    'age': 20,
}
with open('example.json', 'w') as f:
    json.dump(data, f)

# 读取 JSON 文件
with open('example.json', 'r') as f:
    data = json.load(f)
    print(data)
 

在这里，json.dump 和 json.load 函数别离用于将 Python 对象转换为 JSON 格局并写入文件，以及从文件中读取 JSON 数据并转换为 Python 对象。

XML（eXtensible Markup Language）是一种标记语言，能够用来形容数据的构造。Python 的 xml 模块提供了用于读写 XML 文件的工具。

from xml.etree import ElementTree as ET

# 写入 XML 文件
root = ET.Element('root')
child = ET.Element('child')
child.text = 'Hello, Python!'
root.append(child)
tree = ET.ElementTree(root)
tree.write('example.xml')

# 读取 XML 文件
tree = ET.parse('example.xml')
root = tree.getroot()
for child in root:
    print(child.text)

在这里，咱们应用 xml.etree.ElementTree 模块创立一个 XML 文件的树形构造，而后应用 ElementTree 对象的 write 办法将其写入文件。读取 XML 一个 ElementTree 对象，而后通过遍历这个对象来读取 XML 数据。

二进制文件是间接蕴含二进制数据的文件，例如图像文件、音频文件等。Python 应用 ’b’ 模式关上二进制文件，而后应用文件对象的 read 或 write 办法进行读写操作。

# 写入二进制文件
data = b'Hello, Python!'
with open('example.bin', 'wb') as f:
    f.write(data)

# 读取二进制文件
with open('example.bin', 'rb') as f:
    data = f.read()
    print(data)

在这里，’wb’ 和 ’rb’ 别离代表二进制写模式和二进制读模式。留神咱们应用 bytes 类型的数据进行二进制写操作。

解决图片文件个别须要借助第三方库，如 PIL（Python Imaging Library）。

from PIL import Image

# 读取图片文件
img = Image.open('example.jpg')

# 批改图片
img = img.rotate(45)  # 旋转 45 度

# 写入图片文件
img.save('example_rotated.jpg')

这里，Image.open 和 Image.save 函数别离用于读取和保留图片文件。PIL 库提供了丰盛的图像处理性能，例如旋转、裁剪、缩放等。

解决 Word 文件，咱们能够应用 python-docx 库，这是一个创立、批改和提取 Microsoft Word 文件的 Python 库。

from docx import Document

# 创立新的 Word 文件
doc = Document()
doc.add_paragraph('Hello, Python!')
doc.save('example.docx')

# 读取 Word 文件
doc = Document('example.docx')
for para in doc.paragraphs:
    print(para.text)

在这里，咱们首先创立一个 Document 对象，而后应用 add_paragraph 办法增加段落，最初应用 save 办法保存文档。读取 Word 文件时，咱们遍历 Document 对象的 paragraphs 属性，打印出每个段落的文本。

解决 Excel 文件，咱们能够应用 openpyxl 库，这是一个读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。

from openpyxl import Workbook, load_workbook

# 创立新的 Excel 文件
wb = Workbook()
ws = wb.active
ws['A1'] = 'Hello,'
ws['B1'] = 'Python!'
wb.save('example.xlsx')

# 读取 Excel 文件
wb = load_workbook('example.xlsx')
ws = wb.active
print(ws['A1'].value, ws['B1'].value)

在这里，咱们首先创立一个 Workbook 对象和 Worksheet 对象，而后应用字典形式拜访单元格并赋值，最初应用 save 办法保留工作簿。读取 Excel 文件时，咱们应用 load_workbook 函数加载工作簿，而后拜访激活的工作表的单元格。

PDF 是一种常见的文件格式，咱们能够应用 Python 的 PyPDF2 库来解决 PDF 文件。

import PyPDF2

# 读取 PDF 文件
with open('example.pdf', 'rb') as f:
    reader = PyPDF2.PdfFileReader(f)
    page = reader.getPage(0)
    print(page.extractText())

# 留神：PyPDF2 不能间接创立 PDF 文件，但能够合并、裁剪和旋转 PDF 文件

在这里，咱们应用 PdfFileReader 对象读取 PDF 文件，而后应用 getPage 办法获取某一页，最初应用 extractText 办法提取文本。留神 PyPDF2 不能间接创立 PDF 文件，但能够合并、裁剪和旋转 PDF 文件。

SQLite 是一种嵌入式数据库，它的数据库全都保留在一个独自的文件中。Python 的 sqlite3 模块提供了对 SQLite 数据库的反对。

import sqlite3

# 创立并写入 SQLite 数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
c.execute("CREATE TABLE test (name text, age integer)")
c.execute("INSERT INTO test VALUES ('Alice', 20)")
conn.commit()
conn.close()

# 读取 SQLite 数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
for row in c.execute("SELECT * FROM test"):
    print(row)
conn.close()

在这里，咱们首先创立一个数据库连贯和游标对象，而后应用 execute 办法执行 SQL 语句，最初应用 commit 办法提交事务。读取 SQLite 数据库时，咱们遍历 execute 办法的后果，打印出每一行。

解决音频文件，咱们能够应用 pydub 库，这是一个解决音频的 Python 库。

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file('example.mp3')

# 批改音频
audio = audio.reverse()  # 反转音频

# 保留音频文件
audio.export('example_reversed.mp3', format='mp3')

在这里，AudioSegment.from_file 函数用于读取音频文件。pydub 库提供了丰盛的音频解决性能，例如反转、裁剪、合并等。最初应用 export 办法保留音频文件。

解决视频文件，咱们能够应用 moviepy 库，这是一个用于视频编辑的 Python 库。

from moviepy.editor import VideoFileClip

# 读取视频文件
clip = VideoFileClip('example.mp4')

# 批改视频
clip = clip.subclip(10, 20)  # 截取第 10 秒到第 20 秒的片段

# 保留视频文件
clip.write_videofile('example_subclip.mp4')

在这里，VideoFileClip 函数用于读取视频文件。moviepy 库提供了丰盛的视频解决性能，例如裁剪、拼接、增加音频等。最初应用 write_videofile 办法保留视频文件。

HTML 是网页的次要形成元素。咱们能够应用 Python 的 beautifulsoup 库解析 HTML 文件。

from bs4 import BeautifulSoup

# 读取 HTML 文件
with open('example.html', 'r') as f:
    soup = BeautifulSoup(f, 'html.parser')

# 解析 HTML
print(soup.title.text)  # 打印题目

# 留神：BeautifulSoup 不能间接创立 HTML 文件，但能够批改 HTML 文件

在这里，咱们应用 BeautifulSoup 对象解析 HTML 文件，而后通过标签名拜访 HTML 元素。

YAML（YAML Ain’t Markup Language）是一种直观的数据序列化格局，罕用于配置文件。Python 的 pyyaml 库提供了用于读写 YAML 文件的工具。

import yaml

# 写入 YAML 文件
data = {'name': 'Alice', 'age': 20}
with open('example.yaml', 'w') as f:
    yaml.dump(data, f)

# 读取 YAML 文件
with open('example.yaml', 'r') as f:
    data = yaml.load(f, Loader=yaml.FullLoader)
    print(data)

在这里，yaml.dump 和 yaml.load 函数别离用于将 Python 对象转换为 YAML 格局并写入文件，以及从文件中读取 YAML 数据并转换为 Python 对象。

ZIP 是一种罕用的压缩文件格式。Python 的 zipfile 模块提供了用于读写 ZIP 文件的工具。

from zipfile import ZipFile

# 创立 ZIP 文件
with ZipFile('example.zip', 'w') as zf:
    zf.write('example.txt')

# 读取 ZIP 文件
with ZipFile('example.zip', 'r') as zf:
    print(zf.namelist())

在这里，咱们应用 ZipFile 对象创立一个 ZIP 文件，而后应用 write 办法增加文件。读取 ZIP 文件时，咱们应用 namelist 办法列出所有文件。

在解决文件时，一个常被忽视但又极其有用的技巧是应用 Python 的 pathlib 模块来解决文件门路。pathlib 模块提供了一种面向对象的形式来解决文件和目录门路，使得门路的解决变得更加直观和简洁。

from pathlib import Path

# 创立 Path 对象
p = Path('example.txt')

# 查看文件是否存在
if p.exists():
    print('File exists.')

# 获取文件的后缀名
print(p.suffix)

在这个例子中，咱们应用 Path 对象示意一个文件门路，而后应用 Path 对象的办法和属性来进行各种操作，例如查看文件是否存在，获取文件的后缀名等。这是一个十分弱小且易用的模块，能够极大地提高咱们解决文件门路的效率。

以上就是 Python 全文件格式输入输出的介绍。心愿通过本文，你可能对 Python 的文件操作有更深刻的了解，并可能在理论编程中灵活运用。如果你有任何问题或想法，欢送在评论区留言分享。

如有帮忙，请多关注
集体微信公众号：【Python 全视角】
TeahLead_KrisChang，10+ 年的互联网和人工智能从业教训，10 年 + 技术和业务团队治理教训，同济软件工程本科，复旦工程治理硕士，阿里云认证云服务资深架构师，上亿营收 AI 产品业务负责人。

关于python:Python全景系列4-史上最全文件类型读写库大盘点什么还包括音频视频

1. 文本文件

2. CSV 文件

3. JSON 文件

4. XML 文件

5. 二进制文件

6. 图片文件

7. Word 文件

8. XLSX 文件

9. PDF 文件

10. SQLite 数据库文件

11. 音频文件

12. 视频文件

13. HTML 文件

14. YAML 文件

15. ZIP 文件

One More Thing