关于python:Python全景系列4-史上最全文件类型读写库大盘点什么还包括音频视频

欢送来到咱们的系列博客《Python全景系列》！在这个系列中，咱们将率领你从Python的基础知识开始，一步步深刻到高级话题，帮忙你把握这门弱小而灵便的编程语言！

本文系列第四篇，介绍史上最全PYTHON文件类型读写库大盘点！蕴含罕用和不罕用的大量文件格式！文本、音频、视频包罗万象！废话不多说！走起来！
先给大家快捷总结：

文件格式	Python库
文件格式	Python库
文本文件	内置open函数
CSV文件	csv
JSON文件	json
XML文件	xml.etree.ElementTree
二进制文件	内置open函数
图片文件	PIL (Python Imaging Library)
Word文件	python-docx
XLSX文件	openpyxl
PDF文件	PyPDF2
SQLite数据库文件	sqlite3
音频文件	pydub
视频文件	moviepy
HTML文件	BeautifulSoup
YAML文件	pyyaml
ZIP文件	zipfile

注释开始！

1. 文本文件

在Python中，解决文本文件是最根底的文件操作，咱们应用内置的open函数关上一个文件，而后应用文件对象的read或write办法进行读写操作。

# 写入文本文件
with open('example.txt', 'w') as f:
    f.write('Hello, Python!')

# 读取文本文件
with open('example.txt', 'r') as f:
    print(f.read())

在这里，open函数的第一个参数是文件名，第二个参数是文件模式，其中’r’代表读模式，’w’代表写模式。应用’with’语句能够确保文件在操作实现后被正确敞开。这是一个规范的文件操作模式，也实用于其余类型的文件。

2. CSV文件

CSV（Comma-Separated Values）文件是一种罕用的数据交换格局，每行示意一条记录，各字段之间由逗号分隔。Python的csv模块提供了用于读写CSV文件的工具。

import csv

# 写入CSV文件
with open('example.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerow(['name', 'age'])
    writer.writerow(['Alice', 20])
    writer.writerow(['Bob', 25])

# 读取CSV文件
with open('example.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

这里，csv.writer和csv.reader函数别离返回一个写入器和读取器对象，咱们能够应用这些对象进行CSV文件的读写操作。

3. JSON文件

JSON（JavaScript Object Notation）是一种轻量级的数据交换格局，易于浏览和编写，同时也易于机器解析和生成。Python的json模块提供了用于读写JSON文件的工具。

import json

# 写入JSON文件
data = {
    'name': 'Alice',
    'age': 20,
}
with open('example.json', 'w') as f:
    json.dump(data, f)

# 读取JSON文件
with open('example.json', 'r') as f:
    data = json.load(f)
    print(data)
 

在这里，json.dump和json.load函数别离用于将Python对象转换为JSON格局并写入文件，以及从文件中读取JSON数据并转换为Python对象。

4. XML文件

XML（eXtensible Markup Language）是一种标记语言，能够用来形容数据的构造。Python的xml模块提供了用于读写XML文件的工具。

from xml.etree import ElementTree as ET

# 写入XML文件
root = ET.Element('root')
child = ET.Element('child')
child.text = 'Hello, Python!'
root.append(child)
tree = ET.ElementTree(root)
tree.write('example.xml')

# 读取XML文件
tree = ET.parse('example.xml')
root = tree.getroot()
for child in root:
    print(child.text)

在这里，咱们应用xml.etree.ElementTree模块创立一个XML文件的树形构造，而后应用ElementTree对象的write办法将其写入文件。读取XML一个ElementTree对象，而后通过遍历这个对象来读取XML数据。

5.二进制文件

二进制文件是间接蕴含二进制数据的文件，例如图像文件、音频文件等。Python应用’b’模式关上二进制文件，而后应用文件对象的read或write办法进行读写操作。

# 写入二进制文件
data = b'Hello, Python!'
with open('example.bin', 'wb') as f:
    f.write(data)

# 读取二进制文件
with open('example.bin', 'rb') as f:
    data = f.read()
    print(data)

在这里，’wb’和’rb’别离代表二进制写模式和二进制读模式。留神咱们应用bytes类型的数据进行二进制写操作。

6. 图片文件

解决图片文件个别须要借助第三方库，如PIL（Python Imaging Library）。

from PIL import Image

# 读取图片文件
img = Image.open('example.jpg')

# 批改图片
img = img.rotate(45)  # 旋转45度

# 写入图片文件
img.save('example_rotated.jpg')

这里，Image.open和Image.save函数别离用于读取和保留图片文件。PIL库提供了丰盛的图像处理性能，例如旋转、裁剪、缩放等。

7. Word文件

解决Word文件，咱们能够应用python-docx库，这是一个创立、批改和提取Microsoft Word文件的Python库。

from docx import Document

# 创立新的Word文件
doc = Document()
doc.add_paragraph('Hello, Python!')
doc.save('example.docx')

# 读取Word文件
doc = Document('example.docx')
for para in doc.paragraphs:
    print(para.text)

在这里，咱们首先创立一个Document对象，而后应用add_paragraph办法增加段落，最初应用save办法保存文档。读取Word文件时，咱们遍历Document对象的paragraphs属性，打印出每个段落的文本。

8. XLSX文件

解决Excel文件，咱们能够应用openpyxl库，这是一个读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。

from openpyxl import Workbook, load_workbook

# 创立新的Excel文件
wb = Workbook()
ws = wb.active
ws['A1'] = 'Hello,'
ws['B1'] = 'Python!'
wb.save('example.xlsx')

# 读取Excel文件
wb = load_workbook('example.xlsx')
ws = wb.active
print(ws['A1'].value, ws['B1'].value)

在这里，咱们首先创立一个Workbook对象和Worksheet对象，而后应用字典形式拜访单元格并赋值，最初应用save办法保留工作簿。读取Excel文件时，咱们应用load_workbook函数加载工作簿，而后拜访激活的工作表的单元格。

9. PDF文件

PDF是一种常见的文件格式，咱们能够应用Python的PyPDF2库来解决PDF文件。

import PyPDF2

# 读取PDF文件
with open('example.pdf', 'rb') as f:
    reader = PyPDF2.PdfFileReader(f)
    page = reader.getPage(0)
    print(page.extractText())

# 留神：PyPDF2不能间接创立PDF文件，但能够合并、裁剪和旋转PDF文件

在这里，咱们应用PdfFileReader对象读取PDF文件，而后应用getPage办法获取某一页，最初应用extractText办法提取文本。留神PyPDF2不能间接创立PDF文件，但能够合并、裁剪和旋转PDF文件。

10. SQLite数据库文件

SQLite是一种嵌入式数据库，它的数据库全都保留在一个独自的文件中。Python的sqlite3模块提供了对SQLite数据库的反对。

import sqlite3

# 创立并写入SQLite数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
c.execute("CREATE TABLE test (name text, age integer)")
c.execute("INSERT INTO test VALUES ('Alice', 20)")
conn.commit()
conn.close()

# 读取SQLite数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
for row in c.execute("SELECT * FROM test"):
    print(row)
conn.close()

在这里，咱们首先创立一个数据库连贯和游标对象，而后应用execute办法执行SQL语句，最初应用commit办法提交事务。读取SQLite数据库时，咱们遍历execute办法的后果，打印出每一行。

11. 音频文件

解决音频文件，咱们能够应用pydub库，这是一个解决音频的Python库。

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file('example.mp3')

# 批改音频
audio = audio.reverse()  # 反转音频

# 保留音频文件
audio.export('example_reversed.mp3', format='mp3')

在这里，AudioSegment.from_file函数用于读取音频文件。pydub库提供了丰盛的音频解决性能，例如反转、裁剪、合并等。最初应用export办法保留音频文件。

12. 视频文件

解决视频文件，咱们能够应用moviepy库，这是一个用于视频编辑的Python库。

from moviepy.editor import VideoFileClip

# 读取视频文件
clip = VideoFileClip('example.mp4')

# 批改视频
clip = clip.subclip(10, 20)  # 截取第10秒到第20秒的片段

# 保留视频文件
clip.write_videofile('example_subclip.mp4')

在这里，VideoFileClip函数用于读取视频文件。moviepy库提供了丰盛的视频解决性能，例如裁剪、拼接、增加音频等。最初应用write_videofile办法保留视频文件。

13. HTML文件

HTML是网页的次要形成元素。咱们能够应用Python的beautifulsoup库解析HTML文件。

from bs4 import BeautifulSoup

# 读取HTML文件
with open('example.html', 'r') as f:
    soup = BeautifulSoup(f, 'html.parser')

# 解析HTML
print(soup.title.text)  # 打印题目

# 留神：BeautifulSoup不能间接创立HTML文件，但能够批改HTML文件

在这里，咱们应用BeautifulSoup对象解析HTML文件，而后通过标签名拜访HTML元素。

14. YAML文件

YAML（YAML Ain’t Markup Language）是一种直观的数据序列化格局，罕用于配置文件。Python的pyyaml库提供了用于读写YAML文件的工具。

import yaml

# 写入YAML文件
data = {'name': 'Alice', 'age': 20}
with open('example.yaml', 'w') as f:
    yaml.dump(data, f)

# 读取YAML文件
with open('example.yaml', 'r') as f:
    data = yaml.load(f, Loader=yaml.FullLoader)
    print(data)

在这里，yaml.dump和yaml.load函数别离用于将Python对象转换为YAML格局并写入文件，以及从文件中读取YAML数据并转换为Python对象。

15. ZIP文件

ZIP是一种罕用的压缩文件格式。Python的zipfile模块提供了用于读写ZIP文件的工具。

from zipfile import ZipFile

# 创立ZIP文件
with ZipFile('example.zip', 'w') as zf:
    zf.write('example.txt')

# 读取ZIP文件
with ZipFile('example.zip', 'r') as zf:
    print(zf.namelist())

在这里，咱们应用ZipFile对象创立一个ZIP文件，而后应用write办法增加文件。读取ZIP文件时，咱们应用namelist办法列出所有文件。

One More Thing

在解决文件时，一个常被忽视但又极其有用的技巧是应用Python的pathlib模块来解决文件门路。pathlib模块提供了一种面向对象的形式来解决文件和目录门路，使得门路的解决变得更加直观和简洁。

from pathlib import Path

# 创立Path对象
p = Path('example.txt')

# 查看文件是否存在
if p.exists():
    print('File exists.')

# 获取文件的后缀名
print(p.suffix)

在这个例子中，咱们应用Path对象示意一个文件门路，而后应用Path对象的办法和属性来进行各种操作，例如查看文件是否存在，获取文件的后缀名等。这是一个十分弱小且易用的模块，能够极大地提高咱们解决文件门路的效率。

以上就是Python全文件格式输入输出的介绍。心愿通过本文，你可能对Python的文件操作有更深刻的了解，并可能在理论编程中灵活运用。如果你有任何问题或想法，欢送在评论区留言分享。

如有帮忙，请多关注
集体微信公众号：【Python全视角】
TeahLead_KrisChang，10+年的互联网和人工智能从业教训，10年+技术和业务团队治理教训，同济软件工程本科，复旦工程治理硕士，阿里云认证云服务资深架构师，上亿营收AI产品业务负责人。

关于python:Python全景系列4-史上最全文件类型读写库大盘点什么还包括音频视频

1. 文本文件

2. CSV文件

3. JSON文件

4. XML文件

5.二进制文件

6. 图片文件

7. Word文件

8. XLSX文件

9. PDF文件

10. SQLite数据库文件

11. 音频文件

12. 视频文件

13. HTML文件

14. YAML文件

15. ZIP文件

One More Thing

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于python:Python全景系列4-史上最全文件类型读写库大盘点什么还包括音频视频

1. 文本文件

2. CSV文件

3. JSON文件

4. XML文件

5.二进制文件

6. 图片文件

7. Word文件

8. XLSX文件

9. PDF文件

10. SQLite数据库文件

11. 音频文件

12. 视频文件

13. HTML文件

14. YAML文件

15. ZIP文件

One More Thing

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复