关于python:图解python-文件读写

42次阅读

共计 4697 个字符,预计需要花费 12 分钟才能阅读完成。

作者:韩信子 @ShowMeAI
教程地址:http://www.showmeai.tech/tuto…
本文地址:http://www.showmeai.tech/article-detail/85
申明:版权所有,转载请分割平台与作者并注明出处


1.python 文件读写

读写文件是最常见的操作之一,Python 内置了读写文件的函数,整体是比拟不便的。

在磁盘上读写文件的性能都是由操作系统提供的,读写文件就是申请操作系统关上一个文件对象(通常称为文件描述符),而后通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

2.open 办法

Python 内置了 open()函数,用于对文件进行读写操作。应用 open()办法操作文件就像把大象塞进冰箱一样,能够分 3 步走,一是关上文件,二是操作文件,三是敞开文件。

open()办法的返回值是一个 file 对象,能够将它赋值给一个变量(文件句柄)。根本语法格局为:

f = open(filename, mode)

PS:Python 中,所有具备 read 和 write 办法的对象,都能够归类为 file 类型。而所有的 file 类型对象都能够应用 open 办法关上,close 办法完结和被 with 上下文管理器治理。这是 Python 的设计哲学之一。

filename:一个蕴含了你要拜访的文件名称的字符串值,通常是一个文件门路。

mode:关上文件的模式,有很多种,默认是只读形式 r。

一个简略的例子:

# 关上一个文件
f = open("/tmp/foo.txt", "w")
f.write("Python 是一种十分好的语言。\n 我喜爱 Python!!\n")
# 敞开关上的文件
f.close()

(1)关上模式:

模式 操作 阐明
r 只读 默认模式,如果文件不存在就报错,存在就失常读取。
w 只写 如果文件不存在,新建文件而后写入;如果存在,先清空文件内容,再写入。
a 追加 如果文件不存在,新建文件,而后写入;如果存在,在文件的最初追加写入。
x 新建 如果文件存在则报错,如果不存在就新建文件,而后写入内容,比 w 模式更平安。
b 二进制模式 比方 rb、wb、ab,以 bytes 类型操作数据
+ 读写模式 比方 r +、w+、a+

(2)b 模式

二进制模式,通常用来读取图片、视频等二进制文件。留神,它在读写的时候是以 bytes 类型读写的,因而取得的是一个 bytes 对象而不是字符串。在这个读写过程中,须要本人指定编码格局。在应用带 b 的模式时肯定要留神传入的数据类型,确保为 bytes 类型。

(能够在在线 python3 环境中运行代码学习):

s = 'ShowMeAI 是数据迷信与人工智能畛域的资料库和学习社区'
b = bytes(s,encoding='utf-8')

f = open('test.txt','w')
f.write(s)

#这样没问题,失常写入了文件。#-------------------------------------------------
s = "ShowMeAI 是数据迷信与人工智能畛域的资料库和学习社区。\n 我喜爱 ShowMeAI!!\n"
b = bytes(s,encoding='utf-8')

f = open('test_b.txt','wb')    #留神多了个 b
f.write(s)

#报错
TypeError: a bytes-like object is required, not 'str'
#意思是它须要一个 bytes 类型数据,你却给了个字符串

#---------------------------------------------------
s = "ShowMeAI 是数据迷信与人工智能畛域的资料库和学习社区。\n 我喜爱 ShowMeAI!!\n"
b = bytes(s,encoding='utf-8')

f = open('test_b.txt','wb')    # 留神多了个 b
f.write(b)                        # 将变量 b 传给它,b 是个 bytes 类型

(3)+ 模式

对于 w + 模式,在读写之前都会清空文件的内容,倡议不要应用!

对于 a + 模式,永远只能在文件的开端写入,有局限性,倡议不要应用!

对于 r + 模式,也就是读写模式,配合 seek()和 tell()办法,能够实现更多操作。

3. 文件编码

要读取非 UTF- 8 编码的文件,须要给 open()函数传入 encoding 参数,例如,读取 GBK 编码的文件:

>>> f = open('gbk.txt', 'r', encoding='gbk')
>>> f.read()
'GBK'

遇到有些编码不标准的文件,可能会抛出 UnicodeDecodeError 异样,这示意在文件中可能夹杂了一些非法编码的字符。遇到这种状况,能够提供 errors 参数,示意如果遇到编码谬误后如何解决。

>>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

4. 文件对象操作

每当咱们用 open 办法关上一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。上面假如,曾经关上了一个 f 文件对象。

(1)read 函数

读取肯定大小的数据, 而后作为字符串或字节对象返回。size 是一个可选的数字类型的参数,用于指定读取的数据量。当 size 被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

f = open("test.txt", "r")

str = f.read()
print(str)

f.close()

如果文件体积较大,请不要应用 read()办法一次性读入内存,而是 read(512)这种一点一点的读。

(2)readline 函数

从文件中读取一行 n 内容。换行符为 ’\n’。如果返回一个空字符串,阐明曾经曾经读取到最初一行。这种办法,通常是读一行,解决一行,并且不能回头,只能后退,读过的行不能再读了。

f = open("test.txt", "r")
str = f.readline()
print(str)
f.close()

(3)readlines 函数

将文件中所有的行,一行一行全副读入一个列表内,按程序一个一个作为列表的元素,并返回这个列表。readlines 办法会一次性将文件全副读入内存,所以也存在肯定的危险。然而它有个益处,每行都保留在列表里,能够随便存取。

f = open("test.txt", "r")
a = f.readlines()
print(a)
f.close()

(4)遍历文件

实际上,更多的时候,咱们将文件对象作为一个迭代器来应用。

# 关上一个文件
f = open("test.txt", "r")

for line in f:
    print(line, end='')

# 敞开关上的文件
f.close()

这个办法很简略, 不须要将文件一次性读出,然而同样没有提供一个很好的管制,与 readline 办法一样只能后退,不能回退。

几种不同的读取和遍历文件的办法比拟:

  • 如果文件很小,read()一次性读取最不便。
  • 如果不能确定文件大小,重复调用 read(size)比拟保险。
  • 如果是配置文件,调用 readlines()最不便。
  • 一般状况,应用 for 循环更好,速度更快。

(5)write 函数

将字符串或 bytes 类型的数据写入文件内。write()动作能够多次重复进行,其实都是在内存中的操作,并不会立即写回硬盘,直到执行 close()办法后,才会将所有的写入操作反映到硬盘上。在这过程中,如果想将内存中的批改,立即保留到硬盘上,能够应用 f.flush()办法,但这可能造成数据的不统一。

# 关上一个文件
f = open("/tmp/foo.txt", "w")

f.write("ShowMeAI 是数据迷信与人工智能畛域的资料库和学习社区。\n 我喜爱 ShowMeAI!!\n")

# 敞开关上的文件
f.close()

(6)tell 函数

返回文件读写指针以后所处的地位, 它是从文件结尾开始算起的 字节数。肯定要留神了,是字节数,不是字符数。

(7)seek 函数

如果要扭转地位指针的地位, 能够应用 f.seek(offset, from_what) 办法。seek()常常和 tell()办法配合应用。

from_what的值,如果是 0 示意从文件结尾计算,如果是 1 示意从文件读写指针的以后地位开始计算,2 示意从文件的结尾开始计算,默认为 0,例如:

offset:示意偏移量。

  • seek(x,0):从起始地位即文件首行首字符开始挪动 x 个字符
  • seek(x,1):示意从以后地位往后挪动 x 个字符
  • seek(-x,2):示意从文件的结尾往前挪动 x 个字符

参考下述代码示例

>>> f = open("test.txt", "rb+")
>>> f.write(b"ShowMeAI is born for AI and data science.\nI love ShowMeAI!!\n")
60
>>> f.tell()
60
>>> f.seek(5)
5
>>> f.read(6)
b'eAI is'
>>> f.seek(-3, 2)
92
>>> f.read(2)
b'!!'

(8)close 函数

敞开文件对象。当解决完一个文件后,调用 f.close()来敞开文件并开释零碎的资源。文件敞开后,如果尝试再次调用该文件对象,则会抛出异样。如果遗记调用 close(),可能会导致只写了一部分数据到磁盘而失落其余的内容。也就是说「大象塞进冰箱后,肯定不要遗记关上冰箱的门」。

5.with 关键字

with 关键字用于 Python 的上下文管理器机制。为了避免诸如 open 这一类文件关上办法在操作过程出现异常或谬误,或者最初忘了执行 close 办法,文件非正常敞开等可能导致文件泄露、毁坏的问题。Python 提供了 with 这个上下文管理器机制,保障文件会被失常敞开。在它的治理下,不须要再写 close 语句。留神缩进。

with open('test.txt', 'w') as f:
    f.write('Hello, ShowMeAI!')

with 反对同时关上多个文件:

with open('log1') as obj1, open('log2','w') as obj2:
    s=obj1.read()
    obj2.write(s)

6. 视频教程

请点击到 B 站查看【双语字幕】版本

https://www.bilibili.com/vide…

材料与代码下载

本教程系列的代码能够在 ShowMeAI 对应的 github 中下载,可本地 python 环境运行,能迷信上网的宝宝也能够间接借助 google colab 一键运行与交互操作学习哦!

本教程系列波及的 Python 速查表能够在以下地址下载获取:

  • Python 速查表

拓展参考资料

  • Python 教程—Python3 文档
  • Python 教程 - 廖雪峰的官方网站

ShowMeAI 相干文章举荐

  • python 介绍
  • python 装置与环境配置
  • python 根底语法
  • python 根底数据类型
  • python 运算符
  • python 条件管制与 if 语句
  • python 循环语句
  • python while 循环
  • python for 循环
  • python break 语句
  • python continue 语句
  • python pass 语句
  • python 字符串及操作
  • python 列表
  • python 元组
  • python 字典
  • python 汇合
  • python 函数
  • python 迭代器与生成器
  • python 数据结构
  • python 模块
  • python 文件读写
  • python 文件与目录操作
  • python 谬误与异样解决
  • python 面向对象编程
  • python 命名空间与作用域
  • python 工夫和日期

ShowMeAI 系列教程举荐

  • 图解 Python 编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解 AI 数学根底:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程

正文完
 0