乐趣区

关于python:Python-pickle模块实现Python对象的持久化存储

Python 中有个序列化过程叫作 pickle,它可能实现任意对象与文本之间的互相转化,也能够实现任意对象与二进制之间的互相转化。也就是说,pickle 能够实现 Python 对象的存储及复原。

值得一提的是,pickle 是 python 语言的一个规范模块,装置 python 的同时就曾经装置了 pickle 库,因而它不须要再独自装置,应用 import 将其导入到程序中,就能够间接应用。

pickle 模块提供了以下 4 个函数供咱们应用:

  • dumps():将 Python 中的对象序列化成二进制对象,并返回;
  • loads():读取给定的二进制对象数据,并将其转换为 Python 对象;
  • dump():将 Python 中的对象序列化成二进制对象,并写入文件;
  • load():读取指定的序列化数据文件,并返回对象。

以上这 4 个函数能够分成两类,其中 dumps 和 loads 实现基于内存的 Python 对象与二进制互转;dump 和 load 实现基于文件的 Python 对象与二进制互转。

pickle.dumps() 函数

此函数用于将 Python 对象转为二进制对象,其语法格局如下:

dumps(obj, protocol=None, *, fix_imports=True)

此格局中各个参数的含意为:

  • obj:要转换的 Python 对象;
  • protocol:pickle 的转码协定,取值为 0、1、2、3、4,其中 0、1、2 对应 Python 晚期的版本,3 和 4 则对应 Python 3.x 版本及之后的版本。未指定状况下,默认为 3。
  • 其它参数:为了兼容 Python 2.x 版本而保留的参数,Python 3.x 中能够疏忽。

【例 1】

import pickle
tup1 = ('I love Python', {1,2,3}, None)
#应用 dumps() 函数将 tup1 转成 p1
p1 = pickle.dumps(tup1)
print(p1)

输入后果为:

b'\x80\x03X\r\x00\x00\x00I love Pythonq\x00cbuiltins\nset\nq\x01]q\x02(K\x01K\x02K\x03e\x85q\x03Rq\x04N\x87q\x05.'

pickle.loads() 函数

此函数用于将二进制对象转换成 Python 对象,其根本格局如下:

loads(data, *, fix_imports=True, encoding='ASCII', errors='strict')

其中,data 参数示意要转换的二进制对象,其它参数只是为了兼容 Python 2.x 版本而保留的,能够疏忽。

【例 2】在例 1 的根底上,将 p1 对象反序列化为 Python 对象。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
p1 = pickle.dumps(tup1)
#应用 loads() 函数将 p1 转成 Python 对象
t2 = pickle.loads(p1)
print(t2)

运行后果为:

('I love Python', {1, 2, 3}, None)

留神,在应用 loads() 函数将二进制对象反序列化成 Python 对象时,会自动识别转码协定,所以不须要将转码协定当作参数传入。并且,当待转换的二进制对象的字节数超过 pickle 的 Python 对象时,多余的字节将被疏忽。

pickle.dump() 函数

此函数用于将 Python 对象转换成二进制文件,其根本语法格局为:

dump (obj, file,protocol=None, *, fix mports=True)

其中各个参数的具体含意如下:

  • obj:要转换的 Python 对象。
  • file:转换到指定的二进制文件中,要求该文件必须是以 ”wb” 的打开方式进行操作。
  • protocol:和 dumps() 函数中 protocol 参数的含意完全相同,因而这里不再反复形容。
  • 其余参数:为了兼容以前 Python 2.x 版本而保留的参数,能够疏忽。

【例 3】将 tup1 元组转换成二进制对象文件。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
#应用 dumps() 函数将 tup1 转成 p1
with open ("a.txt", 'wb') as f: #关上文件
    pickle.dump(tup1, f) #用 dump 函数将 Python 对象转成二进制对象文件 

运行完此程序后,会在该程序文件同级目录中,生成 a.txt 文件,但因为其内容为二进制数据,因而间接关上会看到乱码。

pickle.load() 函数

此函数和 dump() 函数绝对应,用于将二进制对象文件转换成 Python 对象。该函数的根本语法格局为:

load(file, *, fix_imports=True, encoding='ASCII', errors='strict')

其中,file 参数示意要转换的二进制对象文件(必须以 “rb” 的打开方式操作文件),其它参数只是为了兼容 Python 2.x 版本而保留的参数,能够疏忽。

【例 4】将例 3 转换的 a.txt 二进制文件对象转换为 Python 对象。

import pickle
tup1 = ('I love Python', {1,2,3}, None)
#应用 dumps() 函数将 tup1 转成 p1
with open ("a.txt", 'wb') as f: #关上文件
    pickle.dump(tup1, f) #用 dump 函数将 Python 对象转成二进制对象文件
with open ("a.txt", 'rb') as f: #关上文件
    t3 = pickle.load(f) #将二进制文件对象转换成 Python 对象
    print(t3)

运行后果为:

('I love Python', {1, 2, 3}, None)

总结

看似弱小的 pickle 模块,其实也有它的短板,即 pickle 不反对并发地拜访持久性对象,在简单的零碎环境下,尤其是读取海量数据时,应用 pickle 会使整个零碎的 I / O 读取性能成为瓶颈。这种状况下,能够应用 ZODB。

ZODB 是一个强壮的、多用户的和面向对象的数据库系统,专门用于存储 Python 语言中的对象数据,它可能存储和治理任意简单的 Python 对象,并反对事务操作和并发管制。并且,ZODB 也是在 Python 的序列化操作根底之上实现的,因而要想无效地应用 ZODB,必须先学好 pickle。

退出移动版