序列化 (Serialization)将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象;

序列化的作用:持久保存状态、跨平台数据交互

一、JSON

(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。

Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:

  • json.dumps(): 对数据进行编码。
  • json.loads(): 对数据进行解码。

在json的编解码过程中,python 的原始类型与json类型会相互转换,具体的转化对照如下:

Python 编码为 JSON 类型转换对应表:

Python

JSON

dict

object

list, tuple

array

str

string

int, float, int- & float-derived Enums

number

True

true

False

false

None

null

JSON 解码为 Python 类型转换对应表:

JSON

Python

object

dict

array

list

string

str

number (int)

int

number (real)

float

true

True

false

False

null

None

 

json.dumps 与 json.loads 实例

Python 数据结构转换为JSON:

#!/usr/bin/python3
import json
# Python 字典类型转换为 JSON 对象
data = {
    'no' : 1,
    'name' : 'wangyinhu',
    'url' : 'http://www.baidu.com'
}
json_str = json.dumps(data)
print ("Python 原始数据:", repr(data))
print ("JSON 对象:", json_str)
结果:
Python 原始数据: {'url': 'http://www.baidu.com', 'no': 1, 'name': 'wangyinhu'}
JSON 对象: {"url": "http://www.baidu.com", "no": 1, "name": "wangyinhu"}

通过输出的结果可以看出,简单类型通过编码后跟其原始的repr()输出结果非常相似。

JSON编码的字符串转换Python:

#!/usr/bin/python3
import json
# Python 字典类型转换为 JSON 对象
data1 = {
    'no' : 1,
    'name' : 'wangyinhu',
    'url' : 'http://www.baidu.com'
}
json_str = json.dumps(data1)
print ("Python 原始数据:", repr(data1))
print ("JSON 对象:", json_str)
# 将 JSON 对象转换为 Python 字典
data2 = json.loads(json_str)
print ("data2['name']: ", data2['name'])
print ("data2['url']: ", data2['url'])
结果:
Python 原始数据: {'no': 1, 'name': 'wangyinhu', 'url': 'http://www.baidu.com'}
JSON 对象: {"no": 1, "name": "wangyinhu", "url": "http://www.baidu.com"}
data2['name']:  wangyinhu
data2['url']:  http://www.baidu.com

如果你要处理的是文件而不是字符串,你可以使用 json.dump() 和 json.load() 来编码和解码JSON数据。例如:

# 写入 JSON 数据
with open('data.json', 'w') as f:
    json.dump(data, f)

# 读取数据
with open('data.json', 'r') as f:
    data = json.load(f)

 

二、pickle

python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。

pickle.dump(obj, file, [,protocol])
  注解:将对象obj保存到文件file中去。
     protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示;1:老式的二进制协议;2:2.3版本引入的新二进制协议,较以前的更高效。其中协议0和1兼容老版本的python。protocol默认值为0。
     file:对象保存到的类文件对象。file必须有write()接口, file可以是一个以'w'方式打开的文件或者一个StringIO对象或者其他任何实现write()接口的对象。如果protocol>=1,文件对象需要是二进制模式打开的。

pickle.load(file)
  注解:从file中读取一个字符串,并将它重构为原来的python对象。
             file:类文件对象,有read()和readline()接口。

Python 数据结构转换为pickle:

#序列化
import pickle
dic={'name':'egon','age':18}
with open('d.pkl','wb') as f:
     f.write(pickle.dumps(dic))

#反序列化
import pickle
with open('d.pkl','rb') as f:
    dic=pickle.loads(f.read())
    print(dic['name'])
结果:
egon