#==================序列化小结
把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling.序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
# #---1.pickle
# dumps(网络传输) dump(文件存储)
# loads(网络传输) load(文件存储)pickle.dumps()把任意对象序列 转化成一个 str,然后可以把这个str写入文件
pickle.dump()直接把对象序列转化后 写入一个file-like Object
当我们要把对象从磁盘读到内存时,可以先把内容读到一个str,然后用
pickle.loads()方法反序列化出对象,也可以直接用
pickle.load()方法从一个file-like Object中直接反序列化出对象。
# pickle优点:适用于python中的各种类型
# 自定义的类的实例,可以直接序列化
# eg:picle.dumps(stu1)
# 缺点:用于python语言环境
#
# #---2.JSON
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。
JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:
# dumps(网络传输) dump(文件存储)
# loads(网络传输) load(文件存储)
json.dumps() Python对象-->Json字符串
json.dump() 直接把JSON写入一个file-like Object
json.loads() Json字符串->Python对象 反序列化
json.load() 从file-like Object中读取字符串并反序列化
有一点需要注意,就是反序列化得到的所有字符串对象默认都是unicode而不是str。由于JSON标准规定JSON编码是UTF-8,所以我们总是能正确地在Python的str或unicode与JSON的字符串之间转换。
json进阶
Python的dict对象可以直接序列化为JSON的{},不过,很多时候,我们更喜欢用class表示对象,比如定义Student类,然后序列化:
运行代码显示TypeError 错误的原因是Student对象不是一个可序列化为JSON的对象。
前面的代码之所以无法把Student类实例序列化为JSON,是因为默认情况下,dumps()方法不知道如何将Student实例变为一个JSON的{}对象。 可选参数default就是把任意一个对象变成一个可序列为JSON的对象,我们只需要为Student专门写一个转换函数,再把函数传进去即可:
不过,下次如果遇到一个Teacher类的实例,照样无法序列化为JSON。我们可以偷个懒,把任意class的实例变为dict: print(json.dumps(s, default=lambda obj: obj.__dict__)) 因为通常class的实例都有一个__dict__属性,它就是一个dict,用来存储实例变量。
同样的道理,如果我们要把JSON反序列化为一个Student对象实例,loads()方法首先转换出一个dict对象,然后,我们传入的object_hook函数负责把dict转换为Student实例:
json模块的dumps()和loads()函数是定义得非常好的接口。 当我们使用时,只需要传入一个必须的参数。但是,当默认的序列化或反序列机制不满足我们的要求时,我们又可以传入更多的参数来定制序列化或反序列化的规则,既做到了接口简单易用,又做到了充分的扩展性和灵活性。
# 优点:普适性更强,目前web的主要数据交换格式,传输两端的语言可以不同
# 缺点:格式要求严格
# python中支持的类型 dict list unicode_str
# 自定义 需要转换成这几种类型才可以序列化
# 同样的,反序列化也需要做同样的映射