JSON 简介
JSON(JavaScript Object Notation)
是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。
json 简单说就是 javascript 中的对象和数组,所以这两种结构就是对象和数组两种结构,通过这两种结构可以表示各种复杂的结构。
- 对象: 对象在 js 中表示为{ }括起来的内容,数据结构为 { key:value, key:value, … }的键值对的结构,在面向对象的语言中,key 为对象的属性,value 为对应的属性值,所以很容易理解,取值方法为 对象.key 获取属性值,这个属性值的类型可以是数字、字符串、数组、对象这几种。
- 数组: 数组在 js 中是中括号[ ]括起来的内容,数据结构为 [“Python”, “javascript”, “C++”, …],取值方式和所有语言中一样,使用索引获取,字段值的类型可以是数字、字符串、数组、对象几种。
Python 中的 json 模块
- Python 中自带了 json 模块,直接
import json
就可以使用了。 - json 模块提供了四个功能:dumps、dump、loads、load,用于字符串和 python 数据类型间进行转换。
Python 字典(dict)和 JSON 字符串的区别
- Python 的字典是一种数据结构,json 是一种数据传输格式及表现形式。
- 字典的 key 值只要能 hash 即可,而 json 必须是字符串。
- json 格式的数据,在 python 中以字符串形式呈现
- json 中的空置为 null,字典中的空值为 None
- json 中的 key 不论是数字还是字符串都要用双引号括起来(key 可以重复)
- python 中的字典 key 为数字时用不用引号括起来都可以(key 不能重复)
- json 里面类似 dict 里面的键可以重复,转换成字典之后,后面的会将前面的覆盖,因为 dict 里面的键不能重复
- dict 里可以嵌套 tuple,json 里只有 array。
- json.dumps({1:2}) 的结果是 {“1”: 2};
- json.dumps((1,2)) 的结果是 [1,2]
Python 中 JSON 模块的方法
1.json.loads()
把 json 格式字符串解码转换成 Python 对象,从 json 到 python 的类型转化对照如下:
import json
strList = '[1, 2, 3, 4]'
strDict = '{"city": "北京", "name": "范爷"}'
json.loads(strList)
# [1, 2, 3, 4]
json.loads(strDict) # json 数据自动按 Unicode 存储
# {u'city': u'\u5317\u4eac', u'name': u'\u5927\u732b'}
2.json.dumps()
实现 python 类型转化为 json 字符串,返回一个 str 对象把一个 Python 对象编码转换成 json 字符串
从 python 字典类型向 json 类型的转化对照如下:
import json
listStr = [1, 2, 3, 4]
tupleStr = (1, 2, 3, 4)
dictStr = {"city": "北京", "name": "范爷"}
json.dumps(listStr)
# '[1, 2, 3, 4]'
json.dumps(tupleStr)
# '[1, 2, 3, 4]'
# 注意:json.dumps() 序列化时默认使用的 ascii 编码
# 添加参数 ensure_ascii=False 禁用 ascii 编码,按 utf-8 编码
json.dumps(dictStr)
# '{"city": "\\u5317\\u4eac", "name": "\\u5927\\u5218"}'
print(json.dumps(dictStr, ensure_ascii=False))
# {"city": "北京", "name": "范爷"}
3.json.dump()
将 Python 内置类型序列化为 json 对象后写入文件:
import json
listStr = [{"city": "北京"}, {"name": "范爷"}]
json.dump(listStr, open("listStr.json", "w"), ensure_ascii=False)
dictStr = {"city": "北京", "name": "范爷"}
json.dump(dictStr, open("dictStr.json", "w"), ensure_ascii=False)
4.json.load()
读取文件中 json 形式的字符串元素转化成 python 类型:
import json
strList = json.load(open("listStr.json"))
print(strList)
# [{u'city': u'\u5317\u4eac'}, {u'name': u'\u5927\u5218'}]
strDict = json.load(open("dictStr.json"))
print(strDict)
# {u'city': u'\u5317\u4eac', u'name': u'\u5927\u5218'}
注意事项
- json.loads() 是把 Json 格式字符串解码转换成 Python 对象,如果在 json.loads的时候出错,要注意被解码的
Json 字符的编码。
如果传入的字符串的编码不是 UTF-8 的话,需要指定字符编码的参数 encoding
dataDict = json.loads(jsonStrGBK);
- dataJsonStr 是 JSON 字符串,假设其编码本身是非 UTF-8 的话而是 GBK 的,那么上述代码会导致出错,改为对应的:
dataDict = json.loads(jsonStrGBK, encoding="GBK");
- 如果 dataJsonStr 通过 encoding 指定了合适的编码,但是其中又包含了其他编码的字符,则需要先去将 dataJsonStr 转换为 Unicode,然后再指定编码格式调用 json.loads()
dataJsonStrUni = dataJsonStr.decode("GB2312");
dataDict = json.loads(dataJsonStrUni, encoding="GB2312");