Python json和simplejson的使用

在Python中,json数据和字符串的转换可以使用json模块或simplejson模块。

json从Python2.6开始内置到了Python标准库中,我们不需要安装即可直接使用。

simplejson需要安装后才可以使用。

一、安装simplejson

pip install simplejson

二、使用json和simplejson将json格式的数据转换成字符串

import json
import simplejson


list_json = [{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
print(type(list_json))
json_str = json.dumps(list_json, ensure_ascii=False)
print(json_str)
print(type(json_str))
simplejson_str = simplejson.dumps(list_json, ensure_ascii=False)
print(simplejson_str)
print(type(simplejson_str))

运行结果:

<class 'list'>
[{"a": "bbb"}, {"c": "ddd"}, {"e": "fff"}]
<class 'str'>
[{"a": "bbb"}, {"c": "ddd"}, {"e": "fff"}]
<class 'str'>

json和simplejson都提供了dump()和dumps(),dump是用于将内容转json字符串后写入文件中,dumps是将json格式的数据(字典或字典组成的列表)转换成json字符串。

在dumps对数据进行处理时,会做encoding(编码)操作,dumps()中的ensure_ascii默认是为True的,会将中文也编码成ascii,所以我们指定ensure_ascii=False。

三、使用json和simplejson将json字符串转换成其他数据

json_list = json.loads(json_str, encoding='utf-8', strict=False)
print(json_list)
print(type(json_list))
simplejson_list = simplejson.loads(simplejson_str, encoding='utf-8', strict=False)
print(simplejson_list)
print(type(simplejson_list))

运行结果:

[{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
<class 'list'>
[{'a': 'bbb'}, {'c': 'ddd'}, {'e': 'fff'}]
<class 'list'>

json和simplejson都提供了load()和loads(),load与dump对应,是用于从文件中读取json字符串然后进行转换的,loads是将json字符串直接转换成Python数据类型。

在使用loads对json字符串进行转换时,有时候可能因为json字符串的格式不是完全的符合json格式,会造成loads报错,这时候我们可以设置参数strict=False,表示loads()时,不严格检查json格式。

Bug描述:

在使用json.loads()将json字符串转换成json数据时,报错信息:Expecting ',' delimiter line l column .. (char ..),还遇到过这种报错:Expecting ',' delimiter or '}': line l column .. (char ..)

这都是因为json字符串的样式不是合法的json格式,一般这种情况是从数据库中读数据时或者从文件中读数据时会发生.

最常出现的就是数据里面有双引号",并且双引号前没有反斜杠转义。所以在使用json.loads()时要先确认要loads()的json字符串是否合法。如果有双引号则要有反斜杠转义。

解决方法:

        如果出现了上面的报错,可以检查是否有不合法的字符,如有双引号,可以将双引号进行转义,避免解析时将其识别为json的双引号造成双引号多了报错,如果里面有带反斜杠\的url链接,可以将反斜杠\替换成斜杠/。

可以通过re正则进行匹配替换,或者用字符串的replace()方法替换。

    

Python json和simplejson的使用_