一、JsonPath介绍
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互
Python 2.7及之后版本,自带了JSON模块,直接import json就可以使用了
官方文档:http://docs.python.org/library/json.html
Json在线解析网站:http://www.json.cn/
JsonPath基本语法
简介
json简单说就是javascript中的对象和数组,所以这两种结构就是对象和数组两种结构,通过这两种结构可以表示各种复杂的结构
对象
对象在js中表示为{ }括起来的内容,数据结构为 { key:value, key:value, ... }的键值对的结构,在面向对象的语言中,key为对象的属性,value为对应的属性值,所以很容易理解,取值方法为 对象.key 获取属性值,这个属性值的类型可以是数字、字符串、数组、对象这几种
数组
数组在js中是中括号[ ]括起来的内容,数据结构为 ["Python", "javascript", "C++", ...],取值方式和所有语言中一样,使用索引获取,字段值的类型可以是数字、字符串、数组、对象几种
使用
json模块提供了四个功能:dumps、dump、loads、load,用于字符串 和 python数据类型间进行转换
把Json格式字符串解码转换成Python对象 从json到python的类型转化对照如下:
JSON | Python |
object | dict |
array | list |
string | unicode |
number(int) | int,long |
number(real) | float |
true(false) | True(False) |
null | None |
json.loads()
将Json字符串转Python字典类型
import json
strDict = '{"city": "广州", "name": "小黑"}'
r = json.loads(strDict) # json数据自动按Unicode存储
print(r, type(r))
# 输出结果
{'city': '广州', 'name': '小黑'} <class 'dict'>
json.load()
读取文件中Json形式的字符串元素转化成Python字典类型
# test.json
{
"city": "广州",
"name": "小黑"
}
import json
s = json.load(open('test.json','r',encoding='utf-8'))
print(s,type(s))
# 输出结果
{'city': '广州', 'name': '小黑'} <class 'dict'>
json.dumps()
实现Python类型转化为Json字符串,返回一个str对象;把一个Python对象编码转换成Json字符串
import json
listStr = [1, 2, 3, 4]
dictStr = {"city": "北京", "name": "大猫"}
s1 = json.dumps(listStr)
s2 = json.dumps(dictStr, ensure_ascii=False)
print(s1, type(s1))
print(s2, type(s2))
# 输出结果
[1, 2, 3, 4] <class 'str'>
{"city": "北京", "name": "大猫"} <class 'str'>
json.dump()
将Python内置类型序列化为Json对象后写入文件
import json
json_info = "{'city': '北京', 'name': '大猫'}"
file = open('ceshi.json', 'w', encoding='utf-8')
json.dump(json_info, file, ensure_ascii=False)
# ensure_ascii=False 可以让中文解析不乱码
JsonPath
验证jsonpath执行效果
JsonPath与XPath语法对比
Json结构清晰,可读性高,复杂度低,非常容易匹配,下表中对应了XPath的用法
XPath | JSONPath | 描述 |
/ | $ | 根节点 |
. | @ | 现行节点 |
/ | . or [] | 取子节点 |
.. | n/a | 取父节点,JsonPath未支持 |
// | .. | 不管位置,选取所有符合条件的条件 |
***** | ***** | 匹配所有元素节点 |
@ | n/a | 根据属性访问,Json不支持,因为Json是键值对递归结构,不需要 |
[] | [] | 迭代器表示(可以在里面进行简单的迭代操作,如:数组下标,根据内容选值等) |
[,] | ||
[] | ?() | 支持过滤操作 |
n/a | () | 支持表达式计算 |
() | n/a | 分组,JsonPath不支持 |
常见语法
符号 | 藐视 |
$ | 查询的根节点对象,用于表示一个json数据,可以是数组或对象 |
@ | 过滤器断言,处理的当前节点对象 |
* | 通配符,可以表示一个名字或数字 |
.. | 可以理解为递归搜索 |
. | 表示一个子节点 |
[‘’ (,‘’)] | 表示一个或多个子节点 |
[(,)] | 表示一个或多个数组下标 |
[strat:end] | 数组片段,区间为[start:end],不包含end |
[?()] | 过滤器表达式,表示结果必须是boolean |
符号 | 描述 |
$ | 查询根节点对象,用于表示一个json数据,可以是数组或对象 |
@· | 过滤器,处理当前节点对象 |
* | 获取所有节点 |
. | 获取子节点 |
... | 递归搜索,删选所有符合条件的节点 |
?() | 过滤器表达式,筛选操作 |
[start:end] | 数组片段,区间为[start:end],不包含end |
[A]或[A,B] | 迭代器下标,表示一个或多个数组下标 |
函数
名称 | 描述 | 输出 |
min() | 获取数值类型数组的最小值 | Double |
max() | 获取数值类型数组的最大值 | Double |
avg() | 获取数值类型数组的平均值 | Double |
stddev() | 获取数值类型数组的标准差 | Double |
length() | 获取数值类型数组的长度 | Integer |
过滤器
过滤器是用于过滤数组的逻辑表达式,一个通常的表达式形如:[?(@.age > 18)],可以通过逻辑表达式&&或||组合多个过滤器表达式,例如[?(@.price < 10 && @.category == ‘fiction’)],字符串必须用单引号包围,例如[?(@.color == ‘blue’)]
操作符 | 描述 |
== | 等于号,但数字1不等于字符1 |
!= | 不等于号 |
< | 小于号 |
<= | 小于等于号 |
> | 大于号 |
>= | 大于等于号 |
=~ | 判断是否符合正则表达式,例如:[?(@.name =~ /foo.*?/i)] |
in | 所属符号,例如[?(@.size in [‘S’, ‘M’])] |
nin | 排除符号 |
size | 数组或者字符串的长度 |
empty | 判空符号 |
Json Path 示例
{
"store": {
"book": [
{
"category": "reference",
"author": "Nigel Rees",
"title": "Sayings of the Century",
"price": 8.95
},
{
"category": "fiction",
"author": "Evelyn Waugh",
"title": "Sword of Honour",
"price": 12.99
},
{
"category": "fiction",
"author": "Herman Melville",
"title": "Moby Dick",
"isbn": "0-553-21311-3",
"price": 8.99
},
{
"category": "fiction",
"author": "J. R. R. Tolkien",
"title": "The Lord of the Rings",
"isbn": "0-395-19395-8",
"price": 22.99
}
],
"bicycle": {
"color": "red",
"price": 19.95
}
}
}
XPath和JsonPath对比
XPath | JsonPath | 描述 |
/store/book/author | $.store.book[*].author | 所有book的author节点 |
//author | $..author | 所有的author节点 |
/store/* | $.store* | store下的所有节点,book数组和bicycle节点 |
/store//price | $.store..price | store下的所有price节点 |
//book[3] | $..book[2] | 匹配第3个book节点 |
//book[last()] | $..book[(@.length-1)] 或 $..book[-1:] | 匹配倒数第1个book节点 |
//book[position()<3] | $..book[0,1] 或 $..book[:2] | 匹配前2个book节点 |
//book[isbn] | $..book[?(@.isbn)] | 过滤含isbn字段的节点 |
//book[price<10] | $..book[?(@.price<10)] | 过滤price<10的节点 |
//* | $..* | 递归匹配所有节点 |
JsonPath示例
JsonPath | 描述 |
$.store.book[*].author | 所有book的author节点 |
$..author | 所有的author节点 |
$.store* | store下的所有节点,book数组和bicycle节点 |
$.store..price | store下的所有price节点 |
$..book[2] | 匹配第3个book节点 |
$..book.[-2:-1] | 匹配倒数第2个book节点 |
$..book[0,1] 或 $..book[:2] | 匹配前2个book节点 |
$..book[(@.length-1)] 或 $..book[-1:] | 匹配倒数第1个book节点 |
$..book[?(@.isbn)] | 过滤含isbn字段的节点 |
$..book[?(@.price<10)] | 过滤price<10的节点 |
$..* | 递归匹配所有节点 |