一、JsonPath介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互

Python 2.7及之后版本,自带了JSON模块,直接import json就可以使用了

官方文档:http://docs.python.org/library/json.html

Json在线解析网站:http://www.json.cn/

JsonPath基本语法

简介

json简单说就是javascript中的对象和数组,所以这两种结构就是对象和数组两种结构,通过这两种结构可以表示各种复杂的结构

对象

对象在js中表示为{ }括起来的内容,数据结构为 { key:value, key:value, ... }的键值对的结构,在面向对象的语言中,key为对象的属性,value为对应的属性值,所以很容易理解,取值方法为 对象.key 获取属性值,这个属性值的类型可以是数字、字符串、数组、对象这几种

数组

数组在js中是中括号[ ]括起来的内容,数据结构为 ["Python", "javascript", "C++", ...],取值方式和所有语言中一样,使用索引获取,字段值的类型可以是数字、字符串、数组、对象几种

使用

json模块提供了四个功能:dumps、dump、loads、load,用于字符串 和 python数据类型间进行转换

把Json格式字符串解码转换成Python对象 从json到python的类型转化对照如下:

JSON

Python

object

dict

array

list

string

unicode

number(int)

int,long

number(real)

float

true(false)

True(False)

null

None

json.loads()

将Json字符串转Python字典类型

import json
 
strDict = '{"city": "广州", "name": "小黑"}'
r = json.loads(strDict)		# json数据自动按Unicode存储
print(r, type(r))

# 输出结果
{'city': '广州', 'name': '小黑'} <class 'dict'>
json.load()

读取文件中Json形式的字符串元素转化成Python字典类型

# test.json
{
  "city": "广州",
  "name": "小黑"
}

import json
s = json.load(open('test.json','r',encoding='utf-8'))
print(s,type(s))

# 输出结果
{'city': '广州', 'name': '小黑'} <class 'dict'>
json.dumps()

实现Python类型转化为Json字符串,返回一个str对象;把一个Python对象编码转换成Json字符串

import json

listStr = [1, 2, 3, 4]
dictStr = {"city": "北京", "name": "大猫"}

s1 = json.dumps(listStr)
s2 = json.dumps(dictStr, ensure_ascii=False)

print(s1, type(s1))
print(s2, type(s2))

# 输出结果
[1, 2, 3, 4] <class 'str'>
{"city": "北京", "name": "大猫"} <class 'str'>
json.dump()

将Python内置类型序列化为Json对象后写入文件

import json

json_info = "{'city': '北京', 'name': '大猫'}"
file = open('ceshi.json', 'w', encoding='utf-8')
json.dump(json_info, file, ensure_ascii=False)

# ensure_ascii=False 可以让中文解析不乱码

JsonPath

验证jsonpath执行效果

可以在 http://jsonpath.com/

JsonPath与XPath语法对比

Json结构清晰,可读性高,复杂度低,非常容易匹配,下表中对应了XPath的用法

XPath

JSONPath

描述

/

$

根节点

.

@

现行节点

/

. or []

取子节点

..

n/a

取父节点,JsonPath未支持

//

..

不管位置,选取所有符合条件的条件

*****

*****

匹配所有元素节点

@

n/a

根据属性访问,Json不支持,因为Json是键值对递归结构,不需要

[]

[]

迭代器表示(可以在里面进行简单的迭代操作,如:数组下标,根据内容选值等)



[,]

[]

?()

支持过滤操作

n/a

()

支持表达式计算

()

n/a

分组,JsonPath不支持

常见语法

符号

藐视

$

查询的根节点对象,用于表示一个json数据,可以是数组或对象

@

过滤器断言,处理的当前节点对象

*

通配符,可以表示一个名字或数字

..

可以理解为递归搜索

.

表示一个子节点

[‘’ (,‘’)]

表示一个或多个子节点

[(,)]

表示一个或多个数组下标

[strat:end]

数组片段,区间为[start:end],不包含end

[?()]

过滤器表达式,表示结果必须是boolean

符号

描述

$

查询根节点对象,用于表示一个json数据,可以是数组或对象


过滤器,处理当前节点对象

*

获取所有节点

.

获取子节点

...

递归搜索,删选所有符合条件的节点

?()

过滤器表达式,筛选操作

[start:end]

数组片段,区间为[start:end],不包含end

[A]或[A,B]

迭代器下标,表示一个或多个数组下标

函数

名称

描述

输出

min()

获取数值类型数组的最小值

Double

max()

获取数值类型数组的最大值

Double

avg()

获取数值类型数组的平均值

Double

stddev()

获取数值类型数组的标准差

Double

length()

获取数值类型数组的长度

Integer

过滤器

过滤器是用于过滤数组的逻辑表达式,一个通常的表达式形如:[?(@.age > 18)],可以通过逻辑表达式&&或||组合多个过滤器表达式,例如[?(@.price < 10 && @.category == ‘fiction’)],字符串必须用单引号包围,例如[?(@.color == ‘blue’)]

操作符

描述

==

等于号,但数字1不等于字符1

!=

不等于号

<

小于号

<=

小于等于号

>

大于号

>=

大于等于号

=~

判断是否符合正则表达式,例如:[?(@.name =~ /foo.*?/i)]

in

所属符号,例如[?(@.size in [‘S’, ‘M’])]

nin

排除符号

size

数组或者字符串的长度

empty

判空符号

Json Path 示例

{
  "store": {
    "book": [
      {
        "category": "reference",
        "author": "Nigel Rees",
        "title": "Sayings of the Century",
        "price": 8.95
      },
      {
        "category": "fiction",
        "author": "Evelyn Waugh",
        "title": "Sword of Honour",
        "price": 12.99
      },
      {
        "category": "fiction",
        "author": "Herman Melville",
        "title": "Moby Dick",
        "isbn": "0-553-21311-3",
        "price": 8.99
      },
      {
        "category": "fiction",
        "author": "J. R. R. Tolkien",
        "title": "The Lord of the Rings",
        "isbn": "0-395-19395-8",
        "price": 22.99
      }
    ],
    "bicycle": {
      "color": "red",
      "price": 19.95
    }
  }
}
XPath和JsonPath对比

XPath

JsonPath

描述

/store/book/author

$.store.book[*].author

所有book的author节点

//author

$..author

所有的author节点

/store/*

$.store*

store下的所有节点,book数组和bicycle节点

/store//price

$.store..price

store下的所有price节点

//book[3]

$..book[2]

匹配第3个book节点

//book[last()]

$..book[(@.length-1)] 或 $..book[-1:]

匹配倒数第1个book节点

//book[position()<3]

$..book[0,1] 或 $..book[:2]

匹配前2个book节点

//book[isbn]

$..book[?(@.isbn)]

过滤含isbn字段的节点

//book[price<10]

$..book[?(@.price<10)]

过滤price<10的节点

//*

$..*

递归匹配所有节点

JsonPath示例

JsonPath

描述

$.store.book[*].author

所有book的author节点

$..author

所有的author节点

$.store*

store下的所有节点,book数组和bicycle节点

$.store..price

store下的所有price节点

$..book[2]

匹配第3个book节点

$..book.[-2:-1]

匹配倒数第2个book节点

$..book[0,1] 或 $..book[:2]

匹配前2个book节点

$..book[(@.length-1)] 或 $..book[-1:]

匹配倒数第1个book节点

$..book[?(@.isbn)]

过滤含isbn字段的节点

$..book[?(@.price<10)]

过滤price<10的节点

$..*

递归匹配所有节点