18. Django 2.1.7 查询集 QuerySet

原创

海洋的渔夫 2021-06-18 10:09:56 ©著作权

文章标签 Django教程 Python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者海洋的渔夫的原创作品，请联系作者获取转载授权，否则将追究法律责任

上一篇Django 2.1.7 模型 - 条件查询 F对象 Q对象聚合查询讲述了关于Django模型的介绍F对象、Q对象、聚合查询等功能。

不管什么查询，返回的结果都基本是查询集QuerySet，如下：

In [16]: MiddlewareInfo.objects.all()
Out[16]: <QuerySet [<MiddlewareInfo: MiddlewareInfo object (1)>, <MiddlewareInfo: MiddlewareInfo object (2)>, <MiddlewareInfo:
MiddlewareInfo object (3)>, <MiddlewareInfo: MiddlewareInfo object (4)>, <MiddlewareInfo: MiddlewareInfo object (5)>, <Middlewa
reInfo: MiddlewareInfo object (6)>, ...

其中查询集具有缓存、返回多个值、返回单个值、对查询集切片处理等功能。

参考文献

https://docs.djangoproject.com/zh-hans/2.1/topics/db/queries/#caching-and-querysets

返回查询集的过滤器如下：

all()：返回所有数据。
filter()：返回满足条件的数据。
exclude()：返回满足条件之外的数据，相当于sql语句中where部分的not关键字。
order_by()：对结果进行排序。

返回单个值的过滤器如下：

get()：返回单个满足条件的对象
- 如果未找到会引发"模型类.DoesNotExist"异常。
- 如果多条被返回，会引发"模型类.MultipleObjectsReturned"异常。
count()：返回当前查询结果的总条数。
aggregate()：聚合，返回一个字典。

判断某一个查询集中是否有数据：

exists()：判断查询集中是否有数据，如果有则返回True，没有则返回False。

In [18]: MiddlewareInfo.objects.filter( server_id__exact = 2 )

Out[18]: <QuerySet [<MiddlewareInfo: MiddlewareInfo object (3)>, <MiddlewareInfo: MiddlewareInfo object (4)>, <MiddlewareInfo:
MiddlewareInfo object (12)>, <MiddlewareInfo: MiddlewareInfo object (13)>]>

In [19]: MiddlewareInfo.objects.filter( server_id__exact = 2 ).exists()
Out[19]: True

In [20]: MiddlewareInfo.objects.filter( server_id__exact = 3 )
Out[20]: <QuerySet []>

In [21]: MiddlewareInfo.objects.filter( server_id__exact = 3 ).exists()
Out[21]: False

两大特性

惰性执行：创建查询集不会访问数据库，直到调用数据时，才会访问数据库，调用数据的情况包括迭代、序列化、与if合用。
缓存：使用同一个查询集，第一次使用时会发生数据库的查询，然后把结果缓存下来，再次使用这个查询集时会使用缓存的数据。

查询集的缓存

每个查询集都包含一个缓存来最小化对数据库的访问。

在新建的查询集中，缓存为空，首次对查询集求值时，会发生数据库查询，django会将查询的结果存在查询集的缓存中，并返回请求的结果，接下来对查询集求值将重用缓存中的结果。

示例一：经过存储后，可以重用查询集，第二次使用缓存中的数据。

In [29]: list = MiddlewareInfo.objects.filter( server_id__exact = 2 )

In [30]: [ item.name for item in list ]
Out[30]: ['nginx', 'kafka', 'mysql', 'mongodb']

In [31]: [ item.name for item in list ]
Out[31]: ['nginx', 'kafka', 'mysql', 'mongodb']

使用这种方式读取查询集，访问mysql中执行SQL的次数只有第一次读取的时候执行。mysql日志如下：

18. Django 2.1.7 查询集 QuerySet_Django教程_02

示例二：如下是两个查询集，无法重用缓存，每次查询都会与数据库进行一次交互，增加了数据库的负载。

In [32]: [ item.name for item in MiddlewareInfo.objects.filter( server_id__exact = 2 ) ]
Out[32]: ['nginx', 'kafka', 'mysql', 'mongodb']

In [33]: [ item.name for item in MiddlewareInfo.objects.filter( server_id__exact = 2 ) ]
Out[33]: ['nginx', 'kafka', 'mysql', 'mongodb']

可以看到每次读取list的数据时，都进行这个查询集的执行，所以mysql执行日志有两次，如下：

18. Django 2.1.7 查询集 QuerySet_Django教程_03

限制查询集

可以对查询集进行取下标或切片操作，等同于sql中的limit和offset子句。


注意：不支持负数索引。
”

对查询集进行切片后返回一个新的查询集，不会立即执行查询。

如果获取一个对象，直接使用[0]，等同于[0:1].get()，但是如果没有数据，[0]引发IndexError异常，[0:1].get()如果没有数据引发DoesNotExist异常。

示例如下：

In [34]: MiddlewareInfo.objects.all()[0:2]
Out[34]: <QuerySet [<MiddlewareInfo: MiddlewareInfo object (1)>, <MiddlewareInfo: MiddlewareInfo object (2)>]>

In [35]: MiddlewareInfo.objects.all()[0:1]
Out[35]: <QuerySet [<MiddlewareInfo: MiddlewareInfo object (1)>]>

In [36]: MiddlewareInfo.objects.all()[0]
Out[36]: <MiddlewareInfo: MiddlewareInfo object (1)>