Django(聚合、分组、FQ、Django事务、ORM字段、查询优化)
https://www.zhihu.com/video/1250912499274592256
分组
aggrate :聚合函数,如man、min、count、sum、avg
annotate:分组
按照字段分组:models.xxx.objects.values("分组字段").annotate()
F与Q
F:字段和字段做比较(普通的是字段和常量做比较)、字段修改
Q:and、or、not
only与defer
only:仅查询only里面的字段
defer:不要xx字段
perfetch_related与select_related
prefetch_related:子查询
select_related:联表查询
今日考题
"""
1.必知必会N条都有哪些,每个都是干啥使的
2.简述神奇的双下划线查询都有哪些方法,作用是什么
3.针对多对多外键字段的增删改查方法有哪些,各有什么特点?
4.什么是正反向的概念,及查询口诀,你能否总结一下正反向查询不同情况下点击不同字段的规律
"""
答案
1.必知必会N条都有哪些,每个都是干啥使的
all() 查所有
filter() 查询带条件的
get() 查询带条件的,但是条件不成立会报错,所以不经常用
values() 获取指定的字段的数据,返回一个queryset对象,列表套字典
values_list() 获取指定的字段的数据,queryset,列表套元组
count() 查询统计出来的数据个数
first()
last()
exclude() 除...之外
order_by 排序 默认升序 参数前面加负号是降序
reverse 反转,必须在排序之后才可以使用
distinct 去重(要去除主键)
exists() 判断是否有值,返回t/f
2.简述神奇的双下划线查询都有哪些方法,作用是什么
__gt 大于
__lt 小于
__gte 大于等于
__lte 小于等于
__in 在不在多个数据之内 便是或关系
__range 在不在多个数据之内 是包括报喜
__month 查询月份
__year 查询年份
__contains 模糊查询
__icontains 忽略大小写的模糊查询
3.针对多对多外键字段的增删改查方法有哪些,各有什么特点?
remove
:上述方法括号里面放数字或者对象都可以,都可以放多个
set:括号里面放可迭代对象eg:列表 可以放对象也可以放数字,也可以放一个,但必须放可迭代对象
clear:括号内无需传值,直接清空所有
4.什么是正反向的概念,及查询口诀,你能否总结一下正反向查询不同情况下点击不同字段的规律
正向:主键在自身,要查外表
反向:主键不在自身,要查主键在的表
正向查询按外键字段,反向查询按表名小写
正向在values里面做文章
反正在filter里面做文章
内容回顾
- 单表的增删改查
# 增
1.create()
2.对象.save()
1.all() 查所有
2.filter() 筛选条件,括号内多个参数之间逗号隔开并且默认是and关系
3.get() 筛选条件,条件不存在直接报错 所以不推荐使用
1.update() queryset对象帮你封装的批量更新
2.对象.save()
1.delete() queryset对象帮你封装的批量删除
2.对象.delete()
在实际的项目中 数据是不可能真正删除的 一般情况下都用一个字段来标记是否删除
"""
- 测试环境准备
# 你如果只想测试django某一个py文件(大部分情况下就是models.py)
# 在应用下的tests.py或者自己新建一个任意名称py文件(tests.py)
1.去manage.py拷贝前四行
2.自己书写两行
import django
django.setup()
"""
- 如何查看orm内部的sql语句
# 1.queryset对象可以直接点query查看
queryset对象.query
# 2.配置文件配置日志相关代码即可(不要记 直接拷贝使用即可)
参考笔记或者博客自己保存好
- 必知必会N多条
# 1.all()
# 2.filter()
我们在利用数据的主键字段筛选数据的时候,可以不考虑主键字段叫什么,直接使用pk代替
# 3.get()
# 4.values()
获取指定字段对应的数据 返回的结果是一个queryset对象(列表套字典的形式)
# 5.values_list()
获取指定字段对应的数据 返回的结果是一个queryset对象(列表套元祖的形式)
# 6.count()
统计查询出来的数据个数
# 7.first()
# 8.last()
# 9.order_by()
默认是升序,你可以在字段前面加一个负改为降序
# 10.reverse()
前面必须是已经排讯过了 才能生效
# 11.exclude()
排除...在外
# 12.distinct()
去重(主键一定不要忘了)
# 13.exists()
判断数据集是否有值 返回布尔值
- 神奇的双下划线查询
# 价格大于 小于 大于等于 小于等于
price__gt
price__lt
price__gte
price__lte
# 成员查询
price__in
# 范围查询
price__range
# 模糊查询
title__contains 默认是区分大小写的
title__icontains 忽略大小写
# 只按照年份或者月份或者...
create_time__year
craete_time__month
- 外键字段的增删改查
# 一对多
publish_id = 1
punlish = publish_obj
# 多对多
remove
上述两个方法括号内即可以传数字也可以传对象并且都支持多个
括号内必须传一个可迭代对象 可迭代对象里面的元素可以数字也可以对象并且都支持多个
clear
括号内无需给任何参数,直接清空对应的关系数据
- 多表查询
# 正反向的概念
外键字段就在我手中
外键字段不再我手中
# 小口诀
正向查询按外键字段
反向查询按表名小写
.all()
# 温馨提示
书写orm语句跟书写sql语句一样,不要试图一次性写完,可以分步书写
1.子查询
2.联表操作
inner join
left join
right join
union
Django orm中
1.基于对象的跨表查询
1.先拿到一个数据对象
2.对象点点点
2.基于双下划线的跨表查询
1.基于对象的跨表查询
book_obj.publish
book_obj.authors.all()
author_obj.author_detail
publish_obj.book_set # App01.Book.None
publish_obj.book_set.all()
author_obj.book_set.all()
author_detail.author
2.基于双下划线的跨表查询
models.Book.objects.filter(pk=1).values('title','publish__name')
models.Publish.objects.filter(book__id=1).values('book__title','name')
# 利用双下划线的跨表查询可以帮助你跨N多张表,只要有外键字段
models.Book.objects.filter(pk=1).values('authors__author_detail__phone')
# 图书管理系统 图书的增删改查
内容概要
- 聚合查询(聚合函数的使用)aggregate
max、min、sum、count、avg
- 分组查询(group by的使用)annotate
- F与Q查询
- django中如何开启事务
- orm中常用字段及参数
- 数据库查询优化(only与defer、select_related与prefetch_related)
- 图书管理系统讲解
今日内容详细
聚合查询
只要是跟数据库相关的模块
基本上都在django.db.models里面
如果没有那么应该在django.db里面
# 聚合查询 aggregate
聚合查询通常情况下都是配合分组一起使用的
from app01 import models
from django.db.models import Max,Min,Sum,Count,Avg
# 1 所有书的平均价格
# res = models.Book.objects.aggregate(Avg('price'))
# print(res)
# 2.上述方法一次性使用
res = models.Book.objects.aggregate(Max('price'),Min('price'),Sum('price'),Count('pk'),Avg('price'))
print(res)
分组查询
# 分组查询 annotate
MySQL分组查询都有哪些特点
分组之后默认只能获取到分组的依据 组内其他字段都无法直接获取了
ONLY_FULL_GROUP_BY
from django.db.models import Max, Min
, Sum, Count, Avg
# 1.统计每一本书的作者个数
# 思路:以书分组
# res = models.Book.objects.annotate() # models后面点什么 就是按什么分组
# res = models.Book.objects.annotate(author_num=Count('authors')).values('title','author_num')
author_num是我们自己定义的字段 用来存储统计出来的每本书对应的作者个数
# res1 = models.Book.objects.annotate(author_num=Count('authors__id')).values('title','author_num')
# print(res,res1)
代码没有补全 不要怕 正常写
补全给你是pycharm给你的
# 2.统计每个出版社卖的最便宜的书的价格
# res = models.Publish.objects.annotate(min_price=Min('book__price')).values('name','min_price')
# print(res)
# 3.统计不止一个作者的图书
# 1.先按照图书分组 求每一本书对应的作者个数
# 2.过滤出不止一个作者的图书
# res = models.Book.objects.annotate(author_num=Count('authors')).filter(author_num__gt=1).values('title','author_num')
# """
# 只要你的orm语句得出的结果还是一个queryset对象
# 那么它就可以继续无限制的点queryset对象封装的方法
# """
# print(res)
# 4.查询每个作者出的书的总价格
# res = models.Author.objects.annotate(sum_price=Sum('book__price')).values('name','sum_price')
# print(res)
如果我想按照指定的字段分组该如何处理呢?
models.Book.objects.values('price').annotate()
你们的机器上如果出现分组查询报错的情况
你需要修改数据库严格模式
"""
F与Q查询
# F查询
# 1.查询卖出数大于库存数的书籍
# F查询
能够帮助你直接获取到表中某个字段对应的数据
from django.db.models import F
# res = models.Book.objects.filter(maichu__gt=F('kucun'))
# print(res)
# 2.将所有书籍的价格提升500块
# models.Book.objects.update(price=F('price') + 500)
# 3.将所有书的名称后面加上爆款两个字
在操作字符类型的数据的时候 F不能够直接做到字符串的拼接
from django.db.models.functions import Concat
from django.db.models import Value
models.Book.objects.update(title=Concat(F('title'), Value('爆款')))
# models.Book.objects.update(title=F('title') + '爆款') # 所有的名称会全部变成空白
# Q查询
# 1.查询卖出数大于100或者价格小于600的书籍
# res = models.Book.objects.filter(maichu__gt=100,price__lt=600)
"""filter括号内多个参数是and关系"""
from django.db.models import Q
# res = models.Book.objects.filter(Q(maichu__gt=100),Q(price__lt=600)) # Q包裹逗号分割 还是and关系
# res = models.Book.objects.filter(Q(maichu__gt=100)|Q(price__lt=600)) # | or关系
# res = models.Book.objects.filter(~Q(maichu__gt=100)|Q(price__lt=600)) # ~ not关系
# print(res) # <QuerySet []>
# esc下面的~
# Q的高阶用法 能够将查询条件的左边也变成字符串的形式
q = Q()
q.connector = 'or' # 不写这行 默认是and
q.children.append(('maichu__gt',100))
q.children.append(('price__lt',600))
res = models.Book.objects.filter(q) # 默认还是and关系
print(res)
django中如何开启事务
"""
不可分割的最小单位
跟原子性是相辅相成
事务之间互相不干扰
事务一旦确认永久生效
事务的回滚
rollback
事务的确认
commit
# 目前你只需要掌握Django中如何简单的开启事务
from django.db import transaction
try:
with transaction.atomic():
# sql1
# sql2
# 在with代码快内书写的所有orm操作都是属于同一个事务
except Exception as e:
print(e)
print('执行其他操作')
orm中常用字段及参数
AutoField
主键字段 primary_key=True
CharField varchar
verbose_name 字段的注释
max_length 长度
IntegerField int
BigIntegerField bigint
DecimalField
max_digits=8
decimal_places=2
EmailFiled varchar(254)
DateField date
DateTimeField datetime
auto_now:每次修改数据的时候都会自动更新当前时间
auto_now_add:只在创建数据的时候记录创建时间后续不会自动修改了
BooleanField(Field) - 布尔值类型
该字段传布尔值(False/True) 数据库里面存0/1
TextField(Field) - 文本类型
该字段可以用来存大段内容(文章、博客...) 没有字数限制
后面的bbs作业 文章字段用的就是TextField
FileField(Field) - 字符类型
upload_to = "/data"
给该字段传一个文件对象,会自动将文件保存到/data目录下然后将文件路径保存到数据库中
/data/a.txt
后面bbs作业也会涉及
# 更多字段
AutoField(Field)
- int自增列,必须填入参数 primary_key=True
BigAutoField(AutoField)
- bigint自增列,必须填入参数 primary_key=True
注:当model中如果没有自增列,则自动会创建一个列名为id的列
from django.db import models
class UserInfo(models.Model):
# 自动创建一个列名为id的且为自增的整数列
username = models.CharField(max_length=32)
class Group(models.Model):
# 自定义自增列
nid = models.AutoField(primary_key=True)
name = models.CharField(max_length=32)
SmallIntegerField(IntegerField):
- 小整数 -32768 ~ 32767
PositiveSmallIntegerField(PositiveIntegerRelDbTypeMixin, IntegerField)
- 正小整数 0 ~ 32767
IntegerField(Field)
- 整数列(有符号的) -2147483648 ~ 2147483647
PositiveIntegerField(PositiveIntegerRelDbTypeMixin, IntegerField)
- 正整数 0 ~ 2147483647
BigIntegerField(IntegerField):
- 长整型(有符号的) -9223372036854775808 ~ 9223372036854775807
BooleanField(Field)
- 布尔值类型
NullBooleanField(Field):
- 可以为空的布尔值
CharField(Field)
- 字符类型
- 必须提供max_length参数, max_length表示字符长度
TextField(Field)
- 文本类型
EmailField(CharField):
- 字符串类型,Django Admin以及ModelForm中提供验证机制
IPAddressField(Field)
- 字符串类型,Django Admin以及ModelForm中提供验证 IPV4 机制
GenericIPAddressField(Field)
- 字符串类型,Django Admin以及ModelForm中提供验证 Ipv4和Ipv6
- 参数:
protocol,用于指定Ipv4或Ipv6, 'both',"ipv4","ipv6"
unpack_ipv4, 如果指定为True,则输入::ffff:192.0.2.1时候,可解析为192.0.2.1,开启此功能,需要protocol="both"
URLField(CharField)
- 字符串类型,Django Admin以及ModelForm中提供验证 URL
SlugField(CharField)
- 字符串类型,Django Admin以及ModelForm中提供验证支持 字母、数字、下划线、连接符(减号)
CommaSeparatedIntegerField(CharField)
- 字符串类型,格式必须为逗号分割的数字
UUIDField(Field)
- 字符串类型,Django Admin以及ModelForm中提供对UUID格式的验证
FilePathField(Field)
- 字符串,Django Admin以及ModelForm中提供读取文件夹下文件的功能
- 参数:
path, 文件夹路径
match=None, 正则匹配
recursive=False, 递归下面的文件夹
allow_files=True, 允许文件
allow_folders=False, 允许文件夹
FileField(Field)
- 字符串,路径保存在数据库,文件上传到指定目录
- 参数:
upload_to = "" 上传文件的保存路径
storage = None 存储组件,默认django.core.files.storage.FileSystemStorage
ImageField(FileField)
- 字符串,路径保存在数据库,文件上传到指定目录
- 参数:
upload_to = "" 上传文件的保存路径
storage = None 存储组件,默认django.core.files.storage.FileSystemStorage
width_field=None, 上传图片的高度保存的数据库字段名(字符串)
height_field=None 上传图片的宽度保存的数据库字段名(字符串)
DateTimeField(DateField)
- 日期+时间格式 YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ]
DateField(DateTimeCheckMixin, Field)
- 日期格式 YYYY-MM-DD
TimeField(DateTimeCheckMixin, Field)
- 时间格式 HH:MM[:ss[.uuuuuu]]
DurationField(Field)
- 长整数,时间间隔,数据库中按照bigint存储,ORM中获取的值为datetime.timedelta类型
FloatField(Field)
- 浮点型
DecimalField(Field)
- 10进制小数
- 参数:
max_digits,小数总长度
decimal_places,小数位长度
BinaryField(Field)
- 二进制类型
# django除了给你提供了很多字段类型之外 还支持你自定义字段
class MyCharField(models.Field):
def __init__(self,max_length,*args,**kwargs):
self.max_length = max_length
# 调用父类的init方法
super().__init__(max_length=max_length,*args,**kwargs) # 一定要是关键字的形式传入
def db_type(self, connection):
返回真正的数据类型及各种约束条件
:param connection:
:return:
return 'char(%s)'%self.max_length
# 自定义字段使用
myfield = MyCharField(max_length=16,null=True)
# 外键字段及参数
unique=True
ForeignKey(unique=True) === OneToOneField()
# 你在用前面字段创建一对一 orm会有一个提示信息 orm推荐你使用后者但是前者也能用
db_index
如果db_index=True 则代表着为此字段设置索引
to_field
设置要关联的表的字段 默认不写关联的就是另外一张的主键字段
on_delete
当删除关联表中的数据时,当前表与其关联性的行为。
django2.X及以上版本 需要你自己指定外键字段的级联更新级联删除
"""
数据库查询优化
only与defer
select_related与prefetch_related
orm语句的特点:
如果你仅仅只是书写了orm语句 在后面根本没有用到该语句所查询出来的参数
那么orm会自动识别 直接不执行
# only与defer
# res = models.Book.objects.all()
# print(res) # 要用数据了才会走数据库
# 想要获取书籍表中所有数的名字
# res = models.Book.objects.values('title')
# for d in res:
# print(d.get('title'))
# 你给我实现获取到的是一个数据对象 然后点title就能够拿到书名 并且没有其他字段
# res = models.Book.objects.only('title')
# res = models.Book.objects.all()
# print(res) # <QuerySet [<Book: 三国演义爆款>, <Book: 红楼梦爆款>, <Book: 论语爆款>, <Book: 聊斋爆款>, <Book: 老子爆款>]>
# for i in res:
# print(i.title) # 点击only括号内的字段 不会走数据库
# print(i.price) # 点击only括号内没有的字段 会重新走数据库查询而all不需要走了
res = models.Book.objects.defer('title') # 对象除了没有title属性之外其他的都有
for i in res:
print(i.price)
only:括号内放的字段是查询的对象的话,那么就不走数据库,其他的需要走数据库
defer与only刚好相反
defer括号内放的字段不在查询出来的对象里面 查询该字段需要重新走数据
而如果查询的是非括号内的字段 则不需要走数据库了
# select_related与prefetch_related
# select_related与prefetch_related 跟跨表操作有关
# res = models.Book.objects.all()
# for i in res:
# print(i.publish.name) # 每循环一次就要走一次数据库查询
# res = models.Book.objects.select_related('authors') # INNER JOIN
select_related内部直接先将book与publish连起来 然后一次性将大表里面的所有数据
全部封装给查询出来的对象
这个时候对象无论是点击book表的数据还是publish的数据都无需再走数据库查询了
select_related括号内只能放外键字段 一对多 一对一
多对多也不行,会报错
因为他有拼表的操作,有时候可能效率比下面的要低
res = models.Book.objects.prefetch_related('publish') # 子查询