Django的ORM进阶操作

django1.6中文文档
django1.11官网文档
django2.中文官方文档

一、查询的一般操作

下面有13个方法,是必须掌握的,根据查询返回的结果对这些方法分类:

  • 返回QuerySet对象
    all()
    查询所有结果
    filter(**kwargs)
    它包含了与所给筛选条件相匹配的对象
    exclude(**kwargs)
    它包含了与所给筛选条件不匹配的对象
    order_by()
    对查询结果排序
    reverse()
    对查询结果反向排序,请注意reverse()通常只能在具有已定义顺序的QuerySet上调用(在model类的Meta中指定ordering或调用order_by()方法)。
    distinct()
    从返回结果中剔除重复纪录(如果你查询跨越多个表,可能在计算QuerySet时得到重复的结果。此时可以使用distinct(),注意只有在PostgreSQL中支持按字段去重。)

  • 返回特殊的QuerySet
    values(*field)
    返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的 字典列表
    当不传入参数时,返回这个model的所有字段,如下图:
    values_list(*field)
    它与values()非常相似,它返回的是一个 元组序列 ,values返回的是一个字典列表。可以增加flat=True参数,返回某个字段的列表。例:

    Case_images.objects.filter(case=case_id).order_by('-created_time').values_list('url',flat=True)
    
  • 返回具体对象
    get(**kwargs)
    返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。
    first()
    返回第一条记录
    last()
    返回最后一条记录

  • 返回布尔值
    exists()
    如果QuerySet包含数据,就返回True,否则返回False

  • count()
    返回数据库中匹配查询(QuerySet)的对象数量。

    补充:单表查询的双下划线作用

    models.Tb1.objects.filter(id__lt=10, id__gt=1)   # 获取id大于1 且 小于10的值
    models.Tb1.objects.filter(id__in=[11, 22, 33])   # 获取id等于11、22、33的数据
    models.Tb1.objects.exclude(id__in=[11, 22, 33])  # not in
    models.Tb1.objects.filter(name__contains="ven")  # 获取name字段包含"ven"的
    models.Tb1.objects.filter(name__icontains="ven") # icontains大小写不敏感
    models.Tb1.objects.filter(id__range=[1, 3])      
    # id范围是1到3的,等价于SQL的bettwen and
    #类似的还有:startswith,istartswith, endswith, iendswith 
    如:name__startwith
    #date字段还可以:
    models.Class.objects.filter(first_day__year=2017)
    

    二、ForeignKey操作

    from django.db import models
    # Create your models here.
    class Publisher(models.Model):
        id = models.AutoField(primary_key=True)
        name = models.CharField(max_length=32)
    class Book(models.Model):
        id = models.AutoField(primary_key=True)
        name = models.CharField(max_length=32)
        publisher = models.ForeignKey('Publisher')
        #publisher = models.ForeignKey('Publisher', related_name='person_book')
    正向查找(外键所在表去查另一张表)
    
  • 对象查找(跨表)
    语法:对象.关联字段.字段
    book_obj = models.Book.objects.first()  # 第一本书对象
    print(book_obj.publisher)  # 得到这本书关联的出版社对象
    print(book_obj.publisher.name)  # 得到出版社对象的名称
    
  • 字段查找(跨表)
    利用双下划线跨表查询
    语法:关联字段__字段
    # 查询id是1的书的出版社的名字,一条双下划线就是跨一张表
    models.Book.objects.filter(id=1).values('publisher__name')  
    models.Book.objects.filter(id=1).values_list('publisher__name')  
    models.Book.objects.values_list("publisher__name")
    反向查找(普通表去查外键所在的表)
  • 语法:obj.表名_set
    publisher_obj = models.Publisher.objects.first()  # 找到第一个出版社对象
    books = publisher_obj.book_set.all()  # 找到第一个出版社出版的所有书
    titles = books.values_list("name")  # 找到第一个出版社出版的所有书的书名
    #如果ForeignKey加上related_name参数的话,如改为这样:
    publisher = models.ForeignKey('Publisher', related_name='person_book')
    #那么上述代码就可以这样写,达到的效果是一样的:
    books = publisher_obj.person_book.all()
    titles = books.values_list('name')
    语法:表名__字段
    titles = models.Publisher.objects.values_list("book__name")
    titles=models.Publisher.objects.filter(id=1).values_list('book__name')
    

    三、ManyToManyField 操作

    class RelatedManager
    "关联管理器"是在一对多或者多对多的关联上下文中使用的管理器。
    它存在于下面两种情况:

  • 外键关系的反向查询;
  • 多对多关联关系;
  • 简单来说就是当 点 后面的对象 可能存在多个的时候就可以使用以下的方法。

    create()
    创建一个新的对象,保存对象,并将它添加到关联对象集之中,返回新创建的对象。

    import datetime
    models.Author.objects.first().book_set.create(title="番茄物语", publish_date=datetime.date.today())
    

    add()
    把指定的model对象添加到关联对象集中。

    author_objs = models.Author.objects.filter(id__lt=3)
    models.Book.objects.first().authors.add(*author_objs)
    
    models.Book.objects.first().authors.add(*[1, 2])
    

    set()
    更新model对象的关联对象。

    book_obj = models.Book.objects.first()
    book_obj.authors.set([2, 3])
    

    remove()
    从关联对象集中移除执行的model对象

    book_obj = models.Book.objects.first()
    book_obj.authors.remove(3)
    

    clear()
    从关联对象集中移除一切对象。

    book_obj = models.Book.objects.first()
    book_obj.authors.clear()
    对于ForeignKey对象,clear()和remove()方法仅在null=True时存在。
    举个例子:
    ForeignKey字段没设置null=True时,

    class Book(models.Model):
        title = models.CharField(max_length=32)
        publisher = models.ForeignKey(to=Publisher)
    

    没有clear()和remove()方法:

    >>> models.Publisher.objects.first().book_set.clear()
    Traceback (most recent call last):
      File "<input>", line 1, in <module>
    AttributeError: 'RelatedManager' object has no attribute 'clear'
    

    当ForeignKey字段设置null=True时,

    class Book(models.Model):
        name = models.CharField(max_length=32)
        publisher = models.ForeignKey(to=Class, null=True)
    

    此时就有clear()和remove()方法:

    >>> models.Publisher.objects.first().book_set.clear()
    对于所有类型的关联字段,add()、create()、remove()和clear(),set()都会马上更新数据库。换句话说,在关联的任何一端,都不需要再调用save()方法。

    四、聚合查询和分组查询

    1、aggregate(*args,**kwargs) 聚合函数
    通过对QuerySet进行计算,返回一个聚合值的字典。aggregate()中每一个参数都指定一个包含在字典中的返回值,即在查询集上生成聚合。键的名称是按照字段和聚合函数的名称自动生成出来的。

    from django.db.models import Avg, Sum, Max, Min, Count
    求书籍的平时价格
    models.Book.objects.all().aggregate(Avg("price"))
    #输出结果:
    {'price__avg': 13.233333}
    如果你想要为聚合值指定一个名称,可以向聚合子句提供它。
    models.Book.objects.aggregate(average_price=Avg('price'))
    #输出结果:
    {'average_price': 13.233333}
    如果你希望生成不止一个聚合,你可以向aggregate()子句中添加另一个参数。
    所以,如果你也想知道所有图书价格的最大值和最小值,可以这样查询:
    models.Book.objects.all().aggregate(Avg("price"), Max("price"), Min("price"))
    #输出结果:
    {'price__avg': 13.233333, 'price__max': Decimal('19.90'), 'price__min': Decimal('9.90')}
    

    2、annotate(*args,**kwargs) 分组函数
    我们在这里对比SQL语句的分组和ORM分组有什么区别,
    假设现在有一张公司职员表:

    ORM查询:

    from django.db.models import Avg
    Employee.objects.values("dept").annotate(avg=Avg("salary").values(dept, "avg")
    

    连表查询的分组:

    SQL查询:

    select dept.name,AVG(salary) from employee 
    inner join dept on (employee.dept_id=dept.id) 
    group by dept_id;
    

    ORM查询:

    from django.db.models import Avg
    models.Dept.objects.annotate(avg=Avg("employee__salary")).values("name", "avg")
    

    更多示例:

    示例1:统计每一本书的作者个数

    >>> book_list = models.Book.objects.all().annotate(author_num=Count("author"))
    >>> for obj in book_list:
    ...     print(obj.author_num)
    

    示例2:统计出每个出版社买的最便宜的书的价格

    >>> publisher_list = models.Publisher.objects.annotate(min_price=Min("book__price"))
    >>> for obj in publisher_list:
    ...     print(obj.min_price)
    19.90
    
    >>> models.Book.objects.values("publisher__name").annotate(min_price=Min("price"))
    <QuerySet [{'publisher__name': '沙河出版社', 'min_price': Decimal('9.90')}, {'publisher__name': '人民出版社', 'min_price': Decimal('19.90')}]>
    

    示例3:统计不止一个作者的图书

    >>> models.Book.objects.annotate(author_num=Count("author")).filter(author_num__gt=1)
    <QuerySet [<Book: 番茄物语>]>
    

    示例4:根据一本图书作者数量的多少对查询集 QuerySet进行排序

    >>> models.Book.objects.annotate(author_num=Count("author")).order_by("author_num")
    <QuerySet [<Book: 香蕉物语>, <Book: 橘子物语>, <Book: 番茄物语>]>
    

    示例5:查询各个作者出的书的总价格

    >>> models.Author.objects.annotate(sum_price=Sum("book__price")).values("name", "sum_price")
    <QuerySet [{'name': '小精灵', 'sum_price': Decimal('9.90')}, {'name': '小仙女', 'sum_price': Decimal('29.80')}, {'name': '小魔女', 'sum_price': Decimal('9.90')}]>
    

    五、F查询和Q查询

    1. F查询
    在上面所有的例子中,我们构造的过滤器都只是将字段值与某个常量做比较。如果我们要对两个字段的值做比较,那该怎么做呢?

    Django 提供 F() 来做这样的比较。F() 的实例可以在查询中引用字段,来比较同一个 model 实例中两个不同字段的值。

    查询评论数大于收藏数的书籍

    from django.db.models import F
    models.Book.objects.filter(commnet_num__gt=F('keep_num'))
    

    Django 支持 F() 对象之间以及 F() 对象和常数之间的加减乘除和取模的操作。

    models.Book.objects.filter(commnet_num__lt=F('keep_num')*2)
    

    修改操作也可以使用F函数,比如将每一本书的价格提高30元

    models.Book.objects.all().update(price=F("price")+30)
    如果要修改char字段咋办?
    如:把所有书名后面加上(第一版)

    >>> from django.db.models.functions import Concat
    >>> from django.db.models import Value
    >>> models.Book.objects.all().update(title=Concat(F("title"), Value("("), Value("第一版"), Value(")")))
    

    2. Q查询
    filter() 等方法中的关键字参数查询都是一起进行“AND” 的。 如果你需要执行更复杂的查询(例如OR语句),你可以使用Q对象。

    fifter(Q(查询条件1)| Q(查询条件2))
    fifter(Q(查询条件2)& Q(查询条件3))
    fifter(Q(查询条件4)& ~Q(查询条件5))
    fifter(Q(查询条件6)| Q(Q(查询条件4)& ~ Q(Q(查询条件5)& Q(查询条件3)))

    查询作者名是小仙女或小魔女的

    models.Book.objects.filter(Q(authors__name="小仙女")|Q(authors__name="小魔女"))
    

    你可以组合& 和| 操作符以及使用括号进行分组来编写任意复杂的Q 对象。同时,Q 对象可以使用~ 操作符取反,这允许组合正常的查询和取反(NOT) 查询。

    示例:查询作者名字是小仙女并且不是2018年出版的书的书名。

    >>> models.Book.objects.filter(Q(author__name="小仙女") & ~Q(publish_date__year=2018)).values_list("title")
    <QuerySet [('番茄物语',)]>
    

    查询函数可以混合使用Q 对象和关键字参数。所有提供给查询函数的参数(关键字参数或Q 对象)都将"AND”在一起。但是,如果出现Q 对象,它必须位于所有关键字参数的前面。

    例如:查询出版年份是2017或2018,书名中带物语的所有书。

    >>> models.Book.objects.filter(Q(publish_date__year=2018) | Q(publish_date__year=2017), title__icontains="物语")
    <QuerySet [<Book: 番茄物语>, <Book: 香蕉物语>, <Book: 橘子物语>]>
    

    注意:Q查询条件和非Q查询条件混合使用注意,不包Q()的查询条件一点要放在Q(查询条件)后面

    select_for_update(nowait=False, skip_locked=False)
    返回一个锁住行直到事务结束的查询集,如果数据库支持,它将生成一个 SELECT ... FOR UPDATE 语句。
    举个例子:
    entries = Entry.objects.select_for_update().filter(author=request.user)
    所有匹配的行将被锁定,直到事务结束。这意味着可以通过锁防止数据被其它事务修改。

    一般情况下如果其他事务锁定了相关行,那么本查询将被阻塞,直到锁被释放。 如果这不想要使查询阻塞的话,使用select_for_update(nowait=True)。 如果其它事务持有冲突的锁, 那么查询将引发 DatabaseError 异常。你也可以使用select_for_update(skip_locked=True)忽略锁定的行。 nowait和skip_locked是互斥的,同时设置会导致ValueError。

    目前,postgresql,oracle和mysql数据库后端支持select_for_update()。 但是,MySQL不支持nowait和skip_locked参数。

    使用不支持这些选项的数据库后端(如MySQL)将nowait=True或skip_locked=True转换为select_for_update()将导致抛出DatabaseError异常,这可以防止代码意外终止。

    2. 事务

    import os
    if __name__ == '__main__':
        os.environ.setdefault("DJANGO_SETTINGS_MODULE", "BMS.settings")
        import django
        django.setup()
        import datetime
        from app01 import models
            from django.db import transaction
            with transaction.atomic():
                new_publisher = models.Publisher.objects.create(name="火星出版社")
                models.Book.objects.create(title="橘子物语", publish_date=datetime.date.today(), publisher_id=10)  
    # 指定一个不存在的出版社id
        except Exception as e:
            print(str(e))
    

    六、Django ORM的骚操作(有印象即可)

    1. Django ORM执行原生SQL
    在模型查询API不够用的情况下,我们还可以使用原始的SQL语句进行查询。

    Django 提供两种方法使用原始SQL进行查询:一种是使用raw()方法,进行原始SQL查询并返回模型实例;另一种是完全避开模型层,直接执行自定义的SQL语句。

    执行原生查询
    raw()管理器方法用于原始的SQL查询,并返回模型的实例:
  • 注意:raw()语法查询必须包含主键。

    这个方法执行原始的SQL查询,并返回一个django.db.models.query.RawQuerySet 实例。 这个RawQuerySet 实例可以像一般的QuerySet那样,通过迭代来提供对象实例。

    举个例子:

    class Person(models.Model):
        first_name = models.CharField(...)
        last_name = models.CharField(...)
        birth_date = models.DateField(...)
    

    可以像下面这样执行原生SQL语句

    >>> for p in Person.objects.raw('SELECT * FROM myapp_person'):
    ...     print(p)
    

    raw()查询可以查询其他表的数据。
    举个例子:

    ret = models.Student.objects.raw('select id, tname as hehe from app02_teacher')
        for i in ret:
            print(i.id, i.hehe)
    

    raw()方法自动将查询字段映射到模型字段。还可以通过translations参数指定一个把查询的字段名和ORM对象实例的字段名互相对应的字典

    d = {'tname': 'haha'}
        ret = models.Student.objects.raw('select * from app02_teacher', translations=d)
        for i in ret:
            print(i.id, i.sname, i.haha)
    

    原生SQL还可以使用参数,注意不要自己使用字符串格式化拼接SQL语句,防止SQL注入!

    d = {'tname': 'haha'}
        ret = models.Student.objects.raw('select * from app02_teacher where id > %s', translations=d, params=[1,])
        for i in ret:
            print(i.id, i.sname, i.haha)
    直接执行自定义SQL
    有时候raw()方法并不十分好用,很多情况下我们不需要将查询结果映射成模型,或者我们需要执行DELETE、 INSERT以及UPDATE操作。在这些情况下,我们可以直接访问数据库,完全避开模型层。

    我们可以直接从django提供的接口中获取数据库连接,然后像使用pymysql模块一样操作数据库。

    from django.db import connection, connections
    cursor = connection.cursor()  # cursor = connections['default'].cursor()
    cursor.execute("""SELECT * from auth_user where id = %s""", [1])
    ret = cursor.fetchone()
    

    2. Django终端打印SQL语句
    在Django项目的settings.py文件中,在最后复制粘贴如下代码:

    LOGGING = {
        'version': 1,
        'disable_existing_loggers': False,
        'handlers': {
            'console':{
                'level':'DEBUG',
                'class':'logging.StreamHandler',
        'loggers': {
            'django.db.backends': {
                'handlers': ['console'],
                'propagate': True,
                'level':'DEBUG',
    

    3. 在Python脚本中调用Django环境

    import os
    if __name__ == '__main__':
        os.environ.setdefault("DJANGO_SETTINGS_MODULE", "BMS.settings")
        import django
        django.setup()