Django数据库访问优化

zcyuefan

2018-11-07

先做性能分析 - 两个工具

django.db.connection

from django.db import connection
# context
print connection.queries
# content
''' result is:
[{
'time': '0.002',
'sql': u'SELECT `django_session`.`session_key`, `django_session`.`session_data`, `django_session`.`expire_date` FROM `django_session` WHERE (`django_session`.`session_key` = 5584f8d708ddc2d5e32831885fc36084 AND `django_session`.`expire_date` &gt; 2013-05-07 10:39:36 )'}]
'''

django_debug_toolbar link

标准的数据库优化技巧

Indexes, 分析应该添加什么样的索引,使用 django.db.models.Field.db_index
使用对应的字段类型

title = models.CharField(max_length=100, blank=True, db_index=True, verbose_name=u'标题')

理解QuerySets

理解QuerySet的求值过程

QuerySets是惰性的

news_list = News.object.all()
# 此时并未执行数据库查询
print news_list # 用时方执行查询操作

何时它们被执行.

# 用时方执行查询操作
print news_list

数据如何被缓存

# 这样的QuerySet没有被缓存
print([e.headline for e in Entry.objects.all()])
print([e.pub_date for e in Entry.objects.all()])
# 这么做
entries = Entry.objects.all()
print([e.headline for e in entries])

理解被缓存的属性

QuerySet 会被缓存
不可被调用的属性会被缓存

&gt;&gt;&gt; news = News.objects.get(id=1)
&gt;&gt;&gt; news.channel # 此时的channel对象会从数据库取出
&gt;&gt;&gt; news.channel # 这时的channel是缓存的版本，不会造成数据库访问

方法的调用每次都会触发数据库查询

&gt;&gt;&gt; news = News.objects.get(id=1)
&gt;&gt;&gt; news.authors.all() # 执行查询
&gt;&gt;&gt; news.authors.all() # 再次执行查询

注意
模板系统不允许使用括号，但它会自动调用可被调用的属性
自定义的属性需要由你来实现缓存。

使用with模板标签

在模板中使用QuerySet缓存，需要使用with标签

使用iterator()

获取大量数据时

news_list = News.objects.filter(title__contains=u'违法')
for news in news_list.iterator():
 print news

让数据库做它自己的工作

基本概念

使用 filter and exclude 在数据库层面执行过滤操作

news_list = News.objects.filter(title__contains=u'和谐').exclude(status=1)

使用 F() object query expressions 在同一模型中使用不同字段进行对比过滤

# 查询所有title和sub_title相同的数据
queryset = News.objects.filter(title=F('sub_title'))

使用注解

# 给每个对象添加一个news_count的属性
cl = Channel.objects.filter(parent__id=1).annotate(news_count=Count('news'))
print cl[0].news_count

如果这些还不足以生成你需要的SQL的话，继续往下看：

使用 QuerySet.extra()

显式的执行SQL语句

cl = Channel.objects.filter(parent__id=1).extra(
 select={
 'another_news_count': 'SELECT COUNT(*) FROM web_news WHERE web_news.channel_id = web_channel.id'
 }
)
print cl[0].another_news_count

使用原生的SQL

cl = Channel.objects.raw('SELECT * FROM web_channel WHERE parent_id = 1')
print cl
# &lt;RawQuerySet: 'SELECT * FROM web_channel WHERE parent_id = 1'&gt;
for c in cl:
 print c

预加载数据

尽量一次加载你需要的数据

QuerySet.select_related() ,针对foreign key 和 one-to-one

news = News.objects.select_related().get(id=372924135)
print news.channel # 不会访问数据库

QuerySet.prefetch_related() ,1.4中存在, 和select_related()类似，针对many-to-many

不要获取你不需要的数据

使用 QuerySet.values() 和 values_list()

当只需要一个字段的值，返回list或者dict时，使用

values

news_list = News.objects.values('title').filter(channel__id=1)
print news_list
# [{'title': ''}, ...]

values_list

news_list = News.objects.values_list('title').filter(channel__id=1)
print news_list
# [('新闻标题',),('新闻标题', ) ...]

使用 QuerySet.defer() 和 only()

QuerySet.defer() 来延迟加载某字段，加载时会产生额外查询

news_list = News.object.defer('title').all()
n = news_list[0]
print n.title # 会产生额外的查询语句

QuerySet.only() 只加载某字段，之后读取任何属性都会产生查询

使用 QuerySet.count()

如果你只是想要获取有多少数据，不要使用 len(queryset) 。

nl = News.objects.filter(channel__id=2)
nl.count()
# SELECT COUNT(*) FROM `web_news` WHERE `web_news`.`channel_id` = 2 ; 'time': '0.014'
len(nl)
# 'time': '0.422'

使用 QuerySet.exists()

如果你只是想要知道是否至少存在一个结果，不要使用 if querysets 。

不要过度使用 count() 和 exists()

比如，假设有一个Email的model，有一个 body 的属性和一个多对多关系的User属性，下面的模板代码是最优的：

{% if display_inbox %}
 {% with emails=user.emails.all %}
 {% if emails %}
 &lt;p&gt;You have {{ emails|length }} email(s)&lt;/p&gt;
 {% for email in emails %}
 &lt;p&gt;{{ email.body }}&lt;/p&gt;
 {% endfor %}
 {% else %}
 &lt;p&gt;No messages today.&lt;/p&gt;
 {% endif %}
 {% endwith %}
{% endif %}

它是最优的是因为：

因为QuerySet是惰性的，如果 'display_inbox' 是False的话，这不会产生数据库查询。
使用 with 意味着我们会存储 user.emails.all 在一个变量中供后面使用，这允许被缓存以便重用。
{% if emails %} 其实是调用 QuerySet.__nonzero__() ，在数据库层面执行 user.emails.all() ，然后返回结果，放入缓存。
{{ emails|length }} 的使用将调用 QuerySet.__len__(),数据已在缓存
for 循环的email数据已经在缓存中了。
with的使用是关键
每次的QuerySet.count()调用都会产生查询

使用 QuerySet.update() 和 delete()

批量更新使用 QuerySet.update()
批量删除使用 QuerySet.delete()
批量操作不会调用类中定义的 save() 或 delete() 方法

直接使用外键的值

获取频道ID:

news.channel_id

而不是:

news.channel.id

批量插入

用 django.db.models.query.QuerySet.bulk_create() 批量创建对象,减少SQL查询的数量。比如

Entry.objects.bulk_create([
 Entry(headline="Python 3.0 Released"),
 Entry(headline="Python 3.1 Planned")
])

...而不是

Entry.objects.create(headline="Python 3.0 Released")
Entry.objects.create(headline="Python 3.1 Planned")

这同样适用于 ManyToManyFields, 因此，这么做

team.members.add(me, my_friend)

...而不是这么做

team.members.add(me)
team.members.add(my_friend)

...这里 team 和 members 是多对多的关系。

django 数据库 ul 缓存

zcyuefan

0 关注 0 粉丝 0 动态

关注关注

Django QuerySet查询集原理及代码实例

Django的ORM中存在查询集的概念。查询集，也称查询结果集、QuerySet，表示从数据库中获取的对象集合。filter()：返回满足条件的数据。order_by()：对结果进行排序。对查询集可以再次调用过滤器进行过滤，也就意味着查询集可以含有零个、一

黄书胜 2020-06-14

django配置跨域并开发测试接口

// 允许携带cookie访问我。# 添加 django-cors-headers 使其可以进行 cors 跨域。# 放在中间件第一个。# CORS跨域请求白名单设置。　　if name == ‘zhangsan‘ and pwd == ‘123456‘:

luguanyou 2020-10-05

Django框架安装及项目创建过程解析

在命令行模式下，进入上一步创建的项目目录demo下，里面包括同名子目录demo和manage.py文件，执行以下命令添加一个APP，名字为blog. 恭喜我们自己吧，成功创建了一个Django项目，下面就可以继续Python的学习和Django框架的探索了

刘燕娜 2020-09-14

django 对接elasticsearch实现全文检索

# python manage.py rebuild_index #数据库有多少条数据，全部会被同步到es中。object = BookSerializer # 只读,不可以进行反序列化。fields = # text 由索引类进行返回, object

明瞳 2020-08-19

django报错： ‘set’ object is not reversible

仔细再看报错，Django TypeError: ‘set‘ object is not reversible 是obj的TypeError. 定位到urls.py里，项目(或应用)中的ruls.py文件把urlpatterns列表的[]写成了{}。字典是

theowl 2020-08-18

Python学习第149天（Django之模型层1）

自增列,可以将其理解为ID主键字段,注意的是必须填入参数 primary_key=True当model中如果没有自增列，则自动会创建一个列名为id的列?整形字段,围在 -2147483648 to 2147483647。字符字段，必须提供max_lengt

ssjdoudou 2020-08-09

django中的常用导入

from django.shortcuts import render,redirect # 模板渲染。from django.http import JsonResponse,HttpResponse # 返回response对象。from djan

ssjdoudou 2020-08-03

Django：启动django

windows：需要将下图中的路径添加到系统环境变量，就可以通过django-admin创建django项目，并且django项目应用的就是python36的解释器。# 通过执行manage.py文件来创建应用，执行这个文件，需要在manage.py所有

EdShao 2020-08-03

添加Django后台验证码的方法

pip3 install django-multi-captcha-admin django-simple-captcha # 可以直接安装两个模块。‘engine‘: ‘simple-captcha‘,

taiyanghua 2020-07-29

django的数据库ORM进阶操作

inspuryhq 2020-07-28

Pip安装Django超时(time out)解决方法

learning_log$ pip install Django 执行该命令，始终报错，如上图

Burgesszheng 2020-07-28

django虚拟环境中报E: 无法定位软件包 sqliteman

3，然后在末尾加入下方代码，然后保存。4，在终端运行：。5，接着便可以下载了：

hoooooolyhu 2020-07-28

Django基础四之模板系统

js、css、img等都叫做静态文件，那么关于django中静态文件的配置，我们就需要在settings配置文件里面写上这写内容：。os.path.join, #注意别忘了写逗号,第二个参数就是项目中你存放静态文件的文件夹名称。{% load static

luguanyou 2020-07-28

Django基础五之django模型层(一)单表操作

name=‘红旭妹妹2‘,更新 update方法 model对象不能调用更新方法报错信息‘Student‘ object has no attribute ‘update‘。#<QuerySet [<Student: Student obje

谢育政 2020-07-28

django-debug-toolbar 之内存信息的插件pympler

2.配置：。　　

时光如瑾雨微凉 2020-07-26

在Django中如何使用Redis

在Django中如何使用Redis. 在utils下建立redis_pool.py文件。在视图函数中使用。django默认不支持redis缓存。完成上述配置后，之后所有的缓存都存到redis中。# 方式一直接使用django的cache

Ashes 2020-07-25

基于 Django 的图书馆借阅系统

普通用户注册后通过前台页面登录，进行浏览、查询、借书、还书等操作。图书馆管理员通过后台管理界面登录，可直接对数据库进行增删改查操作。如果逾期，则还需要缴纳罚金。控制器与用户进行交互，并提供模型数据至视图，实现数据与逻辑的解耦。登录视图，获取用户名和密码进行

tuxlcsdn 2020-07-19

Django学习日记-08回顾--温故知新

　　　　　　-Ajax全部操作在一个html页面执行，对于之前的Ajax操作中事件的发生于其对于的联系方式相关，思路上首先都在思考编写模板内容部分，然后在是函数的执行　。　　　-　使用 id = ‘事件名’ 与其对应的是 <script> $.

时光如瑾雨微凉 2020-07-19

django—Form组件

　　class RegForm: 　　 user = forms.CharField() 　　pwd = forms.CharField(). 　　一个功能的form组件是一个类，这个类必须继承forms中的Form类；　　这个类内部定义的成员变

Qc 2020-07-19

django 过滤查询

　　　　　　　　　　　　　　　　　　　 #exact为精确值,id=1为id__exact=1的常用简写形式。　　　　　　　　　　　　　　　　　　　　　　　　　　 #gte表示大于等于，great equal 的缩写

heniancheng 2020-07-19

安科网

Django数据库访问优化

zcyuefan

先做性能分析 - 两个工具

标准的数据库优化技巧

理解QuerySets

让数据库做它自己的工作

预加载数据

不要获取你不需要的数据

批量插入

zcyuefan

相关推荐

Django QuerySet查询集原理及代码实例

django配置跨域并开发测试接口

Django框架安装及项目创建过程解析

django 对接elasticsearch实现全文检索

django报错： ‘set’ object is not reversible

Python学习第149天（Django之模型层1）

django中的常用导入

Django：启动django

添加Django后台验证码的方法

django的数据库ORM进阶操作

Pip安装Django超时(time out)解决方法

django虚拟环境中报E: 无法定位软件包 sqliteman

Django基础四之模板系统

Django基础五之django模型层(一)单表操作

django-debug-toolbar 之内存信息的插件pympler

在Django中如何使用Redis

基于 Django 的图书馆借阅系统

Django学习日记-08回顾--温故知新

django—Form组件

django 过滤查询

zcyuefan