Django框架 之 querySet詳解
瀏覽目錄
-
可切片
-
可叠代
-
惰性查詢
-
緩存機制
-
exists()與iterator()方法
QuerySet
可切片
使用Python 的切片語法來限制查詢集記錄的數目 。它等同於SQL 的LIMIT 和OFFSET 子句。
1 |
>>> Entry.objects. all ()[: 5 ] # (LIMIT 5)
|
1 |
Entry.objects. all ()[ 5 : 10 ] # (OFFSET 5 LIMIT 5)
|
不支持負的索引(例如Entry.objects.all()[-1]
可叠代
1 2 3 4 |
articleList = models.Article.objects. all ()
for article in articleList:
print (article.title)
|
惰性查詢
查詢集 是惰性執行的 —— 創建查詢集不會帶來任何數據庫的訪問。你可以將過濾器保持一整天,直到查詢集 需要求值時,Django 才會真正運行這個查詢。
1 2 3 4 5 6 |
queryResult = models.Article.objects. all () # not hits database
print (queryResult) # hits database
for article in queryResult:
print (article.title) # hits database
|
一般來說,只有在“請求”查詢集 的結果時才會到數據庫中去獲取它們。當你確實需要結果時,查詢集 通過訪問數據庫來求值。 關於求值發生的準確時間,參見何時計算查詢集。
緩存機制
每個查詢集都包含一個緩存來最小化對數據庫的訪問。理解它是如何工作的將讓你編寫最高效的代碼。
在一個新創建的查詢集中,緩存為空。首次對查詢集
請牢記這個緩存行為,因為對查詢集使用不當的話,它會坑你的。例如,下面的語句創建兩個查詢集,對它們求值,然後扔掉它們:
1 2 |
print ([a.title for a in models.Article.objects. all ()])
print ([a.create_time for a in models.Article.objects. all ()])
|
這意味著相同的數據庫查詢將執行兩次,顯然倍增了你的數據庫負載。同時,還有可能兩個結果列表並不包含相同的數據庫記錄,因為在兩次請求期間有可能有Article被添加進來或刪除掉。為了避免這個問題,只需保存查詢集並重新使用它:
1 2 3 |
queryResult = models.Article.objects. all ()
print ([a.title for a in queryResult])
print ([a.create_time for a in queryResult])
|
何時查詢集不會被緩存?
查詢集不會永遠緩存它們的結果。當只對查詢集的部分進行求值時會檢查緩存, 如果這個部分不在緩存中,那麽接下來查詢返回的記錄都將不會被緩存。所以,這意味著使用切片或索引來限制查詢集將不會填充緩存。
例如,重復獲取查詢集對象中一個特定的索引將每次都查詢數據庫:
1 2 3 |
>>> queryset = Entry.objects. all ()
>>> print queryset[ 5 ] # Queries the database
>>> print queryset[ 5 ] # Queries the database again
|
然而,如果已經對全部查詢集求值過,則將檢查緩存:
1 2 3 4 |
>>> queryset = Entry.objects. all ()
>>> [entry for entry in queryset] # Queries the database
>>> print queryset[ 5 ] # Uses cache
>>> print queryset[ 5 ] # Uses cache
|
下面是一些其它例子,它們會使得全部的查詢集被求值並填充到緩存中:
1 2 3 4 |
>>> [entry for entry in queryset]
>>> bool (queryset)
>>> entry in queryset
>>> list (queryset)
|
註:簡單地打印查詢集不會填充緩存。
1 2 3 |
queryResult = models.Article.objects. all ()
print (queryResult) # hits database
print (queryResult) # hits database
|
exists()與iterator()方法
exists:
簡單的使用if語句進行判斷也會完全執行整個queryset並且把數據放入cache,雖然你並不需要這些 數據!為了避免這個,可以用exists()方法來檢查是否有數據:
1 2 3 |
if queryResult.exists():
#SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
print ( "exists..." )
|
iterator:
當queryset非常巨大時,cache會成為問題。
處理成千上萬的記錄時,將它們一次裝入內存是很浪費的。更糟糕的是,巨大的queryset可能會鎖住系統 進程,讓你的程序瀕臨崩潰。要避免在遍歷數據的同時產生queryset cache,可以使用iterator()方法 來獲取數據,處理完數據就將其丟棄。
1 2 3 4 5 6 7 |
objs = Book.objects. all ().iterator()
# iterator()可以一次只從數據庫獲取少量數據,這樣可以節省內存
for obj in objs:
print (obj.title)
#BUT,再次遍歷沒有打印,因為叠代器已經在上一次遍歷(next)到最後一次了,沒得遍歷了
for obj in objs:
print (obj.title)
|
當然,使用iterator()方法來防止生成cache,意味著遍歷同一個queryset時會重復執行查詢。所以使 #用iterator()的時候要當心,確保你的代碼在操作一個大的queryset時沒有重復執行查詢。
總結:
queryset的cache是用於減少程序對數據庫的查詢,在通常的使用下會保證只有在需要的時候才會查詢數據庫。 使用exists()和iterator()方法可以優化程序對內存的使用。不過,由於它們並不會生成queryset cache,可能 會造成額外的數據庫查詢。
Django框架 之 querySet詳解