Postgresql查詢效率計算初探

阿新 • • 發佈：2020-01-09

摘要

關係資料庫很重要的一個方面是查詢速度。查詢速度的好壞，直接影響一個系統的好壞。

查詢速度一般需要通過查詢規劃來窺視執行的過程。

查詢路徑會選擇查詢代價最低的路徑執行。而這個代價是怎麼算出來的呢。

主要關注的引數和表

引數:來自postgresql.conf檔案，可以通過show 來檢視

seq_page_cost = 1.0     # measured on an arbitrary scale
random_page_cost = 4.0     # same scale as above
cpu_tuple_cost = 0.01     # same scale as above
cpu_index_tuple_cost = 0.005   # same scale as above
cpu_operator_cost = 0.0025    # same scale as above
parallel_tuple_cost = 0.1    # same scale as above
parallel_setup_cost = 1000.0   # same scale as above

表(檢視): pg_class（主要關注relpages,reltuples）,pg_stats

分析簡單的查詢的成本計算過程

建立模擬資料，插入100000條資料進入一個表

create table test(id int,info text);
insert into test(id,info) select i,md5(i::text) from generate_series(1,100000) t(i);

沒有索引的情況

分析全表查詢的成本計算過程

postgres=# analyze test;  #防止沒有分析
postgres=# explain select * from test;
       QUERY PLAN       
-------------------------------------------------------------
 Seq Scan on test (cost=0.00..1834.00 rows=100000 width=37)

1.查詢pg_class表，檢視test表的page數量和行數

postgres=# select t.relpages,t.reltuples from pg_class t where t.relname = 'test';
 relpages | reltuples 
----------+-----------
  834 | 100000

成本為1834.00是怎麼算出來的？

2.這個過程，實際上是順序掃描了834個page，節點發射了100000行

3.檢視配置引數

seq_page_cost = 1.0 
cpu_tuple_cost = 0.01

4.得出的結果就是

postgres=# select 834 * 1.0 + 100000 * 0.01;
 ?column? 
----------
 1834.00

5.得出來的查詢成本就是 1834.00。和上面的查詢計劃算出來的一致。

全表加入條件的成本計算過程

postgres=# explain select * from test where id = 100;
      QUERY PLAN      
--------------------------------------------------------
 Seq Scan on test (cost=0.00..2084.00 rows=1 width=37)
 Filter: (id = 100)

成本 2084.00是怎麼算出來的？

1.查詢pg_class表,pages,tuples和上面的例子一樣

2.這個過程就是順序test表，發射100000行，然後通過雲存過濾了100000行

3.檢視過濾運算一行的代價

cpu_operator_cost = 0.0025

4.得出的結果是

postgres=# select 834 * 1.0 + 100000 * 0.01 + 100000 * 0.0025;
 ?column? 
-----------
 2084.0000

加入索引的情況

```
create index on test(id);
```

對比下面的四種情況

Index Only Scan

postgres=# explain select id from test where id = 100;
                 QUERY PLAN                 
-----------------------------------------------------------------------------
 Index Only Scan using test_id_idx on test (cost=0.29..8.31 rows=1 width=4)
  Index Cond: (id = 100)

Index Scan

postgres=# explain select * from test where id = 100;
                QUERY PLAN                
-------------------------------------------------------------------------
 Index Scan using test_id_idx on test (cost=0.29..8.31 rows=1 width=37)
  Index Cond: (id = 100)

Index Scan

postgres=# explain select * from test where id < 100;
                 QUERY PLAN                 
----------------------------------------------------------------------------
 Index Scan using test_id_idx on test (cost=0.29..10.11 rows=104 width=37)
  Index Cond: (id < 100)

把資料亂序插入

truncate table test;
insert into test(id,1000000) t(i) order by random();

postgres=# explain select * from test where id < 100;
                 QUERY PLAN                 
----------------------------------------------------------------------------
 Bitmap Heap Scan on test (cost=5.22..380.64 rows=102 width=37)
  Recheck Cond: (id < 100)
  -> Bitmap Index Scan on test_id_idx (cost=0.00..5.19 rows=102 width=0)
     Index Cond: (id < 100)

結論

有索引的時候，成本會大大減少。
執行計劃跟資料的分佈有很大的關係。
有索引的分析相對複雜一點，可以先參考官方原始碼實現。後面再補充上來

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，謝謝大家對我們的支援。

Postgresql查詢效率計算初探

摘要關係資料庫很重要的一個方面是查詢速度。查詢速度的好壞，直接影響一個系統的好壞。

提升MYSQL查詢效率的10個SQL語句優化技巧

MySQL資料庫執行效率對程式的執行速度有很大的影響，有效的處理優化資料庫是非常有用的。尤其是大量資料需要處理的時候。

mysql in語句子查詢效率慢的優化技巧示例

表結構如下，文章只有690篇。文章表article(id,title,content) 標籤表tag(tid,tag_name) 標籤文章中間表article_tag(id,tag_id,article_id)

Python 中list ,set,dict的大規模查詢效率對比詳解

很多時候我們可能要頻繁的進行元素的find 或in操作，本人一直天真的以為python的list做了hash，通過紅黑樹來高效查詢···直到今天我真正來測試它和set,dict的查詢效率時，才發現自已想太多了！！！！

java8的parallelStream提升數倍查詢效率

業務場景在很多專案中，都有類似資料彙總的業務場景，查詢今日註冊會員數，線上會員數，訂單總金額，支出總金額等。。。這些業務通常都不是存在同一張表中，我們需要依次查詢出來然後封裝成所需要的物件返回給前端。

MySQL時間型別datetime、bigint及timestamp的查詢效率

前期資料準備通過程式往資料庫插入 50w 資料資料表： CREATE TABLE `users` ( `id` int(11) NOT NULL AUTO_INCREMENT,

java8中parallelStream提升數倍查詢效率是怎樣實現的，來看看這篇文章

作者：我恰芙蓉王原文：https://www.cnblogs.com/-tang/p/13283216.html 業務場景在很多專案中，都有類似資料彙總的業務場景，查詢今日註冊會員數，線上會員數，訂單總金額，支出總金額等。。。這些業務通常都不是

NetCore3.1 使用 mongoDb 儲存日誌，提升查詢效率

十年河東，十年河西，莫欺少年窮學無止境，精益求精工欲善其事必先利其器，要想使用mongodb，就必須先安裝MongoDb服務，關於MongoDb的安裝網上有很多教程，我使用的是MongoDb 4.2.1 ，據說4.2版本是最穩定的版本。

簡單瞭解mysql儲存欄位型別查詢效率

檢索效能從快到慢的是（此處是聽人說的）：第一：tinyint，smallint，mediumint，int，bigint

MySql 查詢效率簡單優化

一、建立索引在 where 語句和 ORDER BY 語句涉及到的列上建立索引。索引建立注意事項：

python對檔案進行平行計算初探(二）

上次的平行計算是通過將大檔案分割成小檔案，涉及到檔案分割，其實更有效的方法是在記憶體中對檔案進行分割，分別計算

postgreSQL 查詢鎖表以及解鎖

//查詢是否鎖表 select oid from pg_class where relname = ‘可能鎖表了的表名’; select pid from pg_class where relation = ‘上面查出來的oid’;

(轉)SQL 查詢效率優化原則

1、對查詢進行優化,應儘可能避免全表掃描首先應考慮在 where 及 order by 涉及的列上建立索引。下面我們來以一個表中177條資料比較一下,全表掃描與建立索引之後效能的一個比較.

postgresql查詢分割槽表怎麼查？

技術標籤：分割槽表列表javaphppostgresql 大家知道 PostgreSQL 的分割槽是通過繼承來實現的，按分割槽方式，可以實現表的列表分割槽，範圍分割槽，以及複合分割槽等，本文僅介紹關於

PostgreSQL 查詢當前資料庫的所有表操作

實現的功能類似MySQL： show tables; 在 PostgreSQL 中需要寫： select * from pg_tables where schemaname = \'public\';

postgresql查詢鎖表以及解除鎖表操作

1.-- 查詢ACTIVITY的狀態等資訊 select T.PID,T.STATE,T.QUERY,T.WAIT_EVENT_TYPE,T.WAIT_EVENT,T.QUERY_START

PageHelper外掛分頁實現原理及大資料量下SQL查詢效率問題如何解決學習筆記?

我主要看重那條sql 雖然我沒有測試前面原始碼分析見轉載連結。至此整個查詢過程完成，原來PageHelper的分頁功能是通過Limit拼接SQL實現的。查詢效率低的問題也找出來了，那麼應該如何解決。

【轉載】ES 在資料量很大的情況下（數十億級別）如何提高查詢效率啊？

面試題 ES 在資料量很大的情況下（數十億級別）如何提高查詢效率啊？面試官心理分析

PostgreSQL 查詢需要收集的vacuum 表資訊

前言通常，在PostgreSQL中，由於經常需要對錶進行 UPDATE 和 DELETE，因此表會產生碎片空間。在 PostgreSQL中，使用VACUUM 僅僅對需要執行 VACUUM 表將已刪除的空間標識為未使用，以便以後重用這些空間，但是不能立

上去了server查所有表空間_每日一面 - mysql中，我存十億個手機號碼，考慮儲存空間和查詢效率，怎麼設計？...

技術標籤：上去了server查所有表空間問題參考自：https://www.zhihu.com/question/438078173，以下解答思路為個人原創

Postgresql查詢效率計算初探

相關推薦