三種常見的資料庫查詢引擎執行模型

阿新 • • 發佈：2022-03-09

一、迭代模型/火山模型（Iterator Model）
又稱 Volcano Model 或者 Pipeline Model。

Iterator Model
該計算模型將關係代數中每一種操作抽象為一個 Operator，將整個 SQL 構建成一個 Operator 樹，查詢樹自頂向下的呼叫next()介面，資料則自底向上的被拉取處理。
火山模型的這種處理方式也稱為拉取執行模型(Pull Based)。
大多數關係型資料庫都是使用迭代模型的，如 SQLite、MongoDB、Impala、DB2、SQLServer、Greenplum、PostgreSQL、Oracle、MySQL 等。
火山模型的優點在於：簡單，每個 Operator 可以單獨實現邏輯。
火山模型的缺點：查詢樹呼叫next()介面次數太多，並且一次只取一條資料，CPU 執行效率低；而 Joins, Subqueries, Order By 等操作經常會阻塞。

二、物化模型（Materialization Model）

Materialization Model
物化模型的處理方式是：每個 operator 一次處理所有的輸入，處理完之後將所有結果一次性輸出。
物化模型更適合OLTP負載，這些查詢每次只訪問小規模的資料，只需要少量的函式呼叫。

三、向量化/批處理模型（Vectorized / Batch Model）

Batch Model
向量化模型和火山模型類似，每個 operator 需要實現一個 next() 函式，但是每次呼叫 next() 函式會返回一批的元組（tuples），而不是一個元組，所以向量化模型也可稱為批處理模型。
向量化模型是火山模型和物化模型的折衷。
向量化模型比較適合 OLAP 查詢，因為其大大減少了每個 operator 的呼叫次數，也就簡單減少了虛擬函式的呼叫。
Presto、snowflake、SQLServer、Amazon Redshift等資料庫支援這種處理模式。
Spark 2.x 的 SQL 引擎開始也支援向量化執行模型。
在 Hive 中使用向量化執行的方式：
1、必須以 ORC 格式來儲存資料，
2、將 hive.vectorized.execution.enabled 引數設定為 true

以上為三種常見的資料庫查詢引擎執行模型，「分散式技術專題」是國產資料庫hubble團隊精心整編，專題會持續更新，歡迎大家保持關注。
原文連結：https://blog.csdn.net/m0_51698806/article/details/113739682

三種常見的資料庫查詢引擎執行模型

三種常見的資料庫查詢引擎執行模型

幾種常見資料庫的jdbc連線及簡單查詢

三種常見加密演算法MD5、非對稱加密，對稱加密【多測師_王sir】

SQL Server三種常見備份

java中三種常見記憶體溢位錯誤的處理方法

Java 對HashMap進行排序的三種常見方法

總結python 三種常見的記憶體洩漏場景

Java 單列模式的三種常見寫法

強大：MyBatis ，三種流式查詢方法

三種ThreadLocal，玩轉執行緒變數儲存與傳遞

短視訊商城原始碼，三種常見的輪播圖效果

mit6.830-lab2-常見運算元和 volcano 執行模型

Java執行緒池中三種方式建立 ThreadFactory 設定執行緒名稱

Django 資料庫查詢優化，choices引數(資料庫欄位設計常見)，MVC和MTV模型，多對多三種建立方式

簡單瞭解Java Netty Reactor三種執行緒模型

三種資料庫Oracle、MySQL、DB2分頁查詢

多執行緒常見的三種實現方式

eosvm 執行引擎三種模式

復現一個典型的線上Spring Bean物件的執行緒安全問題（附三種解決辦法）

詳解MySQL執行原理、邏輯分層、更改資料庫處理引擎

三種常見的資料庫查詢引擎執行模型

相關推薦