標籤:開源 blank style 資源 http 引入 掛載 and 根據
作為開來源資料庫的新手,近日有興對比了Pg和MySQL的查詢計劃。
通過Pg源碼目錄下的src\backend\executor\README檔案,加上一些簡單調試,就能對Pg的執行機制產生一個初步印象;
而MySQL的代碼可讀性比Pg差了不少,可能還要花些時日去瞭解先。
原本想寫一篇執行機制對比的文章,現在只能談談對Pg的體會,不足和錯誤之處敬請指正。
- Pg算是學院派的開來源資料庫代表產品,其基於關係代數的最佳化、操作符的實現看起來十分親切。相較於MySQL扁平的計劃,Pg的執行計畫讓人一目瞭然。
- Pg的執行計畫靜態唯讀,這是為了重用計劃方便。在具體執行某計劃時,會有一個包含唯讀計劃指標 + 執行所需資訊的State操作符樹(對應Plan Trees and State Trees)。類似的運算式也包括Expr和ExprState。
- Pg的執行計畫為操作符樹,串連如Merge Join,Hash Join為二元操作符,其它為一元操作符。一個特例是相關的semi join過濾,子查詢會產生一個SubPlan掛載到過濾條件上,如果過濾條件有n個相互關聯的子查詢那麼就會在scan下方得到n個SubPlan,這一點倒是和Oracle類似(註:12c相關查詢處理會更多地進行unnest,在子查詢中加了分組才構造出來)。
- 操作符的執行是基於狀態的,操作符之間用元組來傳遞資料。控制權由上而下,資料的傳遞由下而上。操作符對資料的處理以元組為單位,目前沒有批量的最佳化。
- 操作符中可能涉及運算式計算(介面ExecMakeFunctionResultNoSets),如投影、過濾。根據運算式類型如整型比較、整型相加,會有不同的ExpreState對應。ExprState包含了整型加法或比較用的函數指標,也包含有運算元。 如int_col1 + int_col2,首先載入ExprState的兩個運算元:從Tuple中的第n個欄位擷取值並存放到ExprState的參數中, 接下來使用ExprState的函數指標,結合兩個參數進行加法運算並返回結果。
總結:
Pg的執行器代碼邏輯很清晰,但是以tuple為單位的處理會使得CPU資源得不到充分利用;
運算式重用最佳化現在只看到了9.6引入的彙總OP重用;
PostgreSQL執行機制的初步學習