標籤:
原文連結:http://blog.chinaunix.net/uid-20726500-id-4040024.html
事務的實現原理可以解讀為DBMS採取何種技術確保事務的ACID特性。PostgreSQL針對ACID的實現技術如下表所示。
表1:事務的4個特徵ACID及響應的實現技術
ACID |
實現技術 |
原子性 |
MVCC |
一致性 |
約束(主鍵,外鍵等) |
隔離性 |
MVCC |
持久性 |
WAL |
可以看到PostgreSQL中支撐ACID的主要是MVCC和WAL兩項技術。MVCC和WAL是兩個比較成熟的技術,通常的關聯式資料庫中都有相應的實現,但每個資料庫具體的實現方式又存在很大差異。下面介紹一下PostgreSQL中MVCC和WAL的基本實現原理。
1. MVCC
MVCC(Multiversion Concurrency Control)即多版本並發控制,它可以避免讀寫事務之間的互相阻塞,相比通常的封鎖技術可極大的提高業務的並發效能。PostgreSQL中的MVCC實現原理可簡單概括如下:
1)資料檔案中存放同一邏輯行的多個行版本(稱為Tuple)
2)每個行版本的頭部記錄建立以及刪除該行版本的事務的ID(分別稱為xmin和xmax)
3)每個事務的狀態(運行中,中止或提交)記錄在pg_clog檔案中
4)根據上面的資料並運用一定的規則每個事務只會看到一個特定的行版本
通過MVCC讀寫事務可以分別在不同的行版本上工作,因此能夠在互不衝突的情況下並發執行。
圖1:基於MVCC的資料更新舉例
2. WAL
當系統意外宕機後,恢複時需要回退未完成事務所做的更改並確保已提交事務所作的更改均已生效。在PostgreSQL中通過前面提到的MVCC很容易做到的第一點,只要把所有pg_clog檔案中記錄的所有“運行中”的事務的狀態置為“中止”即可,這些事務在宕機時都沒有結束。對於第二點,必須確保事務提交時修改已真正寫入到永久儲存中。但是直接重新整理事務修改後的資料到磁碟是很費時的,為解決這個問題於是引入了WAL(Write-Ahead Log)。
WAL的基本原理如下:
1)更新資料頁前先將更新內容記入WAL日誌
2)非同步重新整理資料Buffer的髒頁和WAL Buffer到磁碟
3)Buffer管理器確保絕不會先於對應的WAL記錄重新整理髒資料到磁碟
4)事務提交時,將WAL日誌同步重新整理到磁碟
5)Checkpoint發生時,將資料Buffer的所有髒頁重新整理到磁碟
圖2:資料更新時的Buffer修改
圖3:更新提交和Checkpoint時的磁碟同步
[轉]PostgreSQL交易處理機制