理解資料庫中的undo日誌、redo日誌、檢查點

來源:互聯網
上載者:User

理解資料庫中的undo日誌、redo日誌、檢查點

資料庫存放資料的檔案,本文稱其為data file。

資料庫的內容在記憶體裡是有緩衝的,這裡命名為db buffer。某次操作,我們取了資料庫某表格中的資料,這個資料會在記憶體中緩衝一些時間。對這個資料的修改在開始時候也只是修改在記憶體中的內容。當db buffer已滿或者遇到其他的情況,這些資料會寫入data file。

undo,redo

日誌在記憶體裡也是有緩衝的,這裡將其叫做log buffer。磁碟上的記錄檔稱為log file。log file一般是追加內容,可以認為是順序寫,順序寫的磁碟IO開銷要小於隨機寫。

Undo日誌記錄某資料被修改前的值,可以用來在事務失敗時進行rollback;Redo日誌記錄某資料區塊被修改後的值,可以用來恢複未寫入data file的已成功事務更新的資料。下面的樣本來自於楊傳輝《大資料分布式儲存系統 原理解析與架構實踐》,略作改動。

例如某一事務的事務序號為T1,其對資料X進行修改,設X的原值是5,修改後的值為15,那麼Undo日誌為<T1, X, 5>,Redo日誌為<T1, X, 15>。

也有把undo和redo結合起來的做法,叫做Undo/Redo日誌,在這個例子中Undo/Redo日誌為<T1, X, 5, 15>。

當使用者產生一個資料庫事務時,undo log buffer會記錄被修改的資料的原始值,redo會記錄被修改的資料的更新後的值。

redo日誌應首先持久化在磁碟上,然後事務的操作結果才寫入db buffer,(此時,記憶體中的資料和data file對應的資料不同,我們認為記憶體中的資料是髒資料),db buffer再選擇合適的時機將資料持久化到data file中。這種順序可以保證在需要故障恢複時恢複最後的修改操作。先持久化日誌的策略叫做Write Ahead Log,即預寫記錄檔。

在很多系統中,undo日誌並非存到記錄檔中,而是存放在資料庫內部的一個特殊段中。本文中就把這些儲存行為都泛化為undo日誌儲存到undo log file中。

對於某事務T,在log file的記錄中必須開始於事務開始標記(比如“start T”),結束於事務結束標記(比如“end T”、”commit T”)。在系統復原時,如果在log file中某個事務沒有事務結束標記,那麼需要對這個事務進行undo操作,如果有事務結束標記,則redo。

在db buffer中的內容寫入磁碟資料庫檔案之前,應當把log buffer的內容寫入磁碟記錄檔。

有一個問題,redo log buffer和undo log buffer儲存的事務數量是多少,是按照什麼規則將日誌寫入log file?如果儲存的事務數量都是1個,也就意味著是將日誌立即刷入磁碟,那麼資料的一致性很好保證。在執行事T時,突然斷電,如果未對磁碟上的redo log file發生追加操作,可以把這個事務T看做未成功。如果redo log file被修改,則認為事務是成功了,重啟資料庫使用redo log恢複資料到db buffer和 data file即可。

如果儲存多個的話,其實也挺好解釋的。就是db buffer寫入data file之前,先把日誌寫入log file。這種方式可以減少磁碟IO,增加輸送量。不過,這種方式適用於一致性要求不高的場合。因為如果出現斷電等系統故障,log buffer、db buffer中的完成的事務會丟失。以轉賬為例,如果使用者的轉賬事務在這種情況下丟失了,這意味著在系統復原後使用者需要重新轉賬。

檢查點checkpoint

checkpoint是為了定期將db buffer的內容重新整理到data file。當遇到記憶體不足、db buffer已滿等情況時,需要將db buffer中的內容/部分內容(特別是髒資料)轉儲到data file中。在轉儲時,會記錄checkpoint發生的”時刻“。在容錯回復時候,只需要redo/undo最近的一次checkpoint之後的操作。

等冪性問題

在記錄檔中的操作記錄應該具有等冪性。等冪性,就是說同一個操作執行多次和執行一次,結果是一樣的。例如,5*1 = 5*1*1*1,所以對5的乘1操作具有等冪性。記錄檔在故障恢複中,可能會回放多次(比如第一次回放到一半時系統斷電了,不得不再重新回放),如果操作記錄不滿足等冪性,會造成資料錯誤。

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.