關於MySQL的重做日誌(redo log),復原日誌(undo log)及二進位日誌(binlog)
MySQL中有六種五種記錄檔,分別是:重做日誌(redo log)、復原日誌(undo log)、二進位日誌(binlog)、錯誤記錄檔(errorlog)、慢查詢日誌(slow query log)、一般查詢日誌(general log),中繼日誌(relay log)。
其中重做日誌和復原日誌與事務操作息息相關,二進位日誌也與事務操作有一定的關係,這三種日誌,對理解MySQL中的事務操作有著重要的意義。
這裡簡單總結一下這三者具有一定相關性的日誌。
重做日誌(redo log)
作用:
確保事務的持久性。
防止在發生故障的時間點,尚有髒頁未寫入磁碟,在重啟mysql服務的時候,根據redo log進行重做,從而達到事務的持久性這一特性。
內容:
物理格式的日誌,記錄的是物理資料頁面的修改的資訊,其redo log是順序寫入redo log file的物理檔案中去的。
什麼時候產生:
事務開始之後就產生redo log,redo log的落盤並不是隨著事務的提交才寫入的,而是在事務的執行過程中,便開始寫入redo log檔案中。
什麼時候釋放:
當對應事務的髒頁寫入到磁碟之後,redo log的使命也就完成了,重做日誌佔用的空間就可以重用(被覆蓋)。
對應的物理檔案:
預設情況下,對應的物理檔案位於資料庫的data目錄下的ib_logfile1&ib_logfile2
innodb_log_group_home_dir 指定記錄檔組所在的路徑,預設./ ,表示在資料庫的資料目錄下。
innodb_log_files_in_group 指定重做記錄檔組中檔案的數量,預設2
關於檔案的大小和數量,由一下兩個參數配置
innodb_log_file_size 重做記錄檔的大小。
innodb_mirrored_log_groups 指定了日誌鏡像檔案組的數量,預設1
其他:
很重要一點,redo log是什麼時候寫盤的?前面說了是在事物開始之後逐步寫盤的。
之所以說重做日誌是在事務開始之後逐步寫入重做記錄檔,而不一定是事務提交才寫入重做日誌緩衝,
原因就是,重做日誌有一個緩衝區Innodb_log_buffer,Innodb_log_buffer的預設大小為8M(這裡設定的16M),Innodb儲存引擎先將重做日誌寫入innodb_log_buffer中。
然後會通過以下三種方式將innodb日誌緩衝區的日誌重新整理到磁碟
1,Master Thread 每秒一次執行重新整理Innodb_log_buffer到重做記錄檔。
2,每個事務提交時會將重做日誌重新整理到重做記錄檔。
3,當重做日誌緩衝可用空間 少於一半時,重做日誌緩衝被重新整理到重做記錄檔
由此可以看出,重做日誌通過不止一種方式寫入到磁碟,尤其是對於第一種方式,Innodb_log_buffer到重做記錄檔是Master Thread線程的定時任務。
因此重做日誌的寫盤,並不一定是隨著事務的提交才寫入重做記錄檔的,而是隨著事務的開始,逐步開始的。
另外引用《MySQL技術內幕 Innodb 儲存引擎》(page37)上的原話:
即使某個事務還沒有提交,Innodb儲存引擎仍然每秒會將重做日誌緩衝重新整理到重做記錄檔。
這一點是必須要知道的,因為這可以很好地解釋再大的事務的提交(commit)的時間也是很短暫的。
復原日誌(undo log)
作用:
儲存了事務發生之前的資料的一個版本,可以用於復原,同時可以提供多版本並發控制下的讀(MVCC),也即非鎖定讀
內容:
邏輯格式的日誌,在執行undo的時候,僅僅是將資料從邏輯上恢複至事務之前的狀態,而不是從物理頁面上操作實現的,這一點是不同於redo log的。
什麼時候產生:
事務開始之前,將當前是的版本產生undo log,undo 也會產生 redo 來保證undo log的可靠性
什麼時候釋放:
當事務提交之後,undo log並不能立馬被刪除,
而是放入待清理的鏈表,由purge線程判斷是否由其他事務在使用undo段中表的上一個事務之前的版本資訊,決定是否可以清理undo log的日誌空間。
對應的物理檔案:
MySQL5.6之前,undo資料表空間位於共用資料表空間的復原段中,共用資料表空間的預設的名稱是ibdata,位於資料檔案目錄中。
MySQL5.6之後,undo資料表空間可以配置成獨立的檔案,但是提前需要在設定檔中配置,完成資料庫初始化後生效且不可改變undo log檔案的個數
如果初始化資料庫之前沒有進行相關配置,那麼就無法配置成獨立的資料表空間了。
關於MySQL5.7之後的獨立undo 資料表空間配置參數如下
innodb_undo_directory = /data/undospace/ --undo獨立資料表空間的存放目錄
innodb_undo_logs = 128 --復原段為128KB
innodb_undo_tablespaces = 4 --指定有4個undo log檔案
如果undo使用的共用資料表空間,這個共用資料表空間中又不僅僅是儲存了undo的資訊,共用資料表空間的預設為與MySQL的資料目錄下面,其屬性由參數innodb_data_file_path配置。
其他:
undo是在事務開始之前儲存的被修改資料的一個版本,產生undo日誌的時候,同樣會伴隨類似於保護事務持久化機制的redolog的產生。
預設情況下undo檔案是保持在共用資料表空間的,也即ibdatafile檔案中,當資料庫中發生一些大的事務性操作的時候,要產生大量的undo資訊,全部儲存在共用資料表空間中的。
因此共用資料表空間可能會變的很大,預設情況下,也就是undo 日誌使用共用資料表空間的時候,被“撐大”的共用資料表空間是不會也不能自動收縮的。
因此,mysql5.7之後的“獨立undo 資料表空間”的配置就顯得很有必要了。
二進位日誌(binlog):
作用:
1,用於複製,在主從複製中,從庫利用主庫上的binlog進行重播,實現主從同步。
2,用於資料庫的基於時間點的還原。
內容:
邏輯格式的日誌,可以簡單認為就是執行過的事務中的sql語句。
但又不完全是sql語句這麼簡單,而是執行的sql語句(增刪改)反向的資訊,
也就意味著delete對應著delete本身和其反向的insert;update對應著update執行前後的版本的資訊;insert對應著delete和insert本身的資訊。
在使用mysqlbinlog解析binlog之後一些都會真相大白。
因此可以基於binlog做到類似於Oracle的閃回功能,其實都是依賴於binlog中的日誌記錄。
什麼時候產生:
事務提交的時候,一次性將事務中的sql語句(一個事物可能對應多個sql語句)按照一定的格式記錄到binlog中。
這裡與redo log很明顯的差異就是redo log並不一定是在事務提交的時候重新整理到磁碟,redo log是在事務開始之後就開始逐步寫入磁碟。
因此對於事務的提交,即便是較大的事務,提交(commit)都是很快的,但是在開啟了bin_log的情況下,對於較大事務的提交,可能會變得比較慢一些。
這是因為binlog是在事務提交的時候一次性寫入的造成的,這些可以通過測實驗證。
什麼時候釋放:
binlog的預設是保持時間由參數expire_logs_days配置,也就是說對於非活動的記錄檔,在產生時間超過expire_logs_days配置的天數之後,會被自動刪除。
對應的物理檔案:
設定檔的路徑為log_bin_basename,binlog記錄檔按照指定大小,當記錄檔達到指定的最大的大小之後,進行變換,產生新的記錄檔。
對於每個binlog記錄檔,通過一個統一的index檔案來組織。
其他:
二進位日誌的作用之一是還原資料庫的,這與redo log很類似,很多人混淆過,但是兩者有本質的不同
1,作用不同:redo log是保證事務的持久性的,是事務層面的,binlog作為還原的功能,是資料庫層面的(當然也可以精確到事務層面的),雖然都有還原的意思,但是其保護資料的層次是不一樣的。
2,內容不同:redo log是物理日誌,是資料頁面的修改之後的物理記錄,binlog是邏輯日誌,可以簡單認為記錄的就是sql語句
3,另外,兩者日誌產生的時間,可以釋放的時間,在可釋放的情況下清理機制,都是完全不同的。
關於事務提交時,redo log和binlog的寫入順序,為了保證主從複製時候的主從一致(當然也包括使用binlog進行基於還原時間點的情況),是要嚴格一致的,
MySQL通過兩階段交易認可過程來完成事務的一致性的,也即redo log和binlog的一致性的,理論上是先寫redo log,再寫binlog,兩個日誌都提交成功(刷入磁碟),事務才算真正的完成。
總結:
MySQL中,對於以上三種日誌,每一種細化起來都可以夠寫一個章節的,這裡粗略地總結了一下三種日誌的一些特點和作用,以協助理解MySQL中的事物以及事物背後的原理。
參考:《MySQL技術內幕 Innodb 儲存引擎》 PDF 下載見