MySQL最佳化之——安全地關閉MySQL執行個體
關閉過程:
1、發起shutdown,發出 SIGTERM訊號
2、有必要的話,建立一個關閉線程(shutdown thread)
如果是用戶端發起的關閉,則會建立一個專用的關閉線程
如果是直接收到 SIGTERM 訊號進行關閉的話,專門負責訊號處理的線程就會負責關閉工作,或者建立一個獨立的線程負責這個事
當無法建立獨立的關閉線程時(例如記憶體不足),MySQL Server會發出類似下面的警示資訊:
Error: Can’t create thread to kill server
3、MySQL Server不再響應新的串連請求
關閉TCP/IP網路監聽,關閉Unix Socket等渠道
4、逐漸關閉當前的串連、事務
空閑串連,將立刻被終止;
當前還有事務、SQL活動的串連,會將其標識為 killed,並定期檢查其狀態,以便下次檢查時將其關閉;(參考 KILL 文法)
當前有活躍事務的,該事物會被復原,如果該事務中還修改了非事務表,則已經修改的資料無法復原,可能只會完成部分變更;
如果是Master/Slave複製情境裡的Master,則對複製線程的處理過程和普通線程也是一樣的;
如果是Master/Slave複製情境裡的Slave,則會依次關閉IO、SQL線程,如果這2個線程當前是活躍的,則也會加上 killed 標識,然後再關閉;
Slave伺服器上,SQL線程是允許直接停止當前的SQL操作的(為了避免複製問題),然後再關閉該線程;
在MySQl 5.0.80及以前的版本裡,如果SQL線程當時正好執行一個事務到中間,該事務會復原;從5.0.81開始,則會等待所有的操作結束,除非使用者發起KILL操作。
當Slave的SQL線程對非事務表執行操作時被強制 KILL了,可能會導致Master、Slave資料不一致;
5、MySQL Server進程關閉所有線程,關閉所有儲存引擎;
重新整理所有表cache,關閉所有開啟的表;
每個儲存引擎各自負責相關的關閉操作,例如MyISAM會重新整理所有等待寫入的操作;InnoDB會將buffer pool重新整理到磁碟中(從MySQL 5.0.5開始,如果innodb_fast_shutdown不設定為 2 的話),把當前的LSN記錄到資料表空間中,然後關閉所有的內部線程。
6、MySQL Server進程退出
關於KILL指令
從5.0開始,KILL 支援指定 CONNECTION | QUERY兩種可選項:
KILL CONNECTION和原來的一樣,停止復原事務,關閉該線程串連,釋放相關資源;
KILL QUERY則只停止線程當前提交執行的操作,其他的保持不變;
提交KILL操作後,該線程上會設定一個特殊的 kill標記位。通常需要一段時間後才能真正關閉線程,因為kill標記位只在特定的情況下才檢查:
1、執行SELECT查詢時,在ORDER BY或GROUP BY迴圈中,每次讀完一些行記錄塊後會檢查 kill標記位,如果發現存在,該語句會終止;
2、執行ALTER TABLE時,在從原始表中每讀取一些行記錄塊後會檢查 kill 標記位,如果發現存在,該語句會終止,刪除暫存資料表;
3、執行UPDATE和DELETE時,每讀取一些行記錄塊並且更新或刪除後會檢查 kill 標記位,如果發現存在,該語句會終止,復原事務,若是在非事務表上的操作,則已發生變更的資料不會復原;
4、GET_LOCK() 函數返回NULL;
5、INSERT DELAY線程會迅速記憶體中的新增記錄,然後終止;
6、如果當前線程持有表級鎖,則會釋放,並終止;
7、如果線程的寫操作調用在等待釋放磁碟空間,則會直接拋出“磁碟空間滿”錯誤,然後終止;
8、當MyISAM表在執行REPAIR TABLE 或 OPTIMIZE TABLE 時被 KILL的話,會導致該表損壞不可用,指導再次修複完成。
安全關閉MySQL幾點建議
想要安全關閉 mysqld 服務進程,建議按照下面的步驟來進行:
0、用具有SUPER、ALL等最高許可權的帳號串連MySQL,最好是用 unix socket 方式串連;
1、在5.0及以上版本,設定innodb_fast_shutdown = 1,允許快速關閉InnoDB(不進行full purge、insert buffer merge),如果是為了升級或者降級MySQL版本,則不要設定;
2、設定innodb_max_dirty_pages_pct = 0,讓InnoDB把所有髒頁都重新整理到磁碟中去;
3、設定max_connections和max_user_connections為1,也就最後除了自己當前的串連外,不允許再有新的串連建立;
4、關閉所有不活躍的線程,也就是狀態為Sleep 且 Time 大於 1 的線程ID;
5、執行 SHOW PROCESSLIST 確認是否還有活躍的線程,尤其是會產生表鎖的線程,例如有大資料集的SELECT,或者大範圍的UPDATE,或者執行DDL,都是要特別謹慎的;
6、執行 SHOW ENGINE INNODB STATUS 確認History list length的值較低(一般要低於500),也就是未PURGE的事務很少,並且確認Log sequence number、Log flushed up to、Last checkpoint at三個狀態的值一樣,也就是所有的LSN都已經做過檢查點了;
7、然後執行FLUSH LOCKAL TABLES 操作,重新整理所有 table cache,關閉已開啟的表(LOCAL的作用是該操作不記錄BINLOG);
8、如果是SLAVE伺服器,最好是先關閉 IO_THREAD,等待所有RELAY LOG都應用完後,再關閉 SQL_THREAD,避免 SQL_THREAD 在執行大事務被終止,耐心待其全部應用完畢,如果非要強制關閉的話,最好也等待大事務結束後再關閉SQL_THREAD;
9、最後再執行 mysqladmin shutdown。
10、緊急情況下,可以設定innodb_fast_shutdown = 1,然後直接執行 mysqladmin shutdown 即可,甚至直接在作業系統層調用 kill 或者 kill -9 殺掉 mysqld 進程(在innodb_flush_log_at_trx_commit = 0 的時候可能會丟失部分事務),不過mysqld進程再次啟動時,會進行CRASH RECOVERY工作,需要有所權衡。
以上說了那麼多,其實正常情況下執行 mysqladmin shutdown 就夠了,如果發生阻塞,再參考上面的內容進行分析和解決吧。
本文永久更新連結地址: