在資料庫表丟失或損壞的情況下,備份你的資料庫是很重要的。如果發生系統崩潰,你肯定想能夠將你的表儘可能丟失最少的資料恢複到崩潰發生時的狀態。有時,正是MySQL管理員造成破壞。管理員已經知道表已破壞,用諸如vi或Emacs等編輯器試圖直接編輯它們,這對錶絕對不是件好事!
備份資料庫兩個主要方法是用mysqldump程式或直接拷貝資料庫檔案(如用cp、cpio或tar等)。每種方法都有其優缺點:
mysqldump與MySQL伺服器協同操作。直接拷貝方法在伺服器外部進行,並且你必須採取措施保證沒有客戶正在修改你將拷貝的表。如果你想用檔案系統備份來備份資料庫,也會發生同樣的問題:如果資料庫表在檔案系統備份過程中被修改,進入備份的表檔案主語不一致的狀態,而對以後的恢複表將失去意義。檔案系統備份與直接拷貝檔案的區別是對後者你完全控制了備份過程,這樣你能採取措施確保伺服器讓表不受幹擾。
mysqldump比直接拷貝要慢些。
mysqldump產生能夠移植到其它機器的文字檔,甚至那些有不同硬體結構的機器上。直接拷貝檔案不能移植到其它機器上,除非你正在拷貝的表使用MyISAM儲存格式。ISAM表只能在相似的硬體結構的機器上拷貝。在MySQL 3.23中引入的MyISAM表格儲存體格式解決了該問題,因為該格式是機器無關的,所以直接拷貝檔案可以移植到具有不同硬體結構的機器上。只要滿足兩個條件:另一台機器必須也運行MySQL 3.23或以後版本,而且檔案必須以MyISAM格式表示,而不是ISAM格式。
不管你使用哪種備份方法,如果你需要恢複資料庫,有幾個原則應該遵守,以確保最好的結果:
定期實施備份。建立一個計劃並嚴格遵守。
讓伺服器執行更新日誌。當你在崩潰後需要恢複資料時,更新日誌將協助你。在你用備份檔案恢複資料到備份時的狀態後,你可以通過運行更新日誌中的查詢再次運用備份後面的修改,這將資料庫中的表恢複到崩潰發生時的狀態。
以檔案系統備份的術語講,Database Backup檔案代表完全傾倒(full dump),而更新日誌代表漸進傾倒(incremental dump)。
使用一種統一的和易理解的備份檔案命名機制。象backup1、buckup2等不是特別有意義。當實施你的恢複時,你將浪費時間找出檔案裡是什麼東西。你可能發覺用資料庫名和日期構成備份檔案名會很有用。例如:
%mysqldump samp_db >/usr/archives/mysql/samp_db.1999-10-02
%mysqldump menagerie >/usr/archives/mysql/menagerie.1999-10-02
你可能想在產生備份後壓縮它們。備份一般都很大!你也需要讓你的備份檔案有到期期限以避免它們填滿你的磁碟,就象你讓你的記錄檔到期那樣。
用檔案系統備份備份你的備份檔案。如果遇上了一個徹底崩潰,不僅清除了你的資料目錄,也清除了包含你的Database Backup的磁碟機,你將真正遇上了麻煩。
也要備份你的更新日誌。
將你的備份檔案放在不同於用於你的資料庫的檔案系統上。這將降低由於產生備份而填滿包含資料目錄的檔案系統的可能性。
用於建立備份的技術同樣對拷貝資料庫到另一台機器有用。最常見地,一個資料庫被轉移到了運行在另一台主機上的伺服器,但是你也可以將資料轉移到同一台主機上的另一個伺服器。
1 使用mysqldump備份和拷貝資料庫
當你使用mysqldumo程式產生Database Backup檔案時,預設地,檔案內容包含建立正在傾倒的表的CREATE語句和包含表中行資料的INSERT語句。換句話說,mysqldump產生的輸出可在以後用作mysql的輸入來重建資料庫。
你可以將整個資料庫傾倒進一個單獨的文字檔中,如下:
%mysqldump samp_db >/usr/archives/mysql/samp_db.1999-10-02
輸出檔案的開頭看起來象這樣:
# MySQL Dump 6.0# # Host: localhost Database: samp_db#-------------
--------------------------# Server version 3.23.2-alpha-log## Table st
ructure for table 'absence'#CREATE TABLE absence( student_id int(10)
unsigned DEFAULT '0' NOT NULL, date date DEFAULT '0000-00-00' NOT NUL
L, PRIMARY KEY (student_id,date));## Dumping data for table 'absence'
#INSERT INTO absence VALUES (3,'1999-09-03');INSERT INTO absence VALUE
S (5,'1999-09-03');INSERT INTO absence VALUES (10,'1999-09-08');......
檔案剩下的部分有更多的INSERT和CREATE TABLE語句組成。
如果你想壓縮備份,使用類似如下的命令:
%mysqldump samp_db | gzip >/usr/archives/mysql/samp_db.1999-10-02.gz
如果你要一個龐大的資料庫,輸出檔案也將很龐大,可能難於管理。如果你願意,你可以在mysqldump命令列的資料庫名後列出單獨的表名來傾到它們的內容,這將傾倒檔案分成較小、更易於管理的檔案。下例顯示如何將samp_db資料庫的一些表傾到進分開的檔案中:
%mysqldump samp_db student score event absence >grapbook.sql
%mysqldump samp_db member president >hist-league.sql
如果你產生準備用於定期重新整理另一個資料庫內容的備份檔案,你可能想用--add-drop-table選項。這告訴伺服器將DROP TABLE IF EXISTS語句寫入備份檔案,然後,當你取出備份檔案並把它裝載進第二個資料庫時,如果表已經存在,你不會得到一個錯誤。
如果你倒出一個資料庫以便能把資料庫轉移到另一個伺服器,你甚至不必建立備份檔案。要保證資料庫存在於另一台主機,然後用管道傾倒資料庫,這樣mysql能直接讀取mysqldump的輸出。例如:你想從主機pit-viper.snake.net拷貝資料庫samp_db到boa.snake.net,可以這樣很容易做到:
%mysqladmin -h boa.snake.net create samp_db
%mysqldump samp_db | mysql -h boa.snake.net samp_db
以後,如果你想再次重新整理boa.snake.net上的資料庫,跳過mysqladmin命令,但要對mysqldump加上--add-drop-table以避免的得到表已存在的錯誤:
%mysqldump --add-drop-table samp_db | mysql -h boa.snake.net samp_db
mysqldump其它有用的選項包括:
--flush-logs和--lock-tables組合將對你的資料庫檢查點有協助。--lock-tables鎖定你正在傾倒的所有表,而--flush-logs關閉並重新開啟更新記錄檔,新的更新日誌將只包括從備份點起的修改資料庫的查詢。這將設定你的更新日誌檢查點位備份時間。(然而如果你有需要執行個更新的客戶,鎖定所有表對備份期間的客戶訪問不是件好事。)
如果你使用--flush-logs設定檢查點到備份時,有可能最好是傾倒整個資料庫。
如果你傾倒單獨的檔案,較難將更新日誌檢查點與備份檔案同步。在恢複期間,你通常按資料庫為基礎提取更新日誌內容,對單個表沒有提取更新的選擇,所以你必須自己提取它們。
預設地,mysqldump在寫入前將一個表的整個內容讀進記憶體。這通常確實不必要,並且實際上如果你有一個大表,幾乎是失敗的。你可用--quick選項告訴mysqldump只要它檢索出一行就寫出每一行。為了進一步最佳化傾倒過程,使用--opt而不是--quick。--opt選項開啟其它選項,加速資料的傾倒和把它們讀回。
用--opt實施備份可能是最常用的方法,因為備份速度上的優勢。然而,要警告你,--opt選項確實有代價,--opt最佳化的是你的備份過程,不是其他客戶對資料庫的訪問。--opt選項通過一次鎖定所有表阻止任何人更新你正在傾倒的任何錶。你可在一般資料庫訪問上很容易看到其效果。當你的資料庫一般非常頻繁地使用,只是一天一次地調節備份。
一個具有--opt的相反效果的選項是--dedayed。該選項使得mysqldump寫出INSERT DELAYED語句而不是INSERT語句。如果你將資料檔案裝入另一個資料庫並且你想是這個操作對可能出現在該資料庫中的查詢的影響最小,--delayed對此很有協助。
--compress選項在你拷貝資料庫到另一台機器上時很有協助,因為它減少網路傳輸位元組的數量。下面有一個例子,注意到--compress對與遠端主機上的伺服器通訊的程式才給出,而不是對與本地主機串連的程式:
%mysqldump --opt samp_db | mysql --compress -h boa.snake.net samp_db
mysqldump有很多選項,詳見《MySQL參考手冊》。
2 使用直接拷貝資料庫的備份和拷貝方法
另一種不涉及mysqldump備份資料庫和表的方式是直接拷貝資料庫表檔案。典型地,這用諸如cp、tar或cpio公用程式。本文的例子使用cp。
當你使用一種直接備份方法時,你必須保證表不在被使用。如果伺服器在你則正在拷貝一個表時改變它,拷貝就失去意義。
保證你的拷貝完整性的最好方法是關閉伺服器,拷貝檔案,然後重啟伺服器。如果你不想關閉伺服器,要在執行表檢查的同時鎖定伺服器。如果伺服器在運行,相同的制約也適用於拷貝檔案,而且你應該使用相同的鎖定協議讓伺服器“安靜下來”。
假設伺服器關閉或你已經鎖定了你想拷貝的表,下列顯示如何將整個samp_dbDatabase Backup到一個備份目錄(DATADIR表示伺服器的資料目錄):
%cd DATADIR%cp -r samp_db /usr/archive/mysql
單個表可以如下備份:
%cd DATADIR/samp_db%cp member.* /usr/archive/mysql/samp_db%cp score.*
/usr/archive/mysql/samp_db ....
當你完成了備份時,你可以重啟伺服器(如果關閉了它)或釋放加在表上的鎖定(如果你讓伺服器運行)。
要用直接拷貝檔案把一個資料庫從一台機器拷貝到另一台機器上,只是將檔案拷貝到另一台伺服器主機的適當資料目錄下即可。要確保檔案是MyIASM格式或兩台機器有相同的硬體結構,否則你的資料庫在另一台主機上有奇怪的內容。你也應該保證在另一台機器上的伺服器在你正在安裝資料庫表時不訪問它們。
3 複製資料庫(Replicating Database)
複製(Replication)類似於拷貝資料庫到另一台伺服器上,但它的確切含義是即時地保證兩個資料庫的完全同步。這個功能將在3.23版中出現,而且還不很成熟,因此本文不作詳細介紹。
4 用備份恢複資料
資料庫損壞的發生有很多原因,程度也不同。如果你走運,你可能僅損壞一兩個表(如掉電),如果你倒黴,你可能必須替換整個資料目錄(如磁碟損壞)。在某些情況下也需要恢複,比如使用者錯誤地刪除了資料庫或表。不管這些倒黴事件的原因,你將需要實施某種恢複。
如果表損壞但沒丟失,嘗試用myisamchk或isamchk修複它們,如果這樣的損壞可有修複程式修複,你可能根本不需要使用備份檔案。關於表修複的過程,見《資料庫維護與修複》。
恢複過程涉及兩種資訊源:你的備份檔案和個更新日誌。備份檔案將表恢複到實施備份時的狀態,然而一般表在備份與發生問題之間的時間內已經被修改,更新日誌包含了用於進行這些修改的查詢。你可以使用記錄檔作為mysql的輸入來重複查詢。這已正是為什麼要啟用更新日誌的原因。
恢複過程視你必須恢複的資訊多少而不同。實際上,恢複整個資料庫比單個表跟容易,因為對於資料庫運用更新日誌比單個表容易。
4.1 恢複整個資料庫
首先,如果你想恢複的資料庫是包含授權表的mysql資料庫,你需要用--skip-grant-table選項運行伺服器。否則,它會抱怨不能找到授權表。在你已經恢複表後,執行mysqladmin flush-privileges告訴伺服器裝載授權標並使用它們。
將資料庫目錄內容拷貝到其它某個地方,如果你在以後需要它們。
用最新的備份檔案重裝資料庫。如果你用mysqldump產生的檔案,將它作為mysql的輸入。如果你用直接從資料庫拷貝來的檔案,將它們直接拷回資料庫目錄,然而,此時你需要在拷貝檔案之前關閉資料庫,然後重啟它。
使用更新日誌重複做備份以後的修改資料庫表的查詢。對於任何可適用的更新日誌,將它們作為mysql的輸入。指定--one-database選項使得mysql只執行你有興趣恢複的資料庫的查詢。如果你知道你需要運用所有更新記錄檔,你可以在包含日誌的目錄下使用這條命令:
% ls -t -r -1 update.[0-9]* | xargs cat | mysql --one-database db_name
ls命令產生更新記錄檔的一個單列列表,根據伺服器產生它們的次序排序(主意:如果你修改任何一個檔案,你將改變排序次序,這導致更新日誌一錯誤的次序被運用。)
很可能你會是運用某幾個更新日誌。例如,自從你備份以來產生的更新日誌被命名為update.392、update.393等等,你可以這樣重新運行:
%mysql --one-database db_name < update.392
%mysql --one-database db_name < update.393
.....
如果你正在實施恢複且使用更新日誌恢複由於一個錯誤建議的DROP DATABASE、DROP TABLE或DELETE語句造成丟失的資訊,在運用更新日誌之前,要保證從其中刪除這些語句。
4.2 恢複單個表
恢複單個表較為複雜。如果你用一個由mysqldump產生的備份檔案,並且它不包含你感興趣的表的資料,你需要從相關行中提取它們並將它們用作mysql的輸入。這是容易的部分。難的部分是從只運用於該表的更新日誌中拉出片斷。你會發覺mysql_find_rows公用程式對此很有協助,它從更新日誌中提取多行查詢。
另一個可能性是使用另一台伺服器恢複整個資料庫,然後拷貝你想要的表檔案到原資料庫中。這可能真的很容易!當你將檔案拷回資料庫目錄時,要確保原資料庫的伺服器關閉。