Linux 管理員手冊(8)

來源:互聯網
上載者:User

硬體不肯定是可靠的
軟體肯定是不可靠的
人不肯定是不可靠的
而自然肯定是可靠的

本張說明為什麼、如何、何時要做備份,及如何回存備份的東西。

備份的重要

  資料是有價值的。重新產生它需要你花費時間和努力,並且要花費金錢或至少傷心和眼淚,有時甚至不可能重新產生,例如一些實驗結果。由於資料是一種投資,你必須保護它,並採取措施避免丟失。

  遺失資料一般有4個原因:硬體失敗、軟體曲線、人為因素或自然災害。 雖然現代硬體已經相當可靠,但仍可能自然損壞。儲存資料最決定性的硬體是硬碟,它依賴微小的磁區在充滿電雜訊的世界上儲存資料。現代軟體依然不可靠,一個真正可靠的程式是理想、罕見的,而不是規律。人更不可靠,他們很容易犯錯誤,甚至為某種目的惡意地破壞資料。自然可能不是邪惡的,但也可能造成破壞。一切的一切,希望什麼都正常、完美幾乎是不可能的。

  備份是保護資料投資的方法。有資料的多個拷貝,就不怕某個損壞(所需做的僅僅是從備份中恢複丟失的資料)。

  正確的備份是很重要的。正如物理世界中任何東西都與其他相關,備份也遲早會失效。好的備份確保有效,你不希望你的備份無效。 如果你的備份又壞了,這將雪上加霜,如果你只有一個備份,它可能根本是壞的,只留下你和硬碟中冒煙的灰燼。 或者當你恢複時,發現忘了備份一些重要的東西,比如15000個使用者網站的使用者資料庫。 Best of all, all your backups might be working perfectly, but the last known tape drive reading the kind of tapes you used was the one that now has a bucketful of water in it.

  When it comes to backups, paranoia is in the job description.

選擇備份介質

  備份所需的最重要的決定是選擇備份介質。需要考慮成本、可靠性、速度、可得到、可用性。

  成本是很重要的,因為你的資料可能需要多個儲存、多個備份。便宜的介質可以用很多。

  可靠性是最重要的,因為壞的備份會雪上加霜。備份介質必須能儲存資料多年而不損壞。作為備份介質,使用方法影響可靠性。硬碟一般是很可靠的,但作為備份介質並非很可靠,如果它和備份源在同一電腦裡的話。

  速度通常不太重要,如果備份可以非互動地完成。備份花2個小時無所謂,無須監督,多長時間都沒有關係。另一方面,if the backup can't be done when the computer would otherwise be idle, 那麼速度也是個問題。

  可得到是明顯必要的,因為你無法使用不存在的備份介質。不太明顯的是要在將來還能得到這種介質,並且能在其他電腦上使用。否則災害之後,你可能無法恢複你的備份。

  可用性是決定備份周期的主要因素。備份越容易使用越好。備份介質不能難以使用。

  一般用磁碟片和磁帶。磁碟片很便宜,還算可靠,不太快,很容易得到,但資料量大時不容易使用。磁帶也很便宜,還算可靠,還算快,很容易得到,而且,依賴於磁帶的容量,使用很輕鬆。

  還有其他選擇。但通常可得性不好,但如果這不成問題,有時也不錯。例如,磁光碟片同時具有磁碟片(隨機存取,可以快速地恢複單個檔案)和磁帶(大容量)的優點.

選擇備份工具

  備份有很多工具,傳統的UNIX備份工具是tar 、 cpio 和dump 。另外,還可以使用大量第三方軟體包(包括freeware和商業版)。備份介質的選擇可能影響工具的選擇。

  tar 和cpio 類似,從備份來看二者基本等效。都能將檔案存到磁帶並取出檔案。都能使用幾乎所有介質,因為核心裝置驅動處理低級裝置操作,對使用者級程式看來所有裝置都差不多。有寫Unix版本的tar 和cpio 對不是普通檔案可能有問題(符號串連、裝置檔案、極長路徑名的檔案等等),但Linux的能正確處理所有檔案。

  dump 不同,它直接讀檔案系統,而不通過檔案系統。 It is also written specifically for backups; tar 和cpio are really for archiving files, although they work for backups as well.

  直接讀檔案系統有些優點,它可能不考慮time stamps備份所有檔案;對於tar 和cpio ,必須先將檔案系統唯讀安裝。直接讀檔案系統更有效,如果所有東西都要備份,因為它使磁頭移動最少。它的主要缺點是每個檔案系統種類需要特定的備份程式, Linux的dump 程式只理解ext2檔案系統。

  dump 也直接支援備份級(下面討論);對tar 和cpio ,這必須用其他工具實現。

  第三方備份工具的比較超出了本書的範圍。Linux Software Map列出了許多freeware的。

簡單備份

  一個簡單的備份方案是一次備份所有東西,然後備份上次備份後改變的所有東西。第一個備份叫全備份full backup,後來的叫i增量備份ncremental backups。全備份比增量備份費時費力,因為有更多的東西寫到磁帶,而且全備份可能不能放如一盤磁帶中(更別說磁碟片了)。回存增量備份比全備份可能要花更多的時間。備份可以這樣最佳化,就是自上次全備份以後,總用增量備份儲存所有改過的檔案。這樣,備份可能需要多一些的工作,但你只需回存一個全備份和一個增量備份。

  如果有6盤磁帶想每天備份,可以用磁帶1做第一個全備份(比如在星期五),用磁帶2-5做增量備份(周一到周四)。然後用磁帶6做新的全備份(第二個周五),然後再用磁帶2-5做增量備份。在做完新的全備份之前不要覆蓋舊的全備份(磁帶1),一面在做全備份的時候出現問題。有了新的全備份磁帶6以後,最好在另一個地方儲存磁帶1,這樣如果有一個全備份磁帶在火災中損失了,還能有一個。當再做下一個全備份是,再用磁帶1而儲存磁帶6。

  如果你有多於6盤磁帶,可以用多的做全備份。每次做全備份,應該使用最老的磁帶。這樣你會有最近幾周的全備份,對你如果想找到一個現在已經刪除的就檔案,或一個檔案的舊版本很有用。

用tar備份

  一個全備份可以很容易地用tar 實現:

# tar -create -file /dev/ftape /usr/src
tar: Removing leading / from absolute path names in the archive
#

  上面的例子使用GNU版本的tar 及其長選項名。傳統版本的tar 只理解單字元選項。 GNU版還能處理一盤磁帶或一張磁碟不能容納的備份,及很長的路徑名;這不是所有傳統的版本能作到的。 (Linux只使用GNU tar 。)

  如果你的備份一盤磁帶不能容納,你需要使用-multi-volume (-M)選項:

# tar -cMf /dev/fd0H1440 /usr/src
tar: Removing leading / from absolute path names in the archive
Prepare volume #2 for /dev/fd0H1440 and hit return:
#

  注意開始備份前要格式化所有磁碟片,或在tar 需要新磁碟片時用另一個虛擬控制台或虛擬終端格式化它。
備份完後,應該檢查它是否完好,用-compare (-d)選項:

# tar -compare -verbose -f /dev/ftape
usr/src/
usr/src/linux
usr/src/linux-1.2.10-includes/
....
#

  失敗的備份檢查意味著如果你丟失了未經處理資料,備份也無法恢複。

  增量備份可用帶-newer (-N)選項的tar 來實現:

# tar -create -newer '8 Sep 1995' -file /dev/ftape /usr/src -verbose
tar: Removing leading / from absolute path names in the archive
usr/src/
usr/src/linux-1.2.10-includes/
usr/src/linux-1.2.10-includes/include/
usr/src/linux-1.2.10-includes/include/linux/
usr/src/linux-1.2.10-includes/include/linux/modules/
usr/src/linux-1.2.10-includes/include/asm-generic/
usr/src/linux-1.2.10-includes/include/asm-i386/
usr/src/linux-1.2.10-includes/include/asm-mips/
usr/src/linux-1.2.10-includes/include/asm-alpha/
usr/src/linux-1.2.10-includes/include/asm-m68k/
usr/src/linux-1.2.10-includes/include/asm-sparc/
usr/src/patch-1.2.11.gz
#

  不幸的是,tar 不能知道一個檔案的i節點資訊變化,例如,檔案的許可權位變化,或檔案名稱變化。這可用find 命令和比較當前檔案系統狀態和先前備份的檔案清單。用於此的Scripts和程式可以在Linux FTP網站上找到。
用tar回存

  tar 的-extract (-x)選項展開檔案:

# tar -extract -same-permissions -verbose -file /dev/fd0H1440
usr/src/
usr/src/linux
usr/src/linux-1.2.10-includes/
usr/src/linux-1.2.10-includes/include/
usr/src/linux-1.2.10-includes/include/linux/
usr/src/linux-1.2.10-includes/include/linux/hdreg.h
usr/src/linux-1.2.10-includes/include/linux/kernel.h
...
#

  也可以用命令列只展開特定的檔案和目錄(及其中的檔案和子目錄):
# tar xpvf /dev/fd0H1440 usr/src/linux-1.2.10-includes/include/linux/hdreg.h
usr/src/linux-1.2.10-includes/include/linux/hdreg.h
#
用-list (-t)選項看一個備份卷中有什麼檔案:
# tar -list -file /dev/fd0H1440
usr/src/
usr/src/linux
usr/src/linux-1.2.10-includes/
usr/src/linux-1.2.10-includes/include/
usr/src/linux-1.2.10-includes/include/linux/
usr/src/linux-1.2.10-includes/include/linux/hdreg.h
usr/src/linux-1.2.10-includes/include/linux/kernel.h
...
#
  注意tar 永遠是順序讀一個備份卷,因此大的卷會很慢。使用磁帶機或其他順序介質時不可能使用隨機存取資料庫技術。
tar 不處理刪除檔案屬性。如果你需要從一個全備份和一個增量備份恢複一個檔案系統,並且2個備份之間你刪除了一個檔案,當你恢複完後,這個檔案又存在了。如果這個檔案包含應該刪除的敏感性資料,這是個大問題。

多級備份

  上面的章節概述了簡單備份的方法,對個人使用或小的網站使用。對於多數重負荷的使用,多級備份更適用。

  簡單備份有2個備份級:全備份和增量備份。通常可以有任意數量的備份級。全備份是0級,不同層級的增量備份是1、2、3...級,每個增量備份級備份同一或上一層級的上次備份後改變的所有東西。

  這樣多的目的是更便宜地允許更長的備份曆史backup history。在前面的例子中,備份曆史追溯到上一個全備份。可以增多磁帶來擴充備份曆史,但每個新磁帶擴充一周,這樣可能太貴。更長的備份曆史是有用的,因為刪除或損壞的檔案可能長時間未被發現。即使不是一個檔案的最新版本,也比沒有好。

  多級備份可以更便宜地擴充備份曆史。例如,如果你有10盤磁帶,可用磁帶1和2做月備份(每月的第一個周五),磁帶3-6做周備份(其他周五,因為每月最多可能有5個周五,因此需要4盤磁帶),磁帶7-10做日備份(周一到周四)。只增加了4盤磁帶,就將2周的備份曆史擴充到2個月。誠然,我們無法恢複這2個月中每個檔案的所有版本,但這樣恢複的經常是足夠好了。

  備份級可使檔案系統恢複用最少的時間。如果你有許多隻是單調增長層級數的增量備份,要恢複整個檔案系統,你需要回存所有備份。而如果層級數不是單調增長,可以減少備份和回存的數目。

  為了將回存需要的磁帶資料減至最小,可以用小的層級做每個增量磁帶。然而,這樣做每個增量備份的時間會增加(每個備份拷貝了上次全備份後改變的所有東西)。一個好的方案建議在dump man頁中給出,並在表 9.2中說明。 Use the following succession of backup levels: 3, 2, 5, 4, 7, 6, 9, 8, 9... 這使備份和回存所用的時間保持較少。 The most you have to backup is two day's worth of work. 恢複所需磁帶數有賴於全備份的間隔,但它比簡單的方案少。

  一個好的方案降低了工作量,並能追尋更多的東西。You must decide if it is worth it.

  dump 對備份級有內建的支援。而tar 和cpio 則必須用shell scripts實現。

備份什麼?

  你可能想盡多備份。主要的例外是容易重安裝的軟體, 但即使是它們,也有設定檔,對備份很重要,以免對這些軟體全部重新設定。另一個主要的例外是/proc 檔案系統,因為他們只包含通常由核心自動產生的資料,備份它們絕不是個好主意。特別是/proc/kcore 檔案更是不必要,因為它只是你當前實體記憶體的映象,而且很大。

  Gray areas include the news spool, log files, and many other things in /var . 你必須決定重點考慮什麼。

  備份最明顯的是使用者檔案(/home )和系統設定檔(/etc ,但還可能有散落在檔案系統其他地方的其他東西。

壓縮備份

  備份佔用大量空間,要花費大量金錢。為了降低空間需求,備份可以壓縮。有幾種方法。有些程式內建支援壓縮。例如GNU tar 的-gzip (-z)選項,通過管道(pipe),在寫到備份介質前,先用 gzip 壓縮程式壓縮。

  不幸的是,壓縮備份可能導致問題。由於壓縮工作的原理,如果一個bit錯誤,可能導致所有其他壓縮資料不可用。有些備份程式內建錯誤校正,但沒有辦法處理大量的錯誤。就是說,如果用GNU tar 壓縮備份,一個單獨的錯誤回導致整個備份丟失。備份必須可靠,這樣的壓縮方法不好。

  還有一個方法是單獨壓縮每個檔案,這也回導致一個檔案的丟失,但不會影響其他檔案。丟失的檔案可能已經因為什麼原因損壞,因此這種情況比不使用壓縮差不了多少。 afio 程式(cpio 的一個變種)可以這樣。

  壓縮需要時間,which may make the backup program unable to write data fast enough for a tape drive. 這可以靠輸出緩衝來避免(如果備份程式足夠智能,可以內建,否則可以通過其他程式), but even that might not work well enough. 這隻會在慢的電腦上是個問題。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.