標籤:
對於很多儲存管理員來講,對網路附加儲存 (NAS)裝置的備份可以說是一個極大的挑戰,因為為了備份NAS裝置,他們不得不將資料通過網路傳送到備份伺服器上。而這個過程需要在伺服器端安裝備份代理程式以便控制NAS裝置,且這樣做的效率也不是很高。然而也有一些可以簡化NAS備份的方法比如網路資料管理協議(NDMP)以及准連續保護系統(CDP),但是這些技術是不是也有一些局限性呢?
W. Curtis Preston是TechTarget的執行編輯,同時也是一名獨立的備份領域專家。本文中他對一些普遍的NAS備份方面的挑戰進行了討論,對NDMP的優勢和劣勢以及其他可以協助簡化NAS備份的技術進行了回答。
問:NAS備份方面最常見的挑戰有哪些?
答:一個挑戰就是NAS備份其實使用的是標準的基本協議,當我們討論NAS的時候,我們其實是在討論NFS、伺服器資訊攔截器 (SMB)或者CIFS。相對於NAS,另外一個儲存方式就是存放區域網路 (SAN),或者本地串連的DAS儲存,這兩種儲存方式下,檔案系統都運行在伺服器本地。所以,在這種情況下,備份軟體必須通過對應的協議,NFS或者SMB來訪問待備份的檔案,而NFS以及SMB都是基於IP的協議。所以,有這樣一種可能性,即遠端的裝置,比如一台專業NAS裝置,其本身是能夠滿足效能要求的,但是之間所串連的網路就不好說了,可能是直連方式,或者使用高效能的交換器,或者是那種很爛的網路,比如很老舊的網路裝置。總之,在這種情況下你必須通過網路,通過對應的NAS協議來訪問和備份對應的資料。
同時,這也意味著你不能實現什麼有特色的東西。例如,對於傳統的檔案系統來講,一個挑戰就是惡名昭彰的“百萬檔案”問題,所謂“百萬檔案”是指在一個單一檔案系統中存在著上百萬個檔案。當你在檔案系統層進行備份的時候,你就必須處理這數以百萬的單個檔案,此時系統將會非常難受,備份和恢複過程將會變得異常慢。比如,我曾經就見過一個20GB的檔案系統的恢複過程竟然花了72小時,花費這麼長時間的原因並不是因為備份軟體出了問題,而是因為由於檔案系統必須去建立數以百萬計的檔案節點等中繼資料,這個過程是非常耗時的。當你所備份的資料並不存放在NAS上的時候,我們就可以做一種叫做“Image backup”,影像備份,也就是直接備份磁碟或者LUN,恢複的時候直接掛載,拷出檔案即可。所以,由於基於LUN層級的備份,使得對其中檔案系統資料的備份速度有很大的提升,如果你需要恢複這整個的檔案系統,那麼你可以直接恢複整個LUN,這樣對應檔案系統中的檔案也就自動出現了。在“百萬檔案”環境下,這種做法比傳統做法快一百倍。
然而,對於NAS來講,你無法使用上述的影像備份方式來備份NAS上的資料,唯一辦法就是使用NFS或者SMB來備份檔案資料。所以,這就是NAS備份的核心挑戰,而接NAS的網路效能是參差不齊的。
問:NDMP對於NAS備份來講是一個好選擇嗎?它是怎麼工作的?
答:NDMP大約是在10年前被引入業界的。那時候NetApp公司就開始活躍了,而NetApp的NAS裝置正是這樣一種讓你備份起來很頭疼的裝置。那時候人們會問:“到底怎麼備份它?”,一開始答案是:“它就是用NFS的,所以直接用NFS備份就行了。”。然而,很多人根本不想通過NFS來備份他們的資料。所以,NDMP就這樣誕生了,為了更好的備份像NetApp這樣的NAS裝置,眾多的備份軟體廠商都在尋找這樣一種方式,最終NDMP應運而生了。
很多人認為NDMP是一種備份格式或者協議,但NDMP其實是一種管理協議,它讓備份伺服器可以與NAS裝置交流。有了NDMP協議,備份伺服器所要做的便是將磁帶放入磁帶磁碟機中,或者使用虛擬磁帶,或者任何你想要將備份資料存放在的儲存介質,當準備好之後,備份軟體便告訴NAS裝置做備份。之後,NAS裝置如何將資料備份到介質中就完全是NAS裝置自己的事情了。
另外一個挑戰便是備份格式,市場上多種備份軟體都會產生各自不同格式的備份組。比如,NetApp使用dump格式,其他有的使用CIO格式,另一些使用TAR格式或者增強型TAR等等。當使用NDMP來串連備份伺服器時,它會說:“我已經將一盤磁帶放到這了,我想讓你把資料備份到這裡。” 然後,NAS裝置會將一些資訊封裝在NDMP協議中告訴備份伺服器:“好了,我已經做完了備份,資料都存放在這裡了。”,之後備份軟體就可以訪問這些資料了。
備份可以以三種方式來完成:NAS裝置自己備份到自己,NAS裝置之間備份以及NAS裝置備份到伺服器或者相反。備份到自己的方式下,一般是採用直連一個磁帶磁碟機或者磁帶庫到NAS裝置上,然後NAS裝置自己將資料備份到磁帶中。在NAS到NAS的備份方式下,其中一台NAS串連有磁帶磁碟機,另一台NAS通過網路將資料傳送到這台串連有磁帶磁碟機的NAS上,然後這台NAS再將資料寫入磁帶存放。在NAS到伺服器的備份方式下,伺服器串連有磁帶磁碟機,此時伺服器其實是作為一個響應NDMP請求的裝置了,NAS將資料傳送到伺服器,然後伺服器再將資料寫入磁帶中儲存。
NDMP就是提供這樣一種控制方式的協議,而且由於它可以實現自身到自身的備份,也就是說備份軟體可以將一盤磁帶放到正確的位置然後告訴NAS裝置來直接將資料備份到這盤磁帶或者虛擬磁帶中,這樣就不需要使用外部網路來傳輸資料了。通過這種方式,備份的效率提升了很多。
NDMP更酷的是,它不僅可以做磁帶備份,而且你可以用它來查看快照。你可以在備份軟體中來感知到系統中的快照,然後你可以選擇恢複它們。
本質上,NDMP允許將NAS上的資料直接備份到本地所串連的磁帶或者虛擬磁帶中,而這正是很多人都高度興趣的,這種方式也提升了備份和恢複的速度和效率。
問:NDMP有什麼限制嗎?
答:NDMP並沒有規定備份格式,這或許是NDMP的一個主要限制。比如,假如你有一台NetApp的裝置和一台EMC Celerra裝置,而你想把所有的資料移動到Celerra中。在這種情景下,你就不能使用NDMP了,比如你想通過NDMP來將NetApp上的資料備份下來,然後再恢複到Celerra中,這是做不到的。這種情景並不僅限於NetApp與Celerra,比如Celerra和Hitachi Data System(HDS)等等情況都一樣。不同的廠商擁有不同的備份格式,而每種格式都是互不相容的。
NDMP的另外一個限制情景則是廠商自身的格式升級所帶來的利舊問題,比如EMC決定在兩年之後他們不再用dump格式來備份了,而打算使用其他某種新的更好的正在開發當中的備份格式,所以它們之後升級了。那麼之前備份的磁帶怎麼辦?這裡就會產生擔憂了,廠商不得不考慮與舊版相容,而一旦廠商在這方面稍有失誤,那麼你就必須儲存著老舊的裝置以便應對隨時可能發生的資料恢複。
另外一個限制與檔案層級的協議有關。常見的備份格式比如dump、TAR、CIO等,都是檔案層級的協議。而如果你遇到了“百萬檔案”問題,那麼你一樣會在NDMP環境下也遇到這種問題,這也就是為何很多備份軟體廠商都提供影像備份的原因。有不少廠商支援影像層級備份,此時當你發起NDMP備份時,你說:“將這個卷備份到這盤磁帶,不要使用dump,使用這個新的影像格式。”,當你這麼做後,你就會得到一份影像,當你恢複的時候,就必須恢複到一個相等或者更大容量的儲存空間中,而且此時你不可以做檔案層級的恢複。
問:還有什麼其他技術可以簡化NAS的備份嗎?
答:我是准CDP技術的忠實粉絲,這個技術本質上其實就是快照以及資料複製技術的組合。如果你所選用的產品是將快照與複製技術相融合的,那麼你備份的時候就應當選用這種方式,因為這種方式是基於真正的增量備份方式,你就不需要再做全備份了。被複製的資料看起來像是多份完整的全備份,但其實每次傳輸的時候都只是傳輸變化的部分。並且,你所擁有的資料不僅僅是當前系統中的資料,你還擁有了昨天、前天甚至上周時刻的系統資料影像。另外,被複製的資料並不是以某種備份組格式而存在的,這就意味著,當你想恢複資料的時候,你不需要做像傳統磁帶備份那樣的資料回導過程,你可以直接讓你的應用程式直接掛起複製之後的資料,同時將資料導回你的主儲存,當主儲存資料導回完畢之後,你可以選擇繼續讓應用使用副儲存,或者選擇將應用切回到主儲存,同時將副儲存上變化的資料反向同步到主儲存。比如,如果僅僅是主儲存電源故障,這種情況下,應用程式切換到副儲存繼續運行,當主儲存電源恢複之後,將副儲存上的變化過的資料同步到主儲存即可。
所以,如果你有NAS裝置,那麼我高度推薦你調查一下到底哪種方式是最好的備份方式。如果你的裝置不支援某種備份方式,或者你可以考慮選擇另一款NAS產品。在我看來,准CDP方式是最好的備份方式。
【轉】NAS備份所面臨的挑戰