雲存儲是一個非常有吸引力的將日常資料管理外包的服務,但是,一旦資料丟失,所有的後果都將由擁有此資料的公司承擔,而不是託管服務提供者。 考慮到這一點,瞭解資料丟失的原因、雲服務提供者承擔多少責任、安全利用雲存儲的一些基本方法以及不管資料是存儲在本地還是雲端的完整性監測方法和標準就顯得非常重要。
完整性監測在雲存儲服務中是必不可少的,同樣,資料完整性也是所有資料中心最核心的任務。 任何級別的存儲和任何類型的媒質都有可能發生資料損壞。 位衰減(存儲介質上的資料減弱或丟失)、控制器故障、重復資料刪除中繼資料損壞、磁帶故障是導致不同類型媒質資料損壞的主要因素。 中繼資料損壞是上述故障導致的直接結果,比如位衰減,並且也極其容易受到除硬體錯誤率以外的軟體故障的影響。 不幸的是,重復資料刪除的一個副作用是,損壞的檔、塊(block)或位元組將影響到每一塊與之相關聯的中繼資料。 事實上,存儲壞境內的任何一個環節都有可能發生資料損壞。 將資料移轉到不同的平臺過程中很容易就被損壞,即將資料移轉到雲端。 雲存儲系統也是由硬體和軟體組成的資料中心,其也容易受到攻擊而導致資料損壞。 比如最近廣為人知的亞馬遜雲宕機事件。 許多企業不僅受到長時間的宕機影響,實際上,他們0.07%的客戶資料已經丟失。 據報導,引發資料丟失的原因是「亞馬遜ESB卷...... 不一致的資料快照恢復。 」這就意味著亞馬遜系統中的資料已經損壞,因此,客戶資料已經丟失。 每當資料丟失,尤其是重要資料丟失,人們傾向于相互指責以推脫責任。 在IT行業,這通常會導致工作人員被解雇、公司承受巨大經濟損失,甚至最嚴重的情況是企業破產。 因此,關鍵是要瞭解雲服務提供者要承擔的法律責任,以及每個服務水準協定(SLA)已採取一切可能的措施以確保資料的安全,防止資料丟失。 就很多法律檔來說,SLA大多偏向于供應商的利益,而不是客戶的利益。 許多雲服務提供者都提供了不同層次的資料保護,但是,所有的存儲供應商都不對資料完整性承擔責任。
雲SLA協定,包括雲供應商的保護都明確表明,資料丟失或損壞是最常見的情況。 比如亞馬遜的客戶web服務協定,其中規定,「我們...... 不提供任何形式的聲明或保證,所提供的服務或協力廠商內容是不間斷的、無差錯的、無故障部件的,或任何內容... 將是安全的、不丟失的或無損壞的。 」這個協定甚至據以建議客戶「頻繁歸檔」他們的資料。 如前所述,資料的完整性管理,無論其是在資料中心、私有雲、混合雲或公共雲,其責任總是要該資料的實際擁有公司來承擔。
一些共通的最佳方式將允許公司利用雲的靈活性和易接近性的優點,而又不會危及其資料安全。 在資料保護的前提下分散風險,將資料丟失的可能性降到最低。 即使是在雲端存儲資料,保留一個主副本和現場資料的備份副本也是很有意義的,這樣的話,訪問資料就不會依賴于網路性能或連通性。 堅持這些基本的最佳做法,瞭解雲服務提供者SLA的細節,適當構建模組以主動監測資料的完整性,無論其是存儲在雲端或是本地。
驗證一組資料的完整性的方法之一基於雜湊值。 雜湊值是根據一個預定義的方式壓縮一組資料而得到的一個獨特的值。 由於雜湊值是從原始資料本身獲得的,如果兩個雜湊值不完全相同,其就意味著這兩個副本至少有一個已被更改或損壞。
確保雲供應商無論何時何地存儲副本,都能夠提供資料的雜湊值核對,並與第二個數據副本的雜湊值進行比較。
人工進行這個級別的資料監測將非常繁瑣。 幸運的是還有其他的方法可用,包括標題檢查。 SpectraLogic公司和其他動態歸檔聯盟(ActiveArchiveAlliance)成員都提供自動監測系統內資料完整性工具。
雖然動態歸檔是監測資料完整性的方法之一,但其仍需要目前廣泛採用的雲標準協定支援其完整性監測和互通性。 因為並不是所有的資料中心或雲託管基礎設施都採用的同一標準的設備,不同存放裝置之間的互通性至關重要。 雲存儲管理介面(CDMI)標準是全球網路存儲工業協會(SNIA)在2010年提出來的。 相容CDMI的系統可能查詢另一個相容CDMI的系統的物件的雜湊值,以此驗證兩個數據副本是否相同。 通過監測主資料副本和備份副本的完整性,企業可以確認存儲在雲端的資料副本是否損壞。 可以通過資料值來頻繁地監測這些資料集。 諸如CDMI之類的行業標準,其不僅能確保異構相容系統之間的互通性,並且還給資料完整性監測提供了便利機制。
最近很難看到雲行業在媒體上出現,特別是IronMountain公司停止了他們最基本的雲存儲服務和預先討論的亞馬遜宕機事件之後。 但是,這篇文章的宗旨不在於討論雲存儲平臺是否明智,而是在研究和實施雲戰略時,應考慮更多的因素,而不是僅簡單地考慮每GB的存儲成本。 如果雲存儲實施正確,將給所有的企業提供許多的利益。 消除雲劣勢需要智慧資料管理戰略。 不管在何處或怎樣存儲資料,在需要時,其可訪問和可恢復絕對是至關重要的。 這個承諾是所有資料完整性監測和驗證的核心任務。
(責任編輯:蒙遺善)