雲存儲(cloud storage)這個概念一經提出,就得到了眾多廠商的支援和關注。 Amazon在兩年前就推出的Elastic Compute Cloud(EC2:彈性計算雲)雲存儲產品,旨在為使用者提供互聯網服務形式同時提供更強的存儲和計算功能。 內容分發網路服務提供者CDNetworks和業界著名的雲存儲平臺服務商 Nirvanix發佈了一項新的合作,並宣佈結成戰略夥伴關係,以提供業界目前唯一的雲存儲和內容傳送服務集成平臺。 半年以前,微軟就已經推出了提供網路移動硬碟服務的Windows Live SkyDrive Beta測試版。 近期,EMC宣佈加入 道裡可信基礎架構專案,致力於雲計算環境下關于信任和可靠度保證的全球研究協作,IBM也將雲計算標準作為全球備份中心的3億美元擴展方案的一部分。
雲存儲變得越來越熱,大家眾說紛」雲」,而且各有各的說法,各有各的觀點,那麼到底什麼是雲存儲?
雲存儲在雲計算 (cloud computing)概念上延伸和發展出來的一個新的概念。 雲計算是是分散式處理(Distributed Computing)、並行處理(Parallel Computing)和網格計算(Grid Computing)的發展,是透過網路將龐大的計算處理常式自動分拆成無數個較小的副程式, 再交由多部伺服器所組成的龐大系統經計算分析之後將處理結果回傳給使用者。 通過雲計算技術,網路服務提供者可以在數秒之內,處理數以千萬計甚至億計的資訊,達到和」超級電腦」同樣強大的網路服務。
雲存儲的概念與雲計算類似,它是指通過集群應用、網格技術或分散式檔案系統等功能,將網路中大量各種不同類型的存放裝置通過應用軟體集合起來協同工作,共同對外提供資料存儲和業務訪問功能的一個系統。
如果這樣解釋還是難以理解,那我們可以借用廣域網路和互聯網的結構來解釋雲存儲。
雲狀的網路結構
相信大家對局域網、廣域網路和互聯網都已經非常瞭解了。 在常見的局域網系統中,我們為了能更好地使用局域網,一般來講,消費者需要非常清楚地知道網路中每一個軟硬體的型號和配置,比如採用什麼型號交換器,有多少個埠,採用了什麼路由器和防火牆,分別是如何設置的。 系統中有多少個伺服器,分別安裝了什麼作業系統和軟體。 各設備之間採用什麼類型的連接線纜,分配了什麼 xml:lang=IP位址和子網路遮罩。
但當我們使用廣域網路和互聯網時,我們只需要知道是什麼樣的接入網和使用者名、密碼就可以連接到廣域網路和互聯網,並不需要知道廣域網路和互聯網中到底有多少台交換器、路由器、防火牆和伺服器,不需要知道資料是通過什麼樣的路由到達我們的電腦 ,也不需要知道網路中的伺服器分別安裝了什麼軟體,更不需要知道網路中各設備之間採用了什麼樣的連接線纜和埠。
廣域網路和互聯網對於具體的消費者是完全透明的,我們經常用一個雲狀的圖形來表示廣域網路和互聯網。
雖然雲狀的圖形中包含了許許多多的交換器、路由器、防火牆和伺服器,但對具體的廣域網路、互聯網使用者來講,這些都是不需要知道的。 這個雲狀圖形代表的是廣域網路和互聯網帶給大家的互聯互通的網路服務,無論我們在任何地方,都可以通過一個網路接入線纜和一個使用者、密碼,就可以接入廣域網路和互聯網,享受網路帶給我們的服務。
參考雲狀的網路結構,創建一個新型的雲狀結構的存儲系統系統,這個存儲系統由多個存放裝置組成,通過集群功能、分散式檔案系統或類似網格計算等功能聯合起來協同工作,並通過一定的應用軟體或應用介面, 對使用者提供一定類型的存儲服務和訪問服務。
當我們使用某一個獨立的存放裝置時,我們必須非常清楚這個存放裝置是什麼型號,什麼介面和傳輸協議,必須清楚地知道存儲系統中有多少塊磁片,分別是什麼型號、多大容量,必須清楚存放裝置和伺服器之間採用什麼樣的連接線纜。 為了保證資料安全和業務的連續性,我們還需要建立相應的資料備份系統和容災系統。 除此之外,對存放裝置進行定期地狀態監控、維護、軟硬體更新和升級也是必須的。
如果採用雲存儲,那麼上面所提到的一切對消費者來講都不需要了。 雲狀存儲系統中的所有設備對消費者來講都是完全透明的,任何地方的任何一個經過授權的消費者都可以通過一根接入線纜與雲存儲連接,對雲存儲進行資料訪問。
雲存儲不是存儲,而是服務
就如同雲狀的廣域網路和互聯網一樣,雲存儲對消費者來講,不是指某一個具體的設備,而是指一個由許許多多個存放裝置和伺服器所構成的集合體。 消費者使用雲存儲,並不是使用某一個存放裝置,而是使用整個雲存儲系統帶來的一種資料訪問服務。 所以嚴格來講,雲存儲不是存儲,而是一種服務。
雲存儲的核心是應用軟體與存放裝置相結合,通過應用軟體來實現存放裝置向存儲服務的轉變。
雲存儲-與雲計算的關係
雲計算是分散式處理(Distributed Computing)、並行處理(Parallel Computing)和網格計算(Grid Computing)的發展,是透過網路將龐大的計算處理常式自動分拆成無數個較小的副程式, 再交由多台伺服器所組成的龐大系統經計算分析之後將處理結果回傳給使用者。 通過雲計算技術,網路服務提供者可以在數秒之內,處理數以千萬計甚至億計的資訊,達到和」超級電腦」同樣強大的網路服務。 如下圖:
雲計算系統的建設目標是將運行在PC上、或單個伺服器上的獨立的、個人化的運算遷移到一個數量龐大伺服器」雲」中,由這個雲系統來負責處理使用者的請求,並輸出結果,它是一個以資料運算和處理為核心的系統。
雲存儲是在雲計算(cloud computing)概念上延伸和發展出來的一個新的概念,是指通過集群應用、網格技術或分散式檔案系統等功能,將網路中大量各種不同類型的存放裝置通過應用軟體集合起來協同工作, 共同對外提供資料存儲和業務訪問功能的一個系統。 當雲計算系統運算和處理的核心是大量資料的存儲和管理時,雲計算系統中就需要配置大量的存放裝置,那麼雲計算系統就轉變成為一個雲存儲系統,所以雲存儲是一個以資料存儲和管理為核心的雲計算系統。
與雲計算系統相比,雲存儲可以認為是配置了大型存放區空間的一個雲計算系統。
從架構模型來看,雲存儲系統系統比雲計算系統多了一個存儲層,同時,在基礎管理也多了很多與資料管理和資料安全有關的功能,在兩者在訪問層和應用介面層則是完全相同的。
雲存儲-技術前提
從雲存儲結構模型可知,雲存儲系統是一個多設備、多應用、多服務協同工作的集合體,它的實現要以多種技術的發展為前提。
一、寬頻網路的發展
真正的雲存儲系統將會是一個多區域分佈、遍佈全國、甚至於遍佈全球的龐大公用系統,消費者需要通過ADSL、DDN等寬頻接入設備來連接雲存儲,而不是通過FC、 SCSI或乙太網線纜直接連接一台獨立的、私有的存放裝置上。 只有寬頻網路得到充足的發展,消費者才有可能獲得足夠大的資料傳輸頻寬,實現大量容量資料的傳輸,真正享受到雲存儲服務,否則只能是空談。
二、 WEB2.0技術
Web2.0 技術的核心是分享。 只有通過web2.0技術,雲存儲的消費者才有可能通過 PC、手機、移動多媒體等多種設備,實現資料、文檔、圖片和視音訊等內容的集中存儲和資料共用。 Web2.0技術的發展使得消費者的應用方式和可得服務更加靈活和多樣。
三、應用存儲的發展
雲存儲不僅僅是存儲,更多的是應用。 應用存儲是一種在存放裝置中集成了應用軟體功能的存放裝置,它不僅具有資料存儲功能,還具有應用軟體功能,可以看作是伺服器和存放裝置的集合體。 應用存儲技術的發展可以大量減少雲存儲中伺服器的數量,從而降低系統建設成本,減少系統中由伺服器造成單點故障和性能瓶頸,減少資料傳輸環節,提供系統性能和效率,保證整個系統的高效穩定運行。
四、集群技術、網格技術和分散式檔案系統
雲存儲系統是一個多存放裝置、多應用、多服務協同工作的集合體,任何一個單點的存儲系統都不是雲存儲。
既然是由多個存放裝置構成的,不同存放裝置之間就需要通過集群技術、分散式檔案系統和網格計算等技術,實現多個存放裝置之間的協同工作,使多個的存放裝置可以對外提供同一種服務,並提供更大更強更好的資料訪問性能。 如果沒有這些技術的存在,雲存儲就不可能真正實現,所謂的雲存儲只能是一個一個的獨立系統,不能形成雲狀結構。
五、 CDN內容分發、P2P技術、資料壓縮技術、重復資料刪除技術、資料加密技術
CDN內容分發系統、資料加密技術保證雲存儲中的資料不會被未授權的使用者所訪問,同時,通過各種資料備份和容災技術保證雲存儲中的資料不會丟失,保證雲存儲自身的安全和穩定。 如果雲存儲中的資料安全得不到保證,想來也沒有人敢用雲存儲,否則,保存的資料不是很快丟失了,就是全國人民都知道了。
六、存儲虛擬化技術、存儲網路化管理技術
雲存儲中的存放裝置數量龐大且分佈在多不同地域,如何實現不同廠商、不同型號甚至於不同類型(如FC存儲和 IP存儲)的多台設備之間的邏輯卷管理、存儲虛擬化管理和多鏈路冗余管理將會是一個巨大的難題,這個問題得不到解決, 存放裝置就會是整個雲存儲系統的性能瓶頸,結構上也無法形成一個整體,而且還會帶來後期容量和性能擴展難等問題。
雲存儲中的存放裝置數量龐大、分佈地域廣造成的另外一個問題就是存放裝置運營管理問題。 雖然這些問題對雲存儲的消費者來講根本不需要關心,但對於雲存儲的運營單位來講,卻必須要通過切實可行和有效的手段來解決集中管理難、狀態監控難、故障維護難、人力成本高等問題。 因此,雲存儲必須要具有一個高效的類似與網路管理軟體一樣的集中管理平臺,可實現雲存儲系統中設有存放裝置、伺服器和網路設備的集中管理和狀態監控。
參考資料:
中國雲計算:HTTP://www.chinacloud.cn
中國雲計算雲存儲專欄:HTTP://www.chinacloud.cn/list.aspx?cid=30