雲計算漸行漸近 海量資料如何遷移到雲裡

來源:互聯網
上載者:User
風險管理諮詢公司Kroll的首席資訊官Jeff Kubacki為其公司定下一個目標,即在未來三年內將存儲成本降低25%。 到目前為止,該公司的存儲資料量達到13 PB(petabytes),Kubacki計畫通過分級存儲(tiered storage)、改變業務流程和採用包括雲存儲在內的新技術等多種手段相結合的方式來解決這個問題。

雖然還只處於起步階段,雲存儲憑藉其彈性、清晰的收費、多個存儲地點,以及直接從存放裝置拖拽資料的能力,使之看上去頗具吸引力,但雲如何通過乙太網發送大量資料,仍是未知。

「我們還在和供應商討論:如果嘗試雲存儲,可能會給我們帶來什麼? 」 Kubacki說,「我們仍然在研究它是否適合我們。 」

Kroll公司的IT架構師將調查通過互聯網這個「管道」將該公司約25%的符合一定條件的資料移轉到雲裡去的方式。 Kubacki解釋說,之所以只遷移25%的資料,是因為該公司絕大多數的資料是法律檔,太敏感,因此不宜存儲在雲裡。 雖然雲的存儲容量在擴展,但受限於連接雲的網路連接能力,因此企業與雲之間數PB的資料的來回切換成了一個大的挑戰。

企業都會詢問他們的管道是否大到足以將其存儲的資料移轉到雲,而答案通常是否定的。 「回應延遲是阻礙雲存儲被採用的一個主要因素,」Gartner的分析師Adam Couture說,「現在,我們發現企業對雲的應用主要局限于歸檔、備份,也許還用於一些合作。 」

但是大多數雲供應商聲稱有簡單的解決方法——即初次全備份時將資料用物理遷移的方法遷移到資料中心。

雲託管公司The Planet達拉斯分部總經理Rob Walters表示,從日常的、使用者級的角度來說,託管和傳輸大量資料是相對容易的,但是,如果要大塊的遷移20TB到25TB的資料,仍然能「難倒」現有的系統。 Walters說:「我們現在的網路並不好,它只是目前的一個薄弱點,現在大家正在研究解決它。 」

對企業而言, 初次全備份的資料可以通過一個WAN或LAN連結複製到雲裡去,Couture 警告說「初次全備份的時間取決於您的伺服器上有多少資料,它可能會持續數周。 」

Nuvolus公司首席執行官Kevin Ellis介紹說,醫生們的辦公室用的是Arvada(科羅拉多州的 Nuvolus公司所提供的私人雲存儲服務)來保存敏感的醫療資料,因為這些資料不能被覆制和物理帶離他們的辦公室。 因此,該公司要求其醫療保健行業的客戶有「合適的Internet連接」——通常得達到10Mbit/sec,以轉移備份資料。

「各醫生辦公室的情況不同,資料上載時間長短也不同,我們可以看到那種耗費很長上載時間的情況,」Ellis說,「你在晚上可儘管上傳,我們努力確保我們不會影響到白天醫生在辦公室的工作。 」

有些雲存儲供應商還提供從企業到該供應商的某個存儲節點的私人連接。 根據Nirvanix公司(一家位於聖地牙哥的雲存儲供應商)介紹,這種方式非常適合那些首次全備份資料介於2TB和75TB之間,或少於750M檔,以及對資料傳輸時間敏感的公司。 它還適合那種輸送量高、但時延要求一般的一次性和持續的資料移轉。

另一種最常用的辦法是採用「人工網路(sneakernet)」,即將資料用磁片、磁帶或雲存儲供應商提供的設備從客戶那裡直接拷貝出來,然後帶到資料中心進行初始備份。

「我們有些客戶已經賣掉了其存儲陣列,」弗吉尼亞州私人雲託管公司Carpathia Hosting 的首席技術官Jon Greaves 說道,「還有這種情況,客戶在做完鏡像後,直接從機器上卸載磁片交給我們。 」

Nirvanix公司將配置了雙千兆級乙太網介面的存儲伺服器給其客戶傳輸資料用,一旦資料被拷貝完,Nirvanix就會取回伺服器,然後將資料移轉到雲。

亞馬遜網路服務公司支援使用移動存放裝置來將大量的資料從雲裡拷進拷出。 該公司採用了高速的內部網路直接傳輸客戶資料,從而繞過互聯網。

Greaves說大公司們在遷移資料時視情況而定,有時使用互聯網,有時使用sneakernet方法。

Carpathia用基於ParaScale公司的技術來為其企業客戶建立私人雲。 「這取決於如何快速地看到他們所需要的資料和運行,並利用這些資料。 如果客戶是長期歸檔,通常採用逐步遷移資料的方法,」他解釋說,「如果他們是直接需要使用的視頻檔,這種通常是幾百TB大小,那我們就要開始尋找替代方法。 」

在初始備份之後,網路頻寬壓力將得到緩解,因為以後只要做增量備份。

Walters表示,對於雲而言,並沒有無限可擴充性或無限容量之說。 規劃容量、始終保證存儲容量能滿足使用者所需是雲存儲供應商的責任。 他說:「如果有人要上載十幾TB的資料,你要事先就有準備,這是一個要精心策劃的工作。 」

存儲供應商使用複雜的方法進行容量規劃。 例如,Carpathia不斷推動網路流量,將其從450Gbit/sec提升至500Gbit/sec,他還計畫用來自電信業的演算法來改變容量。

「你有一條T1線路,你必須算出從這條T1線路可以擠出多少核心分鐘(core minutes),這確實是一個超額配置(overprovisioning)問題,」 Greaves解釋道。

電信公司使用一種被稱為「erlang(厄朗:1厄朗為同一電路上每3600秒的呼叫數,或者是一個小時內保持此電路繁忙的流量負載)」的測量單位,以説明確定電路負載情況。 「我們在雲上使用相同的方法,」 Greaves說,「我們可以計算出我們在1.2左右,並預測出如果處於2將面臨容量壓力,因此,當我們臨近1.2時,我們會定購更多的硬體。 」

Kroll公司決定要到2010年才使用雲存儲。 「我從來不喜歡充當風險性頗高的試驗品,但是我不介意走在前沿」——Kubacki如此說道。

不過他補充說,明年雲存儲將仍然是一個有吸引力的選擇。 「我認為遷移到雲的好處之一是建立了一個完整的概念,即它更多地是一個支出交易而不是一個資本交易,」Kubacki 說,「現在我有一個大型的資本預算:我買的磁片會一年年的貶值,因此, 我很高興看到通過將一些資料存儲在雲裡使得公司的損益表更好看,因為我不是實際購買存儲,我只是在租用。 」

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.