專訪多備份CTO陳元強:全面開啟企業資料雲端永生之路

來源:互聯網
上載者:User
關鍵字 雲計算 公有雲 陳元強 多備份

4G時代來臨,企業資料面臨爆炸式增長,動則上TB;與此同時,人為因素、軟體缺陷、不可控的自然災害等帶來的安全問題也頻繁發生,如何讓企業資料安全可靠、且低成本高效率的長期保存下來,已經成為任何一家企業亟需考慮的問題。 所幸的是,雲時代伴隨4G時代一起出現,雲計算的核心優勢:高性價比、資源按需分配、基礎設施的柔性擴展、業務的平滑切換、頻寬和存儲無限擴容等特性。

多備份的雲備份、雲恢復、雲歸檔等特性可以充分利用這些優質的雲基礎設施實現企業的資料管理服務;多備份是國內首家專注于企業資料雲端備份、恢復、歸檔、存儲和遷移的互聯網公司,經過10個月的持續反覆運算, 圍繞著企業資料安全管理的服務已經陸續上線,得到了超過4萬的中小企業客戶認可,同時也引入了國際知名的資本投資。 這次我們聯繫到了多備份的聯合創始人兼CTO 陳元強,讓我們來看看多備份是如何解決資料在雲端可靠存儲備份。 以下為採訪實錄:


CSDN:資料存儲備份領域實際已經有很多強勁的大腕,多備份是如何考慮要去做存儲備份的?

陳元強:非常好的問題! 大家都知道,最近繼續出現了多起大型故障,這裡面不乏有錢的主包括銀行和雲巨頭等。 我們都知道一些關鍵系統的容災備份方案實際上是相當的貴,方案動則上億,每年的維護費也是高得嚇人,前段時間在網上討論提到的寧夏銀行就是因為費用太高,而放棄了一些維保計畫,最後導致出現災難故障。 所以問題的根源還是費用問題。 而恰恰超低的投入就可以解決問題,這就是多備份的核心優勢之一。 除此之外,傳統的方案在使用上極其複雜,一般需要極強的專業能力才能上手,而極簡設計也是多備份變革傳統存儲備份的關鍵,使用者只需要3步就可以完成備份。

CSDN:目前包括亞馬遜,阿裡雲,EMC,微軟雲,電信,移動等巨頭都有自己的存儲備份方案,多備份與這些雲存儲備份服務比起來,有哪些特點?

陳元強:首先,我們和這些雲平臺或者存儲巨頭是合作關係,我們是架構在這些平臺上的一個SaaS應用,我們既是他們的客戶,又是他們平臺眾多應用的核心應用。 只有足夠多的應用衍生在這些平臺上,才有利於巨頭構建雲生態鏈產業,所以多備份是雲生態鏈的一個核心環節。

從一開始我們的方向就放在了在這些巨型平臺上做好服務,並不自己研發最底層的存儲,真正通過多備份的整合式計算、存儲、備份等服務,讓這些平臺的潛力發揮出來。 使用者可以根據自己的需要選擇合適的或我們推薦的底層雲計算和存儲平臺,其中一個關鍵技術就是Cloud 5,也就是對資料進行分塊,並分散冗余存儲在不同的雲平臺上,避免單雲故障引起資料丟失。

EMC是一家非常厲害的資料管理服務公司,在大資料管理方面的經驗是我們必須學習的;同時,EMC在雲計算領域很早就佈局了,在超大規模存儲備份方案方面一直是他的強項。 多備份更多是在學習EMC的大資料管理實踐經驗,並很好得和我們的創新方向融合在一起。

CSDN:多備份定位非常清晰:整合平臺,形成強大聚合能力,變成一個可以根據使用者需要,按需自由調度的全球性雲計算平臺。

陳元強:是的:-),的確是這樣。 對於創業企業來說,做自己擅長的事,與廣泛的平臺形成強有力的合作關係,是最容易出效果的路!

CSDN:整合這些雲平臺,多備份用了多長時間,投入資源情況如何?

陳元強:網站從去年10月上線,目前歷時10個月,在研發上投入13人,我們的技術團隊都是資深的人員,在系統,網路,存儲,安全等平均都有7+年的經驗,主要來自騰訊,盛大,迅雷等國內一線互聯網企業。 產品每天反覆運算統上線,使用者發現的問題或缺陷,基本是當天立即修改;每週會有大的特性或優化上線;累計下來差不上萬次的小細節修改,上百處大的優化和新功能開發。 目前產品已經成熟,無論是大到上TB的企業核心應用資料,還是小到幾MB的小網站的資料存儲備份,用多備份都很easy的完成備份任務。


CSDN:一般的存儲備份企業在研發上投入的資源相當大,多備份投入13人10個月的資源,具體的思路上有一些可以分享的麼?

陳元強:的確,現有的一些傳統的設備或軟體投入資源相當大,動則數百人。 實際上,我們的想法很簡單,絕大部分產品要麼是功能的羅列,要麼就是過度設計。 就拿現在的CDP(持續資料保護)產品來說,一般都宣稱是即時,0恢復視窗,但最近有一種觀點是說,實際絕大部分企業是在15分鐘內的能恢復資料就可以滿足要求了。 有些時候,為了減少1分鐘,你可能投入的資源和時間會是現有的數倍,所以把資源投入到最必須的特性上,這樣其實可以解決99%的場景。 這也是互聯網作產品服務的「少即是多「思想的一個應用。 所以,多備份的想法很簡單,就是聚焦在企業核心資料,如各類業務(網站,OA,郵件系統,檔共用系統等)伺服器(Linux,Windows,Aix)上的檔案系統備份存儲,以及常見的資料庫(如:Mysql,Oracle, MSSQL等)資料的備份存儲,具體應用上可以支援不同資料量級的場景。

CSDN:能否分享一些多備份實現多個雲存儲平臺資料整合存儲備份的一些具體思路?

陳元強:這個問題分成幾個點來回答

1.  現有雲計算平臺的發展情況

國外公有雲基本上形成了AWS稱雄,Google,微軟一線雲服務並存的局面;同時包括Rackspace,HP,IBM,EMC等傳統IT廠商,混合雲平臺並存的態勢。 國內的阿裡雲,電信,騰訊雲,UCLOUD、七牛、華雲以及各大老牌IDC廠家如西部資料,新網,萬網,美橙等推出的雲平臺,非常多。 所以來說,國外和國內雲平臺的數量都相當多,國內更多;雲計算目前在國內時間還只有3-4年時間,各方面都在不斷進步,性能、穩定性、服務等參差不齊。

2.  企業到底需要什麼樣的雲平臺能力

隨著資訊化技術深入到每個角落,企業從高利潤中心,變成了薄利多銷的模型,絕大部分企業需要的是容易解決業務需求,容易與外部進行溝通的成本低的方案。 雲計算平臺的出現剛好符合這一趨勢。 同時也對雲平臺提出了更高的要求:高的性價比,穩定且易擴展,業務適應靈活,資料可靠安全。 企業可以專注于自身業務,整合利用優質IT資源為業務服務。

3.  多備份是如何整合這些平臺,並提供這些能力的

基本上來說這些雲平臺都有各自的特點,多備份最直接的情況就是結合各自特點,整合其優勢,提供簡單直接的資料存儲備份使用入口。

就國外來說:AWS是最早的公有雲平臺,業務範圍覆蓋除了中國以外的其他地區,平臺成熟度很高。 但其實如果國內的朋友直接去用,實際會遇到不少的習慣問題,包括計費,存儲和主機的使用。 Google主要是個人和GAE,企業級IAAS平臺最近一段時間才開始發力,和微軟的平臺相對比較新一點,包括個人和企業,穩定性相對沒有AWS穩定,另外一些限制也是各有特色。 RackeSpace這類二線的雲計算企業,在基礎的產品體驗上相對比較更困難一點。 國外相對比較好的優勢是基礎配置比較好,特別是網路頻寬這塊。 就國內來說:產品成熟度,特別是可靠性和穩定性方面低於國外的幾個主流雲平臺,相對比較優勢的地方在於產品使用習慣更符合國人的習慣,最大的優勢在於服務,遇到問題,可以找到人。 國外的產品最大的問題在於溝通困難,除了LINODE/DIGITALOCEAN這類專注雲主機服務的企業,回應快外,其他幾個巨頭的產品設置都找不到服務入口。 國內的IAAS企業也逐步走向海外,香港是連接東南亞市場的第1站。 但國內相對國外,在頻寬計費方面是最大的區別,國外的累計流量消耗計費方式,更適合多備份的業務特點。 就整體容錯和均衡能力來說,這些平臺都沒有實現平臺物理區之間完全互聯,各個服務中心之間都相對割裂。 國外產品相對有一些跨地區的容災能力,加上由於基礎網路好,因為割裂而帶來的影響相對沒有國內大。

所以,其實雲平臺很多,但在產品設計,計費思路,基礎設施,以及主打方向策略上都各有特點。 對於企業來說,在拋棄傳統的方案同時,希望放在雲上的業務和重要資料就如存在銀行的錢一樣,可以非常放心,而不是因為用上了雲,而再花精力來考慮業務之外的相容性,可用性,可靠性和安全性等問題。

對於多備份,我們最關心雲平臺的三件事情:一是有沒有高性能的主機服務,我們需要對備份的企業資料進行加工,屬於I/O運算密集型業務;二是存儲的可靠性,這是我們的命根子;三是主機和存儲、使用者和主機的距離, 直接影響使用者使用服務的速度體驗。

因此我們主要還是聚焦在存儲備份的整合,通過整合,提供簡單易用介面,6個9(99.9999%)的資料安全可靠性(比如我們研發的Cloud 5技術),以及提供比單一雲以及傳統異地資料備份的更高的性價比, 真正用很少的費用實現資料永不丟失。

CSDN:多備份目前覆蓋的區域大體包括哪些國家地區?

陳元強:  多備份目前可以支援北美,國內,東南亞,西歐部分地區,其他地區目前更多是靠這些有雲節點區域來覆蓋,涉及到AWS、微軟Azure、Linode、Rackspace、阿裡雲、Ucloud、移動雲、電信雲、Dropbox 、微軟One Drive、Google drive、百度雲等。 多備份目前全球區域覆蓋分佈示意圖。


CSDN:前面我們有聊到,多備份既有支援國內,也有支援國外的雲平臺。 目前這些平臺是怎麼樣無縫的整合在多備份平臺中,特別是考慮到國際出口的頻寬其實非常擁擠。

陳元強:對於國際國內的平臺的整合,一開始我們並沒有考慮這麼多,更多的是把業務模型做出來,所以前期遇到不少問題,跨國際線路控制命令傳輸丟失,國內國外的資料相互繞著傳遞,調度也沒有考慮工作區域的分配情況, 加上各類雲平臺其實穩定性都存在這樣或那樣的問題,所以一開始挑戰很大,任務時常卡,或存儲失敗率比較高。 互聯網在架構設計上有個說法是,架構從來不是設計出來的,是不斷結合運營優化出來的;經過近10個月的不斷優化反覆運算,產品體驗上了一個大的臺階,在使用者介面上突出啟發式引導,功能聚焦在備份與恢復這兩個的核心體驗上, 基礎資源方面做了大量的體系化的優化和區域路由平衡,對於任務進行分級分區調度,速度更快,任務執行更穩定。

CSDN:有1個安全方面的話題,我們前幾期對其他雲服務的採訪,都提到過雲平臺的安全問題,企業也是非常關心這個話題。 這塊多備份有一些具體的措施麼?

陳元強:的確,安全是多備份運轉的基礎,但安全永遠是1個沒有完結的話題,多備份在安全方面一直非常重視,體現在如下幾個基礎事情方面:

保護使用者資料的承諾從法律和內部規章上進行明確。 系統管理許可權由專人負責,減少因為許可權分散帶來的潛在風險。 所有的服務定期安全檢測和風險評估,並定期進行安全性原則調整。 系統運轉資料即時熱備和冷備,系統自身具備自恢復能力。 所有使用者的敏感性資料用AES演算法加密;對於使用者備份的資料,在流出使用者主機前,就已經做了高強度加密;同時使用者相關的行為操作會自動進行安全審計。 對於採用了Cloud 5的任務,會無序打散在不同的雲和存儲設施 基於主流雲平臺,多備份本身會啟用雲平臺自身的安全保障服務,進一步增強系統的風險發現和預測能力

儘管如此,我們還是希望整個行業有更多的正能量疊加,真正的把團隊的精力用在不斷推動行業效率提升和應對自然災害、軟體缺陷或人為誤操作引起的故障應對的方向上來。

CSDN:我們之前聊到一些資料規模的問題,多備份可以在全球範圍內,流暢支援從幾MB,到數TB的資料存儲備份,這塊能否介紹一下?

陳元強:先說一下多備份的高效智慧化的備份網路架構模型,整體借鑒Linux內核的設計模型,是一個分層大非同步與小同步驅動設計的模型,每一層都為上一層提供核心的能力協定。


為了實現TB/MB各種量級的資料能在備份網路中混合快速備份,具體來說從幾個環節入手:

資料接入層

資料接入層的設計目的很簡單,就是用最容易,最通用的接入資料的技術,讓各類場景的資料,很輕鬆接入到備份系統中,同時保持每次盡可能少的資料傳輸。 所以,除了常規的分塊,壓縮,去重等常規技術外,還結合互聯網的頻寬小的特點,支援多級緩存加速技術,用最快速的差異分析技術,使得每一次備份都保持最小的資料量流入到資料傳輸層。

第1次:藍色區塊表示對資料最小化起主要作用的功能塊,圖中示意從10GB 變成1-5GB,最後輸出的資料還同資料本身的特徵相關。


第2次以後:在第1次的基礎上,本機快取相關加速比對和差異分析開始運轉,實際變化的資料可能會非常小,圖中示意雖然新增了1GB,但實際變化的資料只有0.1GB不到。


目前具體部署形態上,我們支援外掛程式,託管,以及用戶端代理模式,外掛程式主要針對中小型(1GB以下的)網站,託管支援規模稍大一點的1-30GB,而用戶端模式支援30GB以上的資料備份。

目前我們在Linux(32,64位),Windows(32,64),以及Aix上都已經完整支援。 資料庫目前我們支援主流的MySQL,Oracle,MSSQL,PostgreSQL。 在具體的應用場景上,我們有一套對應的場景識別能力,同時可以結合API,把控制台嵌入到雲平臺,虛擬主機廠家,以及線上SAAS服務等。

資料傳輸層

目前備份網路工作策略:基本是採用傳輸和控制分離的方式來設計整體傳輸網路,類似目前SDN的思想:通過對目標型別識別,伺服器進行分區編碼,資源狀態以及網路狀態動態分析,支援全球範圍的智慧化的調度能力,對於不同規模, 不同區域的物件,我們會自動調度到最合適的節點和線路,確保最優化配置網路節點和頻寬資源,優化備份恢復體驗。


具體分為幾個要點來考慮:

節點:直接採用優化過的OS底層協定棧,快速啟動傳輸視窗,加快資料傳送速率。

網路:在具體的網路部署上,通過採用優質的節點,建立核心傳輸通道;同時對根據資料特點,設定節點優先順序分區,隔離大、小資料和VIP通道;同時啟動就近接入和鏈路聚合策略,提高節點之間的頻寬利用率;對於一些要求比較高的場景, 比如超大規模的資料,我們同時會啟動區域加速策略完成分段資料快速傳輸。

資料存儲層

目前多備份支援企業級和個人雲盤存儲接入;並支援完全冗余分組組合和Cloud 5分塊跨雲冗余模式。 資料原則上就進存儲,對於啟用組合合Cloud 5模式的會進入區域加速模式傳輸。

提高資料存儲效率。 另外,在雲存儲這裡,我們已經與幾家平臺有深入的合作,比一般接入商開放的API能力會更加強大。


存儲為多級索引設計,支援跨地區分佈,支援多雲存儲,同時存儲物件分為區塊和檔物件組合的方式,提供高速的存儲,下載,搜索等能力。

優化永遠沒有結束,目前我們正在與國內的頂級加速廠商以及更多的雲計算與雲存儲企業合作,在不久後,就會全面啟動全球範圍內的的資料傳輸通道加速,預計在目前備份網路目前的基礎上會提升3-5倍的傳輸能力, 對於超過TB級的資料的備份和恢復、遷移等動作回應時間會大大縮短。

CSDN:最近幾年,雲計算相關的平臺和服務發展非常快,據說多備份已經有超過4萬家企業在使用,祝福多備份在此浪潮中順勢建立起口碑,不斷推出雲上驚喜的資料管理功能,為上雲的企業提供更多親民的資料安全保障服務,讓資料永生!

陳元強:感謝,這也是我們確定的目標,必須努力!

(責編/魏偉)

免費訂閱「CSDN雲計算(左)和CSDN大資料(右)」微信公眾號,即時掌握第一手雲中消息,瞭解最新的大資料進展!

CSDN發佈虛擬化、Docker、OpenStack、CloudStack、資料中心等相關雲計算資訊,     分享Hadoop、Spark、NoSQL/NewSQL、HBase、Impala、記憶體計算、流計算、 機器學習和智慧演算法等相關大資料觀點,提供雲計算和大資料技術、平臺、實踐和產業資訊等服務。

相關關鍵詞:
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.