就在資料中心、網格計算、超級計算、雲計算等技術與概念逐漸崛起時,IT行業也正在朝著商業模式、技術架構到管理運營等各方面的方向去變動。 同時,雲管理技術也漸漸進入了我們的視野,有關雲管理的話題也愈演愈熱。 在從使用者需求、技術特徵和功能組成來看,目前,雲管理主要是資料中心的管理。 該管理主要把重心放在了重點資源和業務的整合上、視覺化和虛擬化上,而雲管理注重的是按需分配資源和雲的收費運營;目前,雖然資料中心管理相關的經驗與技術很多已較成熟,但雲管理的相關技術仍還沒有很好的發展。 而資料中心管理未來的發展方向與目標將是雲管理。
如何進行雲管理? 現階段需要關注哪些內容? 從淘寶、騰訊等國內雲計算應用先行者的IT建設和管理中,或許能夠獲得啟迪。
先行者眼中的雲管理
日均4億次的網頁訪問量、日均交易額6億元、全年交易額達2000億元,......,這就是亞洲最大的網上交易平臺——淘寶網。 在這些驚人數位的背後支撐的IT基礎設施,則是分佈在杭州及全國的8個資料中心的上萬台伺服器、上千台網路設備以及運行著上百種應用。 對淘寶而言,未來的雲計算服務模式是「B2C+C2C+網路行銷+雲租用服務」,是對現有業務的繼承和發展,因此首先要對現有的IT基礎設施(尤其是資料中心)進行整合,而相應的雲管理就是對資料中心和底層基礎設施進行整合管理。 具體說來有三個層面:
設備層面。 需要實現對大容量設備(上萬台伺服器和網路設備)的管理,同時要考慮物理上分散式部署、邏輯上統一的管理需求;
業務層面。 需要實現在同一個平臺中實現對IT和IP設備的融合,可以從業務的角度對網路進行管理,也可以從性能和流量的角度對業務進行監控和優化;
服務層面。 需要提供運維服務方面的支援,説明IT部門向正常化、可審計的服務運營中心轉變。
總的來說,淘寶目前涉及的雲管理實際上就是資料中心的管理,按照基礎設施管理->上層業務和流量分析->IT服務運維的次序,整合好各種資源,包括設備、應用、流量、服務等,為將來建立虛擬化資源池、 對外提供雲服務打下基礎。
與淘寶類似,現階段騰訊的雲管理也同樣集中在對底層資料中心基礎設施的管理。 除了關注資源整合之外,騰訊更進一步地關注資源的虛擬化和自動化。 這包括兩方面:首先是對虛擬化資源(包括虛擬網路設備、虛擬主機等)的管理,能夠查看這些虛擬資源的狀態;其次是對資源池各種資源的自動化管理,能夠對物理資源和虛擬資源進行配置。 總而言之,先整合資源,再進行資源的虛擬化和自動化,這些就是騰訊對現階段雲管理的要求。
雲管理從資料中心開始——資料中心管理解決方案
從淘寶和騰訊這兩個案例可以看出,目前的雲管理還處在初級階段,實質上是資料中心管理,其主要需求為資源的整合、虛擬化、自動化等。 而傳統網管採用的是以裝置管理為核心的FCAPS網管模型,各種管理工具之間不易融合,很難滿足資料中心各種靈活易變的業務模型和管理需求。 新的資料中心管理平臺應該採用面向服務架構(SOA)的設計思想,融合並統一管理資源、業務、運維這三大資料中心組成要素,通過按需裝配功能元件與相應的硬體設備配合,形成直接面向客戶應用需求的一系列整體解決方案, 從而為資料中心的各種關鍵業務系統提供支撐。
圖1 資料中心管理解決方案模型
如圖1所示為資料中心管理解決方案概貌,其主要包括四個部分。
首先,資料中心管理需要提供端到端、大容量、視覺化的基礎設施整合管理方案。
資料中心除了傳統的網路、安全設備外,還存在存儲、伺服器等設備,這要求對常見的網管功能進行重新設計,包括拓撲、告警、性能、面板、配置等,以實現對基礎設施的整合管理。 在底層協定方面,需要將傳統的SNMP網路管理協定和WMI、JMX等其他管理協定進行整合,以同時支援對IP設備和IT設備的管理。
在軟體架構方面,需要考慮上萬台設備對管理平臺性能的衝擊,因此必須採用分散式的架構設計,讓管理平臺可以同時運行在多個物理伺服器上,實現管理負載的分擔。
另外,資料中心所在的機房、機架等也需要進行管理,這些靠傳統物理拓撲的搜索是搜不出來的,需要考慮增加新的視覺化拓撲管理功能,讓管理員可以查看如分區、樓層、機房、機架、設備面板等視圖, 方便管理員從各個維度對資料中心的各種資源進行管理。
圖2 資料中心視覺化拓撲視圖(機房、機架等)
其次,資料中心管理需要提供虛擬化、自動化的管理方案。
傳統的管理軟體只考慮物理設備的管理,對於虛擬機器、虛擬網路設備等虛擬資源無法識別,更不要說對這些資源進行配置。 然而,資料中心虛擬化和自動化是大勢所趨,虛擬資源的監控、部署與遷移等需求,將推動資料中心管理平臺進行新的變革。
對於虛擬資源,需要考慮在拓撲、設備等資訊中增加相關的技術支援,使管理員能夠在拓撲圖上同時管理物理資源和虛擬化資源,查看虛擬網路設備的面板,以及虛擬機器的CPU、記憶體、磁碟空間等資訊。 其次加強是對各種資源的建構管理能力,能夠對物理設備和虛擬裝置下發網路設定,建立配置基線範本,定期自動備份,並且支援虛擬網路環境(VLAN、ACL、QoS等)的遷移和部署,滿足快速部署、業務遷移、新系統測試等不同場景的需求。
圖3 資料中心虛擬化資源管理
再次,資料中心管理需要提供面向業務的應用管理和流量分析方案。
資料中心存在著各種關鍵業務和應用,如伺服器、作業系統、資料庫、Web服務、中介軟體、郵件等,對這些業務系統的管理應該遵循高可靠的原則,採用agentless無監控代理的方式進行監控,儘量不影響業務系統的運行。
在視覺化方面,為便於實現IP與IT的融合管理,需要將網路管理與業務管理的功能進行對接,拓撲圖上不光可以顯示裝置資訊,也可以顯示伺服器功能表運行業務及詳細性能參數。 另外,資料中心帶來了新的業務模型,如1:N(一台伺服器運行多個業務)、N:1(多台伺服器運行同一個業務)和N:M(不同業務間的流量模型),這些業務對於資料中心的流量帶來了很大的衝擊,有可能會造成流量瓶頸,影響業務運行。
因此可以對諸如流量分析軟體進行改進,提供基於NetFlow/NetStream/sFlow等流量分析技術的分析功能,並通過各種視覺化的流量視圖,對業務流量中的介面、應用、主機、會話、IP組、7層應用等進行分析, 從而找出瓶頸,規劃介面頻寬,滿足使用者對內部業務進行持續監控和改進的流量分析需求。
圖4 資料中心業務流量模型
另外,資料中心管理還需要提供可控、可審計、可度量的運維管理方案。
對於負責運行資料中心的企業IT部門經常遇到以下問題:
IT部門的工作量難以衡量與評估;
故障處理有較大的隨意性,出現問題後難以找到責任人與處理辦法;
技術人員的流動增大IT管理難度,只有依賴經驗豐富的老管理人員,新人一時無法接手管理;
IT部門的成本不好控制,投入產出的效果不明顯。
因此,必須考慮引入運維管理,參考IT服務管理的最佳實踐——ITIL管理模型,結合企業內部的人員、技術、流程和其他條件,通過使用者服務平臺、資產庫、知識庫等工具,對常見的故障處理流程、配置變更流程等進行梳理和固化, 加強服務回應能力,及時總結相關經驗,提高IT部門的服務交付能力與服務支援能力。
結束語
雲計算是IP技術與IT技術兩大領域的結合體,因此雲管理不僅需要從底層資源的角度出發來保障業務和性能,也要從業務和性能的角度出發來優化網路。 這意味著對雲的管理需要採用全新的管理模型和靈活的功能架構,並且充分考慮基礎設施、技術趨勢、業務運行、運維服務等各種管理要素,建立一個標準化、開放式、易擴展、可聯動的統一智慧管理平臺,實現資源、業務、 運維融合聯動的精細化管理。
隨著雲的建設重點從資料中心向公共雲、私有雲、混合雲等不同類型雲的運營過渡,相應的管理工作也從對資料中心的管理轉變為對雲的管理。 從現在的「看雲不是雲」,到未來的「看雲還是雲」,這是一個過程。 雲管理的最佳路徑是從資料中心管理開始,對底層資源進行整合,並通過虛擬化和自動化進行調配,最終向雲服務過渡。 只要從實際出發,在實踐中對資料中心管理不斷進行完善,自然而然的就能迎來真正實用的雲管理解決方案。