起步于2005年初的STB China在成立之時就樹立了成為世界一流的開發、創新和業務中心的願景,助力伺服器與開發工具事業部在全球和中國的成功。 作為微軟亞太研發集團的核心部門,伺服器與開發工具事業部中國研發團隊目前在上海和北京兩地共有近400名開發人員,積極參與SQL Server、Visual Studio、System Center、Windows Small Business Server、Windows HPC Server等微軟核心平台產品的全球研發和創新。
微軟伺服器與開發工具事業部中國研發工程實驗室(上海)
1500台伺服器後面的3名運維工程師
2005年初到2011年,隨著業務的擴展及範圍的增長,STB China的伺服器數量遞增至千台以上,然而在業務數量的增長和伺服器管理工作增加後,其負責和龐大的維護工作依然是由三位工程師組成的研發工程實驗室小組負責管理, 同時還需要為十幾個產品組搭建、維護產品測試環境。 和所有業務快速發展的組織一樣,STB China正遭遇了IT基礎設施缺乏戰略規劃所帶來的困擾。
劉擎在研發工程實驗室演示私有雲實踐
「目前STBC China在上海的運維團隊,連同我在內,總共有三人,其中一人負責硬體保修,一人負責網路,兩人為互備份」,對微軟伺服器與工具開發事業部在上海的研發工程實驗室管理工程師劉擎而言,這個壓力無疑是巨大的。 2007年加入STBC的劉擎,目前主要負責微軟伺服器與工具開發事業部在上海的研發工程實驗室管理,主要工作內容為向微軟的開發、測試和產品經營的團隊提供Lab服務,包括測試和搭建環境,以及產品構建和產品設計。
「STBC總共有近1500台伺服器,平臺基於System Center,總共包括虛擬化服務管理系統,伺服器管理,管理用戶端,備份管理共四個系統」,劉擎表示,雲計算已經成為瞭解決當前運維瓶頸的唯一方式。
據瞭解,在STB China,劉擎花了近一年時間用412台伺服器搭建了一個私有雲,總共運行了5000多台虛擬機器。 而在整個管理平臺上,團隊的資源就是按照分組的方式,大概有超過13到15個產品組,會把他們分配到不同的組裡面,每個使用者會在自己的組裡面分配虛擬機器資源。
「幾年的時間,伺服器的數量增長了2.5倍,但我們運維團隊的人數並未增加」,在談到近幾年機房的擴容時,劉擎認為,強大的管理平臺再加上IT流程自動化管理工具Opalis是能達成的關鍵所在。
「研發的特點在於,經常需要伺服器異地同時工作,也至少需要兩個人工作在同一個平臺上,北京或者美國的一些資料中心的伺服器需要加到上海這邊來,因此我們就需要把它整合到一起。 」
「但我們我們其實還沒有達到微軟內部的指標,因為微軟內部的指標是資料中心是1000台伺服器配備一位工程師。 」
雲計算在研發團隊
劉擎認為,對研發團隊而言,私有雲的好處首先在於能夠讓計算資源變得像電、水這樣更方便的使用。
「在我們的庫裡提前準備好幾千個虛擬機器的範本,任何研發工程師可以通過自動化的機制,根據需要進行選擇。 」
在虛擬化領域,有兩種工作模式,一個是資源優先,一個叫性能優先,通俗的說,就是少占資源多花時間和少花時間多用資源。 對使用者來說,最好的一個比較有彈性的,能來說處理各種緊急需求,非常靈活。 「我們一直在追求資源利用率的最大化,過去每個團隊把自己的資源放在一個實驗室裡面,相互之間沒有一個很好的共用平臺,在有了這個虛擬化管理,他可以很容易地去共用團隊資源。 就類似這個專案A,他有自己忙的時候,繁忙階段。 在另外一個團隊繁忙,他沒有更多的機器的時候,他除了購買新的機器的時候。 現在有個選擇,可以從別的團隊調一部分資源過來,因為所有的機器都是虛擬化的話,他不會相互干擾。 」
STB China虛擬機器管理效率
據瞭解,在具體的實現上,VMM的SDK有一個基於Power shell的自動化腳本。 作為運維工程師,需要首先瞭解需求,把共同的需求抽象出來作為一個服務包,然後通過VMM的自動化腳本將裝置管理實現自動化。 這樣使用者用起來就不需要重複自動化的工作,這也解決了團隊和團隊之間的重複勞動問題。
「原先自動化是基於硬體的,我們現在變成虛擬化以後,其實自動化還是需要做,但是我們把這些寫了一個抽象的描述,使用者就不需要再使用重複勞動這一層,對他來說就是他想要的,並且我們做了更多的工作,結合了一些自動化腳本」,「 我們可以想像一下,開發者需要一個測試環境,首先你要需要兩個CPU多少記憶體,然後需要幾個Windows,再需要這個Windows是變成AD,那個Windows變成Exchange,你把這些選好之後,點一下, 後面我們自動化會把虛擬機器準備好,然後調用你所選擇好的。 這樣的話,將運維實現完全自動化,研發人員就能夠聚焦在他自己所關注的技術上。 」
研發私有雲需要先瞭解瓶頸問題
劉擎認為,對於研發而言,需要首先瞭解問題的瓶頸在哪。 從去年接手工作以後,劉擎花半年時間在調研內部的流程、資源以及內部的工程師的工作習慣。 因此在設計私有雲的時候,目標就是解決最優先的三個問題。
「我們需要評估私有雲如何提高生產利用率」,劉擎談道,「對於研發而言,尤其是團隊與團隊之間有很多重複勞動,比如在做測試的時候,需要先把Windows部署到一個環境中,然後再構建一個網路環境,運行還沒有正式上市的產品。 而實際上構建環境的過程中,不同的團隊經常需要做相同的事情。 因此這是一個問題,我們需要資源分享。 」
此外,工程師對於部署機器所花的時間也非常有意見。 比如需要安裝系統的時間至少要20分鐘,如果還再安裝所有的最新的補丁則至少要40分鐘,這樣的話,整套完成時間至少要一個小時。 「如果物理機在做這個測試的時候需要做一個AD,而通過伺服器,沒有兩個半小時是完不成的。 一天八個小時,工程師一天最多隻能做四套。 而現在的虛擬化技術可以並行去部署,每一態虛擬器,從開始部署到結束只需要20分鐘左右時間。 從兩個半小時縮減到30分鐘,這是一個質變。 」
Azure代表未來
實際上,微軟的平臺即服務雲(PaaS)Windows Azure向企業開放已經有一年時間,但是,在國內由於眾所周知的原因並沒有在國內得到廣泛應用。
對此,劉擎表示,微軟的雲計算目前是兩條腿走路,一是針對超算中心的分散式運算,另一個就是Windows Azure,微軟內部叫OS for Datacenter。 Windows Azure不是服務單獨的硬體,而是支援整個資料中心的設計,涵蓋面就包括存儲、網路等。
「微軟並沒有包袱,因為在微軟看來,雲計算的終極目標也是公有雲,微軟一直在理性地對待」,「而目前之所以採用公有雲+私有雲的模式,很大一定程度上是由於企業自己的IT基礎架構,至少還會存在非常長的一段時間。 」
「微軟的下一代VMM會將二者結合起來,能夠讓使用者同時管理到公有雲和私有雲資源,以此更自如地遷移應用」,劉擎透露道,「我相信每一個人都喜歡更多的選擇,沒有人喜歡只有一個選擇。 」
(責任編輯:admin)