3. 物理伺服器增加而維護人員並未增加
原視頻地址:http://v.csdn.hudong.com/s/article.html?arcid=302330
譚茂:背後的話,這1,500台伺服器,加上上邊的幾千個虛擬機器,維護人員是什麼樣的變化?
劉擎:維護人員我們其實沒有人數的變化,最早的時候,其實是三位在上海,北京這邊業務還沒開始,事實上從09年開始在北京增加了新的團隊,我們增加了1位工程師在北京。那麼人數的增加,從伺服器相當於增長了2.5倍,人數沒有增加。
譚茂:像這1,500台伺服器,按照業界標準它大概需要多少人管理?
劉擎:這個各個地方都不太一樣,我舉個美國的微軟內部的一個指標。我們其實還沒有達到微軟內部的指標,微軟內部的指標是資料中心是1,000台伺服器配備一位工程師。這是微軟資料中心的標準。
4. 傳統物理伺服器如何無縫遷移
原視頻地址:http://v.csdn.hudong.com/s/article.html?arcid=302331
譚茂:還想回到技術這一塊來聊,其實我們也想瞭解,包括現在很多客戶他們也想去建私人雲端,但他們比較為難的一點,就說他們做傳統的物理的伺服器怎麼去無縫的遷移到私人雲端上,這塊你們有沒有一些經驗?
劉擎:這塊其實我們和傳統的工業碰到相同的問題,在我們做遷移的時候,我們第一步想解決的問題,就是你剛才提到的問題,就是我們怎麼把現有應用往虛擬化去遷。在微軟的System Center產品裡面,就設定了一個P2V功能,就是指從是為了把一些早期的服務和應用,從物理機遷移到虛擬機器時,通過這個功能話,基本上在10到20分鐘左右,就可以把一個運行在硬體層面上的Windows、Linux以及應用,轉到虛擬機器當中。可以保留所有的設定,可以保留所有的團隊關係,所有的應用的設定,包括儲存、資料庫。
其實當初我們還用了一個方法,就是說在我們把物理機的資源遷到虛擬機器以後,我們把物理機重新安裝,就是我們把它叫做Reprepare,重新放回到資產庫來,讓它變成虛擬化可用的資源。原來它幹一件事情,現在它幹三件事情。這樣的話,我們就可以最大化。
譚茂:還有一點,其實我們知道在雲裡邊是用了微軟相當多的微軟的一些技術,一些產品在裡面,其實過去的資料中心都會有些管理工具,一些程式,將來這種,特別是基於平台的這種伺服器,管理可能是個大的麻煩。微軟在管理中,因為微軟自己也有本身的產品。這塊?
劉擎:這個其實也是我們全體工程師,就說一步步走過來說碰到的最多問題。我們最開始在看,我們各家廠商的意見,有惠普、戴爾、聯想、伺服器,每家有自己的管理工具,像惠普有Insight manager和Dell 的OpenManage,同時我們還要管理實驗室的交換器和儲存。這時候就像你剛剛提到的,我們怎麼去管理這麼多的系統,我們看了挺多的開源管理工具和商用管理工具。最後我們看下來,還是使用微軟的System Center最方便。
我們可以和思科的裝置,我們可以和戴爾的OpenManage,可以和惠普的Ingisht Manager,可以和聯想的管理工具,可以全部整合在一起,我們通過一個平台看到思科的交換器裡面的CPU的負載是什麼情況,可以看到戴爾伺服器的功耗,風扇的速度、CPU記憶體,可以在一個平台可以看到所有的資訊。並且每個裝置的健康狀態,都會通過email即時地反饋,我們可以在第一時間主動的去做相應的行動。
譚茂:像這種管理,它是通過跟思科標準,開發的人員自己是根據這個介面去做的?
劉擎:這個沒有,因為所有的廠商都遵循共同標準,比方說思科是遵循SNMP網路管理標準,戴爾有自己專門設計的符合微軟COM標準的套件。那你把這些套件,這是一個自由下載的軟體包,實際上是描述它的硬體。它們都是免費下載的。通過這些,就可以監控這些伺服器,一直到硬體這個層面。包括比方說記憶體的插槽出現了錯誤,硬碟可能馬上要損壞,第幾個硬碟,第幾個記憶體,都可以把這些進行即時報告。
5. 微軟虛擬化的安全和效能
原視頻地址:http://v.csdn.hudong.com/s/article.html?arcid=302332
譚茂:其實虛擬化,可能大家現在不容易接受,他們仍然對他們的一些安全是有質疑的,在虛擬化的安全?
劉擎:的確很多使用者除了在安全化虛擬上有很多的疑問,我們包括實際測試,還有微軟內部,其實微軟的虛擬化它的產品目標,因為我們設計每個產品都有產品的目標,比如這個產品要解決什麼樣的問題。所以我們會從我們產品設計的目標和我們實現的目標,我們可以看到基本上在98%的轉化效率以上,這樣的話,基本可以說做到了1:1這樣一個轉化效率,你可以理解成一個虛擬機器它的效能和實體機是完全一致的,在CPU轉換上。記憶體就肯定原來就是那麼多,而在磁碟效率上它是根據運行虛擬機器,你只要達到I/O的最大值,就是安全的。剛才你提到安全這一塊,實際上這個和業界的虛擬化上,實際上有些標準,你怎麼去做虛擬機器的分塊。
譚茂:98%的轉化效率,是基於Windows平台之上?
劉擎:實際上所有的東西,它CPU轉換效率,下面在執行的時候,不管是Windows還是Linux。它實際作為一個假的CPU,所以虛擬化有一個假的CPU,你的那個虛擬機器是在這個假的CPU上。轉換效率是把那個虛擬機器pass掉。
譚茂:現在整個系統,你們也在做一些調優,最佳化?
劉擎:我們日常工作中,第一個是不停的往裡加新的機器,因為我們有很多項目會進來,同時我們會把一些資源做淘汰。實際上我們日常的管理工作就是在這個平台上維護。
還有一塊,就是我們在這個平台的自服務門戶上加新的東西,我們在做比方說我一級的管理,我這個管理在上海,但我們現在已經有一些美國的,北京的一些資料中心的伺服器加到上海這邊來。這樣的話,我就可以一個平台上管理微軟本身。因為我們這個項目的要求,異地同時工作,但至少他需要兩個人工作在同一個平台上,我們就需要把它整合到一起。
譚茂:另外還有一個我們比較關心的是在這種戰略當中,因為基於虛擬化的自動化,管理服務化,這是虛擬化最核心的工作。其實這塊的話,您也談到一點,微軟也做了很多工作在自動化管理這一塊,具體談一下。
劉擎:虛擬化實際上在真正的對生產力提供影響,讓虛擬化技術,讓這個雲技術變得像電、水這樣更方便的使用,你肯定得需要一些配套設施,比如你必須有大樓的強弱電布線,然後才能夠送到使用者。實際上虛擬化技術把計算能力也是以這種形式出現的,首先你看我們工程師需要什麼,他需要幾個虛擬機器,我們怎麼能更快地通過服務門庫這樣一個簡單的方式,然後選擇。在我們的庫裡面提前準備好幾千個虛擬機器的模板,使用者需要的話,就是根據他的選擇,就像點菜一樣,是要一個中式的,西式的,湘菜還是粵菜,他測試中需要選擇什麼,我們把這些都準備好,這就是料。他可以直接去選擇,需要通過我們自動化的機制,那麼他選擇他的那個菜,直接就可以變成他要用的東西。
所以我們會為使用者去選拔,虛擬化技術,自動化整合在一起,為內部客戶們服務。
譚茂:目前你們通過什麼來實現的?
劉擎:通過VMM的SDK,它會有一個基於Power shell的自動化指令碼。我們首先會理解使用者需求,他可能會需要三個機器,我們把這個共同需求抽象出來,因為我們和很多團隊談,他們有一些共同的需求,把這些共同需求抽象出來,我們作為一個服務包,然後這下面是通過VMM的自動化指令碼,可以把很多東西都自動化。這樣的話,使用者用起來就不需要重複自動化的工作,這也解決了我之前所提到的一個問題,就是團隊和團隊之間會重複。我們現在把這個重複全部抽象起來,變成一個層次的東西,我們把它叫Virtualization Infrastructure Layer。原先自動化是基於硬體的,我們現在變成虛擬化以後,其實自動化還是需要做,但是我們把這些寫了一個抽象的描述,使用者就不需要再使用重複勞動這一層,對他來說就是他想要的,並且我們做了更多的工作,結合了一些自動化指令碼。
他原先的自動化指令碼,我們做了一個類似於指令碼庫的概念,就是說把他指令碼庫裡面,關於SQ server,關於Office,就直接調到那個地方。這樣的話,可以想像一下,需要一個測試環境,首先你要需要兩個CPU多少記憶體,然後需要幾個Windows,再需要這個Windows是變成AD,那個Windows變成Exchange,你把這些選好之後,點一下,後面我們自動化會把虛擬機器準備好,然後調用你所選擇好的。實際上指令碼是我們庫裡的。這樣的話,完全自動化,使用者就聚焦在他自己的專業領域上。