「國統局資料顯示全國70個大中城市房價上漲勢頭明顯遏制」、「國統局調查顯示中國群眾最關注醫療問題」、「國統局稱3月份CPI同比漲幅創31個月以來新高」......
類似以上的這些消息我們經常可以看到,國家統計局源源不斷地向社會公佈涉及國家經濟發展、民生等各個層面的資料。 而這些龐大的資料處理背後是怎樣的一個IT系統在支撐? 涉及到省市級各個層面的資料是如何匯總到國家統計局的呢? 龐大的資料處理對於IT系統會有哪些挑戰? 對於種種疑問,國家統計局資料管理中心主任許劍毅向記者介紹了目前國家統計局整個IT系統的建設思路,同時國家統計局資料管理中心王洪琛處長詳細介紹了虛擬化和雲計算技術在整個系統中的作用。
運用雲計算虛擬化直面挑戰
去年,記者在採訪許劍毅時,他就給記者描述了一副「統計雲」的畫面:國家統計局正在建整個統計資料系統的私有雲,今後國統局統計資料的採集、加工、處理,都以北京為中樞資料中心,再分四個階層,逐層伸向全國。
再次見到許劍毅,是在國統局核心業務系統專案在進行二期之時,對於「統計雲」的建設,許劍毅又有了更多的感受和想法。
經過多年的發展,國統局資訊化建設已經取得了很大的成績,然而更多的資料處理,尤其在時效性、準確性方面要求更多,給國統局的資訊化建設帶來挑戰。 「國統局的應用系統非常龐大,其海量資料處理量、高併發量等對於IT系統都會是挑戰。 」許劍毅指出,要改變這些情況,硬體設備能力、性價比都是所要考慮的。
「我們的思路是用小機器代替大機器的作用,把小的機器通過集群的方式,集群到核心業務系統來滿足業務需求。 」許劍毅指出這是國統局的一個思路,與此同時,建立一個全國各級統一的系統也是國統局需要解決的,「統計雲」就是按照這樣的需求提出來的。
許劍毅向記者詳細介紹了目前國統局IT系統的組成情況。 「國統局利用現在最先進的虛擬化、雲計算、資源池這些先進的IT技術,以國統局為中心建立國家統一的核心業務系統,包括統一的資料中心。 」許劍毅特別提出了,其系統架構裡用到的10台IBM最新的小型機(包括6台IBM Powre595伺服器和4台IBM Power780伺服器)構成的集群,「整個架構裡利用了IBM等多家公司的最新的產品和技術, 使得整個系統裡沒有單一故障點,從而解決安全問題。 」
與此同時,國統局的核心業務系統還需很好解決高併發的問題。 許劍毅指出,系統整個設計之初是按照百萬級高併發量設計的,「利用虛擬化、雲計算這些技術百萬級不會是問題,甚至可以達到千萬級。 」許劍毅認為,該套系統也較好的發揮了IBM小型機練級處理高併發的能力,去年的人口普查就很好的檢驗了這套系統,「整個系統的協調、運算能力非常強。 」許劍毅還給了我們一個資料,之前13億多人的表格單機處於需要一天甚至更多的時間,而基於新的系統,兩分鐘可以搞定。
大統一的思想貫徹國統局整個資訊化建設的過程中,雲的思想也躍然其中。 許劍毅說目前國統局正在開發全國統一的資料處理應用平臺,而下一步也希望以此為中心統一業務應用。 「全國統一的業務將會集中到一套核心業務系統上來處理,為整個統計工作提供一個雲服務。 」許劍毅描繪到,國統局的資訊化建設正在一步步邁向大統一的「統計雲」。
四個資源池各司其職 小型機支撐核心業務發展
許劍毅向我們描述了國統局整個IT系統的狀態,以及其所能發揮的作用,給我們描繪了一副充滿「誘惑」的統計雲,而這個系統到底有哪些硬體設備在支撐,雲計算、虛擬化又是怎樣發揮著作用呢? 王洪琛就從技術層面向記者做了詳細介紹。
私有雲的理念對於整個國統局來說有著很強的吸引力,尤其是立于服務的雲。 王洪琛告訴記者,完整的私有雲概念實施起來會有難度,但是依然需要在這個思想的指導下,去架構整個IT系統。 目前國統局在基礎架構雲層面做了很多工作。
「隨著業務發展,如果不斷買機器,承重、電、空間都不夠,在這種情況下虛擬化技術讓一台機器支援更多的應用,這是在PC服務上經過幾年的探索已經實現了,並且效果還是不錯的。 」王洪琛指出,這種成功也希望能夠複製到小型機上來,「小型機安全可靠,一直支援著國統局重要的業務,然而實施其虛擬化也會存在相容、統一平臺的問題。 」IBM的解決方案在王洪琛看來是最能滿足國統局的需求的。
關於整個基礎架構的規劃,資源池的調用,王洪琛介紹到其一共劃分為四個資源池,即Web伺服器、應用伺服器、資料庫以及存儲各屬一個資源池。 四個資源池也根據不同的需求和標準進行各自的統一。 其中「資料庫池是通過IBM的基於小型機的虛擬化技術,實現整個資料庫資源池的調用。 另外通過不同品牌的小型機或者PC伺服器組成虛擬化的應用伺服器的資源池。 」王洪琛也強調各個資源池之間的防火牆等安全手段必須做好,確保安全性。
對於目前業界說到很多的基於x86的應用伺服器,在國統局的IT系統中我們也可以看到。 「基礎架構雲中,資料庫雲是通過Power來實現;應用伺服器雲一個通過IBM的應用伺服器,以來應對大併發的應用,IBM Powre595和IBM Powre780發揮了很好的作用,Web伺服器雲採用的都是刀片式伺服器。 基於x86的應用伺服器也會支撐一些非關鍵業務的發展。 」王洪琛強調,無論是哪種雲、基於哪種架構的,所有的都是冗余性的,會最大限度保證業務的高可用和持續性。
完善、穩固的基礎架構雲為整個統計雲的實現打定了堅實的基礎。
第一個吃「螃蟹」的總是會引起眾多的關注,伴隨而來的也會有各種各樣的疑問,許劍毅指出IT是為業務服務的,只要新技術能夠為業務發展帶來實在的好處就應該去嘗試。 基礎架構雲的建立使得統計局日常管理和運維變得簡單、資源配置也會非常靈活。 從業務層面看,全國統計系統的融合為所有資料能夠即時傳達、處理提供了很好的先決條件。 這也是許劍毅一直強調到的大統一,而落到技術層面,對於IT設備的性能也有著更多的挑戰,如何處理眾多系統之間的關係、保障系統的穩定性和資源的高利用,國統局的基礎架構雲會是一個很好的借鑒。