國內某高校為了提高科研品質,保證學校科研工作的順利完成,該校希望能夠構建一個學校的「內部雲」,把校內的各個學院所需要的科研系統統一部署在這個「內部雲」系統之上,完成統一的部署和管理。
為了解決不同學科對高性能計算的實際需求問題,這套高性能計算系統將用於滿足包括石油地震處理、材料化學、水文應用、GIS系統等不同的數值科學類比方面計算需求。 因此,這套系統對於計算性能的要求極高,對於穩定性要求極強,存儲量要求極大,可管理性要求極為成熟。 在國內著名的高性能計算解決方案供應商——曙光公司以及中科院計算所的協助下,建立完成了用於構建自身「雲計算」的高性能計算基礎平臺。
優異的計算性能
為滿足使用者對於計算性能方面的需要,此次方案中的計算子系統高性能計算節點部分共包括92個曙光CB65-F刀片伺服器,該伺服器為雙路設計,採用了AMD「上海」處理器的升級版——六核伊斯坦布爾處理器, 共提供了736個2.6GHz處理器核心和1.5TB記憶體。
「伊斯坦布爾」處理器產品與現有的AMD皓龍4核處理器介面相容,並在功耗設計相同的情況下,性能提升高達30%。 6核心皓龍處理器「伊斯坦布爾」採用了45納米制造工藝,具備6MB三級緩存,並集成有雙通道DDR2記憶體控制器、相容Socket F介面,功耗大約只有40瓦。 AMD「伊斯坦布爾」6核皓龍處理器充分利用了現有的平臺基礎架構以及低成本、高能效的DDR-2記憶體,有助於降低系統的採購成本。 和上一代的「上海」相比,核心數量提升,並繼續提高了處理器上匯流排的速度。
另外,在此次案例中還提供了兩台胖計算節點,具備超強的計算能力,理論峰值運算速度高達8.87Tflops(每秒8.87萬億次浮點運算)。 充分滿足了該高校對於計算性能的要求。
超高的計算密度
在社會高度發展的今天,空間成本愈發明顯。 而曙光公司此次解決方案超高的計算密度成為了此次專案的一大亮點。 曙光研製了具有自主智慧財產權的雙路四核和四路四核高密度刀片主機板和基於該主機板的中國第一款7U高度的10片工業標準刀片伺服器,該刀片伺服器採用全內置的ConnectX DDR二層交換模組,全內置的管理Ethernet網交換模組, 可以實現單機箱最高40CPU,160核的超高計算密度,並實現了單節點內部的OpenMP平行計算。 這些高密度計算的特性有效的節約了使用者的空間成本。
超低功耗
在能源成本日益嚴重的今天,節能環保成為了整體社會的基調。 由於在此次的高性能計算解決方案中採用了刀片設計,使得此次專案可以比常規機架式解決方案節電節約20%耗電;它採用了液冷系統散熱技術,比常規空調製冷節約30%空調耗電;同時,方案中採用節能軟體和作業調度相結合, 系統全年預計可節約20%的耗電。
雙重保險的水冷散熱
此次高校使用者的高性能計算解決方案是國內大規模機群系統首次採用水冷系統的解決方案,通過使用水冷系統,降低了高性能計算系統對客戶機房的要求,同時提高了冷卻效率。 水冷系統的設計實現了水電分離,保證了系統的安全性。
同時水冷系統還包括備份的被動散熱系統,可以在水冷失效的情況下保證系統的正常運行,提高了系統的穩定性。
總之,作為面向國民經濟建設和社會發展的重大需求的新一代高性能電腦,曙光5000A適用于各種大規模科學計算和工程計算,完全可以滿足使用者的需求,並能在未來3-5年內保持一定的技術先進性。
超大的存儲空間
此次高性能計算解決方案採用了目前業界領先的高速Infiniband互聯之上的全域共用並行IO架構,包括4個數據伺服器、1個中繼資料伺服器、一套12T的一級即時存儲和一套二級備份存儲, 軟體部分基於成熟的Lustre並行檔案系統,資料塊分散存儲于4個存儲管理節點,降低資料丟失風險。 和曙光集群管理軟體結合,對檔案系統部署、檔案系統管理、檔案系統快速恢復提供良好支援。
一級存儲是在計算過程中,用於存放計算所需的原始資料集、臨時資料以及暫存計算結果的高性能磁片存儲。 在一級存儲中,採用曙光企業級磁碟陣列DS8314FF,配置8個FC主機介面,配備8Gb/s高速Cache,最大擴展可支援224多塊磁片,直接接入SAN光纖交換器網路。
二級存儲則用於存放那些需較長時期保存的資料,如結果資料、一些公共的資料資源,或使用者希望長期存放的其它資料。 在二級存儲中,採用曙光企業級磁碟陣列DS2412FA,配置8個FC主機介面,配備4Gb/s高速Cache,最大擴展80塊磁片,直接接入SAN光纖交換器網路。
杜絕浪費的資源整合
在此次方案中,曙光公司根據使用者的要求整合整個校園地區分散的超級計算資源,構建本地區的綜合計算平臺,不存在任何相容性問題和技術障礙。
卓越的管理系統
在此次的解決方案中,曙光公司不僅提供了先進的高性能計算硬體解決方案,同時,曙光5000A高性能電腦還提供了豐富的軟體系統,包括作業系統、編譯器、調試器、函式程式庫、並行通信庫、全域共用並行檔案系統等基礎軟體, 以及曙光公司專門為業內高級使用者開發的Gridview2.0綜合監控管理系統和業界領先的PBS GridWorks作業管理軟體,説明使用者從硬體、系統、應用、能耗、使用者行為等各個層面上都可以方便有效地管理自身的高性能計算中心。