基於ARM的伺服器恪守了極低功耗和優異的每瓦性能比,同時還有可能將一個難以置信的數量的伺服器放在一個機架上——現在已經實現了在一個機架上放置多達1000個ARM伺服器(在一個2U的主機殼內可放置48個伺服器節點), 而所有這些節點消耗少於5KW的電能(或者一個四內核ARM節點消耗大約5W)。
但是當一種新技術被大肆宣傳時,最好還是保持懷疑態度。 由於人們樂於瞭解一些新的東西,所以媒體總是鋪天蓋地地宣傳和熱議新的趨勢;但是到了最後,系統管理員不得不保障其IT服務正常運轉,並說服其老闆投資于新的技術。
關於ARM與x86伺服器之間的紛爭,已經有成百上千篇的評論並將有更多,但是一直沒有在真實的基準測試環境進行過一次測試,這正是我們今天將要探究的所在。 我們在我們運行了24個網站的Boston Viridis集群系統上載入了一些重量級的負載——同時還有其他的應用——並測量了流通速率、回應時間和功率消耗。 我們將其與低功耗的至強(Xeon)進行了比較,以揭示出目前商用的ARM伺服器與最好的英特爾至強產品的對比,包括性能功耗比和性能價格比;不管你的測量資料是多少,我們有一手的可靠資料。
乍一看,ARM CPU相對較低的每核性能似乎是伺服器的一個較差的搭檔。 毫無疑問的是:在伺服器市場上占統治地位的CPU是英特爾的至強處理器。 至強系列的成功,很大程度上源于其在中等功耗(70-95W)時優異的單線程(或者每個內核)性能。 將這種超群的單線程性能與相應的內核數量相結合,你就幾乎可以為任何應用實現良好的性能。 規模經濟和相應的價格檔次也很重要,但是如果回應時間更短和電費更加少,伺服器市場已經願意稍微多付出一些。
一項證明單線程性能仍然十分重要的資料是Oracle(或者你願意稱之為Sun也行)的T系列的演進。 Sun T3擁有16個核和128執行緒,但是T4卻只有每個帶有8執行緒的8個內核,其首席執行官Larry Ellison不止一次地兜售其單線程性能已經得到大幅度地提升,實現了高達5倍的提速。 我們真的需要另外一種建立在一個更慢、但是能效更高的內核集群上的伺服器嗎? 難道歷史沒有告訴我們幾頭「公牛」是優於一群「小雞」嗎?
歷史也已證明每台伺服器上的記憶體也很重要,許多高性能電腦(HPC)和虛擬化應用都受制于隨機儲存體(RAM)的數量。 現今的Cortex-A9這一代的ARM處理器用一個32位的位址匯流排,並且不能支援超過4GB的記憶體。
然而,對基於ARM的伺服器的興趣卻在不斷增加,而且已經不再是停留在宣傳的層次上。 是的,基於ARM的處理器仍然在處理能力上有所欠缺,而且至強處理器的記憶體控制器能夠處理大量的雙列直插記憶體模組(DIMM),但是當談及成本和功耗時,ARM處理器的得分就高了不少。
基於ARM的處理器在性能上也有巨大的進步。 測試資料表明:一個在2011年發佈的1.2GHz的雙核ARM Cortex-A9(三星Exynos 1.2GHz)比2008年發佈的、通用的ARM 11壓縮速度要快10倍。 根據Anand用iPhone進行的測試,SunSpider的性能也提高了20倍(儘快這種提升幾乎肯定部分得益于瀏覽器和軟體優化)。 最新的ARM Cortex-A15毫無疑問地更加強大,提供了大約50%的性能提升。 A57將增加對64位的支援,並再有20-30%的性能提升。 簡而言之,單線程性能正在被快速提升,同時也可以連接到更大量的RAM上。 ARM Cortex-A9受制于4GB,但Cortex-A15能夠處理16GB,且A57能夠處理的遠遠更多。
看起來ARM產品在伺服器這個市場區隔上開始大量發貨只是一個時間問題,那麼還需要多久呢? 最好的觀察方法是探究今天已經付運商用的最成熟的ARM處理器:基於嘉協達(Calxeda)的Boston Viridis伺服器。 看看這種伺服器現在能處理什麼? 它還有什麼樣的潛能可以發揮? 其缺點有哪些? 讓我們共同去發現。
1234下一頁閱讀全文分頁導航1.前言2.這是一個集群3.對伺服器節點更深入的觀察4.交換矩陣(作者:王欣責任編輯:王欣)