在此次的SPF大會上,思科大中華區資料中心首席架構師謝軍針對大資料解決之道發表了演講,SP特此將精彩內容摘要如下。
大資料從IT角度將帶來商務驅動,會帶來增值業務,這是大家的共識。 然而,大資料架構和傳統資料中心資料管理方式有很大差異。 這些差異在IT行業產生了很多新的變革和挑戰,面對這些挑戰應該怎麼辦?思科哪些技術可以説明克服這些挑戰呢?
事實上,挑戰主要集中在三個方面。 首先,傳統的HADOOP方式會有一個非常關鍵的節點,這相當於工作引擎,所有資料管理要通過這個引擎操作。 這個節點出現故障則會使整個大資料系統不可用,業務徹底癱瘓。 因此要求其具有高可用性。
第二: HADOOP通常有多份資料複本保存資料,當一個資料複本出現故障系統會説明做複製,這個複製通過網路實現。 這就可能導致在一些特定情況下產生大量資料複製,特別是當分散式系統做得比較大的時候。
第三,過去資料存放是集中式存儲與伺服器相連。 整個資料管理層面只需管理幾個節點。 比如一個傳統的資料庫有兩個節點或者三四個節點,而在HADOOP環境下會出現幾十個甚至上千個,而且是上千個有可能跨不同資料中心的超大集群。 這意味著管理點非常多,管理成本大幅上升。 以上都是大資料可能面臨的挑戰。
針對以上的挑戰,思科做了統一計算系統。 今後資料中心發展,計算一定是往橫向擴展。 這意味著虛擬化、雲計算以及大資料,其實都有個共同特點是分散式發展。 分散式系統必然需要和網路關聯,因此思科希望做一個產品把計算和網路融為一體,這就是思科的UCS伺服器系統。
思科的伺服器系統核心取決於一對萬兆矩陣,該矩陣是計算域的管理點,所有掛在計算域上面的伺服器只是一個計算單元,它掛在哪個應用上全由網路層決定。 思科的系統本身實現了硬體虛擬化,把伺服器的屬性上升到網路,由網路去定義這個伺服器。
其二,思科的系統將會使得管理域變大,只要客戶連接到交換群,就可以控制所有的節點,這會極大的縮短管理點。
第三,思科的系統集成了兩個自愈的能力,怎樣實現高可用性,有兩種方式,思科提供的是硬體解決方案。 由於思科的系統是AB兩個矩陣環路,因此一旦A環路出現問題,B環路就能馬上解決,其次,思科的系統實現了硬體漂移的能力,比如伺服器的CPU壞了,客戶不需要重裝一台伺服器,思科的系統可以將其硬體屬性「寫」到另外一台機器上, 就可以直接使用。 這HTTP://www.aliyun.com/zixun/aggregation/17183.html">説明客戶節約了很多軟體的維護成本。
大資料的發展現在基本呈現兩個趨勢,一個是堅持獨立自主開源方式。 另外一個是會提供自己的解決方案,在原先大資料架構裡面提供自己的產品。 這兩種方式思科都會提供很好支撐。
總結一下,思科的統一計算系統,針對關鍵節點,思科可以提供具有硬體漂移能力的技術,出席故障可以快速修復。
其次,它解決了大範圍管理的問題,假設160個伺服器,它可以做一個非常大的大資料集群,這意味著有一百六十個管理點,使用思科的系統,管理者只需要對其中一個點進行管理,就能對所有的管理點進行監控。
最後,思科的系統可以保證它的高可用性和提高性能。 高可用性是思科有兩個自愈能力。 它對於節點快速大量資料複製帶來的好處是不言而喻的。
不妨關注一下大資料的另外一個趨勢,既很多廠商根據自身的技術特點推出了一些新型的解決方案,最近一年最熱的就是SAP的HADOOP,它實際上是通過記憶體的方式來解決快速資料處理的問題。 SAP的HANA可以通過一些方式做到節點的擴張,它採取的方式是通過將資料都放在記憶體裡面。 它在思科的解決方案裡都有體現,主要分為兩部分,第一是單一節點,一般是些小規模的節點。 還有一種是可擴張的節點。
思科可擴展節點的解決方案,需要本地磁片的支撐,在存儲方面思科有兩個合作夥伴,一個是EMC,一個是NetApp 。 我們的解決方案裡融合了網路。 因此在擴展時不需要考慮擴展時的連接模組,更不需要重新佈線。
今天主要介紹了思科計算產品,思科計算不是單純計算,是以網路發展計算。 相信在今後,特別是越來越多強調的分散式系統裡,思科計算會給大家帶來很多驚喜。 (王衛東)
(責任編輯:蒙遺善)