5月23日—5月25日,2012第四屆中國雲計算大會雲基地專場拉開帷幕,展示雲實踐、探討雲趨勢,共用雲未來。 雲基地專場全面展示了雲計算領域的最新技術和新產品,並以論壇形式探討雲計算發展趨勢、大資料的大價值、雲時代資料中心的節能等備受業界關注的熱點話題。 天雲科技副總裁雷濤表示目前大資料落地的應用方式有三種。 第一個本身就是資料服務,資料服務更多的是提供一些資源服務,以及一些傳統的資料能力的服務,比如資料的保存,長期資料的保存,還有面向大企業的一些專業維護,容災的能力。 第二塊更多是資訊的,這塊採用了很多雲機損的一些核心技術的變化,比如對傳統資料的保存,原有的方式,檔案系統也好,塊資料也好,是沒有檢索的,我們在雲計算裡通過一些新的資料封裝方式可以實現長期的保存。 第三知識服務,一個個給大家介紹一下。 從資料到資訊到知識,Big DATA所起到的一些內容。
天雲科技副總裁雷濤 雷濤:今天下午的主題是雲計算裡很關鍵的兩項,從雲平臺一直到大資料,基本上從雲計算裡走過來的很大的兩個關鍵歷程,大家知道2011年底的時候, 華爾街時報評了後PC時代的四大巨頭來表示現在雲產業時代的內容,亞馬遜、Facebook、谷歌和Apple,每家都有自己的形象和特點,亞馬遜是一家賣書的互聯網公司,它覆蓋了每一個使用,把存量的IT資產包裝出來, 作為服務提交的形式,亞馬遜也是雲最主要的比較明確的雲的形態出現。 另外兩家Facebook、谷歌不是賣資源,賣的是能力,賣的是它對資料本身的處理和分析,最終把價值體現出來。 就像Facebook和Google更多的是我們今天探討的第二個能力,大資料上需要掌握那些內容。 Apple更多的看的是IT消費化,也是2011年比較熱的一個題目,使整個市場的餅擴大了,服務IT的最終這項從傳統的企業端,買得起檔案伺服器、郵件伺服器的高端企業也擴展到我們SMB的市場,擴展到每一個個體的消費者, 通過隨時可用可獲取的智慧終端機網路,今天下午的題目會花兩個多小時的時間給大家分享這四個巨頭裡的前三種類型,雲平臺和大資料。
我們先從大資料開始,討論Big DATA的時候會討論什麼內容? 多數情況大家都在看什麼? 這個市場是不是夠熱了,從去年麥肯錫發佈的第一個重大的倡議,150頁的大資料的Paper,到今年美國政府採納這個調研報告,把將近400多億美金投資在了大資料上,它已經走過了從市場到落地的過程。
我們在市場中更多的聽到Big DATA是什麼? 還是Technology本身,越來越多的平臺級廠商給大家做了很多的宣講,也就是工具層面。 實際上我們今天要談的,要跨越這幾個,我們要談的不光是產品與技術,更多的是要看Big DATA到底驅動了哪一塊業務,它把一個從IT作為一個支撐角色演變成IT作為一個業務創新的驅動能力, 這塊是我們希望跟大家在後面的一個多小時分享的。 所以,我們會從業務形態的模式,以及資料價值本身去跟大家做更多分享。
這些數位,35.2ZB,這個數位背後意味著什麼呢? 意味著更大的市場,更大的餅等待所有IT的從業者去挖掘和探索。 這個資料本身我不講更多了,通過這個DATA本身我給大家描述一下這個市場。
這個市場有百億以上美金的投資,這個市場跟傳統的BI,很多人談Big DATA就說是不是你們做基於資料的分析,這個跟傳統的體系有一個很大的差異,BI跟Big DATA的差異在哪裡呢? 我們拿Google上的一個資料可以看到,下面黃色、粉色和藍色的線就是BI,它基本上是在這個市場上沒有太多變化,也沒有吸引太多投資者和技術的追捧者,相反看Big DATA從2005年開始持續受到市場的關注, 因為它的技術架構和解決的問題上跟BI有著非常顯著的差異,這個差異在哪裡呢? 我相信今天一個小時之內可能解釋不清楚,我們外面有一個售書,解答本身對於資料的價值怎麼體現在生產生活之中。
很多新的Big DATA Winner而都在區分BI和Big DATA,無論是從技術層面還是資料價值層面,這兩者的差異性都是非常大的。 廠商也是非常熱衷於在此投資的,從資本界到現在,從2005年至今可以看到,大手筆的投資在這個領域裡,IBM、EMC、都是花了超過一百億美金投資于這個領域。
我也分享一個今年2月份華爾街時報的一個報告,它描述了一個未來企業的核心競爭力,我們現在談的都是從市場的角度看這個市場為什麼會如此之熱,這個報告裡講了一個核心的概念,什麼是企業的核心價值資產,這裡面列了IT結構的層次性, 從底下的基礎設施,到私有的IT架構,伺服器,資料中心,到企業的應用,以及Analytics。 我們分析這些年最掙錢的軟體,這個報告闡述了一個觀點,它關注于在後線市場,back office,更多的關注在交易性,關注在流程本身,也就是我怎麼做更好的IT支撐,能夠讓這個工作更為高效敏捷。
當你達到一定的績優以後,我這個物件到什麼切入點最合理的使用,當所有的效率都達到最高的時候,你的核心的競爭能力在哪裡呢? 這個描述的就是資料本身,這個企業的資料將會成為你區別于其他企業的一個核心的能力,它不會成為下一層資產裡的一些大路貨。 基礎設施我們也可以跟運營商高端的企業打高蹈,賣伺服器已經是很低的產品了,什麼東西是你在企業裡能夠奠定自己有核心價值的內容呢? 就是資料。
傳統的企業需要一個轉型,back office轉向更前線,前線指的是市場,怎麼通過你的IT能力引導你的業務,這是未來軟體企業的核心價值。
剛才提到市場,七十從技術架構我們也看到一個很大的挑戰,這裡面分析了一個傳統的業務架構,比如用J2EE、database,Web可以橫向擴展,J2EE。
分散式運算在技術架構上解決了一個什麼問題? 我們不太多的談技術本身,我們從宏觀概念上給大家做一個解答,之前我們看SOA的時候,為了保證某一個業務能夠很好的SOA的請求能夠返回,我是讓我的應用越做越大,但是應用要處理資料,我要不斷的輸入和吞吐, IO對我就是一個很大的瓶頸,分散式運算的很大的理念就是我不再調入資料,資料分散式的放在該放的結構上,調度的是應用,把一個應用切分成上百份、上千份滿足計算,資料是一個對立的設計概念, 有了這種方式以後可以實現更多的面向資料敏感型的業務操作。
這種架構帶來一個什麼好處呢? 給大家分享一下Facebook的應用,我可以在意秒一級我的好友可以看到,它支援每天200億處理,每秒是20萬次的點擊處理,整個全部是小於30秒的延遲,30秒是從用戶端生成,在後端實施處理,然後動態的其他一些服務, 整個服務是8.2億使用者的情況下使用。 這個架構客觀的講,我們可以看到,拿傳統的理念套用的話,Stream data processing類似于J2EE。
(責任編輯:蒙遺善)