他是IBM IT技術創新者最高榮譽IBM Fellow的獲得者;他領導過IBM「網格計算」戰略;他是EMC公司院士及傑出工程師評估委員會的創始人和主席;他在EMC設定技術方向上扮演著重要角色。 多年來, 他一直走在IT技術變革的最前沿,他就是EMC高級副總裁及CTO Jeff•Nick。 近日,Jeff•Nick先生接受了Watchstor獨家專訪,暢談了對雲計算、大資料等熱門技術的看法。
從網格計算、雲計算到大資料---這是場進化論
回顧過去十餘年的IT發展歷程,網格計算、雲計算和大資料是不可饒過的三大話題。 網格計算曾經轟轟烈烈,最終卻是無疾而終;雲計算亦是風起雲湧,逐漸走向落地之時仍不乏質疑之聲;大資料現在風頭正勁,引發的爭論卻也是最為激烈。 每一場IT技術變革都有其背後的前因後果,無論網格計算、雲計算還是大資料,甚至未來接踵而至的某個IT新概念,都需要從各方面去洞悉它們的本質。
EMC CTO Jeff•Nick則認為從網格計算到雲計算,再到大資料,猶如一場IT的進化,他表示:「網格計算其實就是雲計算的前身,以前我們稱之為公用事業型計算,它主要研究如何通過互聯網來實現資源分享和統一分配。 網格計算和雲計算其實是連在一起的。 從技術成分來看,雲計算和網格計算存在很多共性,比如在網格計算結構上部署一個應用和在並行處理多節點上共同運行一個Hadoop作業具有很多相同特性。 」
圖一:EMC公司高級副總裁兼首席技術官Jeff-Nick接受Watchstor獨家專訪。
事實上在IT發展歷史中,如果某種技術不能夠很好的商業化和市場化,那麼這項技術即便再出色也不能夠獲得很大的市場認可和成功。 EMC CTO Jeff•Nick認為雲計算其實就是網格計算走向商業化的結果,他表示:「網格計算其實是來自高校和科研單位等做研究的圈子的呼聲,是滿足研究圈的需求,而雲計算只不過是商業化或者商品化的IT。 現在非常商業化的生命科學應用、天氣預報應用或者油氣勘探應用和過去網格計算所作的HPC功能界限已經非常模糊了,這就是雲計算商業化的體現。 」
Jeff•Nick還認為大資料會是雲計算總體進化的下一個步驟,他表示:「其實讓我們仔細分析一下雲計算發展過程就會發現為什麼會有大資料的產生。 雲計算第一階段是推動了資源分享,這也是網格計算的一個特點;第二步是把應用放在雲端,就是我們通常所說的SaaS服務(軟體即服務);第三步是 PaaS平臺的搭建;第四步就是統一的資料分析,也就是我們現在談到的大資料。 」
資料是未來的核心所在
基金公司動用Hadoop分析社交網路使用者情緒來預測股票市場走勢、大型零售超市通過分析商品位置資料來分析使用者購買行為、購物網站通過使用者點擊資料來分析廣告投放位置、油氣公司通過分析各種勘探資料來尋找油氣資源...... 諸多鮮活的案例似乎在告訴人們:一個資料分析的時代已經到來,一場挖掘資料價值的革命正在進行。
EMC 高級副總裁及CTO Jeff•Nick表示:「我認為經濟現在不光在全球化,經濟還在資訊化。 這種資訊化的經濟指的是人們渴望能夠獲得更多的洞察力和獲得更多有利的價值。 這些價值不僅僅是商業價值,還包括社會效益價值,而這一切則都依賴我們對資訊和資料的製造、處理以及對它的快速回應。 」
大資料時代已經到來,大資料所帶來的價值真如廠商們描繪的那麼美好麼?事實上,大資料概念誕生就產生了比雲計算以往任何IT概念更大的爭論,對於大資料的質疑之聲從來沒有停止過,這種質疑可謂是全方面的,包括法律法規、商業價值、 商業創新、技術手段等。 比如在法律法規方面,對於企業自身而言,要想獲得最為準確的商業洞察力,所希望獲得的資料樣本應該是越大越好,這無疑將超出企業自身業務資料的範疇,企業自身自然而然希望獲得更多的外部資料, 而這些外部資料來源的合法性如何去定義尚處於法律空白;又比如在資料有效性方面,企業每天有新增的有價值資料,也會有部分資料失去它的價值,如果去判斷資料的有效性,如何去挖掘有效資料的價值仍然是需要企業去面對的一大難題。
對此,Jeff•Nick表示:「有句老話是‘車到山前必有路’。 如果出現了一個問題,但利益的吸引又非常之大,人類社會總會找到一種方法去克服。 我們不能忽視正在發生的現象是:我們正在整個資料價值鏈上攀升,過去我們做的僅僅是一些關聯式資料庫,而現在我們正在往上走,通過Hadoop做資料分析、做資訊的橫向擴展、實現雲端的資料共用, 這些其實都能夠説明我們從整個資訊的生態鏈上產生更大的價值。 」 Jeff•Nick的觀點讓人想到網銀的發展,網銀從出現之初到現在一直面臨著安全的問題,但網銀並沒因此而消失,反而得到極大地普及,並給人類生活帶來了巨大的便捷。
除此之外,Jeff•Nick還強調了資料從量變到質變的重要性,他強調:「資料越來越像地球引力,資料量達到了一定程度就會引發量變到質變,就像地球引力一樣,它的重要性就會顯著提升。 」
為此,Jeff•Nick特意舉出了三個大資料有趣現象:「第一個例子就是私有資料雲,我們發現現在越來越多企業在資料生成、資料分配上並不在傳統的資料中心之內,很多企業開始專門建立專有資料的私有雲,它本身包含多個資料中心, 資料分析工作並不會集中在一個資料中心,把資料分析能力放在資料所在的網站去做會更有效,這也就是為什麼私有資料雲現正正在快速興起;第二個例子就是共生資料雲,這是一個聯合的資料雲或者合成資料雲, 比如Twitter如果對某個話題感興趣,需要把這個話題相關資訊提取,這需要強大的即時資料分析能力,Twitter可以將針對這個話題每個小時產生的資料包傳輸給另一家專門做資料的公司, 這家公司對這些資料進行分析之後再將結果交換給Twitter,這就叫共生資料雲現象;另外一個例子就是大資料分析對於社會福利的創造非常有利,比如在醫療領域,通過資料分析對於基因的研究,對個人醫療方案的優化, 這是社會公益型的資料雲。 」
大趨勢,不可逆。 雖然大資料在商業決策和商業創新上仍然有著很大的質疑,但是經濟走向資訊化的今天,以資料為核心正在顛覆過去傳統的商業模式。 暫且不去討論大資料對於商業創新有多大説明,大資料給人類社會的福利、社會效益、商業模式優化的確有著廣泛的應用前景。
(責任編輯:蒙遺善)