Patricia Florissi:大資料需求真實存在

來源:互聯網
上載者:User

現在,大資料這個話題甚至比雲計算還要火。 EMC公司副總裁、銷售部全球首席技術官Patricia Florissi博士認為:「目前,我們對於大資料能夠帶給人們什麼樣的利益,能夠在多大程度上影響人們的生活和工作還沒有一個深刻的認識。 現在,我去亞馬遜網站買書,絕不會只買一本書,而會根據網站的推薦資訊,購買其他一些我感興趣的東西。 這就是大資料時代給人們生活帶來的新變化。 」

大資料需求真實存在

大資料是一場變革,它不僅影響了人們的生活、工作,更重要的是影響了人們思考問題的方式。 很多人認為,大資料的主要作用就是説明廠商更準確地瞭解消費者的消費行為,比如買了某個品牌手機的使用者通常會再購買另一個品牌的衣服。 其實,大資料的功用遠不止這些,大資料將在很大程度上影響人們的決策和行為模式。

Patricia Florissi告訴記者:「通過與客戶的交流我們發現,很多客戶現在並不明白大資料到底能給他們帶來什麼樣的價值。 但是不管客戶現在是不是理解大資料的內涵,絕大多數的客戶面對大資料不會袖手旁觀。 許多企業內部至少會有一個部門或一個人在做與大資料相關的事。 」

雲計算剛興起的時候,很多人熱衷於討論雲計算是不是一種具有變革性的創新技術,是「新瓶裝新酒」還是「新瓶裝舊酒」。 大資料是不是也存在類似的問題呢?雲計算改變的是IT的消費模式,大資料則改變了我們工作、生活和思考問題的方式。 Patricia Florissi認為,大資料不僅僅是資料量大,而是代表了三個新的趨勢:第一,海量資料改變了人們看待事物、看待資料的角度;第二,因為有了雲計算,人們有能力部署更大規模的存儲,具有更強的處理海量資料的能力; 第三,人們已經具備了一定的知識和技術水準,可以進行大資料分析。

Patricia Florissi舉了印刷機的例子。 印刷機是15世紀發明的,但是印刷機的大量商業化應用卻發生在其後幾百年。 印刷機剛出現時,雖然有能力快速印製出很多書,但那時會讀書、寫字的人並不多。 隨著人類文明的進步,人們掌握了更多文化知識以後,印刷機才真正有了用武之地。 大資料處理和分析也會經歷這樣一個發展過程。 大資料出現後,如果人們沒有足夠的存儲空間和存儲能力,那麼就只能把大量的資料刪除;如果人們有了足夠的存儲能力,但是沒有分析資料的能力,那麼大資料也沒有價值可言,就像面對大量的金礦石,卻無法從其中提煉出金子一樣; 如果有了存儲能力和資料分析能力,但人們本身不具備解讀資料的能力,那麼也無法挖掘出資料的價值。 「現在,我們已經擁有了存儲能力、資料分析能力和資料解讀能力,因此大資料應用對我們來說並不是虛幻的,而是真實存在的。 」Patricia Florissi表示。

即時處理能力更重要

很多人一談到大資料,首先會想到非結構化資料的處理。 IDC的統計資料表明,非結構化資料已經占資料總量的80%~90%。 因此,處理多樣化的資料成了許多使用者關注的焦點。 但是有的存儲廠商認為,再過一段時間,使用者就不會再關心資料到底是結構化的還是非結構化的,因為資料即時處理才是大資料處理的關鍵。

Patricia Florissi認為,使用者對資料即時處理的需求正變得越來越迫切。 人們對資料即時分析的關注度已經超越了對資料本身準確性的關注度,這正是資料量激增帶來的變化。 「如果使用者只擁有少量資料或資料樣本,那麼資料的準確性對於使用者來說是非常重要的;如果使用者面對的是海量資料,那麼資料的準確性就不再那麼重要,因為大量的資料可以彌補資料準確性的不足。 」Patricia Florissi表示,「資料的價值是有時間性的。 比如,我今天拿到了一張商場的優惠券,明天就可以用這張優惠券去買一條裙子,而幾周或幾個月以後,沒人會再理會這些資訊。 」

EMC現在就擁有這樣的技術和能力,可以找到非結構化資料中的一些結構化特徵,這樣就可以把針對結構化資料的某些分析方法和分析技巧用於處理和管理非結構化的資料。

存儲可變形

在即將舉行的EMC World大會上,EMC將發佈其「軟體定義存儲」(SDS)的新產品。 不過,在新產品正式發佈之前,Patricia Florissi拒絕向記者透露產品的技術細節。

Patricia Florissi認為,SDS將顛覆現有的存儲市場,軟體定義網路(SDN)將顛覆現有的網路世界,軟體定義資料中心(SDDC)將顛覆現有的資料中心市場。 這些變革將彙集成一股強大的力量,顛覆整個IT市場。

「軟體定義」的意思是智慧從硬體轉向軟體。 以手機為例,消費者會根據自己的喜好在手機中安裝不同的應用軟體,因此每個人的手機都是不同的。 「軟體定義」賦予了手機一種新的能力,即靈活地通過軟體來定義硬體設定的能力。 另一個例子,以前使用者如果購買了多台網路設備,就不得不動用人力對每一台網路設備進行配置,不僅費時費力,而且不管如何改變設備的配置,網路設備的基本功能也不會被改變。 使用者如果採用了SDN,只需極少的硬體,就能將網路設計成自己需要的樣子,讓網路設備具有使用者想要的功能。 硬體就像是一塊膠泥,它可以按照使用者的需求,經由軟體被塑造成各種形態。

「從存儲的角度看,以前存放裝置分工明確,檔存儲只能存儲檔,塊存儲只能存儲塊資料。 SDS的概念出現後,使用者就可以在一個統一的存儲平臺上,對所有的檔、塊資料、物件資料進行統一存儲和管理。 」Patricia Florissi表示,「存儲虛擬化只是SDS的一個子集。 通過虛擬化技術,使用者可以分別構建檔的虛擬存儲池或塊資料的虛擬存儲池,而SDS構建的是一個全面的資料池,可以把使用者需要的不同功能分配到不同的軟體層面中去。 」

存儲管理包括控制管理和資料管理兩方面:控制管理決定資料存儲在哪個區塊中,而資料管理的任務是以盡可能快的速度把資料移轉到一個合適的地方,這是兩種不同的功能。 在軟體定義的存儲中,執行控制管理功能的那部分硬體將變得越來越不重要,它只是一種便宜的存儲介質。 因為專業化的資料需要以非常快的速度來存儲,所以在資料管理層面,硬體的專業化要求越來越高。

Pivotal是新起點

2013年初,EMC與VMware合資成立了一家專注于大資料與雲計算業務的公司——Pivotal。 該公司的成立有利於EMC進一步推動其大資料整體戰略的落實與發展。 Patricia Florissi表示:「EMC今後將把重點放在存儲與資料管理上,雲計算、大資料和可信計算將成為公司的三大戰略核心。 為了滿足雲計算和大資料的應用需求,存儲必須在靈活性、經濟性和可用性方面有進一步的提升。 」

具體到大資料的處理,EMC更關注如何對存儲進行擴展,包括橫向擴展與縱向擴展,同時還要考慮資訊在不同的存儲層級之間快速、安全的移動,使資訊移動最優化。 使用者還應該著重考慮如何對大資料進行備份和歸檔。 除了大資料的概念以外,現在業界還在熱烈討論一個新概念——快資料,其目標是以極快的速度處理海量的資料。 為了提升資料處理的效率,資料的處理和分析工作應該無限接近資料,也就是在資料產生地進行資料處理。

Patricia Florissi歸納說:「在大資料方面,EMC與Pivotal分工明確,Pivotal主要做大資料分析,而EMC的核心業務是大資料管理。 」

(作者:王欣責任編輯:王欣)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.