探索大資料理論

來源:互聯網
上載者:User

標籤:

最早的大資料這個概念是由McKinsey提出的,他認為在當今世界,已經滲透到各個行業及其業務職能的各個領域的資料已成為生產人員能夠開採和利用海量資料的一個重要原因,可以看出,新的生產率上升和消費者盈利的大潮即將到來。

行業中最早對大資料進行定義的是IBM,它將其展開並分為四個特質,那就是量,多種類,價值和速度。深入分析來看,大資料的這四個層次可以一一進行剖析:首先,資料量是巨大的,對於大資料的初始計量的單位至少也是P(相當於一千T),E(相當於一百萬T)或Z(相當於十億T);其次是資料的類型品種十分豐富,舉例來說,有部落格、視頻、圖片和位置資訊等;再次,越低的密度造就了越高的商業價值;最後,大資料的處理速度與傳統的DM技術相比較而言從本質上就拉開了差距。

然而,事實上,這些特質並沒有真正說清大資料應當具備的所有特點,實際上,還有更多大資料的特徵需要我們去發現,例如分析性、社交性、研究性等等。

正如那句老話:三分靠技術,七分靠資料,誰得到資料,世界就是誰的。有人可能會質疑這句話的有效性,但實際上不管是誰說過的,這句話都是不變的真理。 Viktor Mayer-Schönberger在其著作《大資料時代》中列舉了各種例子,只為了說清一個事實,那就是大資料時代已經來臨,所以我們必須使用大資料分析的探索性思維來挖掘大資料自身和對外界的價值,包括其潛在價值。他在書裡著重闡述了Google是怎樣使用人們進行搜尋的記錄來進行二次BI資料採礦從而得到更多價值的,其中令人印象最深的就是利用搜尋記錄預計某個地方的流感傳染的情況。另外,作者還描寫了亞馬遜網站是怎麼購買使用使用者的曆史瀏覽記錄資料來針對特定使用者進行推薦不同種類書籍的購買,後來的統計結果發現,這樣做的確能夠對銷售收入產生一個激增的影響。還有一些美國的購票系統利用所有過去的十年裡機票價格的資料來預計何時開始放出購買車票的許可權是適當的,主要是想得出一個對其盈利能力能有大幅增長的方案,最後的結果也顯示出這麼做的確具有較好的效果。

因此,問題就來了,怎樣判定一個思維是大資料的? Viktor Mayer-Schönberger在書中寫到,大資料並不存在抽樣,而是包括所有資料的樣本,並且它注重的不是準確性,而是效率如何,另外,大資料注重相關性而非因果關聯。

其他還有一些專家對大資料也存在一些獨特的想法:

目前的資料還不算大,資料變得真正有趣的是因為它在網上,而這個正是互連網的特徵。

不在互連網時代存在的產品的功能必須是它具有一定的價值,而如今在互連網時代存在的產品,資料就是這個產品所具有的價值。

 

【瞭解更多商業智慧行業資訊,商業智慧解決方案以及商業智慧軟體下載請訪問FineBI商業智慧官網www.finebi.com】

探索大資料理論

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.