三本書讓你瞭解大資料

來源:互聯網
上載者:User

團購、社交媒體、電商;雲,O2O,大資料。 每個階段都有熱點詞。 這會兒最熱的應該就是「大資料」了。 不過,有點濫,有點俗,似乎也有點泡沫化了。 不用擔心,一般來講,講得最厲害的時候,時候還早呢;等到無聲無息了,那真是隨風潛入夜了。 但是,說真的,處於這個風雲激蕩創業年代的人們,如果能夠靜下心仔細瞭解點有關大資料的概念、框架、實質,對於形成所謂的「大資料觀」,真心有必要,真心有説明。

市面上如今關於大資料的書,近20種。 挑出這三本,是有理由的。 不僅單本比較靠譜,講述得有意思,而且串聯起來,竟然有邏輯聯繫,有互補,好像商量好了似的首先看巴拉巴西的《爆發》,在一個歷史故事的連續講述中,瞭解大資料的概念實質;接著看舍恩伯格的《大資料時代》, 明白大資料理念和生活工作及思維變革的關係;最後翻翻塗子沛的《大資料》,看美國政府在大資料開放上的進程與反復,算是個案。 如果能夠基本瞭解這三本的觀點,出門有底氣,見人腰杆直,不再被忽悠。

「人生看似雜亂無章,其實有規可尋」,巴拉巴西整本書講述的大資料根本目的,是預測。 他甚至有零有整地判斷,人類行為93%是可以預測的。 打個比方,千百年前人類無法如今天般準確預測天氣,以致某些大致預測的行為都被認為是「通神」,其實核心在於對天氣資料的海量佔有和分析能力。 但假如全人類的所有基礎及行為資料全部被佔有全部能分析呢? 比如通過智慧終端機LBS功能採集全部運動軌跡、通過金融系統採集所有支付記錄、通過SNS採集所有社會關係和通過郵件、文檔、社會視頻監控和自我視頻監測採集所有言行記錄,24小時,每分每秒,一生,全地球70億人,那會如何?

人往極大和極小處思考哪怕想像的話,一方面頭會疼會暈,一方面會因為這種宏大性或窮盡性而恐懼。 科幻迷看到上面的描述,不知會否想起科幻小說巨匠阿西莫夫的《基地》系列,起源就是主角對銀河帝國社會未來數千年的發展和危機的宏大預測,導致一系列綿延千百年的基地、第二基地拯救計畫。 也就是說,阿西莫夫大約在50年前就在思考「大資料」問題了。

巴拉巴西不是個通俗科幻小說家。 他是全球複雜性網路科學領域最前沿的領軍科學家,他要傳遞的不是科幻故事,而是一整套新的理解人類行為時空模式的觀念和理論。 作者的核心觀點,是認為當我們將生活數位化、公式化和模式化的時候,會發現大家都很相似,都具備爆發模式,而且非常規律,看上去隨意偶然,其實極易預測前提自然是佔有和分析海量大資料而在電腦運算能力、 網路發展階段和社交邏輯被成熟之前,這些做不到而已。

科學的盡頭和哲學、宗教是交融的。 因此,巴拉巴西的理論不止是互聯網複雜科學的一項探索,本質是一種新歷史觀的論證,甚至是一種哲學。 這麼深艱的命題,作者講述得非常漂亮,十幾章節講述了十字軍的一段歷史故事,泰勒格迪預測主人公塞克勒起義並一路發展至兵敗坐上「燃燒的御座」,帶上燒紅的鐵王冠;講述了演出者哈桑的旅行,因為被安檢不斷懷疑是恐怖分子,而自願「 自我量化」,記錄自己所有行蹤並不斷公佈在個人網站,實現個人資料全積累全公開;一張一美元鈔票被跟蹤被記錄所有的軌跡。 可以說,這本書整個就在講故事,這是我最佩服老外科學作者的地方,如此艱澀的話題,我們可以寫成隻有幾個人懂的論文,他可以寫成一氣呵成的故事集!

轉到《大資料時代》這本書。 它被包括寬頻資本董事長田朔甯、知名IT評論人謝文等專業讀者鑒定為「大資料領域最好的著作沒有之一,一本頂一萬本」。 有這麼好嗎? 看完自己評價吧。 這本書對這個大規模產生、分享和應用資料的新的大時代進行了闡述和厘清,作者圍繞「要全體不要抽樣、要效率不要絕對精確、要相關不要因果」三大理念,通過數十個商業和學術案例,剖析了萬事萬物資料化和資料複用挖掘的巨大價值。

如作者所言「大資料開啟了一次重大時代轉型。 就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們看清微生物一樣,大資料要改變的是,我們的生活方方面面以及理解世界的方式」。 比如,谷歌通過全球搜索分析,比國際疾病控防中心更早更准地預測了流感爆發。

在思維變革部分,作者講述的重點是:樣本=總體,我們需要對全部資料的佔有和分析;因此,資料缺乏時代的精確性不必執迷,接受混雜基於大資料的簡單演算法比小資料的複雜演算法更有效;樣本推斷的因果關係不重要了,知道「是什麼」的相關關係 ,或者結果就可以了。 如果說上一本《爆發》是通過講故事闡述一個核心觀點的話,這一本倒是不遺餘力、不計巨細就大資料的方方面面進行系統分析和介紹,而且案例非常精彩非常時新。 所以,個人覺得,就實務而言,這本的裨益確實比較大。

塗子沛那本冠以《大資料》名字的書,我是在三星NOTE上完整看完的第一本手機電子書(花了30元,我是願意為好數位內容花錢的! )。 全書講述的,是大資料在美國政府管理中的應用,以及美國政府運行方式大資料變革的歷史與鬥爭,其實也是故事性的。 從奧巴馬上臺就頒佈《資訊公開法案》,到設立第一個美國政府首席資訊官開始,講述美國政府與民間在社交資料公開的鬥爭史,以及美國社會管理向大資料思維轉變的過程。 首先,這算是一個最詳實的案例;其次,這代表的不是某種管理方式變革,深處是對民主運行機制的變革與進步。 說好了,這本書用心良苦,遠遠超越科普技術領域;說壞了,其心可誅。 有一段,民間鬥爭,逼迫奧巴馬公佈所有每日白宮全部日程,包括接見了誰、談話的全部內容,這不就是個人大資料全公開在公眾人物上的應用嗎? 這可比現在所謂官員公開財產的要求高了幾十倍這要求政府全部行為、全部資料、全部公開,全體公眾隨時可查技術和成本上其實已經可以做到或至少努力接近如果不這麼做,不止是落後問題而是真正的其心可誅了。

三本書,延續觀點實務案例分析的路徑,全景展示了大資料這個東西。 但重要的是,大資料是個概念,是個趨勢,更是一種「觀」,看世界、看未來的一種方法。 我們可以拒絕那些言必稱大資料的人的浮躁,但絕對不能拒絕世界潮流的確定走向。 而就企業而言,包括全球的谷歌、蘋果、FACEBOOK等互聯網巨頭,沃爾瑪、塔吉特、亞馬遜等零售巨頭,中國的BAT三巨頭,早就實質上已經是大資料玩家,並且狂奔在大資料潮流上很久,而其他叫喚「大資料」 的其實連基本資格都沒有叫的狗不咬人。 可以說,除了巨頭,所有其他傢伙都跟大資料沾不上實質的邊,只有打打下手的機會;但實際上,每個企業,甚至個人,都已經是大資料的一部分、一環節了。

數千字難言書中真諦。 馬上開始你的拯救大資料白癡之旅吧。

原文連結HTTP://www.huxiu.com/article/8740/1.html

(責任編輯:蒙遺善)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.