大資料時代已經來臨,大資料正在成為主流。 據國際資料公司(IDC)預測,全球大資料技術和服務市場將從2010年的32億美元增長到2015年的169億美元,其複合年增率將達到40%,大約是整個資訊和通信技術市場的7倍。 大資料對於企業發展的影響力,已不可忽視。
2012年是大資料爆發的一年,諸多科技巨頭紛紛投身大資料領域,基於大資料的創業公司也紛紛湧現,而其中,Facebook在今年厚積薄發、抓住機遇,成為大資料領域當之無愧的領頭羊之一。
Facebook的大資料戰略
從社交巨頭到大資料公司,Facebook的成長歷程中一向不乏精彩,但它成功的根本原因卻並非社交,而是其社交網路產生的海量資料以及基於此的大資料戰略。
2012年5月18日,Facebook在納斯達克上市,IPO定價為38美元,融資規模達160億美元,而按照發行價計算,Facebook的估值達到1040億美元,成為美國有史以來上市時市值最大的企業。 中信證券(600030,股吧)研究部發佈的薦股書中更是稱,Facebook的IPO代表了全球互聯網商業模式的第三次浪潮,它的上市引領互聯網進入了大資料時代。
而資料收集、資料分析和資料應用正是構成了Facebook大資料戰略的三駕馬車。
資料收集是Facebook的長項,從成立之初,Facebook就已經在有意識地收集使用者資料。 Facebook去年底發佈的大資料產品Timeline(時間表)使用者可以在這條時間表的頁面上記錄自己的生活故事,更是將Facebook收集資料的範圍從即時資料擴大到了歷史資料。 而2012年,Facebook對圖片分享應用商Instagram等公司的收購行動也為它帶來了大量細分資料。
在這個社交網路幾乎全民化的時代中,社交大佬Facebook已經成為當之無愧的資料收集巨頭,「海量+非結構化/複雜類型」的資料從這些社交網路中產生,間接推動了大資料產業的發展。
但僅僅將資料收集起來並不能產生價值,挖掘這些海量資料背後的商業價值成為大資料產業鏈中不可或缺的一環。
正如有學者所說:「Facebook之前數年的努力讓超過10億數位移民建立了聯繫和紐帶,這個世界的邊界仍要擴張,而下一步更重要的則是考慮如何讓關係產生的海量資料更有價值。 」
在資料收集後,Facebook需要對這些雜亂的資料進行歸類,結構化處理,然後對其解讀並加以分析,從而獲得資料對應的使用者的具體資訊,為大資料應用打好基礎。
「我們所做的一切,歸結起來只是一件事,就是大資料處理,」Facebook基礎設施技術部門副總裁Jay Parikh說,「大資料就是利用你的洞察力,發現資料背後的潛在價值,並利用它來為你的企業創造利益。 這個道理非常簡單,如果你不能很好的利用在業務中收集和保存的資料資訊,那麼你擁有的就僅僅是一堆資料而已,我們越來越感興趣並正在做的,是研究怎樣利用收集來的資料做一些更價值的事情。 」
而資料應用在Facebook的大資料戰略中還沒有完全定型,主要集中在廣告行銷、產品服務和使用者管理三個層面。
通過前期對資料的收集和分析,Facebook可以瞭解使用者的需求,及時調整產品設計及服務,滿足不同使用者的需求。
同時,這些資料對廣告投放也大有裨益,Facebook可以依此制定出有針對性的廣告方案,並針對使用者進行有針對性的行銷活動。 而作為Facebook主要盈利模式之一的廣告行銷,在Facebook的大資料戰略中一直是主要發展方向之一,大資料能説明Facebook獲得更多廣告主的青睞,將資料創造出更多的價值。
正如2012年Facebook第三季度財報顯示的那樣,在第三季度12.62億美元的營收中,來自廣告業務的營收占86%,為10.9億美元,比去年同期增長36%。
Facebook的核心資料資產
在投資人眼中,相對於sns概念,他們更願意把Facebook看作是大資料概念,因為Facebook的核心競爭力還是在於它的核心資料資產上, 而Facebook在俄勒岡州Prineville自建的資料中心更是可以說明它對自身海量資料的重視。
Facebook在今年8月份披露了一組資料,Facebook系統每天需要處理25億條消息、500+ TB的資料、27億次使用者點擊Like按鈕的次數、3億張使用者上傳照片,而每半小時通過 Hive 掃描的資料大約為105TB。 並且,Facebook擁有世界上最大的單一Hadoop系統,每個單獨的Hadoop磁片集群記憶體儲了超過100 PB的資料,甚至以現今增長速度之快,也許很快,100 PB的磁片集群也就不再令人吃驚了。
目前,Facebook在全球擁有超過10億使用者,44%的全球線民使用Facebook,移動使用者高達6億之多,美國巴西印度是使用的前三大國家,一共有1403億個好友連接,照片的上傳量為2190億,有6260萬音樂被播放, 次數高達220億。
Facebook的社交網路每秒鐘都在生成海量的資料,如文本、圖片、音樂、視頻、地理資訊、web連結等,並且這些資料即時更新、海量聚集,而且不會被搜尋引擎抓取,構成了Facebook最核心的資料資產。
雖然一開始,Facebook也是並不完全知道這些收集來的資料有什麼作用,他們只是「想知道是誰訪問該網站,他們的動態,以及他們在網站的哪個板塊活動,所以這一切對我們來說都是有趣的。 」 Jay Parikh這樣說。 但隨著資料背後的價值逐漸被發現,Facebook越來越重視網站資料的收集,並借此奠定了自己的資料基礎。
而單純地採集資料卻不加以分析的話,就不能體現出資料真正的價值,也就不能稱之為大資料。 「大資料的意義在於真正對你的生意有內在的洞見。 如果你不能好好利用自己收集到的資料,那你只是空有一堆資料而已,不叫大資料。 」Jay Parikh說。
對於這些海量的資料,Facebook抓住了它們背後真正的價值,不只是單純粗暴地使用,而是對這些資料進行分析處理並加以應用,真正實現了大資料。 從原材料生產者進步為原材料加工者和消費者,對資料的利用不止上了一個臺階。
Facebook作為社交媒體,在資料資源的採集上有著先天的優勢,超過10億的使用者給Facebook帶來了海量的資料資源,這在如今這個大資料正要爆發的時代,是一筆無法估量的寶貴財富,而Facebook正是抓住機遇, 在2012年厚積薄發,將這筆數位財富轉化成了真正的財富。