去年5月筆者曾撰文闡述百度、阿裡和騰訊這三個互聯網巨無霸開始挖掘大資料。 一年過去,擁有海量資料的公司已在多個領域嘗試對掌握的資料進行利用,大資料意識和能力進步飛快,體系和工具日趨成熟。
 
大資料應用實踐,碩果累累
 
百度在大資料方面讓人印象深刻的有百度遷徙這樣的公益專案,應用在民生和新聞等領域。 最新動向是,百度網盟利用基於大資料的CTR(廣告內容匹配)資料,站長的平均收入提升70%。
 
阿裡則對外宣稱已經擁有100PB資料並以令人欣喜的速度增長,馬雲最新的內部郵件將阿裡戰略闡述為雲端+大資料,阿裡要進入資料時代。
 
騰訊廣點通平臺不乏亮點應用,例如美麗說借助廣點通在移動端取得豐收,小米手機與QQ空間合作更是基於社交資料行銷的經典。
 
百度、阿裡均已將大資料升級為公司戰略,李彥宏、雷軍等互聯網代表人物在兩會時都曾有建言,推動政府的大資料意識和開放,大資料正在從理論走向實踐,從專業領域走向全民應用的階段。
 
互聯網牽頭大資料的必然性
 
為什麼國內的大資料應用,只有幾個互聯網巨頭取得成就呢? 是因為它們擁有最多的使用者、流量和資料嗎? 答案是否定的。 因為所有關于大資料的論斷都認為,大資料並不在於大。 品質、性質以及誰擁有它,將決定大資料能被挖掘出來的價值和難度。
 
物聯網感應器、視頻監控設備時時刻刻都在收集海量資料,但價值沒有微博大,因為資料難以變現。 運營商擁有使用者通信相關資料,從語音到短信再到位置,量大過任何一個互聯網巨頭。 只能白白浪費,因為運營商不被允許也無能力去利用這些資料。 與之類似,政府部門、軟體企業均擁有大資料,卻只能任其沉睡。
 
之所以BAT走在國內大資料應用的前列,即與其擁有的資料性質有管,與互聯網企業的技術基因、開放創新和積極進取有關。
 
大資料利用難點在於技術。 從資料的收集到存儲到清洗,再到脫敏,歸類,標籤化、結構化,以及最後的建模分析、挖掘利用,均是技術活兒。 需要伺服器集群、資料利用模型和資料處理演算法來保障,然後才是挖掘出來的結果的包裝、變現。
 
相對其他擁有大資料的金主來說,互聯網企業的技術甩開它們幾條街。 運營商技術是外包;銀行的技術外包居多;其他公共部門例如政府、交通、教育、能源等行業,技術對他們是遙遠的名詞。
 
還有動機。 互聯網企業的服務產品幾乎是免費,必須通過其他模式賺錢。 過去是廣告、遊戲和增值這三種模式,到了移動端廣告模式遇到瓶頸,需要新模式,抑或加強原有模式。 這兩點上,大資料都會起到大的作用。
 
BAT大資料思路迥異
 
BAT三家的資料各有特色。
 
百度是基於使用者搜索行為的需求資料,阿裡掌握著交易以及信用資料,騰訊則掌握著社交關係數據。 各有千秋。 它們對大資料的應用方向並不相同。 百度和阿裡更為激進。 騰訊觀望多過行動,也可能是說得少做得多。
 
首先是動機。
 
百度收入95%以上來自廣告,淘寶的主要收入模式也是廣告。 百度、淘寶和CCTV是中國前三大廣告投放陣地。 騰訊主要收入來自遊戲和社交增值業務,廣告收入占比僅為三成左右。
 
本階段大資料變現的主要途徑是精准廣告,這契合百度和阿裡的訴求,兩家將大資料升級為公司戰略。
 
其次是技術。
 
搜尋引擎是技術驅動,百度和其創始人李彥宏最具技術基因。 馬雲對外宣稱因為其不懂技術所以阿裡技術最強。 只有騰訊不怎麼強調技術,一直強調產品能力。
 
大資料是技術活兒,百度和阿裡這兩位自認為技術很強的玩家探索在先符合常理。 百度和阿裡在大資料技術已經進行較多佈局,從人才到架構到基礎設施再到技術理論。
 
百度有深度學習研究院、高價聘請大資料領域人才以及與高校合作,正在建設亞洲最大雲電腦房;阿裡有飛天計畫,有先進的跨機房5k集群、Apsara分散式運算系統,還有資料委員會這樣的架構。
 
幾家在雲計算平臺上的不同態度可以佐證我的觀點。 雲平臺和大資料是連體嬰。 「移動端」、合作夥伴和使用者個人的資料,均需要「雲」來收集、存儲和處理。 要掌握大資料,一定要具備承載資料的開放的雲。
 
阿裡雲09年成立,百度雲12年推出,分別對應到IaaS模式和PaaS(Amazon VS Google)。 它們的雲服務在向開發者和使用者提供基礎設施、雲端服務的同時,收集協力廠商網站、應用、硬體和使用者的資料。 百度遷徙能夠生效便是得益于協力廠商App為百度貢獻位置資料。
 
騰訊雲去年9月才推出,起步晚了點。 雖然騰訊開放平臺成熟,但開放平臺更多是分享騰訊的使用者和資源出來,目的不是收集資料。 而且開放平臺是運營、合作、生態層面的事,雲平臺才是技術問題。
 
最後是位置。
 
典型的互聯網交易場景大概是這樣的,使用者在聊天、社交、娛樂的過程中,會被吸引注意力,關注「興趣」,抑或因為興趣而發現新的資訊。 然後使用者去瞭解、去尋找想要的東西(需求、欲望、找到所求),最後在網上完成交易(電商和O2O)。
 
這裡引用一下漏斗模型——一個悠久經典的行銷概念。 在這個模型裡,使用者消費時的大致決策路徑是從注意(attention)、興趣(interest)、欲望(desire)最後到行動(action)。
 
 
上圖是被倒過來的漏洞。 漏斗越到底部轉化率越高。 阿裡在欲望和行動之間,百度在興趣和欲望之間,騰訊則在漏洞頂部。
 
廣告收費模式可以看出三家的位置差異。 百度是CPC,按照點擊次數付費(不管點擊後的行為),阿裡淘寶客等廣告則直接可以對應到購買行為,CPA(按實際效果)和CPS(按效果傭金)居多。 騰訊門戶、QQ聊天Banner廣告更親睞于CPM或者CPT(按照展示次數或者時長),廣點通是CPA,但亮點案例集中在應用下載領域,而不是交易領域。
 
三家都不希望只處於某一個環節,而是期望上中下通吃。 百度有貼吧這樣的興趣社交產品,有視頻這種注意力型業務,還推出了直接在結果頁下單的「微購」,上下延展;騰訊重組了搜索業務(與搜狗合併)和電商業務(與京東合併),向下的機會還有;阿裡投資微博、佈局智慧電視以及做導購網站做微淘 ,努力在向上走。
 
幾個互聯網巨頭的動機、技術和位置的不同,在大資料應用上的思路也不同:騰訊蜻蜓點水,阿裡佈局為先,百度技術至上。 相同的是,幾家都在想方設法籠絡更多的資料,收集資料是第一階段,形成收集資料的能力和機制是第二階段,第三階段才是資料採礦,目前BAT三家均處於從第二階段到第三階段之間,一旦大資料應用全面進入第三階段,積累更深、 投入更多的百度或將有望顯出優勢。
 
AppStore和iPhone的誕生,將人們帶入了智慧手機和移動互聯網時代,顛覆了傳統的軟體業和手機業。 未來,對大資料商業價值的發掘將給互聯網公司拓展出更大的增長空間,甚至有可能催生出全新的商業模式和硬體產品,就像AppStore和iPhone那樣,給人們的工作和生活方式帶來顛覆性的變化。
 
作者微博@互聯網阿超,微信SuperSofter
 
(責任編輯:蒙遺善)