巴西世界盃的帷幕已然落下,億萬球迷或喜或悲、或驚愕或迷茫——情緒紛繁複雜卻終將平復,生活與工作仍會繼續向前。 回顧比賽全域,也許有朋友還能記 起,本屆世界盃開幕前,雅虎美國的一支團隊曾預測說,巴西終將折桂奪冠。 而今塵埃落定,顯然,事前的預言未能成真。 不過,這並不意味著相關團隊的研究方法 沒有價值。
雅虎的研究小組從輕博客Tumblr浩如煙海的1.889億個博客帳戶的831億篇文章中抽取出與足球相關的內容,再將焦點凝聚在今年2月至5月2730萬篇與世界盃相關的粉絲評論,以「為每支隊伍賦予優勢值」的方式, 判斷出巴西隊的贏面較大。
與我們這個時代最偉大的物理學家霍金教授應用「世界盃奪冠公式」來測算比賽結果不同,雅虎給出的結果由於是基於輕博客粉絲討論,因而更多地展現了多 數觀眾的傾向和預期——每位球迷都有心目中的冠軍球隊, 桑巴足球憑藉強悍實力和出眾的觀賞性而深得人心,奪冠呼聲極高。 巴西隊大比分慘敗德國後,球迷的悲 痛也是個證明。 但比賽結果不取決於億萬觀眾票選,而是場上十幾人的表現。 這一點也正如霍金教授所言:相對於量子力學來說,足球要複雜多了。
無論如何,雅虎的預測都是一種非常有益的嘗試。 在那些粉絲傾向足以決定結果的領域,類似的研究對於企業研究市場和消費者需求會很有説明。
雅虎對世界盃賽結果的研判還可能引發更多思考:比如近來被炒得有點兒過熱的大資料能否預測未來? 一些業界同仁和分析家認為資料可以揭示規律,進而説明人和企業預知結果;另一些研究者則認為大資料的功用有限、迷信大資料是愚蠢的。
作為在此領域有所涉獵的研發人員,我的觀點介於兩者之間。
大資料揭示的是關聯與現象,而非規律和本質,所謂「知其然而不知其所以然」正是大資料分析結果的寫照。 商學院流 傳很廣的一個案例,賣場資料顯示啤酒和紙尿褲的銷售相關。 經過調查發現,這是年輕父親被妻子指派採購嬰兒用品時夾帶啤酒私貨的一種趨同傾向。 如果僅限於發 現關聯,賣場也許會簡單地把兩種商品擺放在一起;而瞭解到現象背後的模式,便可以開展更有針對性的促銷。
也就是說,大資料能提供寶貴的線索,但不能替代人工研究——比如深入現場去發掘消費行為鏈背後隱藏的邏輯。 有興趣的讀者可以看看《品牌洗腦》一書,作者是資深行銷人士,書中列舉了很多生動卻可能讓人驚詫的例子:現代行銷是如此無孔不入,比如,人還沒出生行銷就開始了,孕婦常去的賣場的背景音樂對嬰兒有止啼的效果等等。
這些案例經常有研究資料支撐,雖然未必達到大資料的級別,但已經相當精密,包括用核磁共振掃描測試者的大腦。
對大資料極度樂觀或悲觀的人,其實都是將大資料視為傳統行銷模式的延伸。 樂觀派渴望找到一個「大殺器」,對消費者實現完美的「引誘」和控制。 而悲觀派則更理性一些——物極必反,過度行銷會招致消費者反抗,利用大資料分析結果來強化原本已如水銀瀉地般無孔不入的行銷,這真是好事嗎?
在我看來,消費者行為實際上很難預測和控制——據傳薩特在戰後出版哲學巨著《存在與虛無》,出版商對這部巨著的銷量並不看好,權當支援文化事業,但 銷售成績居然大大超出預期。 出版商驚訝之余,發現原來戰爭期間金屬被搜刮一空,商販缺乏秤砣,用各種物品代替,有不知名的商販發現該書的重量正好是一磅, 於是商販普遍購來充當秤砣。
在這個故事中,大資料分析就無法準確預測這一應用情境。 但我們可以做到,當消費者產生用書來當秤砣這樣的奇思妙想,大資料可以馬上向他推薦《存在與 虛無》。 既然消費者很難預測和控制,不如一方面利用大資料來觀察和總結特定情境下的群體行為關聯,一方面更謙虛和認真地與消費者個體溝通,用審慎執著的態 度及更好的產品、服務來黏住顧客,而不是只在行銷上下功夫。
總而言之,大資料雖然能在很大程度上提高預測的準確性,它也只能讓產品和服務本就出色的企業變得更強,卻不能拯救那些存在致命缺陷的企業于水火之中。