「一支身價四千萬的棒球隊如何能和一個一億四千萬的球隊相抗衡,而且還能贏得一個億? 」在影片《點球成金》中,布拉德·皮特所飾演的美國奧克蘭運動家棒球隊總經理正是用電腦程式分析比賽資料,使得一支僅僅屬於「三流」之列的棒球隊取得了一場又一場的勝利,甚至有能力與大名鼎鼎的紐約揚基隊競爭市場。
這部2012年曾紅極一時的影片,獲得了包括最佳影片在內的六項奧斯卡提名,而對互聯網業界而言,它用了一種相當極端的「屌絲逆襲上位」的戲碼預示著一個新時代的來臨。
在此次採訪中,不少投資人都不約而同地向南都記者表示,2013年將是大資料領域的投資佈局之年。 同時,他們也相信,在這一領域內,極有可能誕生出下一個Google或Facebook。
大號轉身 肉在哪
說一部電影開啟了一個新的資訊時代的來臨,聽起來或許多少有些誇張,但「大資料」概念的走熱,正在變得越來越毋庸置疑。
曾任雅虎中國總經理、新浪微博社區委員會專家成員的知名IT評論人謝文向南都記者預言,「1998年雅虎上市。 八年後,2004年谷歌上市。 又八年後,2012年Facebook上市。 再過八年,2020年還將誕生一家全新的互聯網巨頭,而它極有可能是一家大資料公司。 」
或許正是在這樣的大勢所趨下,2012年年底,當新浪微博面向企業微博新增以付費微博行銷為主打的「微任務」功能,對此前寄生在新浪微博平臺上的草根微博行銷公司進行規范整頓時,不少人甚至喊出了「草根大號已死,大資料分析行銷當道」 的口號。
在接受南都記者採訪時,手握「全球時尚」、「歐美街拍」、「精選語錄」等多個草根大號實際控制權的酒紅冰藍(網名)說:「第一次聽到有人喊這樣的口號,我心裡直想笑,因為事實根本不是這樣。 」
據酒紅冰藍介紹,新浪微博于2012年10月成立自媒體協會,由新浪COO杜紅擔任協會理事長,酒紅冰藍和另一位草根大號控制者伊光旭擔任聯席秘書長。 「從此,我們就不再是什麼草根了,我們有了一個新名字———自媒體。 」能夠摘掉「草根」的帽子,變身為「媒體」,酒紅冰藍很是高興。
而對新浪來說,此舉相當於是對之前自發生長起來的微博行銷公司(或個人)進行了一次「招安」,通過微任務的官方平臺,對草根大號們轉發廣告資訊的管道、定價、資訊真實性與否進行統一管理。
「所以,對我們來說,規範調整之後,不是生意越來越難做了,反而是變得越來越公平透明瞭。 」酒紅冰藍對南都記者說道,「我們公司剛剛開過年會,我可以告訴你,根據我們銷售部門的預計,明年公司的收入會比今年翻上一番。 」
不過,自稱對技術一竅不通的酒紅冰藍也向南都記者坦言,儘管自己對時下時興的「大資料」概念知之甚少,但針對現在有不少草根行銷企業已開始轉戰微信等其他社交平臺,她堅持認為,新浪微博上的行銷生態已發展多年, 更具有相對成熟的變現能力,仍將成為她的著力重點。 同時,她也相信,只有跟著真正掌握著「大量資料」的大佬走,才可能有肉吃。
在這一點上,酒紅冰藍並沒有說錯。 2011年從澳洲回國,創立基於大資料方式的口碑及輿情分析公司陝西識代運籌資訊科技有限公司(下簡稱識代運籌)創始人李哲君也向南都記者表示,目前對於在大資料領域創業的小公司來說,最大的障礙即來自于資訊獲取管道的不通暢。
謝文再三向南都記者強調,在未來,互聯網上的海量資料一定是開放的,資料的獲取能力不會成為大資料公司長期發展的競爭壁壘。 但在眼下,李哲君卻只能通過與大佬們合作獲得官方高許可權介面,運用擁有自主智慧財產權的分散式資料獲取工具,以及與協力廠商公司合作,來獲取盡可能全的資料。
而另一家利用大資料方式進行慢性病管理的初創企業時雲醫療科技(上海)有限公司(下簡稱時雲醫療)的聯合創始人郭輝,則向南都記者表示,除了會引進由國外頂級時間生物學實驗室收集了半個多世紀的資料和分析模型之外, 他們也打算逐步積累屬於自己的資料庫。
資料大未必是大資料
不過,先等等。 究竟什麼是大資料? 資料大就算是大資料了嗎? 究竟多大才算是大資料呢?
面對這些問題,行業專家、投資人和創業者,幾乎每一個人都有一套自己的理解和答案。
謝文在去年5月撰寫的有關大資料時代系列博文之一《資料大未必是大資料》中指出,網路業中一個公司是否能稱得起擁有大資料,至少要從三個維度考量,即資料規模、資料結構和資料相關性。
換句話說,如果一個網站擁有一億使用者,但他們在上面只幹同一類的事情,譬如流覽新聞,買東西,或是玩遊戲,那麼由此產生的資料量雖然不小,但結構簡單,重複性高,分析起來相對比較容易,只需根據使用者背景和使用習慣進行分組歸類即可, 那根本稱不上是大資料。
同理,如果一個網站上的十種產品和服務,彼此之間相互孤立,造成同一個使用者的十種網路行為的資料無法有效地整合在一起,或者需要付出高昂的整合成本,從而降低了資料的可挖掘性,那麼無論資料量多大,結構多複雜,也同樣形成不了大資料。
(責任編輯:蒙遺善)