如果說有一家科技公司準確定義了「大資料」概念的話,那一定是谷歌。 根據搜索研究公司康姆斯科(Comscore)的調查,僅2012年3月一個月的時間,谷歌處理的搜索詞條數量就高達122億條。
谷歌不僅存儲了它的搜尋結果中出現的網路連接,還會儲存所有人搜索關鍵字的行為,它能夠精准地記錄下人們進行搜索行為的時間、內容和方式。 這些資料能夠讓谷歌優化廣告排序,並將搜索流量轉化為盈利模式。 谷歌不僅能追蹤人們的搜索行為,而且還能夠預測出搜索者下一步將要做什麼。 換言之,谷歌能在你意識到自己要找什麼之前預測出你的意圖。 這種抓取、存儲並對海量人機資料進行分析,然後據此進行預測的能力,就是所謂的「大資料」。
2012:大資料十字路口?
為什麼大資料突然變得這麼火? 為什麼《紐約時報》把2012年定義為「大資料的十字路口」?
大資料之所以進入主流大眾的視野,源自三種趨勢的合力:
第一,許多高端消費品公司加強了對大資料的應用。 社交網路巨擎 Facebook 使用大資料來追蹤使用者在其網路的行為,通過識別你在它的網路中的好友,從而給出新的好友推薦建議,使用者擁有越多的好友,他們與 Facebook之間的黏度就越高。 更多的好友意味著使用者會分享更多照片、發佈更多狀態更新、玩更多的遊戲。
商業網站LinkdIn則使用大資料在求職者和招聘職位之間建立關聯。 有了LinkdIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以通過簡單的搜索找出潛在受聘者並聯系他們。 與此相似,求職者也可以通過聯繫網站上其他人,自然而然地將自己推銷給潛在的雇主。
第二,以上兩家公司都在2012年早些時候陸續上市。 Facebook 在納斯達克上市,LinkedIn 在紐約證券交易所上市。 這兩家企業和谷歌一樣,雖然表面上是消費品公司,然而其本質是大資料企業。 除去這兩家,Splunk 也在 2012 年完成了上市,它是一家説明大中型企業提供運營智慧的大資料企業。 這些企業的公開上市提高了華爾街對於大資料的興趣。 這種興趣帶來了空前的盛況——矽谷的風險投資家們開始前仆後繼地投資大資料企業。 大資料將引發下一波創業大潮,而這次浪潮有望讓矽谷在未來幾年取代華爾街。
第三,亞馬遜、Facebook、LinkedIn 和其他以資料為核心消費品的活躍使用者們,開始期待自己在工作中也能獲得暢通無阻地使用大資料的體驗,而不再僅僅限於生活娛樂。 使用者們此前一直想不通,既然互聯網零售商亞馬遜可以推薦閱讀書目、推薦電影、推薦可供購買的產品,為什麼他們所在的企業卻做不到類似的事情。
比如,既然汽車租賃公司擁有客戶過去租車的資訊和現有可用車輛庫存的資訊,這些公司為何就不能在向不同的租車人提供合適的車輛方面做得更智慧一點? 公司還可以通過新的技術,將公開資訊利用起來——比如某個特定市場的狀況,會議活動資訊,以及其他可能會影響市場需求和供給的事件。 通過將內部供應鏈資料和外部市場資料結合在一起,公司就可以更加精確地預測什麼車輛可用,以及可用時間。
與此類似,零售商應當可以將來自外部的公開資料和內部資料結合在一起,利用這種混合的資料進行產品定價和市場佈局。 同時還可以同時考慮影響現貨供應能力的多種因素以及消費者購物習慣,包括哪兩種產品相搭配會賣得更好,這樣零售商就可以提升消費者的平均購買量,從而獲得更高的利潤。
(責任編輯:蒙遺善)