導讀:大資料技術在大量資料中發現規律的能力顯然為旅遊業提供了很多機會,那些擁有大資料項目目的企業能以一種全新的方式向消費者銷售旅遊產品。
如果你是Tnooz的忠實讀者,你肯定看到過關于大資料(Big Data)的潛力之類的文章。
但就像大多數不斷湧現的技術一樣,人們很困惑它真正意味著什麼,它能夠帶來更好的客戶體驗,提升銷售嗎?
這篇文章只是抛磚引玉,分析了大資料未來在旅遊業一些潛在的應用:
大資料
「大資料」這個詞通常有幾種表達方式,其意義不言而喻。 「大資料」意為大量的資料,即在規模、工作量和總體成本方面都超越了普通資料庫的資料集,以及提取分析其中含義的技術。
那麼我們會在旅遊業哪些地方遇見大量的資料呢?
其中一個最好的例子就是線上旅行社的分析日誌。 多年來,分析工具讓旅遊企業追蹤轉化率管道、詳細的消費者資料及其他相關資訊,如哪些頁面的轉化率最高? 哪些頁面的蹦失率最高等等。
然後這些分析報告被用於優化網站以確保最高的轉化率。 但在大資料的時代,旅遊企業在收集並關注的資料比以往任何時候都多。
例如,某些網站還即時收集訪客具體的滑鼠頁面活動資訊。
針對每位使用者自然生成了很多資訊,使得旅遊企業對於每位使用者在頁面上的行為有著獨到的理解。
在幾年前,要完成這樣的資料儲存量甚至比登天還難(因為非常昂貴)。
如今,廉價的儲存方式逐漸流行起來,分佈的檔案系統使得資料可以在幾十甚至幾百台電腦之間共用,因此實現了廉價有效的資料儲存。
隨著儲存技術的提高,儲存每個位元組資料的成本將繼續下降。
大資料分析、MapReduce以及語義提取
擁有所有的資料固然很好,但是真正的價值依賴于語義提取功能。 基於Google最初發明的技術,大資料工具如MapReduce能輕易發現資料中的共同趨勢,以及與這些趨勢相對應的行為。
舉個例子讓大家更容易理解:
想像一下,你有一份包含全世界所有酒店的Excel表格,你想從中發現那些被描述為「很棒! 」的酒店。
原始資料看起來也許如下圖:
酒店名稱——描述
—————————–
A酒店 「糟糕的體驗」
B酒店 「很棒的游泳池」
C酒店 「喜歡」
B酒店 「很棒的餐廳」
A酒店 「喜愛」
C酒店 「很棒的體驗」
B酒店 「乏味」
這裡只是列舉了其中幾條記錄,這份表格可能有幾百甚至幾千頁。
利用MapReduce,你可以編寫一個功能,找出符合條件的每家酒店名稱,並針對每家酒店整合出一組評論。
在上面例子中,「B酒店」出現了3次,因此Map功能可能創造以下資訊集:
B酒店:‘很棒的游泳池’‘很棒的餐廳’‘乏味’
因此,Map功能幫我們發現B酒店的所有評論,但是這還不夠,我們還需要利用Reduce功能進行下一步分析。
此項功可以説明我們在Map創建的資料集基礎上進行各種分析。 在此例中,我們想要找到只含「很棒」這個詞的評論。 Reduce功能會寫出如下電腦編碼:
「只要發現評論中含有很棒這個詞,內部計數器就+1。 」
內部計數器通常會顯示得分,或者某個特定資料集中「很棒」這個詞的數量。 在此例中,B酒店將排在首位(有兩個「很棒」),然後是C酒店,最後是A酒店。
因此在這個例子中我們得到了什麼? 我們在原始非結構化的資料基礎上發現了共同點,並且基於商業目的進行分析。
儘管看似很簡單,但這就是MapReduce及相關技術的力量:提取隱藏在資料中的規律。
MapReduce的驚人之處在于它能夠對數以億計的資料資訊進行分析,然後發現其中的規律。
現在你能感受到這種潛力嗎?
旅遊領域中大資料的狀態
大資料技術在大量資料中發現規律的能力顯然為旅遊業提供了很多的機會,來重塑針對消費者的行銷和銷售方式。
毋庸置疑,那些擁有大資料項目目的企業能以一種全新的方式向消費者銷售旅遊產品。
目前在大資料儲存公司Acunu任職的Emmanuel Marchal對於旅遊業大資料的狀態進行了簡要的描述:
大資料應用程式正在從分析階段向真正的個人化階段過渡。 例如,真正的個人化是指,旅遊網站能夠根據旅遊者的具體需求、愛好和此前的購買行為,為不同的旅行者提供不同的酒店選擇,而不是基於旅行者的類別提供大眾化的選擇。
真正的個人化是主要的驅動力,是旅遊業大資料的「重中之重」。
OTA和其他旅遊企業應該把大資料看成是「必須的」,而不是「可有可無」。
關於大資料,2009年開始有人談論,2010年很多公司開始啟動大資料項目目,2011年略見雛形,那麼2012年會是廣泛實踐大資料項目目的開端嗎? 除了個人化之外,Hopper公司也在這方面努力嘗試,並且提供了另外一個典型的例子來證明大資料是如何服務消費者的。
針對自然語言處理和地點相結合的資料的大規模分析使得「附近500美元以下的海濱度假酒店」這樣的搜索成為可能。 儘管這需要技術整合,大資料處理應用程式使得它們成為可能。
展望未來
雖然個人化是「重中之重」,旅遊業中使用大資料的潛在使用者很多。
地理圍欄(請點擊此處注釋)技術出現了,此技術可用於監測靠近一個特定的景點或商戶的旅行者。
最近推出的Foursquare Radar功能是這種應用的一個很好的例子,在你希望到某地並進行了設定之後,當你在它附近時,你的手機就會自動提醒。
這項技術就是大資料:通過你手機的GPS功能搜尋即時的地理位置資訊,然後提醒你在某個特定區域。
這項功能可用於數以億計的消費者,此過程中需要收集和處理的資料量在幾年前是無法想像的。
試想一下:每天有多少使用者使用GPS導航功能? 地理圍欄技術對於行銷人員來說帶來的潛力是巨大的。
圖像資料處理技術:每天在有幾十億張照片在互聯網上上傳,這代表著超大的容量。
圖片共用應用程式(如Instagram)是與好友分享精彩瞬間的絕佳方式,但這些創業企業的真正價值在於他們在後臺收集的資料。 每張圖片都含有大量的資料,通過進一步分析才能發現使用者的主要資訊。
Color,這家備受爭議的創業企業在推出產品之前就獲得了天價的估值,他們希望去收集的資料的巨大潛力說服了投資者。
旅遊業中,創業企業Jetpac已經採用了影像處理技術,給社會旅遊領域注入了不同的色彩。
近日被eBay 收購的創業企業Hunch也是在分散資料中發現規律的很好例子。
他們的API和某些公共測試控管讓每個人發現類似「40%喜歡斯巴魯汽車的人也喜歡入住五星級酒店」這樣的結論。 (當然這不是個實例)
儘管這種相關性看上去很可疑,但是想像一下當你試圖針對旅行者進行交叉行銷時,這樣的關聯性會多麼有價值。
Taste Graphs將瞭解客戶的「某件事」變成同時瞭解「很多其他的事」。 Taste Graphs應用程式的使用在將來肯定會得到廣泛的應用,從線上零售商到旅遊業。
總之,大資料不是你可以從供應商那裡買到的驚奇魔術盒。
大資料是這樣一個概念,即我們每天產生的大量資料,並且隨著技術應用的發展,我們可以更好地出售產品及服務。
你準備好了嗎?
(責任編輯:呂光)