今年《紙牌屋》的收視大火,讓Netflix這家原本只做線上租賃DVD的公司成為演算法節目製作成功的典範。 但在優酷土豆策劃總監陳漢澤看來,《紙牌屋》僅僅是Netflix的精准行銷的產品,並非眾人口中的依靠大資料分析的劇作。 「聽說Netflix老總是聽取了下屬的建議,才決定拿下該劇的改編和發行權,而這名下屬是英劇《紙牌屋》的忠實粉絲。 」
媒體人出身的陳漢澤對大資料持一種審慎的態度。 她認為,大資料只是一個工具。 在大資料之前,早已有統計學邏輯和資料採礦技術。 比如大資料在互聯網的最早應用是流量分析。 2005年前後,互聯網通過入口網站開始訪問,是流量的主要入口。 但到了2011年,最大的流量源自于視頻網站。
在優酷土豆合併之前,陳漢澤在土豆網負責自製劇業務。 她說,資料模型可以精准地識別出在每一部劇裡,哪一分鐘使用者視線離開、重看、拖放觀看。 這些資料為自製劇選擇題材、設計橋段提供極大的參考價值。 在好萊塢電影劇本的精細化生產工序中,「劇本醫生」扮演了極其關鍵的角色,他們通常會改編劇本以強化某個情節,突出某個橋段。 而大資料分析技術正是陳漢澤口中的「劇本醫生」,借助大資料可以分析出觀眾喜歡的劇情元素。
Netflix上排名前十的影片,分別代表了不同家庭成員對觀影的需求。 另外,十部影片也可以分別對應不同時間、處於不同情緒下消費者的需求。 這背後是對收視群體的多維度分析。 陳漢澤說,視頻排序的背後是一套清楚的邏輯體系,瞭解排序和目標指引,才能更準確地推薦給消費者。
五年前,網路上一段視頻的爆紅通常基於一個點狀擴散的模式,屬自發的、分享式傳播;但隨著網路視頻行業逐漸轉向以自製劇、採購電視節目為導向時,視頻公司必須對觀眾有一個量化分析的過程。 基於大資料分析得出的這份資料包告,又可以為電影電視製作方、廣告商、協力廠商統計機構所用。
廣告主已不再滿足于傳統的彈跳式廣告行銷模式。 原先視頻網站重視的PV,現在變成為更關鍵的指標ROI。 「馬化騰在近期的演講時提到,連接一切,互聯網+創新湧現,開放協作,消費者參與決策,資料成為資源,順應潮流的勇氣和連接一切的風險。 而大資料行銷的潮流便是移動端的崛起。 」陳漢澤說。
在PC時代,基於cookie和邏輯分析來追蹤和分析使用者資訊是慣用手段。 但由於移動端瀏覽器沒有cookie, 再加上cookie對使用者隱私的放任,谷歌等巨頭正開始尋找新的資料分析模型。
陳漢澤認為,未來可以利用大資料的模型。 例如,使用者在手機上先打開A網站,長時間訪問後,會產生一些交互行為,而這些資料將會共用到下一家他流覽的網站。 這必須基於A網站和B網站之間的協助,他們之間可能產生千絲萬縷的聯繫。 所有的資料都是共用的,這也是「連接一切」的意思。
「谷歌的PPC模式(每點擊一次谷歌網路廣告,廣告客戶就需要谷歌支付一定費用)可能很快就不適用。 」陳漢澤說,今後的模式是,使用者經過A網站、B網站,直到N網站,廣告主才實現最後的盈利,但之前的流覽過程也能參與到盈利的分享。
不過,大資料技術也有其局限性,包括樣本選擇的有限性、資料篩選過程的真假判斷、分析邏輯的正確與否,都能影響到最後的結果。
《大資料時代》作者維克托·邁爾·舍恩伯格認為,大資料時代只需要人們知道是什麼,而無需知道為什麼。 正如商家不必理會為什麼啤酒和紙尿褲的銷售能如此匹配,只要抓到商機,採用交叉組合的戰略提升業績,無需搞清楚背後的商業邏輯。 如果非要把所有事情都分析清楚才做出判斷,損失的是眼界和時間成本。 關聯性遠勝過因果性,但這在陳漢澤看來是一個過激的論調。 「難道所有的頁面排序通過資料模型就能完成,不再需要編輯了? 」
她認為賣故事、講故事的人不死,內容永生,編輯依然能發揮作用。 譬如傳統視頻網站多以動作片、喜劇片、愛情片等類別分檔,但在Netflix有上,有一個很小的類別,比如cult影片也被視作一個門類,這是基於編輯對內容的理解和人腦智慧的產物,這是資料無法抓取的。