在第十六屆的上海電影節論壇上,圍繞大資料的話題又引起了人們的討論。 各方媒體大佬對於大資料的意見不一,討論火花四濺。
一直以來,影視文化行業就是以回報率難以預測據稱。 著名導演邁克爾西米諾的天堂之門電影是影史上最為賠本的電影之一,華人著名導演吳宇森的風語者曾經拖累了米高梅公司最終走向破產。
由於影視產業屬於文化創意產業,而創作人員的天馬行空的藝術思維和作為商業人士的製片人本身思維就存在一定的衝突,所以有導演就是妥協的藝術的說法,保持商業和藝術的協調也是所有成功導演的必經之路。 但正因為如此那麼從源頭來控制劇本,演員以及影片風格的選擇的科學性,是否能夠提高商業的回報準確率?
其實所有的文化創意產業類別都存在這樣類似的問題,就是一個產品的可複製性和產品品質的相抵觸問題。 擴展來說,在文化創意產業目前成為國民經濟的增長點的背景下,通過大資料和雲計算這些新技術能否有效的提高產業的回報率? 從而吸引更多的資本投入文化創意產業?
最近NETFLIX投資的《紙牌屋》獲得了一致好評。 《紙牌屋》不僅是Netflix網站上有史以來觀看量最高的劇集,也在美國及40多個國家大熱。 《紙牌屋》是一部美國政治題材電視劇,劇本改編自1991年首播的英國廣播公司BBC同名劇集,由視頻網站Netflix投資1億美元製作。 敢於斥鉅資老劇重拍,是因為Netflix在分析3000萬使用者影視消費「大資料」後,認為其中有利可圖。 純粹政治劇的稀缺填補了國內電視劇消費市場的空白,而帶有濃厚導演創作風格的電視劇引起的反響度也超過了最近兩年幾部類似的政治題材美劇,比如STARZ的《大佬》,HBO的《副總統》等。
《紙牌屋》是首部完全繞開了由廣播電視網和有線電視所構成的傳統電視生態系統的劇集,Netflix同一天將一季所有13集內容都播放出來,供觀眾點播。 《紙牌屋》引起的風潮還在繼續。
據稱亞馬遜正在製作至少11部試播劇集,這些劇集僅可通過互聯網觀看,原因是這家公司正在與Netflix展開「戰爭」,競相利用人們對於在智慧手機、平板電腦和互聯網電視上觀看電視節目的興趣, 以擴大自身在流媒體播放服務這一領域中的佔有率。 與此同時,微軟也正在製作自己的電視連續劇,而且有報導稱,谷歌、蘋果、英特爾和Twitter也正在考慮開發自己的類似產品。
從這個資訊可以發現,一方面是互聯網行業對於傳統影視產業鏈的滲透,另一方面是大資料對於影視製作行業的影響。 由於互聯網企業收集了大量的使用者資料,因此成為了大戶資料利用的主力軍也毫不奇怪。
以紙牌屋為例,看大資料時代如何顛覆電視製作產業鏈?
著名導演大衛·芬奇曾拿著《紙牌屋》的改編劇本,找過美國多家電視台,卻沒有一家敢掏錢,因為誰也說不準一部20年前的老劇是否還有市場。 Netflix也有類似的擔心,於是進行了「電視劇消費習慣資料庫」分析。 最終,Netflix發現老劇《紙牌屋》依舊是點播熱門,而點播該劇的使用者群,也幾乎和網站上大衛·芬奇、凱文·史派西的粉絲圈重合,於是決定投資1億美元重拍,並由大衛·芬奇導演、凱文·史派西主演該劇。
相比傳統收視率統計只抽取數千個樣本戶,「算」出《紙牌屋》的資料庫卻包含了3000萬使用者的收視選擇、400萬條評論、300萬次主題搜索,是名副其實的「大資料」。 這些資料來源自Netflix數年來積累的資料資源。 當一位使用者通過瀏覽器登錄Netflix帳號,Netflix後臺技術將使用者位置資料、設備資料悄悄地記錄下來。
這些記憶代碼還包括使用者收看過程中所做的收藏、推薦到社交網路等動作。 在Netflix看來,暫停、重播、快進、停止等動作都是一個行為,每天使用者在Netflix上將產生高達3000多萬個行為。 此外Netflix的訂閱使用者每天還會給出400萬個評分,300萬次搜索請求,詢問劇集播放時間和設備。 這些都被Netflix轉化成代碼,當作內容生產的元素記錄下來。
為了找到分析大資料的方法,Netflix沒有少花功夫。 首先,千萬級別的使用者對網站提供的影片給出1至5星的評級,幾年下來相關資料的總量超過百億條。 要找准使用者推薦新影視劇,識別觀眾品位需要一個「演算法」。
然而要將巨大的資料轉化為生產力並非易事。 長年以來,為了提高演算法精准,Netflix一直舉辦大型比賽招賢納士,以此拓寬資料採礦處理能力。 2005年底,Netflix曾開放一資料集,並設立百萬美元的獎金(netflix prize),徵集能夠使其推薦系統性能上升10%的推薦演算法和架構。 這個資料集包含了超過48萬個匿名使用者對大約近2萬部電影做的大約10億次評分。
對於中國的啟發
目前國產文化創意產業已經出現了初步依據大資料的跡象,例如萬達院線就將資料庫作為重要的核心資產,預計在今年年底前建立的會員資料庫將達到600萬,而萬達剛剛並購的美國院線AMC會員資料庫人數達到400萬。 另一方面類似于騰訊,優酷等視頻網站都有著大量基於使用者的資料積累,也開始嘗試運用HADOOP等技術進行資料採礦和分析。 但是基於大資料既不能夠過於擴大大資料的作用,又不能再過於狹窄的意義上來理解大資料。
所謂大資料,是一種在多樣或大量資料中快速收集資料和分析資料的能力,其根本依然是洞悉消費者需求。 影視產業一直是一種感性化的行業,因此在洞悉消費者的需求方面表現不突出,並且很多創作者站在作者電影或者藝術電影不考慮觀眾的感受,這會造成培養多元化觀眾群體的失利,長遠來說對於國產影視行業的發展是不利的。 而大資料則是以一種科學化結構化的思維來看待影視行業,這能夠提高影視行業的回報率。
目前在洞悉消費者需求方面,今年年初以來的幾部電影《泰囧》,《致青春》和《中國合夥人》,或是知名青春小說的改編版本,或是在迎合新時代消費者心理需要和電影新媒體行銷方面有獨到之處,應該說就是大資料的初步體現, 在科學洞悉消費需求方面有了初步成果。 而目前國產影視行業也在大量購買近年來比較有知名度的網路小說版權,這些購買行為是基於對互聯網文學消費群體的資料分析,細化到了消費者群體的年齡,性別,學歷等維度要素,大大提高了科學性。
所謂大資料不應該只是在製作電影和購買版權時起作用的一個環節,影視公司應該將大資料滲透了企業經營的每一個環節。 比如說在影視製作流程中製作團隊可以通過微博,SNS等管道多方面和潛在消費者互動,主動收集消費者資料,同時改變影視製造團隊的管理邊界,在製作中可以根本消費者的需求對產品進行進一步優化。
同時在影片成品行銷,消費者回饋中影視公司持續和消費者進行互動,收集消費者的各方面資訊,從而優化消費者的購買管道和消費管道,用智慧化推送改變企業和消費者陳舊的消費關係。 比如出版行業中的新經典文化嘗試建立私有雲來優化產品的銷售管道,就有大資料的思路在其中。 從而讓以前不太明確的產品銷售過程變得明晰化,就是一種值得借鑒的嘗試。
但是也不能過於神話了大資料的應用,大資料是一種工具和解決思路,但是不能包治百病。 影視產業和其他文化創意產業一樣,作者帶有一定的演出者氣質,但是好的產品必然要求藝術和商業有效的結合。 消費者對於自身的需求往往有著盲目性的特點,在尋找到特定產品前,消費者往往不知道自己是要尋找什麼樣的產品,比如說亨利福特的名言:當你問消費者需要什麼產品時,他們會說請給我一匹跑得更快的馬。
因此有時候基於消費者的資料分析可能會導致不科學的結果,另一方面過於強調大資料的分析作用會干擾創作過程,使得產品不倫不類。 在創作風格受到干擾的情況下,導演的個人風格不再明顯,會影響產品的多元化,降低產品的吸引力。 在消費者隊伍不成熟需要培育的情況下,這個過程尤其需要慎重。
圍繞大資料推進影視投資在國內的環境目前還不夠成熟。 就互聯網視頻而言,中國視頻網站的內容由資本的興趣決定,但是國內的視頻付費市場並不成熟,目前的主要盈利模式還是廣告投放,很難完全以使用者為中心決定影視劇的「配置」。 只有付費收視覆蓋成本,多屏融合加速之後,視頻服務才能突破網路電腦的範疇,成為「客廳文化」,才有可能實現由資料說了算的定制服務。
其次,行銷必須和內容相關聯,根據觀眾喜好定制的節目,不但可以被定向推送給關聯觀眾,而且可以根據觀眾群的定位「定制」廣告。 最關鍵的因素則是國內的資料分析習慣並沒有形成,一方面「萬惡的收視率」「收視率造假」等收視率統計風波不斷,另一方面精確的資料分析始終未能納入影視劇投資成本,往往一本糊塗賬,更不用提「算出」一部劇。
筆者認為,大資料的潛力十分大,但是需要更好的將大資料嵌入產品的創作流程,一方面根據不同的資料維度收集有效資料,優化分析演算法,另一方面需要在產品行銷,版權購買和創作及消費管道等方面入手,使得大資料不只是一種更加, 更滲入到公司的管理流程成為企業的經營資產和管理要素。