視頻行業的大資料採礦還不到百分之一

來源:互聯網
上載者:User

在大資料時代下,資料在變革我們的思維。 有幾張圖讓我們值得一看,第一張圖,在2013年7月份發佈的中國互聯網的一個數量,第二張是中國手機線民規模線民比例,我覺得大家尤其要關注一下手機的增長率非常高。 同時跟大家分享的一個資料,愛奇藝在移動端佈局是比較早的,我們在2011年開始就預測什麼時候移動端流量會超過PC端。 我們原來有一個預測是在2013年的年底,但是經過實際的運營,其實在2013年的9月2日那一天移動端的流量完全超過了PC端,而移動端的增長速度遠遠比PC快,所以未來移動終端潛力是非常大的。

大資料最重要的價值是預測

對於移動端我們要看到現在手機在改變我們什麼,我想在座各位每個人都可以想一想,現在我們看手機的頻次是什麼樣,我基本上5分鐘之內一定會看一下手機。 因為你的碎片化時間,還有對於手機的使用頻次,現在手機如果只是純打電話這種工具已經很弱了,我們更多的拿手機當作獲取資訊的一個管道。

整個互聯網每天產生的資料量大概是一個什麼樣?我這兒有一組資料,我們每一天可以發出2940億封Email,可以在推特上產生340億條資訊,可以克隆1.68億張DVD。 這些都在說明,現在產生的資料非常龐大。 在這些龐大的資料裡面我們怎麼樣去挖掘,這些資料能夠為我們做什麼。 現在這些資料的特點是規模非常大,處理速度要求越來越快,而且資料的類型非常多。 大資料時代並不是要求現在我們像以前那樣,在抽樣樣本的研究時代,我們可能對於資料的精准性會非常在意,而在大資料時代我覺得資料的精准性是可以忽略的。 因為從大資料裡面觀察出的趨向和趨勢是我們要研究整個資料能代表的含義的價值。 所以對於資料的分析,最後我們是希望能夠產生高價值的預測,大資料最大的最重要的一個一個價值是在於預測。

大資料讓使用者服務更精確

對於愛奇藝和PPS,(愛奇藝2013年的4月份收購了PPS),在這個平臺上面,這(幻燈片展示的)只是一些基礎資料,在PC端產生使用者3.5億,移動端使用者2個億,我們整個的12億小時的內容、 2億的註冊使用者和1.33億小時的移動端播放。 大資料能夠做什麼呢?

對於傳統行業來講,沃爾瑪是最早利用大資料來做分析做經營預測,而且是做得非常優秀的。 沃爾瑪會通過連接上facebook和推特上回饋的一些資料。 在美國經常會有颶風,當颶風來的時候他們會發現,從銷量資料分析蛋撻和颶風用品擺在一起的時候銷量都會上升,沃爾瑪在經營上的堆積擺放都是來自于大資料的挖掘。

而在互聯網上對資料做得研究最深刻的應該是谷歌。 對於流感預測,谷歌曾經通過搜索的資料,同時針對使用者搜索的資料的詞彙裡面,從上千個詞彙裡面去找跟流感匹配的詞彙,他們找到了83個精准的詞彙。 他們通過資料能夠預測到在什麼地方會發生流感,它甚至比美國的衛生監督機構獲得的資訊會更快更準確更早。

對於資料,我們最終是希望它能夠在商業化應用中發揮重要的力量,一個很簡單的例子,這是2013年一部臺灣劇叫《兩個爸爸》。 傳統的片方在推這部劇的時候會告訴我們,這個劇使用者大概是24到35歲之間,而通過百度使用者的搜索以及愛奇藝的播放,我們對於使用者播放的精准,能夠精准到他最近搜過什麼東西,上過什麼網站,他最近有什麼需求,通過這些資料分析, 我給他更準確更精准的行銷。 對於大資料在互聯網上,其實就是從原來對人群的標籤變為對個人的標籤,為使用者打上標籤之後對於使用者提供的個人化服務就更精准更有價值,那我們媒體的價值會體現出來。

在我們周圍有Ipad、PC包括現在計程車上視頻的播放,未來包括手錶、微波爐、冰箱等都會有一個屏,同時這個屏的處理速度也會越來越快。 在這個時候我們就要考慮,既然使用者被這麼多屏在包圍,我們什麼樣的內容能夠佔據使用者更多的時間,這就是媒體核心價值所在。 這裡有一個不同屏的行為資料,在上下班,移動端一定是最核心的,最便捷的使用者獲取資訊和獲得觀看視頻的工具。 這是移動取代了PC成為每天上網的起點,很多使用者都是早上起來之後,可能先把手機拿出來看一看,上一下微信、微博,然後看有哪些消息發生,最後又快速的看,或者扔到房間睡覺。 大多數人的習慣可能都是越來越多的在利用移動端來獲取資訊,而 PC則更多的是一個工作工具。

大資料下的視頻機會

接下來我說一下對視頻而言,我們對於大資料到來可能存在哪些機會。 這個《紙牌屋》我相信大家非常熟悉了,《紙牌屋》是2013年推出的美劇,在美劇的創造開始的時候,通過分析了三千萬人流使用者的留言以及分析,首先題材上選用了政治背景,因為他認為付費使用者對這個題材會非常感興趣。 然後它的導演跟演員也通過資料採礦和資料分析出來的,它是集凱文史派西、大衛芬奇、BBC出品三種元素于一體的電視節目,這樣可能有更好的收視。

而對這部電視劇行銷、策劃以及推廣,包括上線之後對使用者的分析都非常極致,它主要是利用這些資料,對這些資料行銷做更好的挖掘。 《紙牌屋》儘管在宣傳上很多的是利用了大資料採礦,但是我覺得也不儘然。 這部劇的成功是多方面的,它的行銷手段,包括它在製作的時候用的大牌的好萊塢的導演,而凱文在前三集之後由其他導演接替了。

我們可以這麼理解,在現在互聯網這麼發達的時代,一切都可以變為資料,當文字當創意這些都變為資料的時候,這些資料其實是可以為我們內容的創作、製作有一個在前期的一個保障,這比我們在沒有任何資料的前提下去做創作, 可能有這種資料基礎更有價值。

我也在這裡說一下,愛奇藝在3721.html">2014年也會大力推廣我們的自製劇,包括自製綜藝節目。 去年愛奇藝做的漢字英雄以及現在正在熱播的《人生需要揭穿》,對這些劇在整個製作之前,我們也是做了很多的資料分析和資料採礦。 第二點,在視頻網站,它最大的特點是有海量的資訊。 使用者在找自己內容的時候有兩個管道,這兩個管道一個是搜索,搜索的習慣我想我們都喜歡,流覽資訊實在是太多了,另外一個就是推薦,對於推薦來講有很多種推薦,其中我覺得利用大資料做的很多、做得最極致的個人化的推薦, 是把使用者的行為變成資料。 我們現在每天在愛奇藝和PPS上產生的資料非常龐大,這些資料我們挖掘的連1%都不到,我們有待去做更多的挖掘。 對於使用者行為的這種,比如說什麼類型的使用者在看什麼類型的片子,或者把使用者打上標籤的時候,我跟你是一類人,在個人化的時候,把我們互相看的去做推廣,你喜歡這個內容的機會就會高。 當這一切都變成可以記錄、可以分析、可以挖掘資料的時候,實際上會給使用者帶來非常多的方便。 使用者有一習慣搜索內容,他們通過觀看行為分析,我們來提供給他。

其實資料有很多,最終我們希望所有用資料的行為分析能夠落在商業上。 使用者在這個平臺上所產生的行為資料,溝通,都會變成我們分析的基礎。 當進行資料分析的時候,我們可以把這些們通過一些科學的分類方式,然後給他劃分不同的群體,然後每個群體的人裡面又有不同的個體。 對於使用者的性別、年齡、喜好以及他的意圖,都會變成一個一個的資料,他是什麼樣的使用者,他喜歡看什麼樣的電影等等。

龐大的使用者每一個人有不同的標籤屬性,不管我在內容應用也好,或者在做商業挖掘也好,相對於客戶群體,我們會有更多的價值來挖掘。 我舉兩個例子,一個是"一搜百應",背後是百度,我們跟百度的搜索,整個百度的搜索使用者資料打通了,當使用者在百度上搜索之後,他到愛奇藝之後,搜索行為會傳到愛奇藝,實現了某種溝通的方式。 他目標人群搜的這些東西給他提供的是針對于他感興趣的一些內容,不管是商業內容還是其他內容,我們整個資料是基於百度的資料和愛奇藝整體的資料來做的分析。

我們還有一個專案是"蒲公英"專案,針對百度使用者每天的上億次搜索,尤其搜索之後,對於有很多內容可能是非常熱銷的內容,比如說像ISO、韓國的明星很多人在搜。 現在熱播的電視劇在搜,還有很多搜索,很多沒有熱播,但是客戶在搜,希望有一個精准的解決方案,對這個來說我們就有"蒲公英"的專案,會提供精准的內容。

關於電視互聯網的未來,其實互聯網擋是擋不住的,我們要用一個什麼樣的心態,要擁抱這種新的變化,因為大的時代不是屬於互聯網,是屬於全人類的。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.