洪倍:怎麼用大資料玩轉數位媒體

來源:互聯網
上載者:User

2014中關村大資料日于2014年12月11日在中關村舉辦,大會以大會以「聚合資料資產,推動產業創新」為主題,探討資料資產管理和變現、大資料深度技術以及行業大資料應用創新和生態系統建設等等關鍵問題。 大會還承載從政亞信府主管部門到各行各業的需求和實踐中的疑問,探討包括政府、金融、運營商等部門是如何通過資料資產管理和運營,實現轉型發展和產業創新的路徑。

在下午運營商@Big Data環節中,來自ADmaster的洪倍作主題演講,介紹如何利用按資料玩轉數位媒體。 以下是他的演講全文:

洪倍:其實我們講的整個數位媒體這個生態圈其實是目前大資料整個領域可能自發玩的最火的一個領域,而且我們講運營商資料是給整個數位媒體提供非常好的基層業務的支撐,我們看整個數位媒體生態圈有什麼樣的角色分工,剛剛其實有講到媒體, 各種網站就是媒體,第二個提到廣告,第三個就是受眾,電信使用者,移動使用者,包括寬頻的使用者,也就是我們講的訪客,第四個當然是電商,那就是直銷管道。 第四個是受眾互動,第五個是廣告推送。 所以最後我們講互聯網生態圈就是五個維度上積累資料。 這是我們看到的一個趨勢,從1980年家裡面開始普及電視,電視是單項的傳播管道,後來是互聯網,首先是交互的,而且聯結在一起,最後看到互聯網方式越來越多了,從最開始互聯網到移動概念,手機,PAD,最後大家發現又回到了原點, 電視化了,上海電視通在數位電視領域已經耕耘很深。 所以最後你會發現我們現在所有的受眾移動盤,我們的媒體內容已經在搶佔受眾各種各樣的時間,然後又產生各種各樣的資料,這個資料讓我們產生各種各樣的有利於纏身各種各樣的資訊,所以它形成了非常好的互聯網的閉環。

大家看到一個圖,都在吃飯,都在玩手機。 看微信,微博,包括朋友圈,公司圈,都在微信上進行溝通,所以這也是大量的資料。 所以最後你會發現最近十年互聯網包括移動互聯網,你會發現最後死掉的是右下覺,活下來的都是黏度高的,黏度最高的是郵件活得很好,然後慢慢地新聞資訊,我們看到很多傳統的紙媒,電視,都在轉型,他們希望成為一個有觀點的黏度狀態。 互聯網行銷方式也在改變,最早是砸大錢在電商欄目買一個好廣告,投電視,慢慢地變成廣告精准。 還有買博士倫眼鏡怎麼樣定義受眾,同樣我們看中國好聲音怎麼分受眾,同樣我們可以看到廣告跟社交聯動。 怎麼樣聯動? 之前我們做了一個案例,一個汽車使用者他有幾百萬的粉絲,這些使用者以什麼樣的關係存在? 以前是沒有人知道的,我們用新的趨勢就是顯卡計算,我們知道整個人的關係網是一個什麼樣,是一個圖,所以顯卡天然的是用圖計算,所以我們分析了,發現這樣一個計算品牌的粉絲天然的報了18個團,裡面有兩個是僵屍粉的團, 歷史上他有兩家公司加粉,一個是跟他有關系的明星代言人,被他邀請過參加試駕活動,被他邀請過參加拍攝的明星是一個粉絲團。 另外一個是轉銷商。 如果投廣告的話,對這四個粉絲團不要投。 所以我們剩下的可能應該是對內,剩下14個團去投廣告,社交跟廣告也在聯動,所以這是大資料分析的比較有典型的案例。

我們再看互聯網也在開始做專題活動,一些不同的季節不同的領域不同的產品做活動,他們通過資料採礦去行銷策劃這個活動,明天就是雙12,一個月前雙11,雙11就是電商平臺的聯動,怎麼樣提高轉化率,我看亞信的同事提到, 通過電商資料提高17%的轉化率,意味著未來提高更大的170%的轉化率。

這個是我們歷史上跟客戶做的非常經典的案例,一個是達成率,地域分佈、拼刺控制、內容劇碼定向。 每個人看高八次以上,很多人會覺得非常煩,我相信大家看視頻的時候前面幾十秒廣告很難受。 同樣的地域,是不是能夠做廣告,我們發現地域還是有差別,我們跟合作夥伴在考慮怎麼樣分析裡面有多少因為路由的設置導致的錯誤。 同樣比如說這個地區沒有4S店,他們就不要做廣告銷售。 如果兩個媒體使用者重合度非常高的話,是不是另外一個小的媒體就可以替代掉,或者是補強的作用。

前面是媒體大資料的統計產生。 這裡面是微觀的資料,比如說使用者,我們看網站設計,從使用者訪問路徑上來看是不是合理的,訴求是A,但是你的交互是B,所以我們通過路徑方式也是一張圖網,哪條路徑是使用者最喜歡的豎井,哪條路徑是最容易實現使用者購買的路徑, 這個是我們説明客戶提高轉化效率的路徑。 同樣的我們也發現有一個非常有趣的資料,看廣告真的沒有用嗎? 不是,我們在一些電信網站上發現看廣告的使用者,在看完廣告後三天之後再回到電商平臺購買的廣告率是沒有看廣告的三倍。 而且這個使用者是忠實的老使用者,而且他的流失率很低,這也是大資料採礦出來非常有趣的一個現象。

當然這個可以未來跟很多運營商合作,運營商不會説明虛假資訊,怎麼樣判別? 比如說亞信,可以非常方便地知道這是機器人,老是在播放,這是亞信和運營商知道的,機器人他不斷地刷COOKIE,它是類比的手段。

剛剛講到異常資料甄別六大維度,我們看到運營商裡面很多,我們作弊的時候最大的作弊就是機器人,被機器控制的人,或者叫機器人,運營商本身做安全的時候已經有了一定的模型。 還有整個廣告的行業更乾淨,讓廣告主願意花更多的錢,同時為他產生更多的價值。

剛剛我們講的都是一些冷冰冰的數位,我們發現更多的是實現價值,廣告第一個是不是能夠看到? 在什麼樣的環境下被看到,視頻廣告跟普通原來我們看到橫幅的廣告最大的區別是什麼? 你會發現視頻在空間上幾乎獨佔,但是時間15秒,然後原來的小的按紐廣告在空間不是獨佔,但是在時間上永遠是獨佔。 所以這兩種得到的結果可能空間是存在的,但是效果完全不一樣。

還有提到了副媒體。 還有音訊廣告,最近有很多的APP開始搶到了耳朵了,眼睛已經搶了,所以一些聽音樂的軟體開始做了,像司馬拉雅,FM,他們也是開始做廣告的方式,包括今天早上看到的新聞Google已經在美國把戶外的液晶屏成功可以即時定價進行投放 ,當然它會參照很多的參數比如說地理位置,人流量,以及周邊的廣告交互情況定不同的情況。

最最傳統微觀的就是調研,調研是什麼,我們拿樣本去統計,做統計指標來映射,這個我覺得是比較有趣的東西。 怎麼樣建立更好的樣本,我們講樣本最大的問題還是甄別真和假。 我們認為運營商的資料天然的有人和資料,人和的分佈,甚至是套餐使用方式,消費者的簡單統計可以做簡單的消費行為,當然簡單統計之後要處理敏感性資料。 我們過去怎麼得到這個人的收入的,現在你還用問嗎,運營商發現每個月20號發短信工資已發18500,運營商完全可以知道,但是他不知道是誰。 過去說你有每年看過這樣的廣告? 這個時候有一個悖論,這次看廣告是不算看廣告呢? 只有通過真實的監測資料,我們為廣告提供看過多少次,在哪個媒體看,看的是哪個形式,通過這樣的採集過程中,我們採集了200萬的樣本庫,接下來我們會跟運營商做得更準確,覆蓋更廣,因為現在手機有9個月到12個月的換機週期, 我們通過匿名方法把它關聯起來提供一些樣本的持久度。

這個是我們實際在我們這個行業裡面給廣告主做的品牌價值的指標,這些指標其實通過調研的方法計算出來的,當調研樣本比較大的時候它其實就是一個比較大的資料量的統計了,我們有一個資料庫有一個分支是幾萬個樣本庫, 那個樣本庫差不多有十幾萬份,那個東西也是非常龐大的,我們看到它是非常款的一張表,分析起來需要一些工作。

這個是所有媒體對比的即時的案例。 時間關係我就不講了。

我們回到社交化,移動化,這裡面有幾個東西跟運營商非常有關系,運營商也都在做的,WIFI,移動,電信聯通都在做的WIFI接入,最近央視又報導不要介WIFI,可能資訊會被偷盜。 但是用了wifi它是個閘道,隱私都可以提取到。 然後我們可以通過一個特定的管道代碼優惠券到使用優惠券的轉化率,這個是不是夠準確。 同樣我們設了兩個條件,針對平時消費運動品的同學去賣隱性眼鏡和平時去火鍋的隱性眼鏡,通過短信發出去的優惠券和刷卡發出去的優惠券不一樣。 這是直觀的轉化通路。 同樣我們廣告在過去很硬,現在慢慢軟化,過去說APPG內制虛擬道具,比如說某某可樂的運動表情,會搭配運動產品讓使用者使用,目的就是積累使用者的行為,我可以針對你使用者的使用記錄,剛剛我們看到使用者的畫像。 所以同樣運營商我相信可以做很多這樣的事情。

剛剛我們講的是一些實際應用場景,我們的方法論。 其實我這裡不太想提的大家非常熟悉的東西,比如HADOOP,比如資料關聯分析,資料建模,資料採礦。 你看這裡面提的東西都是分析,你會發現內部輿情很重要,我們跟內部有一個共識就是廣告費是一個數位,但是它前面是一個符號,正還是負很重要,如果你最近都是負面,大家看到廣告結果,這就是被某個電視臺曝過光的品牌。 所以我們花了很多力氣去做了這樣一個實驗室,專門做輿情分析,分幾個部分,誰在哪個場合說了什麼樣的話跟哪個品牌有關系,表示怎麼樣。 我們新浪微博是我們最大的合作夥伴。 爬完輿情之後做情感分析,情感分析我們鑒定規則引擎,能夠快速定論調主題。 過去怎麼做情感分析,比如某某物件很好,但是另一個牌子就有點差了,請問這句話過去情感判斷判斷出來什麼? 中性,因為有一個好字有一個差字,但是我們的引擎裡面兩個品牌,A品牌好,B品牌差,所以它要被拆解開,因為我們做跟傳統相關的內容。 同樣一條好的消息或者是一條壞的消息,怎麼樣被轉發的,轉發到了多少人,它是不是覆蓋到你的粉絲。 最後你可以統計出一個你是好事傳千里還是壞事傳千里,這個取決於你最後是正還是負。 大家都知道可樂,兩年多都是在可樂瓶上打標籤,可樂這兩年瓶子是我們做的,我們把粉絲挑出300個熱詞,喜歡什麼樣的歌,喜歡什麼樣的自稱,他們把30個比較高大上的正面的詞,然後大家可以超市里面購買小清新的可樂瓶。 然後他們給王力宏送了一箱可樂,王力宏自發地收到一瓶可樂,然後稱為我的歌聲王力宏,我用一箱可樂的成本換了幾十萬次的轉發成功。 也就是我們講行銷不僅僅是廣告,很有趣,但是你要依靠資料。

這個當然是回到了最後我們講的PRE的引擎,我們講到了行銷是廣告,還有一個O字,廣告主有自己的陣地,自己的網站,自己的商店,這些廣告主都是自己的OD,這些OD本身沒有什麼流量,我們需要賺流量,剛剛講的社交, 有多少人願意分享你,有多少人願意曬單,它其實願意跟你的官方網站帶流,當然這裡面可以唯一打標識。 PC互聯網COOKIE是很好的標識,運營商將來的ID是不是可以成為運營商的數位識別碼。 如果一個家庭有多個上網帳號,多個上網帳號,你可以知道這個家庭是可以跟哪個手機綁定。 通過這個標識可以在任何環境下面找到定向,因為通過標識可以分析他行為的大概畫像。 行為畫像是有很多很多側面,比如說這個是HQ1,回到講人的側面,很多資料來源都能夠畫出一個人的側面,但是怎麼畫出一個更全的側面? 這是我們今天和運營商討論的層面。 我們怎麼把這些側面融合起來,廣告主自己也有一部分,因為你有可能買了廣告主的東西。 我們把只有這些全部融合起來,能夠在對的時間,在對的場合,找到對的人說對的話。 最近雙11淘寶的話,會發現你搜索的東西還沒買的話,會在微博和其他場合到處看到淘寶關於這部分的廣告。 那時候你會覺得淘寶怎麼還聰明,後來多了你可能會反感。 這時候你會發現如果我們能夠把這些標籤全部打成ID之後,有這麼多的廣告形式,可能都跟你的需求有關系,這個時候當然有的人很害怕,我沒有隱私了,我的世界被探知了,但是你有的時候又覺得我的生活很便利,我出去的時候可能要叫車吧, 這個時候會覺得有個社會小助手不斷的在提醒你。

當然這個是我們廣告主怎麼樣跟電視和互聯網跨起來,未來數位化是更好的跨,當然有曲線模型和資料模型,也是基於我們很多經驗挖掘,做到很好的整合。 今年我們做了非常有趣的模型,叫做贊助模型。 我們通過這個評估大資料的建模方法,讓贊助的東西也變得更加精准,可以被評估。

所以最後我們回到說整合行銷,我們講生態鏈裡面你會發現一個詞其實很重要,剛剛我提到的,對的時間,對的地點,找對的人,說對的話。 任何一個操作都是准的,同樣你還能預估,我應該花多少錢,買什麼樣的媒體,我在電商網站怎麼樣備貨,我產品應該怎麼樣設計,我針對不同的人群開發新的產品。

這是我們講的雙閉環的結果,這是廣告主,你會發現大家都在這個雙閉環結構中發展。 一開始你發展這個產品,你需要推廣這個產品,這些都是靠資料的力量來幫你提供資料決策,然後在集成過程中會幫你做二次傳播,你在網路管道銷售,或者線上下銷售,這個評論回饋到網上,這兒評論可以重新設計下一代產品, 下一代產品可以同時做推廣,再回饋,再做資料模型。 如果這個環做好,就會發現這個產品不斷的做下去,這個產品不會死,因為不斷的有人在裡面把它做更好的正向下去。 今天我就說到這兒,待會兒我們有圓桌,會討論更多實際的東西。 謝謝大家!

(責任編輯:mengyishan)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.