[天極網伺服器頻道專稿]巴西世界盃的熱潮已然退去,這四年一次的足球盛宴,除了每天熬夜看到綠茵場上揮汗如雨的球員,還能看到很多高科技技術,處在這樣一個資料爆發的時代,基於大資料的分析技術涉足體育界也已經不足為奇了。 無論是賽場上運動員的表現、教練的戰術佈置、裁判的執法,還是場內場外球迷的體驗,大資料都在扮演著舉足輕重的角色。
本屆世界盃,可以看到谷歌、百度、微軟等巨頭通過大資料分析賽果,讓彩民們「歡樂」了一把,德國隊奪冠背後的MatchInsight系統,讓對手們失落了一下,而讓筆者印象較為深刻的是這次的世界盃上,大資料和媒體的一次碰撞。
從騰訊的世界盃報導看社交大資料
大資料分析技術融合到媒體報導並不算是新鮮事了,在年初,央視就和百度合作報導了「春運」,以資料新聞的全新形式來體現。 在本次世界盃上,騰訊體育攜手IBM應用大資料分析等技術使得報導形式和內容都比以往獨特了許多。 除了「進球」、「裁判」、「冷門」等話題,球迷們還關注些什麼? 社交媒體讓塵世間的宅男腐女真假球迷有了賣萌腹黑的集聚地。 世界盃期間,在社交媒體,吐槽與段子齊飛,據統計,在世界盃近半的時候,微博上關於世界盃的討論量就已經接近了10億次。
曾幾何時,在媒體發展的軌跡中,有一個關鍵的指標是傳播的效率與準確性。 在資訊爆炸的時代,一篇報導的好壞不再僅僅取決於效率和準確性,而是能不能更懂使用者:使用者關心什麼,在做什麼,喜歡看什麼內容,以及背後代表的使用者取向。
以騰訊體育對2014世界盃的報導為例,與以往的體育比賽報導模式不同,騰訊在本屆世界盃比賽報導中利用了IBM社交大資料分析和雲計算技術,來針對社交網路上球迷關於世界盃的廣泛評論、觀點、聲音進行即時分析,並獲得對球迷關注話題 、球迷性格特點、球迷觀點的即時掌握,從而讓我們看到了與眾不同的「足球報導」,更加「接地氣」。
相關專案負責人在接受天極網採訪仲介紹,IBM與騰訊的合作是將所有的中國球迷在輿情上、在社交工具上的「聲音」進行匯總分析,得出即時的熱點,提供給騰訊,讓騰訊的編輯和記者作為自己報導一個全新的資訊來源和話題來源。
這些報導形式中讓筆者眼前一亮的是「球迷畫像」,利用IBM社交大資料分析並結合個人性格分析模型,不同球星的典型球迷可以被清晰的勾勒出來形成球迷畫像。 比如,喜歡梅西的人被勾畫的性格特徵是「敏感、玻璃心、有條理」,屬於宅男宅女型;內瑪律球迷的關鍵字則為「簡單、活潑、愛熱鬧」等等。
IBM中國研究院的蘇中博士在採訪中表示,性格分析模型以認知心理學作為一個理論基礎。 類似于心理測試,不同的是以往的心理測試的方法是需要一個訪談的問卷,給很多場景,通過和心理專家的溝通把性格判斷出來。 IBM研究院做了這方面的研究,把心理測試結果和他的社交分析資料進行對比,發現這之間是有聯繫的。 這也是為什麼在體育賽事的分析當中,對球迷做分析的原因。 所謂的球迷分析,以C羅為例,在社交媒體上把C羅的球迷篩選出來,跟足球相關的,跟足球無關的都抓下來,這樣就可以分析出球迷的典型性格特徵。
同時,在支援率的呈現和統計也和傳統不同,傳統調研基於樣本的資料,而通過IBM語義分析技術,系統可以對社交網路上的海量球迷的聲音進行分析,判定對於不同球隊和球星的態度,呈現即時支援率。
這其中應用到的技術比較複雜,蘇中表示,首先要進行實體分析,收集個人參與討論話題裡包含的隊伍、球員等元素,然後要進行深度的情感挖掘,也就是支援還是反對的判斷。 「很多時候我們做的一些技術,實際上希望能夠真的讓電腦理解人類的語言,理解人類的行為,從後面找到亮點和洞察。 」蘇中說,IBM社交大資料分析系統最大的特點是用到了很多基於機器學習的方法和自然語言分析的技術。 舉例來說,目前系統的深度情感挖掘不僅知道他喜不喜歡,而且還知道他為什麼喜歡。 同時,系統還能夠真的是像一個人一樣理解一篇文章裡面講到的一些線索,時間,地點人物事件,其對模糊語言有90%的正確判斷能力。
社交關系在過去一直被看作是資訊而存在,但很少被界定為數據,在國外,Facebook、Twitter嘗試了將社交資訊資料化,在國內,這方面的應用還鮮少看到,騰訊與IBM的這次合作,讓我們看到了一個良好的開始。
圖:IBM 社交大資料分析解決方案為企業提供社交環境下客戶全生命週期的支援
IBM大中華區全球諮詢服務部高級經理郭樹勇介紹說,除了媒體行業,IBM社交大資料解決方案在快銷、交通運輸等行業已經有了很多應用,可以説明企業瞭解客戶、瞭解消費者,從收集資訊開始,通過社交和大資料分析的方式, 進而説明企業制定精准化行銷策略,從而實現客戶的增長和信任。
大資料背後的雲計算
大資料處理往往都離不開雲計算,在騰訊與IBM的這次合作中,上文中筆者提到的語義分析、社交大資料解決方案, 其背後的支撐也需要雲計算來解決計算彈性的問題。
不久前,SoftLayer被引入到大名鼎鼎的沃森(Watson)中,在這個案例中,社交大資料解決方案被部署在SoftLayer在香港開設的雲計算平臺裡,並即時把分析結果推送到騰訊的世界盃網站上。 另外,系統也會將分析結果分享給騰訊的編輯人員,實現即時的話題把控。
圖:Softlayer全集成解決方案
據IBM GTS雲服務業務總監余忠甯介紹,這次世界盃合作中的訪問量是平常一般小的訪問量不能比擬的,比如說淩晨4點的比賽發現一些什麼需要擴展,系統會自動回應,快速部署這些資源,只有這樣才能滿足即時性的要求。 雲計算帶來的價值是如此:當你需要一些資源的時候可以很快速的反應出來,SoftLayer擁有公有雲本身的特性。
寫在最後
Big Data: A Revolution That Will Transform How We Live, Work, and Think
人們一直想找到如何能更準確認識這個世界的方法,從傳統的統計學到大資料分析運算,之前相當長的一段時間都在談在概念,卻很少能將其真正融入到商業、生活和乃至思維方式中。 從本質上說,媒體的存在就是為了解決資訊的不對稱。 然而,作為一名媒體工作者,筆者往往遇到一些窘境,我們用心製作的選題使用者端反映平平,實際上,單單依靠編輯記者經驗的判斷來洞察讀者的需求是存在問題的。 在本文裡,大資料分析工具來代替所謂的經驗,拉進了媒體和讀者之間的距離。 窺一斑而知全豹,在其他行業,大資料分析正在潛移默化的改變著遊戲規則。
網上商城商品/規格/促銷價格(作者:陳東方責任編輯:嘉文)