大資料預測世界盃不准

來源:互聯網
上載者:User
關鍵字 大資料 世界盃

人類一思考,上帝就發笑;世界盃一來到,上帝笑得血壓也升高。 倒不是足球踢得多歡樂,而是世界盃預測太惡搞。

我略微總結了下,剔除掉貝利和大校這種聲名卓著的反向指標,煞有介事的世界盃預測大致可以分為五類:一是實力決定論,以高盛和德銀等投行為代表,將HTTP://www.aliyun.com/zixun/aggregation/ 19351.html">FIFA排名、過往戰績、近期表現、球員身價、賭球賠率、國家經濟等一系列資料綜合反映出的球隊實力作為預測依據,用計量模型計算出看上去精確至極的概率,只不過,計算結果有較大差異,比如, 高盛預測巴西奪冠,德銀則更看好英格蘭。

二是條件決定論,以霍金教授為代表,將各種客觀條件對某一球隊的表現影響糅到一個獲勝公式裡,這些條件包括球場選擇、裁判國籍、球衣選擇、陣型選擇和交通工具選擇等,只不過,這種公式的預測有效時段很短,所以在決賽還離得遠的現在, 公式還預測不出最後的冠軍歸屬。

三是流言決定論,以雅虎和微軟Bing為代表,將以億為單位的網路噪音轉化為清晰的結果信號。 雖然這種互聯網魔術看上去既科學又玄妙,甚至可以從經濟學的「預期自我實現」理論加以解釋,但總讓人聯想到古時候無論中國還是西方,帝王對童謠和吟游詩人作品的格外關注。

四是宿命歸屬論,以一則關於1966年和3721.html">2014年的時空重疊熱帖為代表,1966年,歐冠冠軍是皇家馬德里,西甲冠軍是馬德里競技,西乙冠軍是拉科魯尼亞,意甲冠軍是尤文圖斯,皇家貝蒂斯降級西乙, 2014年無一例外都是如此。 「Yesterday once more」就剩世界盃了,1966年是英格蘭奪冠,按照宿命歸屬,2014年英格蘭也將問鼎。

五是動物先知論,以章魚保羅為代表,2008年保羅預測歐洲杯6場5勝,2010年保羅預測南非世界盃8場全勝,只不過,保羅沒能活到2014年巴西世界盃揭幕,於是,烏龜、大象、熊貓等動物先知又登上了預測舞臺,只不過, 保羅的輝煌再難複製。

當然,所有這些世界盃預測或多或少都有惡搞的成分,當不得真。 但稍微嚴肅一下,細緻分析這五種方法論,除了最後一種,剩下四種都用到了大資料,這恰是時下大資料熱的一種表現。 從世界盃預測看大資料熱,三個誤區值得警醒。

首先,大資料並不能解決所有問題。 大資料是很有用的,幾乎每一個環節,包括產品設計、市場定位、目標選擇、銷售策略和模式修正,都能靠大資料來解決問題,甚至連各種和商業無關的問題,也都能從大資料這裡得到説明。 但大資料並不是萬能的,大資料能解決的都是客觀問題,而不是主觀問題。 就拿世界盃預測來說,誰能奪冠取決於多種因素,各種預測方法論本質上並無區別,只不過它們對不同決定要素賦予的權重不盡相同。 也就是說,決定奪冠的要素是什麼,這是一個主觀問題,大資料只能說明客觀的狀態,無法對夾雜重要主觀判斷的問題直接給出解答。

其次,資料並不是越大越好。 資料分析早就存在,大資料火爆卻是最近的事情,其中的區別就在一個「大」字。 從道理上講,資料種類越多、序列越長,包含的資訊就越豐富。 但值得強調的是,資訊越豐富未必就越好,當下是一個資訊大爆炸的時代,資訊越多有的時候越不利於獲知。 而且更重要的是,像世界盃預測,明顯是一個核心資訊不突出的事情,所以資訊之間反而容易形成無邏輯的衝突,這恰是預測方法論眾多,誰都不靠譜的原因。 此外,資料越大,資料處理過程中的選擇就越多,而選擇總是難以回避道德風險問題,每一個大資料分析者,都得面對為特定目標而選擇的誘惑,「有選擇的選擇」往往是大資料反而模糊了真相的潛在原因。

最後,大資料搞不定薛定諤的貓。 在盒子打開前,薛定諤的貓既是活的,又是死的,只有打開盒子這一行為,才能導致狀態疊加的坍塌,不確定性才會消失。 也就是說,在世界盃真正開始前,32支球隊都是冠軍,又都不是冠軍,只有踢起來才能見真章。 大資料分析都是基於既成事實的,它更擅長於告訴我們,世界是怎樣,而不是世界應是怎樣和將會怎樣。 在不確定性面前,大資料是無力的,所以究其根本,大資料不是用來預測的。 大資料能帶給我們的,是知識,是獲知,而不是判斷,更不是武斷,而尊重不確定性,才是正確使用知識的一部分。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.