科學界也有像Elon Musk那樣玩嘛嘛酷的偶像派人物?當然有,除了美國總統奧巴馬想跟他「玩」以外,恐怕未來每屆的總統候選人也都想跟他「玩」,他就是美國當前政治圈裡的超級新星Nate Silver,號稱為美國公眾眼裡完美的「 預言帝」,他的「預言」被稱為競選預測之神諭。
這哥們曾單槍匹馬打敗了所有時政記者、政黨媒體顧問以及政治評論員,讓研究數位的書呆子們好好風光了一把,美國人也因此說奧巴馬的勝利也是統計學家的勝利。 讓我們把時間追溯回2012年美國總統大選時,當時奧巴馬和羅姆尼選情普遍認為很接近,評論員們都無法預計哪方會獲勝,Silver卻計算出「真實」情況指出二者並非處於旗鼓相當的局面,在投票當天他成功預測奧巴馬將有90.9% 機會獲得大多數選票,最後他對美國50個州投票結果的預測全對了。 事實上,2008年的總統大選他也預測對了最終結果,美國50個州的投票結果他預測對了49個。
Silver的選情分析被極度精妙的美國政治評論圈認為是達到了前所未有的水準,但因為他所使用的是被學界稱為「巫術統計」的貝葉斯理論,所以也招惹來頻率學派和一些保守的統計科學家們質疑,還有一些來自政黨和媒體們的指責, 因為Silver的預測就像是軍事級別而且是精確到個人的傾向式報導,接下來的每一次大選,整個政治圈和媒體圈只能「坐以待斃」。
「大資料是非常重要的工具,而不是一個遊戲」
在美國,做選情預測的統計員不計其數,之所以Silver能夠一戰成名成為美國資料超人,皆因他在大選的節骨眼上一個人證明瞭大多數時政評論員是「無用」,同時他在紐約時報網站的博客讓眾多企業看到了大資料應用的真實性和大資料視覺化 、行業化的希望。
Silve在2008年大選結束之後,很快就出版了他的處女作《信號與雜音:預測學的藝術與科學》,牛津大學資料專家維克多·邁耶曾對這本書稱讚道,大資料革命將改變我們的生活、工作和思維模式, 我們不必擔心資料對我們自身有多大的相關性,大資料會讓我們看清楚「假說」意義,未來它將會成為影響我們決策的重要因素,因為它重塑了我們眼前的世界。
事實上,Silver也開始擔心:他的聲望將會影響往後的選情,也將失去旁觀者清優勢。 他並不希望人們視他為科學界「占卜的巫師」,不希望人們因此迷信這些預測,「預測是一門嚴謹科學,不是一種遊戲,我們要用來衡量我們主觀現實是否能與客觀世界吻合。 」
從大資料實用性來看,大資料可以幫我們解決如災害預告、財務預告等實際問題,但Silver也指出,資料是有陷阱的,人們經常對資料產生虛有的危險幻想。 「概率性思考還是絕對性思考在預測中有著截然相反的導向,如果不能做到誠實地看待資料,預測有可能變成災難,忽略事物的不確定性往往會導致嚴重後果。 」
Silver舉例分析,1997年時美國國家氣象局預測,大福克斯的洪水水位是49英尺,鎮上的防洪堤限定為承受51英尺的洪水,並未將通過歷史資料的正負9英尺誤差算進去,結果洪水達到了54英尺,大福克斯遭遇了特大洪水災難。 日本福島核反應爐是另外一個活生生的樣本, 過去45年間福島最大的地震記錄是裡氏規模8.0級,日本地震研究人員參考這個資料後,他們預測該地區不會超過裡氏9.0級的地震規模,然後按8.5級的防震標準來建造核反應爐,而事實上福島在過去更早的時間曾發生過9級地震,但這種情況被認為排除了,這個 預測最終為日本乃至全球帶了歷史性的災難。
「資料本身是不能為自己代言的,我們經常是帶著偏差的思想、個人興趣的情況開展資料分析,我們必須知道在你所接收到資訊和你知道的資訊之間是存在巨大鴻溝的。 」Silve同時指出,是否看到自己弱點也對分析資料有較大的影響,因為明白自己弱點人反而會採取一定辦法來抵消它的作用。
相比而言,他認為從民眾調查得回來的建模資料更可靠,因為沒有經過媒體的渲染,直接到達他手中民意資訊更真實,民眾是不可能持續性地高度關注政治動態的。 因而,他在做選情分析時儘量回避和兩邊的競選團隊打交道,因為這些資訊大部分是干擾的雜音,大多數政治觀察家往往容易掉進候選人形形式式的辯論和拉票情況
「如果你想成功,可尋找和大資料相關、競爭性較小的領域。 」
今年三十五歲Nate Silver,既沒有從哈佛耶魯大學輟學的經歷,也沒有從實驗室建造改寫歷史記錄數學模型的成績,甚至可以說在美國大街上隨手抓一個都有可能都比他優秀。
從芝加哥大學獲得經濟學學位後,他去了畢馬威擔任顧問,那四年時間後來成為了他人生中最後悔的四年時間,後來他開始沉迷于網路撲克,但從網友手中贏得的錢足夠能讓他辭掉工作靠玩撲克為生。 他六歲的時候,家鄉的棒球隊底特律猛虎贏得了美國職業棒球全國錦標賽的冠軍,也是在那個時候Nate Silver開始接觸並愛上了各種棒球統計資料。 在他轉向政治資料預測之前,他是一名棒球選手成績的預測高手。
棒球燃點了Silver對資料的熱情,而Silver燃點了全球對大資料的追逐的激情,企業家們相信 「雲端化」、或是「遊戲化」必將引領時代的潮流,股民投資者們也希望大資料能為他們指點迷津,研究人員希望建立更科學更見效的模型......
「我的書可以告訴計程車司機如何工作和選擇客人,也能給網路婚介網站一點經營建議。 但多數情況下,我們是無法處理龐雜無序的資料,擁有更多的資訊並不意味著我們能更好地預測,也就是說我們並不能夠對所有東西進行很精准的預測。 」Silver指出,事實上人們是可以非常擅長預測天氣這類事物的,但特別不擅長預測股票價格,而恐怖襲擊則是我們可以預測但卻容易忽視了的事物。
Silver的回應估計讓不少人失望了,他建議初創公司不妨先嘗試進入一些競爭性較小的領域。 「企業可以探索一些還沒有人涉足的領域,如果企業在這些領域擁有有效的資料,並可以提供相應的分析手段,那麼可能會更容易獲得成功。 」
事實上,sillver也是這樣做的,他是少數最早發現棒球潛在的資料導向的人,他發現棒球比賽和總統大選都不是競爭激烈的領域,接著他用從網路博彩中贏回來的四十萬美元創建了一個建模分析網站, 專門用來預測MLB棒球運動員職業前景的,後來他把這網站賣給了Baseball Prospectus。
「技巧和運氣間存在著微妙而又模糊的關聯。 贏錢的時候是因為牌技好還是運氣好?你永遠也不知道。 」Silver指出,尋找那些可用的資料、但卻從沒有人拿這些資料進行過分析的領域,競爭更小才更容易成功,企業所有的收益,或者說所有的競爭優勢,都是來自于邊際收益。
看到這裡,如果你非常羡慕Silver擁有這種超人能力,那不得不告訴你,不排除正是他的同性戀傾向才讓他有了這般神通廣大的「預測」能力,「我總覺得自己是個局外人,我總是有不合群的觀點。 如果你從小就是同性戀,又或者你成長在一個相信不可知論但又篤信宗教的家庭,那你和一樣,你也不願意相信社會的主流信念。 」
(責任編輯:蒙遺善)