第85屆奧斯卡金像獎頒獎晚會將于美國當地時間2月24日舉行,奧斯卡小金人最終將花落誰家? 近日,由微軟研究院的David Rothschild通過對奧斯卡入圍影片相關資料分析,預測出本屆奧斯卡各項大獎的最終歸屬。
大家可以在David Rothschild的博客上看到他的最新預測結果。 作為預測努力的一部分,David Rothschild與微軟團隊合作開發了一款Excel應用——Oscars Ballot Predictor(奧斯卡投票預測器),該應用為所有24個類別的奧斯卡得獎獎項提供即時預測。
David Rothschild所提供的一些獲獎概率資訊:
最佳影片獎:《逃離德黑蘭》(Argo),獲獎可能性93.9%。
最佳導演獎:斯蒂芬·斯皮爾伯格(Steven Spielberg)(影片《林肯》),獲獎可能性83.7%。
最佳男演員獎:丹尼爾·戴-路易斯(Daniel Day-Lewis)(影片《林肯》),獲獎可能性99%。
最佳女演員獎:詹妮弗·勞倫斯(Jennifer Lawrence)(影片《烏雲背後的幸福線》)(Silver Linings Playbook),獲獎可能性70.7%。
當然,這些資料只是初步預測,David Rothschild說:「我對今年部分獎項的預測很有把握,但預測並非100%,期待奧斯卡頒獎晚會上的最終結果。 」
《林肯》獲最佳導演和最佳男主的概率分別是83.7%和99%
詹妮弗·勞倫斯憑《烏雲背後的幸福線》獲影后的概率為70.7%
去年,David Rothschild就曾使用一個通用的資料驅動型模型,正確預測了美國50個州和哥倫比亞特區共計51個行政區中50個行政區的總統大選結果,其預測準確性高於98%。
David Rothschild表示:「我預測奧斯卡金像獎得主的方法與預測其它事情的方法完全相同,其中包括政治。 首先關注最有效的資料,然後創建不受任何特別年份結果乾擾的統計模型,所有模型都根據歷史資料進行測試、校正,我們在建模時很有耐心,確保模型能夠正確預測外樣本結果,而不僅僅是過去發生的結果。 我們創建的模型是用來預測未來的,而不是預測過去的。 」他指出:「科學是相同的,但證明哪些資料最有用卻存在千差萬別。 」
你或許會認為一個能夠攻克選票近1.27億張變化莫測總統大選的預測模型也一定能夠在預測不太複雜的事件中輕鬆獲勝,如奧斯卡投票,其投票成員不足6000人,但美國總統大選與奧斯卡投票採用的資料大相徑庭。
David Rothschild透露:「我通常關注四個不同類型的資料:投票資料、預測市場資料、基本資料和使用者產生的資料。 在預測政治時,我採用基礎資料如過去的選舉結果、義務和經濟風向標。 通過基礎資料建立一個基準,然後轉向預測市場資料和投票資料,因為這兩個類型的資料吸收並包含了更多選舉資訊。 2012年總統大選預測時,我使用了少量使用者產生的資料,但Xbox Live資料對補充重大事件即時分析起了關鍵作用。 」
「預測奧斯卡金像獎花落誰家時不需要投票資料,基本票房回報和電影評級資料也不統計在內。 我更關注的是預測市場資料,這是主要因素,同時採用部分使用者產生的資料,這有助於理解電影內部和不同類別之間的相關度,例如影片《林肯》會贏得多少個獎項? 」David Rothschild說。
David Rothschild強調:「每當我關注一個新領域,我都會認真考慮一些關鍵事情,確保自己的預測更有意義。 」首先,我會確定最中肯的預測。 至於奧斯卡金像獎得主預測,我關注的是所有24個類別的獲勝概率,並會預測各個類別主流電影的總獎項。 其次,我的所有預測結果會即時更新。 從研究觀點看,即時更新預測結果至關重要,我們能夠獲悉最初預測與最終事件之間發生的不同事件的價值。 這些事件就是奧斯卡獎項歸屬的前奏。 最後,我借助特定領域的歷史資料建模,然後通過不斷升級模型確保預測的準確度。 我還想強調的是,我們所做的一切都是為了盡可能保證領域獨立性,確保所有問題的可衡量性。 如果該研究能夠催生出更高效的預測方法、在眾多領域適用于大量問題,對學術界和這個世界都有價值。 」
(責任編輯:施柏鵬)