數學模型
如果你已經聽過這個笑話,儘管打斷我:有三位統計學家去獵兔。 他們發現了一隻兔子。 第一位統計學家率先開槍,離兔子的頭差了一英尺。 第二位統計學家開槍射擊,離兔子的尾巴差了一英尺。 第三位統計學家大喊道:「我們逮住它了! 」
就算你並不覺得這個笑話有多麼好笑,但你卻很可能跟類似于它所描述的獵兔者的管理人員一起工作過。 他們的數學水準或許無可挑剔,但可悲的是,他們在真實世界的成果毫無價值。 謊言,該死的謊言。 各大組織到底必須掌握什麼東西,才能提高其數量分析專家產生真實價值(而不是統計幻象)的幾率? 不懂數學的高管們怎樣才能確保他們不會受到「大資料」(Big Data)的蒙蔽?
我們或許可以在撒母耳-阿貝斯曼的著作《事實的半衰期》(The Half-Life of Facts)和內特-希爾的著作《信號與噪音》(The Signal and The Noise)中找到這些問題的精彩答案。 這兩部既相互獨立、又互為補充的著作深入探索了「資料」如何變為「證據」,這麼多看似高深莫測的數學模型為什麼根本無法區分這兩種事物等問題。 這兩本書接受、並進一步擴展了納西姆-塔勒布備受歡迎並富於洞見的著作《被隨機現象蒙蔽》(Fooled By Randomness)和《黑天鵝》(The Black Swan),以及諾貝爾獎得主丹尼爾-卡尼曼的卓越作品《思考,快與慢 》(Thinking, Fast and Slow)所闡述的不確定性和數量的自我欺騙等主題。 如同其先驅一樣,阿貝斯曼和希爾也寫出了不僅妙趣橫生、而且具備可操作性的作品。
兩位作者都引用了馬克-吐溫、威爾-羅傑斯和查理斯-凱特林等人頗具嘲諷意味的妙語:「引領我們進入困局的並不是我們不知道的事物,而是我們知道、但不那麼真實的事物。 」兩人都探討了用以區分「真實」知識和「不那麼真實的」知識的媒介和機制。 阿貝斯曼和希爾都言之鑿鑿地聲稱,目前佔據上風的是「不那麼真實的」知識。 處理的資料越多,受到的關注也就越多。
應用數學家、哈佛大學數量社會科學研究所(Harvard's Institute for Quantitative Social Science)研究員阿貝斯曼解構了「事實」的定義。 對讀者頗為仁慈的一點是,他並沒有跌入後現代主義哲學的泥沼。 相反,他深入探索了嚴肅的科學家如何確定他們自認為瞭解、與其正在研究的事物相關的事實。 這種「科學計量」方式——科學如何衡量其過程和進步的科學——在確定科學家所稱的「事實」的生命週期和生態系統方面非常有説明。 通過這種方式,阿貝斯曼提出了一些有趣的問題,比如:「事實」是如何誕生的? 它們通常如何複製、變異和進化? 它們將在多久之後消逝?
病理缺陷
阿貝斯曼頗具挑釁性的核心觀點是,有一個由事實組成的虛擬物理現象。 「事實」遵從既定的規律和軌跡,這取決於它們的界定和衡量方式。 「我們每天讀新聞時,可能都要面對一個關於我們的世界,與我們自認為瞭解的狀況完全不同的事實,」他寫道。 「但事實證明,這些日新月異的變化,雖然在我們看來它們發生了真實的相變,但並不意外,也不是隨機的。 通過應用概率,我們可以理解它們的總體行為方式,但我們也可以通過搜索我們對其認識的速度更慢、有規律的變化,來預測這些變化。 事實的快速變化,如同我們看到的其他任何事物一樣,有其自身的規則,是可衡量、可預測的。 」
「可衡量」、「可預測」是什麼意思? 阿貝斯曼非常擅長描述機構、個人和概率的偏差,這種偏差可以扭曲科學和科學家評估、發佈以及消滅「事實」的方式。
「這方面最明顯的例子出現在負面結果領域,」阿貝斯曼這樣寫道。 他援引了進化生物學家約翰-梅納德-史密斯曾經說過的一段話:「統計學是一門讓你每年進行20次試驗,然後在《自然》雜誌(Nature)發佈一個錯誤結果的科學。 然而,要是20位獨立的科學家分別進行同一項試驗,其中的19位將以失敗告終,其職業生涯自然也就無法更進一步。 這種情形當然令人苦惱,但這就是科學的運行方式。 大多數想法和實驗都是不成功的。 但最重要的是,失敗的結果也很少公佈。 」
問題的關鍵並非統計科學或科學的統計學存在病理缺陷,而是這種已知的病理缺陷可以創造出動機,讓我們重新思考、修改並重新設計我們衡量和測試的事物。 我們需要「事實」説明我們更新我們對於「事實」的思考和理解。 科學——以及為其提供驅動和支援的日益數位化的技術——為難以理解自身不斷增長的海量資料、無法為這些資料增添價值的企業提供了一個強大的模型。
就這方面而言,《事實的半衰期》是一部入門讀本,闡述的是認識論的流行病學,即對於知識和認知性質的理解在一門學科、一種職業或文化中如何傳播的過程。 阿貝斯曼的工作將敦促世界各地的決策者重新思考一個問題,他們的組織如何將有趣的資料轉化為有用的事實。
統計資料驅動
統計學家、《紐約時報》(The New York Times)網站 FiveThirtyEight博客撰稿人內特-希爾則採用了一種完全不同,但又與阿貝斯曼相互相容的方式探討知識、事實和可預見性等問題。 通過有些過於繁多的詳細例證和插曲,希爾的這部著作就預測的傲慢發出了一組發人深省的警告。 希爾這樣寫道:「這本書講述的與其說是我們知道的事物,倒不如說是我們知道的事物與我們認為我們知道的事物之間的差異。 」
從天氣、地震、全球變暖、足球,到次級抵押貸款和全球金融危機,希爾解釋了建模者和預報者為什麼難以將昨天的資料轉化為明天「你可以賭一把」的預測。 這些微觀案例研究雖然肯定是膚淺的,但並沒有回避數學,而且對大多數最重要的假設採取了一以貫之的公正態度。 要是本書編輯更優秀一些的話,他或許將督促希爾犧牲數量,撰寫更多的深刻見解,但這些例證的廣度無可否認地揭示了「預測的病理學」。
阿貝斯曼的分析單位是事實,希爾則聚焦于「預測的有效性」。 希爾擁有良好的風度和自我認知,他承認人性的弱點是一種設計約束。 「但我認為,我們的信念永遠不能達到完美的客觀性,合理性和準確性,」希爾寫道。 「相反,我們可以力爭少一點主觀性、少一點不合理性、少犯一點錯誤。 根據我們的信念作出預測,是進行自我測試的最佳(或許也是唯一的)方式。 如果客觀性關係到一個更大的超越我們自身條件的真理,那麼預測就是審視我們個人看法與那個更大真理之間的聯繫究竟有多麼密切的最佳方式,最客觀的往往是那些做出最準確預測的人。 」
然而,我想知道的是,希爾是否充分意識到,他將警示故事與令人震驚的失敗混合在一起的做法,可能會對將其報導銘記于心的讀者產生累積效應。 他提供了一個又一個例子來說明,帶有缺陷和偏見的人,使用帶有缺陷和偏見的方式,構建出帶有缺陷和偏見的模型。 他非常出色地反復闡述了「過度學習的」統計模型。 希爾解釋稱,為了適應資料,統計學家們竭力調試自己的模型,最終往往大大降低了這些模型的準確性,進而無法用其進行可靠的預測。
希爾的故事為現在的預測模型構建者提供了一個公平的樣本。 就這一點而言,這本書預測稱,未來的新世界將充斥著許多由統計資料驅動的成功案例,既不快樂,也不勇敢。 在這個世界中,平均表現距離世界級水準或許相差好幾個標準差。
希爾引用了菲利浦-泰洛克對專家意見所進行的經典研究。 這項研究顯示,數量多得令人不安的專業領域的「專家」在預測可能結果方面的表現往往差得離譜。 此外,專家們往往對其預測的品質過度自信,簡言之,專家意見時常獲得兩個世界的最差結果:以妄自尊大的態度給出了錯誤答案。 這不是成功的秘訣。
從IBM的超級電腦Watson,谷歌(Google)的搜索演算法,到亞馬遜網站(Amazon)的推薦引擎,資料驅動的計算系統無疑能夠獲得非凡的成功,特別是當它們專注于現實生活測試,而不是抽象理論的時候。 「真正‘懂得’大資料的公司,比如谷歌,並沒有將大量時間花在構建模型上,」希爾寫道。 「這些公司每年從事數十萬次實驗,在真實的顧客身上測試自己的想法。 」
然而,讀完這兩部著作,我們可以得出一個頗具諷刺意味的結論:一個人獲得的資料和事實越多,預測就越有意義,人的判斷也就顯得愈發重要。 人類、資料集和演算法的協同進化將最終決定「大資料」究竟是會創造新財富,還是會摧毀舊價值。
(責任編輯:蒙遺善)