編者:2012年底問世的《大資料時代:生活、工作與思維的大變革》,以一個帶有預見性的新概念,引起全球熱議,至今仍居各大圖書排行榜前位,作者維克托·邁爾—舍恩伯格也因之被譽為「大資料時代的預言家」。 輿論認為,「大資料」顛覆了千百年來人類的思維慣例,對人類的認知和與世界的交流方式提出了全新的挑戰。 同時,因「大資料」理論引發的激辯和質疑也絡繹不絕......
近日,美國兩本著名學術雜誌同時關注大資料話題:《外交》雜誌5/6月刊將《大資料的興起》一文作為封面文章,認為大資料將改變人類思考和看待世界的方式。 而《外交政策》雜誌則在網站上發表微軟研究院首席研究員、麻省理工學院公民媒體中心客座教授凱特·克勞福德的文章《對大資料的再思考》,從五個方面對大資料理論提出質疑。
大資料帶來變革
《大資料的興起》一文作者是近 期 引 發 熱 議 的 專 著 《 大 數 據 時代:生活、工作與思維的大變革》作者肯尼士·庫克耶和維克托·邁爾—舍恩伯格。 在文章中,庫克耶和舍恩伯格肯定了大資料對社會的巨大變革能力,稱大資料不僅將改變人們的生活和工作,而且將改變人類認識和思考世界的方式。
兩人認為,隨著技術環境的變化,一方面世界出現「資料爆炸」的現象,另一方面人類處理資料的能力也大為增強。 由此,人們對待數 據 的 方 式 出 現 了 三 個 變 化 : 第一,人們處理的資料從樣本資料變成全部資料;第二,由於是全樣本資料,人們不得不接受資料的混雜性 , 而 放 棄 對 精 確 性 的 追 求 ; 第三,人類通過對大資料的處理,放棄 對因果關係的渴求,轉而關注相互聯繫。 這一切代表著人類告別總是試圖瞭解世界運轉方式背後深層原因的態度,而走向僅僅需要弄清現象之間的聯繫以及利用這些資訊來解決問題。
《大資料的興起》列舉了大資料 在 醫 學 、 消 費 品 領 域 的 應 用 實例。 但作者同時認為,大資料的影響力絕不僅限於商業範疇,它將深遠地改變政府的運作方式和政治的性質。 他們在文章中寫道,「在推動經濟增長、提供公共服務或進行戰爭等方面,那些能夠有效利用大資料的人將擁有勝過別人的巨大優勢」。 不過,兩位作者承認,大資料應用在公共服務領域比較成功的案例出現在城市這一級,因為在這個級別上獲取資料和利用資訊進行試驗要容易一些。
學者提出五質疑
克勞福德的文章認為,大資料是當前的時髦術語,但人們是否能依靠海量資料揭示人類行為的規律仍值得懷疑。 她針對大資料理論從五個方面提出質疑。
第一,大資料中存在偏見和盲區。 大資料的宣導者認為,「有了足 夠 的 數 據 , 數 字 就 可 以 自 己 說話」。 但克勞福德認為,數位無法自己說話。 不論其規模有多大,資料集歸根到底是人類設計的產物,而大資料的工具並不能使人們擺脫曲解、隔閡和錯誤的成見。 當大資料試圖反映人類所生活的社會化世界時,認清這些因素就尤為重要。 偏見和盲區存在於大資料中,從大資料得出的結論並不比人為的意見更客觀。
第二,大資料在一定程度上可以使城市變得更加智慧和高效,但具體效果如何取決於市政官員對資料 及 其 局 限 性 的 了 解 。 克 勞 福 德稱,大資料的宣導者認為,「大資料將使我們的城市變得更加智慧和高效」,在一定程度上確實如此。 但另一方面,資料在生成或採集的過程中並不都是平等的,大資料集存在「信號問題」即某些民眾和社區被忽略或未得到充分代表。 因此,要想運用好大資料,市政官員必須對資料及其局限性有充分瞭解。
第 三 , 大 數 據 可 能 導 致 基 于群 體 的 歧 視 。 大 數 據 的 倡 導 者 認為 , 「 大 數 據 對 不 同 的 社 會 群 體不 會 厚 此 薄 彼 」 , 其 理 由 是 , 原始 數 據 的 分 析 是 在 大 規 模 水 平 上進 行 的 , 因 而 避 免 了 基 于 群 體 的歧 視 。 但 克 勞 福 德 認 為 , 實 際 情況 並 非 如 此 。 由 于 大 數 據 能 夠 作出 有 關 群 體 不 同 行 為 方 式 的 論斷 , 而 且 其 使 用 的 主 要 目 的 是 把不 同 個 體 歸 入 不 同 的 群 體 中 , 因此大資料不僅不會避免群體歧視,還可能加重這一趨勢。
第四,隱私洩露是大資料應用中的重要問題。 克勞福德認為,大資料的宣導者關於「大資料是匿名的,因此它不會侵犯我們的隱私」一說大錯特錯。 儘管許多大資料的提 供 者 盡 力 消 除 數 據 中 的 個 體 身份,但身份重新被確認的風險仍然很大。 鑒於利用大量公共資料集可以推斷很多資訊,這使洩露個人隱私成為「日益嚴重的擔憂」。
第五,大資料為科學研究提供了新的途徑,但不可斷言「大資料是科學的未來」。 克勞福德稱,大資料的研究方法只能統計某件事情發生的頻率和相關性,但不能得出因果關係。 將大資料策略和小資料研究相結合也許是更好的科學研究途徑。
庫克耶和舍恩伯格也認識到了大 數 據 理 論 的 一 些 內 在 瑕 疵 。 在《大資料的興起》一文結尾,兩位作者表示,大資料是一種資源和工具 , 它 的 目 的 是 告 知 , 而 不 是 解釋;它意在促進理解,但可能導致誤解關鍵在於人們對它的掌握程度。 他們認為,人們必須用一種不僅欣賞其力量、而且承認其局限的態度來接納大資料。
(盧朵寶)
(責任編輯:蒙遺善)