與傳統資料相比,大資料的資源性特徵尤為突出,成為各國重視開發大資料的依據。 在知識的演化過程中,資料既是產生資訊、知識、智慧的基礎,又同時貫穿于其中。 進入資訊化時代,遇到的最大難題不是資訊不足,而是資訊孤島的問題,只有實現大資料的共用和規範管理,才能破解這一難題。
曾幾何時,資料是人類用於識別環境的計數工具,對其精確性的關注似乎僅限於科學研究領域。 進入資訊化時代,我們每一個人都明顯感受到與資訊相關的資料無處不在。 可以說,我們自身在不斷產生各種資料的同時,資料也在極大地影響我們。
兩次資料革命融合資料與科學研究
在資料的發展歷程中有過兩次革命。 第一次資料革命是近代科學誕生之時,實現了資料與科學研究的融合,資料在科學研究中的基礎地位得到確立。 對研究過程和結果賦予精確化的訴求,是近代科學的基本特徵之一。 在以資料為依據的研究范式中,資料的可靠性和準確性代表了研究的精確性,人們甚至將以資料為依據的實證研究作為判斷「科學」與「偽科學」的標準。
隨著科學和技術的發展,資料的形式和內涵也在不斷變化和發展。 除觀測資料、實驗資料、理論資料、統計資料、類比資料等外,圖、表、文字均被納入資料行列,形成了結構化資料和非結構化資料的多元化資料形式;資訊技術的發展導致從資料匱乏向「資料豐富,理論匱乏」方向轉變, 資料產生的速度和規模急劇發展;資料所蘊含的資訊遠遠超出其工具性和依據性特徵,形成可以從中挖掘出新知識的大資料。 與統計資料相比,大資料強調的是全部樣本;與科學資料的精確性相比,大資料允許存在一定範圍的不准確性;與科學范式的因果關係相比,大資料通過關聯性尋求自然和社會的變化規律。 因此,大資料引發了第二次資料革命,它不僅改變著科學研究范式,實現社會科學研究的定量化,也將促使經濟、社會、軍事等所有社會領域產生巨大的變革。
大資料促進社會科學定量研究走向深入
在科學研究方面,通過遙感裝置、感應器、電腦收集資料或類比方法獲取的密集型資料,經過電腦軟體處理,產生的資訊/知識被存儲在電腦中,科學家們只需在後臺利用資料管理和統計的方法對資料進行處理、分析,獲取知識, 形成以大資料為基礎的密集型科學,成為格雷提出的資料驅動科學的第四種科學范式。 正如EPJ Data Science雜誌所指出的,21世紀面臨的資料驅動科學已成為傳統假說驅動科學方法的補充,這種進化伴隨科學范式從還原主義(簡化)到複雜系統科學轉變的變革。
大資料可能導致社會科學研究的革命,促進定量研究的深入。 大資料突破了自然科學和社會科學的研究界限,實現了資料的可通約性,通過資料溝通了不同學科的資源。 哥倫比亞大學沃茨博士通過研究發現,大資料對極其複雜的人類行為的社會學研究起到了極其重大的作用,通過網路資料,大量個人或很小組織的真實行為通過電腦以資料形式被記錄下來,這些資料為人類行為研究提供了極其豐富的可靠資訊, 避免了研究者認知的偏見、感知的誤差和框架的歧義。
大資料對經濟、社會、人類日常生活產生的影響不僅僅限於技術層面,對於管理理念、運作方式也都將產生巨大的影響。 「資料驅動的社會管理」就是在社會管理中實施的一種新型管理模式,無論是政府還是組織機構,資料收集和分析已經成為基層管理部門的基本要求,根據資料分析結果制定政策和法規,將社會管理從事後處罰轉向事前防備,在醫療健康、國土安全、 智慧城市建設、防範和打擊恐怖活動、社會治安、治理社會腐敗等方面發揮著重要作用。 20世紀美國的警務管理模式CompStat是利用大資料對社會治安進行管理並取得良好成效的成功範例。 利用地方各種感應器收集的大資料和通過互聯網搜索關鍵字,疾病控制部門可以預測和判斷某地的流行病爆發的情況。 商務智慧實現了從資料到知識的挑戰和跨越,「決策支援系統」更是以資料和資訊為主要來源,等等。
無論是「資料驅動的社會管理」還是「決策支援系統」,資料的獲取和對資料的挖掘都至關重要,對收集到的各種資料,在後臺進行分析,建立模型,利用雲計算等計算手段,為制定政策、法律和決策提供技術支撐。 各國已經意識到大資料的重要性,將其視為與能源同等重要的資源。 2012年3月29日,代表美國政府的白宮科技政策辦公室發佈了《大資料研究和發展計畫》,並成立了「大資料高級指導小組」,將大資料技術革命帶來的機遇和挑戰提升到國家戰略層面。
亟須實現大資料共用和規範管理
與傳統資料相比,大資料的資源性特徵尤為突出,成為各國重視開發大資料的依據。 在知識的演化過程中,資料既是產生資訊、知識、智慧的基礎,又同時貫穿于其中。 進入資訊化時代,遇到的最大難題不是資訊不足,而是資訊孤島的問題,只有實現大資料的共用和規範管理,才能破解這一難題。
在移動網路、雲計算和其他技術的支援下,大資料迅猛發展,分析資料的技術不斷創新,第二次資料革命悄然發生。 大資料與任何一項新技術一樣,在推動社會變革的同時也造成了社會風險,例如,個人隱私、資料的客觀性和準確性、大資料的濫用等問題,已經遍及科學研究、社會管理、醫療保健、商務智慧等眾多領域。
大資料與其他技術的不同在於其虛擬性,其隱蔽性和滲透性更加突出。 這對個人、組織、國家甚至整個世界都可能帶來負面影響。 因而,對其進行更深層次的倫理學和哲學反思尤為重要。
(作者單位:中國科學院大學人文學院)
(責任編輯:蒙遺善)