報告說,大資料提出了嚴肅的隱私問題以待解決,宜早不宜晚。
大資料的潛力是無窮的-可能帶來好處也可能帶來壞處。 一份描述大資料的變革特質的白宮新報告深入地探究了與資料相關的隱私和安全主題。
關鍵的關注點:大資料正在創造大量的隱私主題需要及時處理,宜早不宜晚。
該報告的引文說到:「本報告一個顯著的發現是大資料分析將個人資訊用於供房、信貸、雇用、健康、教育和商場購物,有潛力使長期存在的公民權利保護黯然失色。 美國人與資料的關係,她(他)們的機會和潛力將得以擴展而不是消減」.
報告討論了一系列有關隱私的主題,包括以下5個:
1.「去識別化」並不總是有效
機構常常採用隱私保護技術來去除與特定個人或設備資料的連接識別性。 不幸的是,再識別技術又同樣有效地把這些資料連線起來。
報告提出:「綜合性的多種資料可能導致某些分析師所說的」馬賽克效應「,即個人可識別資訊可以從甚至不包括個人識別碼的資料集裡衍生或推斷出來,關注點在於描繪一個人的形象和她(他)們所喜歡的東西」.
隨著再識別匿名資料的技術日益強大,個人如何管理她(他)們的私人資訊和身份,或者基於多種資料集資訊做出決策,這逐漸變得撲朔迷離。
2.「完美的個人化」可以有助於識別力
報告說,不同類型HTTP://www.aliyun.com/zixun/aggregation/13739.html">非結構化資料的融合使得行銷人員可以「在消費者提出要求之前就準確地把她(他)們想要的消息、 產品或服務發送過去」.「 可惜的是,完美的個人化也為定價、服務和機會方面精細的和不那麼精細的識別力留下了空間。 」
3.「小」資料造成更大的隱私威脅
不論對大資料潛在侵犯個人權利的言論多麼洶湧,今天大多數最常見的隱私風險都與「小資料」有關,比如駭客以個人銀行資訊為目標實施金融詐騙。 報告指出:「這些風險並不總是大量、快速或資訊種類繁多的,也不隱含某種與大資料相關的複雜分析」.報告認為,小資料的保護已經由美國隱私法律、強有力的實施細則,以及全球隱私保護機制修正規範起來。 即使這是事實,最近的2篇文章顯示出在這個領域還有很大的改進空間。
4.預測醫學可能導致隱私混亂
「預測醫學」是一個前景遠大的大資料應用,它深入挖掘病人的健康和基因資訊,以預測她(他)們是否將得一種特殊的疾病,以及對具體治療方法的接受程度。 這兒資料濫用的潛力是巨大的。 比如,通過「預測醫學」收集來的健康資訊也許就被運用於擁有類似基因的人們(比如病人的孩子們)的醫療決策中。
報告提到:「目前覆蓋資訊並運用於健康的隱私框架體系並沒有很好的適應處理這些新發展,或者對驅動新發展的研究起到促進作用」.
5.相反地,隱私法律反而阻礙了某些重要的分析
報告說:「大資料分析使得資料科學家可以積累大量的資料,包括非結構化資料,並且發現異常現象和模式」,「這個發現模型中一個關鍵的隱私挑戰是,你不得不去大海裡撈針。 為了獲得一定的洞察力,你就需要一定數量的資料。 」
因此難題就出來了:研究人員可以受益于獲得更大量敏感的基因資訊資料集,但是隱私法律卻限制她(他)們獲取這些資料。 報告說,舉個例子,布羅德研究所的一位基因研究者就未能探測與3500個精神分裂症基因資料集相關的基因變異,但卻取得了35000個案例的「統計顯著性」結果。