主動出擊戰略管理大資料隱私

來源:互聯網
上載者:User

似乎所有人都在關注大資料,甚至包括美國聯邦政府。 美國聯邦貿易委員會(FTC)去年年底向資料經紀行業的9家公司發出命令,要求他們提供對客戶資料收集和使用方式的資訊。 FTC的行動明確表明,雖然大資料的興起提供了很多商業利益,但也帶來重大的隱私問題。

為什麼要使用大資料?

大資料不同于過去的資料倉儲,因為它幾乎分析所有類型的資料檔案或格式,包括圖像、視頻以及從社交媒體收集的資料。 大資料的另一個特點是它沒有像伺服器對資料存儲的「一對一」的關係,而是依賴虛擬化架構,從大型內容商店和檔案中提取內容作為單一全球資源。

在企業管理人員和業務線經理中,使用大資料的最大動機是形成更準確、詳細的預測或者推測,從而為企業提供潛在的優勢。 大資料帶來的業務優勢很廣泛,從新產品開發和改進到最佳定價,再到篩選求職簡歷和設計有效的行銷活動等。 事實上,政治運動已經開始利用大資料分析:2012年奧巴馬競選就利用了大資料分析來確定可能投票的選民,然後影響他們,通過他們來籌集競選資金,並獲得選票,這是奧巴馬獲得最終勝利的關鍵戰略。

大資料隱私問題

FTC最近採取的行動是專門針對資料經紀公司:這種公司收集和分析特定消費者行為資料,然後將分析結果賣給希望提高行銷和銷售業績的公司。 然而,需要承認的是,使用大資料帶來越來越多的隱私問題,這並不僅限於這些傳統的資料經紀公司。 經濟學人資訊部(經濟學人集團內獨立的業務部)公佈了使用大資料最多的19個行業領域,包括製造業、IT和技術、金融服務、專業服務、醫療保健、製藥和生物技術以及消費品等。 毫無疑問,大資料革命已經開始。

根據大資料的特點,以及大資料使用的業務動機,最關鍵的隱私問題是,簡單地說,資料的品質或者準確性;以及企業使用這些資料來作出決定而可能會對個人產生的負面影響。 例如,從社交媒體獲取的個人資訊的準確性?從社交媒體或者其他網路來源的資訊可以用於篩選或者排名求職申請,或者提高醫療保險的價格嗎?基本的個人資料,例如年齡、婚姻狀況、教育或者就業情況通常都是未經驗證的。 在免費電子郵件服務中同樣也沒有這些驗證,幾乎所有使用者都會點選接受使用條款和私隱聲明,表明同意放棄用於資料匯總的一定程度的隱私權利。

另一個品質問題是,當收集互聯網搜索字詞或短語時,可能會對它們存在誤解。 企業利用大資料不佳的例子包括使用互聯網搜索詞條來評估產品定價,或者潛在目標客戶。 要知道,在家庭電腦中可能有多個使用者,並且有很多原因某人在網上搜索與他們無關的主題。 這種類型的資料收集、分析和使用可能產生有問題的分析結果,從而導致錯誤的決策,而最終造成個人和分析資料的企業兩敗俱傷的局面。 這種缺乏對大資料品質的控制將我們指向另一個隱私保護原則,即收集符合且適合既定目標的個人資料。

大資料隱私的最佳做法

企業處理大資料的最佳做法仍然還沒有確定,但已經有一些經驗可供我們借鑒,確保在不犧牲個人資料隱私的情況下,推動大資料創新。

有效使用大資料的第一步是正確地採購和管理雲服務,這是使大資料符合成本效益的先決條件:大多數企業不能或者不會投資于支援大通話方案所需要的IT基礎設施,而是依賴雲計算應用、基礎設施和處理能力。 此外,即使是那些願意投資的企業也會發現,沒有雲計算提供的靈活性,他們將舉步維艱。 這也暴露了很多企業的薄弱環節,即普遍不能確保雲計算中資料的安全性和隱私性。 企業執行標準的一般安全合同條款並不夠。 對於特定資料隱私控制,雲服務供應商和雲服務使用者明確各自必須承擔的責任。 還必須對雲服務進行持續的檢測和審計,同時通過相關指標來顯示資料完整、保密和可用。 使用雲計算服務的完美的資料保護資源是雲安全聯盟(Cloud Security Alliance),其官網上有很多指導性檔可供參考。

從過往的經驗來看,在部署雲服務時,最好在公共雲執行大資料原型,然後轉移到私有雲。 為什麼?公共雲部署,顧名思義,是在協力廠商環境內,並可能受到「不信任」各方的訪問。 而私有雲部署直接受組織或者企業的控制和管理,即使資料計算設施可能位於企業外部,但私有雲部署只能由受信任的各方來訪問。

更好地利用大資料的下一個戰略是部署融合存儲。 融合存儲更有效,並能夠降低錯誤的可能性,而這些錯誤可能影響資料品質或準確性。 融合存儲與資料品質和準確性相關的關鍵特徵是重復資料刪除,它還具有成本效益的優勢。

另一種最佳做法是正確地清洗資料,以説明避免一些上述隱私問題。 Emory University資料倉儲專家Amy Dean表示:「在盡可能早的時候,對資料進行過濾、清理、刪減、一致化、匹配、連接和診斷。 」鑒於資料品質對分析的影響,Dean建議對多樣的不同的資料進行衡量或者評估。 Dean還建議,為了查詢,資料來源應該有連結或可用,這樣有問題的任何資料元素都可以追溯到其源頭。

最終,確保個人資料準確性(進而確保更好的資料隱私)的最好辦法是鼓勵和要求消費者查看、審查和糾正收集到的有關自己的資訊,而不只是企業自己動手。 此外,消費者審查過程要易用,而且不需要消費者花錢的。 對於早期大資料消費者,這是很艱巨的工作,因為他們通常收集大量甚至他們從未使用的資料,操作起來會很複雜。 並且,企業可能也擔心消費者看到他們收集了如此詳細的個人資訊。 但這種透明度是讓消費者決定採用大資料,建立信心的最佳方式。 信譽報告實體一直以來讓消費者訪問、審查和糾正資料,這是長期有效的做法,這也是美國監管部門對該行業的要求。 同樣,隱私提示、網站聲明(其中包含回答問題的詳細連絡方式)能夠實現更好的透明度,也是處理錯誤資料的方法。

大資料之謎

最富爭議的企業隱私觀念是取得同意或者允許收集和使用個人資料。 如果時光可以倒流,一切重新開始,這將是個理想的基本規則。 然而,尋求個人的同意來收集個人資料已經為時已晚,因為已經有大量個人資料被收集和廣泛共用。 不爭的事實是,我們不可能確定所有可能收集了個人資料的企業。

有種辦法可以説明個人重新獲得對其個人資料的「控制」,即允許他們完全刪除和清除自己的資料。 當然,大資料使用者並不樂於提供該功能,並且,這是對消費者是否能意識到和相信使用其資料能夠帶來優勢的「嚴峻考驗」。 監管部門在考慮保護消費者隱私權利的時候,必然會要求提供刪除資料的能力。 隨著大資料使用的不斷發展,在企業大資料部署的技術設計和架構階段,企業應該考慮提供允許個人刪除特定資料欄位的功能。

同樣的,從保護個人隱私權利的角度來看,使用個人資料的更好的辦法就是對所有個人資料「匿名化」處理。 然而,匿名化的概念(即刪除任何可識別的欄位或屬性)並沒有被證明是可行的。 早在2000年, Latanya Sweeney博士(現為哈佛大學教授)就表明只需要三個資訊就可以確定87%的美國人:ZIP代碼、出生日期和性別,而這些資訊都可以在公共記錄中找到。 考慮到這些研究結果,即使部署了匿名化系統,我們仍然能夠重新確定任何居住在美國的個人消費者的身份。

考慮到所有這些問題和戰略,在蓬勃發展的大資料領域,保護個人隱私權利的解決辦法是,確保可靠的準確的個人資料,並對其進行適當的解譯。 同時,企業應該將上述隱私原則納入其大資料開發和使用中,只有這樣,企業才能夠獲得最好的結果,或者說,最少的消費者抵觸情緒。

 

(責任編輯:fumingli)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.