大資料的安全理解及應對策略研究

來源:互聯網
上載者:User

1.引言

大資料的產生使資料分析與應用更加複雜,難以管理。 據統計,過去3年裡全球產生的資料量比以往400年的資料加起來還多,這些資料包括文檔、圖片、視頻、 Web頁面、電子郵件、微博等不同類型,其中,只有20%是結構化資料,80%則是非結構化資料。 資料的增多使資料安全和隱私保護問題日漸突出,各類安全事件給企業和使用者敲醒了警鐘。 在整個資料生命週期裡,企業需要遵守更嚴格的安全標準和保密規定,對資料存儲與使用的安全性和隱私性要求越來越高,傳統資料保護方法常常無法滿足新變化網路和數位化生活也使駭客更容易獲得他人資訊,有了更多不易被追蹤和防範的犯罪手段 ,而現有的法律法規和技術手段卻難於解決此類問題。 因此,在大資料環境下資料安全和隱私保護是一個重大挑戰。

但是也應該看到,在大資料時代,業務資料和安全需求相結合能夠有效提高企業的安全防護水準。 通過對業務資料的大量搜集、過濾與整合,經過細緻的業務分析和關聯規則挖掘,企業能夠感知自身的網路安全態勢,預測業務資料走向。 瞭解業務運營安全情況,這對企業來說具有革命性的意義。 目前,在一些運營商的營業單位已經開始使用安全基線和大資料分析技術,及時檢測與發現網路中的各種異常行為和安全威脅,從而採取相應的安全措施。 據Gartner公司預測,2016年 40%的企業(以銀行、保險、醫藥、電信、金融和國防等行業為主)將積極地對至少10TB資料進行分析,以找出潛在的安全危險。

隨著對大資料的廣泛關注。 有關大資料安全的研究和實踐也已逐步展開,包括科研機構、政府組織、企事業單位、安全廠商等在內的各方力量,正在積極推動與大資料安全相關的標準制定和產品研發,為大資料的大規模應用奠定更加安全和堅實的基礎。

2.不同領域的大資料安全需求

在理解大資料安全內涵、制定相應策略之前,有必要對各領域大資料的安全需求進行全面瞭解和掌握,以分析大資料環境下的安全特徵與問題。

(1)互聯網行業

互聯網企業在應用大資料時,常會涉及資料安全和使用者隱私問題。 隨著電子商務、手機上網行為的發展,互聯網企業受到攻擊的情況比以前更為隱蔽。 攻擊的目的並不僅是讓伺服器宕機,更多是以滲透APT的攻擊方式進行。 因此,防止資料被損壞、篡改、洩露或竊取的任務十分艱巨。 同時,由於使用者隱私和商業機密涉及的技術領域繁多、機理複雜。 很難有專家可以貫通法理與專業技術,界定出由於個人隱私和商業機密的傳播而產生的損失,也很難界定侵權主體是出於個人目的還是企業行為。 因此,互聯網企業的大資料安全需求是:可靠的資料存儲。 安全的挖掘分析,嚴格的運營監管,呼喚針對使用者隱私的安全保護標準、法律法規、行業規範,期待從海量資料中合理發現和發掘商業機會和商業價值。

(2)電信行業

大量資料的產生、存儲和分析,使得運營商在資料對外應用和開放過程中面臨著資料保密、使用者隱私、商業合作等一系列問題。 運營商需要利用企業平臺、系統和工具實現資料的科學建模,確定或歸類這些資料的價值。 由於資料通常散亂在眾多系統中,資訊來源十分龐雜,因此運營商需要進行有效的資料收集與分析,保障資料的完整性和安全性。 在對外合作時,運營商需要能夠準確地將外部業務需求轉換成實際的資料需求,建立完善的資料對外開放存取機制。 在此過程中,如何有效保護使用者隱私,防止企業核心資料洩露,成為運營商對外開展大資料應用需要考慮的重要問題。 因此,電信運營商的大資料安全需求是:確保核心資料與資源的保密性、完整性和可用性。 在保障使用者利益、體驗和隱私的基礎上充分發揮資料價值。

(3)金融行業

金融行業的系統具有相互牽連、使用物件多樣化、安全風險多方位、資訊可靠性、保密性要求高等特徵。 而且金融業對網路的安全性、穩定性要求更高。 系統要能夠高速處理資料,提供冗余備份和容錯功能,具備較好的管理能力和靈活性,以應對複雜的應用。 雖然金融行業一直在資料安全方面追加投資和技術研發,但是由於金融領域業務鏈條的拉長、雲計算模式的普及、自身系統複雜度的提升以及對資料的不當利用。 都增加了金融業大資料的安全風險。 因此,金融行業的大資料安全需求是:對資料存取控制、處理演算法、網路安全、資料管理和應用等方面提出安全要求,期望利用大資料安全技術加強金融機構的內部控制,提高金融監管和服務水準,防範和化解金融風險。

(4)醫療行業

隨著醫療資料的幾何倍數增長,資料存儲壓力也越來越大。 資料存儲是否安全可靠,已經關乎醫院業務的連續性。 因為系統一旦出現故障,首先考驗的就是資料的存儲、災備和恢復能力。 如果資料不能迅速恢復,而且恢復不到中斷點,則對醫院的業務、患者滿意度構成直接損害。 同時,醫療資料具有極強的隱私性,大多數醫療資料擁有者不願意將資料直接提供給其他單位或個人進行研究利用,而資料處理技術和手段的有限性也造成了寶貴資料資源的浪費。 因此,醫療行業對大資料安全的需求是:資料隱私性高於安全性和機密性,同時需要安全和可靠的資料存儲、完善的資料備份和管理,以説明醫生與病人進行疾病診斷、藥物開發、管理決策、完善醫院服務,提高病人滿意度,降低病人流失率。

(5)政府組織

大資料分析在安全上的潛能已經被各國政府組織發現,它的作用在於能夠説明國家構建更加安全的網路環境。 例如,美國進口安全申報委員會不久前宣佈,通過6個關鍵性的調查結果證明,大資料分析不僅具備強大的資料分析能力,而且能確保資料的安全性。 美國國防部已經在積極部署大資料行動,利用海量資料採礦高價值情報,提高快速回應能力,實現決策自動化。 而美國中央情報局通過利用大資料技術,提高從大型複雜的數位資料集中提取知識和觀點的能力,加強國家安全。 因此,政府組織對大資料安全的需求是:隱私保護的安全監管、網路環境的安全感知、大資料安全標準的制定、安全管理機制的規範等內容。

3.大資料環境安全

通過上述分析可知,各領域的安全需求正在發生改變,從資料獲取、資料整合、資料提煉、資料採礦、安全分析、安全態勢判斷、安全檢測到發現威脅,已經形成一個新的完整鏈條。 在這一鏈條中,資料可能會丟失、洩露、被越權訪問、被篡改,甚至涉及使用者隱私和企業機密等內容。 通常,大資料安全具有以下6個方面的特徵和問題。

(1)移動資料安全面臨高壓力

社交媒體、電子商務、物聯網等新應用的興起。 打破了企業原有價值鏈的圍牆,僅對原有價值鏈各個環節的資料進行分析,已經不能滿足需求。 需要借助大資料戰略打破資料邊界,使企業瞭解更全面的運營及運營環境的全景圖。 但是,這顯然會對企業的移動資料安全防範能力提出更高的要求。 此外。 資料價值的提升會造成更多敏感性分析資料在行動裝置間傳遞,一些惡意軟體甚至具備一定的資料上傳和監控功能,能夠追蹤到使用者位置、竊取資料或機密資訊,嚴重威脅個人的資訊安全,使安全事故等級升高。 在行動裝置與移動平臺威脅飛速增長的情況下,如何跟蹤移動惡意軟體樣本及其始作蛹者。 分析樣本相互間關係,成為移動大資料安全需要解決的問題。

(2)網路化社會使大資料易成為攻擊目標

在網路空間裡,大資料是更容易被發現的大目標。 一方面,網路訪問便捷化和資料流程的形成,為實現資源的快速彈性推送和個人化服務提供基礎。 正因為平臺的暴露,使得蘊含著潛在價值的大資料更容易吸引駭客的攻擊。 另一方面,在開放的網路化社會,大資料的資料量大且相互關聯,使得駭客成功攻擊一次就能獲得更多資料,無形中降低了駭客的進攻成本。 增加了收益率。 例如,駭客能夠利用大資料發起僵屍網路攻擊,同時控制上百萬台傀儡機併發起攻擊,或者利用大資料技術最大限度地收集更多有用資訊。

(3)使用者隱私保護成為難題

大資料的彙集不可避免地加大了使用者隱私資料資訊洩露的風險。 由於資料中包含大量的使用者資訊,使得對大資料的開發利用很容易侵犯公民的隱私,惡意利用公民隱私的技術門檻大大降低。 在大資料應用環境下,資料呈現動態特徵,面對資料庫中屬性和表現形式不斷隨機變化,基於靜態資料集的傳統資料隱私保護技術面臨挑戰。 各領域對於使用者隱私保護有多方面要求和特點擻據之間存在複雜的關聯和敏感性,而大部分現有隱私保護模型和演算法都是僅針對傳統的關聯式資料,不能直接將其移植到大資料應用中。

(4)海量資料的安全存儲問題

隨著結構化資料和非結構化資料量的持續增長以及分析資料來源的多樣化。 以往的存儲系統已經無法滿足大資料應用的需要。 對於占資料總量80%以上的非結構化資料,通常採用NoSQL存儲技術完成對大資料的抓取、管理和處理。 雖然NoSQL資料存儲易擴展、高可用、性能好,但是仍存在一些問題。 例如,存取控制和隱私管理模式問題、技術漏洞和成熟度問題、授權與驗證的安全問題、資料管理與保密問題等。 而結構化資料的安全防護也存在漏洞,例如物理故障、人為誤操作、軟體問題、病毒、木馬和駭客攻擊等因素都可能嚴重威脅資料的安全性。 大資料所帶來的存儲容量問題、延遲、併發訪問、安全問題、成本問題等,對大資料的存儲系統架構和安全防護提出挑戰。

(5)大資料生命週期變化促使資料安全進化

傳統資料安全往往是圍繞資料生命週期部署的,即資料的產生、存儲、使用和銷毀。 隨著大資料應用越來越多,資料的擁有者和管理者相分離,原來的資料生命週期逐漸轉變成資料的產生、傳輸、存儲和使用。 由於大資料的規模沒有上限,且許多資料的生命週期極為短暫,因此,傳統安全產品要想繼續發揮作用,則需要及時解決大資料存儲和處理的動態化、並行化特徵,動態跟蹤資料邊界,管理對資料的操作行為。

(6)大資料的信任安全問題

大資料的最大障礙不是在多大程度上取得成功,而是讓人們真正相信大資料、信任大資料,這包括對別人資料的信任和自我資料被正確使用的信任。 例如,近年來工資「被增長」、CPI「被下降」、房價「被降低」、失業率「被減少」,因百姓的切身感受與統計資料之間的差異以及國家和地方之間GDP資料嚴重不符。 都導致了市場對統計資料的質疑。 同時,大資料的信任安全問題也不僅是指要相信大資料本身,還包括要相信可以通過資料獲得的成果。 但是,要讓人們相信和信任通過大資料模型獲得的洞察資訊卻並不容易,而證明大資料本身的價值比成功完成一個專案要更加困難。 因此,構建對大資料的安全信任至關重要,這需要政府機構、企事業單位、個人等多方面共同建設和維護好大資料可信任的安全環境。

4.大資料安全內涵

保障大資料安全,即大資料自身的安全問題

大資料安全不同于關聯式資料安全,大資料無論是在資料體量、結構類型、處理速度、價值密度方面,還是在資料存儲、查詢模式、分析應用上都與關聯式資料有著顯著差異。 大資料意味著資料及其承載系統的分散式,單個資料和系統的價值相對降低,空間和時間的大跨度、價值的稀疏,使得外部人員尋找價值攻擊點更不容易。 但是,在大資料環境下完全的去中心化很難。 只要存在中心就可能成為被攻擊的穴道,而對於低密度價值的提煉過程也是吸引攻擊的內容。 針對這些問題,傳統安全產品所使用的監視、分析日誌檔、發現資料和評估漏洞的技術在大資料環境中並不能有效運行。 很多傳統安全技術方案中,資料的大小會影響到安全控制或配套操作能否正確運行。 多數安全產品不能進行調整,無法滿足大資料領域,也不能完全理解其面對的資訊。 而且,在大資料時代會有越來越多的資料開放,交叉使用,在這個過程中如何保護使用者隱私是最需要考慮的問題。

為解決大資料自身的安全問題,需要重新設計和構建大資料安全架構和開放資料服務,從網路安全、資料安全、災難備份、安全風險管理、安全運營管理、安全事件管理、安全治理等各個角度考慮,部署整體的安全解決方案。 保障大資料計算過程、資料形態、應用價值的安全。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.