Hadoop存在巨大資料安全風險的十個理由:
1、Hadoop不是專為企業資料而生
像許多開拓性的IT技術(如TCP / IP或Unix)一樣,,Hadoop的概念並非來自企業使用者,企業安全更是無從談起。 使用Hadoop的最初目的是管理公開可用的資訊,,如Web連結。 其是針對大量的HTTP://www.aliyun.com/zixun/aggregation/13739.html">非結構化資料在分散式運算環境中設計的,並沒有形成書面的安全、合規、加密、政策支援和風險管理等協定。
2、Hadoop的安全完全依賴Kerberos
Hadoop使用Kerberos進行身份驗證。 然而,該協定卻可能很難實現,因為其並沒有涵蓋企業在安全方面的需求,比如基於角色的驗證、LDAP和活動目錄的政策支援等。 Hadoop還不能支援節點與節點之間的傳輸資料的加密。
3、Hadoop集群包含很多節點
傳統的資料安全技術的概念是建立在保護一個物理實體(如資料庫或伺服器)基礎之上,這與Hadoop集群獨特的大資料分散式運算環境有所不同。 傳統的安全技術在這種分散式的、大規模的環境中不能有效發揮作用。
4、在Hadoop環境中,傳統的備份及災害復原資料並不相同
Hadoop集群的分散式特性也使得許多傳統的備份及恢復方法和政策無效。 如果使用者使用Hadoop,則需要將資料複製、備份、存儲在一個單獨的、安全的環境中。
5、Hadoop很少能夠單獨運行
為了獲得好處的大資料處理結果,Hadoop需要結合使用其他技術。 雖然這些工具能夠説明處理大資料的訪問和使用,但其大多數也缺乏真正的企業級安全。 強化Hadoop本身,只是應對大資料安全挑戰的一個部分而已。
6、大資料的工作負載遵從統一規則
大資料沒有附帶單獨的管理規定和要求。 不管它用於存儲還是管理資料,企業組織必須要建立符合監管要求的資料保護和安全政策,如HIPAA、PCI等。 但在此基礎上,傳統安全技術仍不能完全解決大資料環境下的挑戰。
7、維護成本不確定
到目前為止,還沒有人能夠確定一個安全性漏洞未企業帶來多大的風險成本。 沒有全面的安全風險評估,企業將無法評估其安全弱點,也無法確定其在安全保障方面投入了多少資金。
8、大資料使用者憑自己的力量維護安全
目前,企業使用者關於維護Hadoop集群安全的做法包括對外部訪問的控制,以及限制允許訪問集群的人員數量等。
9、保護資料集群需要額外的步驟
Hadoop環境下的漏洞仍舊存在的話,那維護資料安全的額外步驟就必不可少。 使用者必須定期掃描他們的集群環境,以發現其脆弱點。 這也是在複製和備份資料的同時將其存儲在一個單獨的安全環境中的最佳實踐。
10、Hadoop使用者必須時刻保持更新
大資料分析處理日漸成為企業的主流業務,,IT技術的應用貫穿公司從創業到運營的始終,其目的是使大資料分析為企業帶來更多效益。 IT管理者維護安全的最好做法包括定期訪問網站的回饋意見,要將包含大資料的所有部分:安全、存儲、伺服器和資料中心系統等作為一個整體來看待。