큰 데이터 아키텍처와 플랫폼 새로운 것 이며 특별 한 속도로 발전 하 고 있습니다. 비즈니스 오픈 소스 개발 팀의 플랫폼의 새로운 기능 거의 매달 게시합니다. 오늘날의 대형 데이터 클러스터 우리가 미래에 참조 데이터 클러스터에서 매우 다른 것입니다. 이 새로운 어려움에 적응 하는 보안 도구 변경 됩니다. 큰 데이터의 라이프 사이클에서 산업은 아직 초기 단계에서 하지만 빨리 회사 시작 대처 대용량 데이터의 보안을 쉽게 작동 하는. 보안 되 면 큰 데이터 클러스터의 개발에 중요 한 요구 사항, 클러스터 해커에 의해 쉽게 손상 되지 이다. 또한, 기업의 중요 한 생산 환경에 미 숙 보안 기능을 넣어 피할 수 있다.
"빅 데이터" 단어는 종종 오해 했다. 사실, 그것은 너무 많은 주파수를 사용 하 여 작은 말. 큰 데이터 저장 하 고 데이터 집합의 많은 수를 처리 하지만 그것의 특성은 그 보다 훨씬 더.
그것이 올 때 큰 데이터 문제를 해결 하, 그들을 볼 생각 보다는 특정 규모 또는 기술 유용 합니다. 그것의 간단한 형식에서는, 큰 데이터 현상 3 개의 주요 동향의 교차점에 의해 구동 됩니다: 귀중 한 정보, 저렴 한 컴퓨팅 자원과 거의 무료 분석 도구를 포함 하는 데이터의 큰 금액.
오늘날, 많은 대용량 데이터 관리 시스템을 지리적 데이터와 다른 데이터 형식에 특별 한 주의. 이러한 시스템은 다양 한 다른 쿼리 패턴, 다른 데이터 저장 패턴, 다른 작업 관리 및 조정, 그리고 다른 리소스 관리 도구를 사용합니다. 비록 큰 데이터 종종 "관계형 반전"으로 설명, 개념 대형 데이터의 특성을 캡처하지 않습니다. 성능 문제를 방지 하려면 큰 데이터 많은 관계형 데이터베이스의 핵심 기능을 삭제 했 어 하지만 어떤 실수를 하지 않았다: 관계형 구조, 비즈니스 연속성, 그리고 구조적된 쿼리 처리를 제공 하는 일부 대형 데이터 환경.
전통적인 정의 큰 데이터의 특성을 캡처하는 데 실패, 이후 우리 큰 데이터 환경 구성 하는 핵심 요소에 기반 하는 큰 데이터를 좋습니다. 이러한 핵심 요소는 많은 분산된 데이터 저장 및 관리 노드를 사용합니다. 이러한 요소 데이터의 여러 복사본을 저장 하 고 데이터 "조각" 여러 노드에서. 즉, 단일 노드에 오류가 발생 하면 데이터 쿼리 처리 리소스를 사용할 수 있는 데이터를 이동 합니다. 데이터 관리 및 데이터 쿼리 큰 데이터를 그래서 다른 만드는 문제를 해결 하기 위해 서로 협력 수 분산된 데이터 노드 클러스터의이 종류 이다.
위의 그림 어떻게 데이터 노드와 클라이언트 상호 작용을 보여주는 하 둡 파일 시스템의 아키텍처 다이어그램을 보여 줍니다.
노드의 느슨한 연결 많은 성능 장점, 하지만 그들은 또한 고유한 보안 과제를 포즈. 큰 데이터 데이터베이스 (반대는 "완전히 오픈" 인터넷, 웹 콘텐츠에 대 한 사용자 액세스를 제어 하거나 관련 서비스 환경에 참조), 중앙된 "벽으로 둘러싸인 정원" 모델을 사용 하지 마십시오 그리고 내부 데이터베이스 자신을 숨기기 고 다른 응용 프로그램을 액세스할 수 있도록 하지 않습니다. "내부" 개념, 그리고 큰 데이터 지점 데이터 액세스의 농도 의존 하지 않습니다. 큰 데이터 클라이언트 작업 중 많은 다른 노드와 통신 하는 동안 그것을 사용 하는 응용 프로그램에 스키마를 제공 합니다.
규모, 실시간, 그리고 분산 처리: 대용량 데이터 (큰 데이터를 넘어 용량, 실시간, 분산 아키텍처, 병렬 처리 등 이전 데이터 관리 시스템의 데이터 관리 및 처리 요구 사항을 해결할 수 있는)의 필수 특성 이러한 시스템을 확보 하기 위해 더 어렵게 만들. 큰 데이터 클러스터 오픈 및 자기 조직화 되며 사용자가 여러 데이터 노드를 동시에 통신할 수 있도록. 데이터 노드를 확인 하기가 어렵습니다 이며 고객 정보에 액세스 해야 합니다. 잊지 마세요, 대용량 데이터의 자연 의미 새 노드 클러스터, 데이터 및 쿼리 결과 공유 하 고 고객 작업에 자동으로 연결 됩니다.
임베디드 보안: 큰 데이터, 확장성을 개선 하기 위해 사용 하는 자료는 대부분 개발에 관련 된 미친 콘테스트에 사용 및 큰 데이터 분석의 용이성. 몇 가지 특징만 보안 기능을 추가 하는 데 사용 됩니다. 그러나, 당신은 큰 데이터 플랫폼에 포함 된 보안 기능이 고 싶어. 개발자가 디자인 및 배포 단계에서 필요한 기능을 지원 하기 위해 수 있을 것이 좋습니다. 보안 기능을 확장, 높은-성능, 그리고 큰 데이터 클러스터 같은 자기 조직 할 수 있습니다. 문제는 오픈 소스 시스템 또는 대부분의 비즈니스 시스템 일반적으로 포함 되지 않습니다 보안 제품 이다. 그리고 많은 보안 제품 Hadoop 또는 다른 비 관계형 데이터베이스에 포함 될 수 없습니다. 대부분의 시스템 제공 최소한의 보안 기능, 모든 일반적인 위협 커버에 충분 하지. 대부분, 보안 정책 구축 해야 합니다.
응용 프로그램: 대용량 데이터 클러스터를 대상 하는 대부분의 응용 프로그램은 웹 응용 프로그램. 그들은 웹 기반 기술 및 상태 비저장, rest 기반 Api의 활용. 그러나 그것은 완전히 대형 데이터 보안의 문제를 논의 하기 위해이 문서의 범위를 넘어, 웹 기반 응용 프로그램 및 Api 포즈이 큰 데이터 클러스터에 가장 큰 위협 중 하나. 그들은 공격 되거나 훼손 후 큰 데이터 클러스터에 저장 된 데이터에 대 한 무제한 액세스를 제공할 수 있습니다. 응용 프로그램 보안, 사용자 접근 관리 및 권한 부여 제어는 보안 조치는 큰 데이터 클러스터 보안에 초점으로 필수적,입니다.
데이터 보안: 대용량 데이터 클러스터에 저장 된 데이터 파일에 기본적으로 저장 됩니다. 각 클라이언트 응용 프로그램의 데이터를 포함 하는 자신의 디자인을 유지할 수 있지만이 데이터는 노드의 많은 수에 저장 됩니다. 클러스터에 저장 된 데이터는 일반 파일에 취약 한 모든 위협에 취약 하 고 파일 불법 보기 및 복사에서 보호 될 필요가.