Dataguise는 최근 10 Hadoop 데이터 보안 조치, 개인 정보 보호 위험, 데이터 관리 및 정보 보안 전문가 도울 수 있는 잠재적인 데이터 유출 및 대용량 데이터 응용 프로그램에 정책 위반의 위험을 줄일 Hadoop의 배포를 고려 하는 기업에 대 한 참조 가치가 있다 상단을 발표 했다.
Dataguise 여러 포춘 200 기업, Hadoop 보안 서비스를 제공 합니다 큰 데이터 보안 관행 및 대규모 및 다양 한 환경에 적합 한 프로세스의 집합을 종결 하 고.
대용량 데이터 분석 항상 개인 정보 보호 문제에 의해 동반 되어 나타나고 분쟁, 대용량 데이터 분석, 데이터의 광대 한 수의 것 이다 필연적으로 하지 이름, 주소와 같은 개인 사생활 정보 PII (개인 식별 정보) id 번호가 있습니다.
그리고 신용 카드 및 은행 계좌 번호 같은 금융 데이터의 많은 것 이다 필연적으로 하지 위에서 언급 한 개인 정보, 이러한 데이터에 대 한 액세스 큰 논란을 일으킬 것입니다. 하지만 대부분 개인 정보 보호 문제를 신중 하 게 계획, 테스트, 생산 준비, 및 큰 데이터 기술의 합리적인 응용 프로그램에 의해 완화 될 수 있습니다.
특히 프로젝트의 초기 계획 단계에 대 한 Dataguise에 의해 구현 하 둡 프로젝트에 대 한 최상의 보안 방법을 다음과 같습니다.
1. 빨리 데이터 개인 정보 보호 조치는 더 낫다. 취소 데이터 개인 정보 보호 정책 계획 단계에서 선호 Hadoop으로 데이터를 가져오기 전에.
2. 요소 귀하의 비즈니스에 중요 한 데이터에 속하는 데이터를 식별 합니다. 회사의 개인 정보 보호 정책, 관련 업계 규정 및 정부 규제의 전체 계정에 걸릴.
3. 여부 중요 한 데이터는 환경을 분석 하 고 Hadoop 시스템을 조립 하는 과정에서 숨겨진/최.
4. 규정 준수 위험을 식별 하는 충분 한 정보를 수집 합니다.
5. 명확한 여부 비즈니스 분석 해야 실제 데이터에 액세스 또는 "둔감" 데이터를 사용할 수 있습니다. 그런 다음 적절 한 교정 기술 보호 (암호화) 중요 한 정보 폐색 및 암호화에 대 한 선택. 폐색 (마스킹) 기술은 암호화 보다 유연 하 고 미래의 요구에 따라 최상의 보안 성능을 제공 한다.
6. 다른 Hadoop 디렉터리에서 데이터의 폐색과 무수정 두 버전을 저장 하는 데 필요한 경우에 특히 데이터 보호 체계 지원 폐색 및 데이터 보정 기법, 암호화 하는지 확인.
7. 데이터 보호 기술을 모든 데이터 파일, 따라서 다양 한 데이터 집계 차원에 분석의 정확성을 보장 하는 일관 된 마스킹 접근 방식을 제공 하는 것을 확인 합니다.
8. 특정 dataset 사용자 지정된 보호 제도 필요 여부를 확인 하려면 데이터 단위 보안 관리의 요구에 대 한 더 작은 그룹으로 Hadoop 디렉터리를 분할 하는 것이 좋습니다.
9. 되도록 선택한 엔터프라이즈 액세스 제어 기술, 상호 운용 가능한 특정 수준 및 id 사용자 Hadoop 클러스터에 데이터의 특정 범위에만 액세스할 수 있도록 암호화 체계.
10. 암호화 기술이 필요할 때 적절 한 기술 (자바, 돼지, 등) 데이터에 대 한 접근을 보장 하는 동안 완벽 한 암호화를 달성 하기 위해 배포 됩니다 확인 하십시오.
초기 개시 및 중요 한 데이터 시나리오의 설립, 기업 수 데이터 누설 및 규정 준수 위험을 크게 줄일 뿐 아니라 또한 큰 데이터 프로젝트의 투자 수익을 향상 시킬 있는 Hadoop 환경 일찍 가능한 준수 위험을 분석 하 고 합리적으로, 데이터 보호 기술 채택에서 중요 한 데이터를 검색할 수 있습니다.