클라우드 컴퓨팅은 분산 컴퓨팅, 온라인 네트워크 서비스 제공 및 네트워크를 통해 필요와 확장에 필요한 서비스를 얻는 사용 모델의 형태 이다. 네트워크 서비스와이 서비스를 제공 하는 데이터 센터의 하드웨어 및 소프트웨어 컬렉션입니다. 클라우드 컴퓨팅은 병렬 컴퓨팅의 진화, 분산 컴퓨팅 및 그리드 컴퓨팅. 클라우드 컴퓨팅 서비스, 유틸리티 컴퓨팅, 서비스 플랫폼, 서비스 인프라 소프트웨어의 구현입니다. 클라우드 컴퓨팅을 이미 Google의 Googledocs 같은 일부 응용 프로그램은 그리고 마이크로소프트와 아마존과 유사한 클라우드 컴퓨팅 서비스.
클라우드는 효율적인 컴퓨팅 서비스를 제공 하는 컴퓨팅의 기본 목표. 클라우드 컴퓨팅 인프라 중 하나는 안정적이 고 안전한 데이터 스토리지 센터를 제공 합니다. 따라서, 스토리지 보안 클라우드 컴퓨팅 분야에서 보안 항목 중 하나입니다. 데이터 개인 정보 보호의 문제를 해결 하려면 일반적인 방법은 사용자 데이터를 암호화 하 고 서버에 암호화 된 암호 텍스트 정보를 저장할 것 이다. 구름에 저장 된 암호화 된 데이터의 크기, 후 암호화 된 데이터의 검색 해결 해야 할 긴급 한 문제가 된다.
암호화 정보 검색의 연구 작업에 단일 사용자 선형 검색 처럼 여러 알고리즘, 키워드에 공개 키를 검색, 보안 인덱스를 기반으로. 이러한 알고리즘 신속 하 게 필요한 정보를 검색할 수 있지만 비용은 높다, 대규모 데이터 검색에 적용 되지 않습니다 그리고 클라우드 스토리지, 관련 문서 검색에서에서 관련 순위 추가 문제가 해결 될, 위의 여러 가지 알고리즘 문제를 해결할 수 없습니다.
문서에서 단어 빈도 정보 검색 정확도 및 반환 율 향상 보장된 주문 암호화로 상관 관계 정도 따라 문서를 정렬 사용할 수 있습니다. 그러나 일부 키워드는 문서에 표시 하는, 주파수가 매우 높은, 참조는 강한, 단어의 이러한 종류 일반적으로 사용 되는 단어 라고, 문서 및 실제 쿼리 상관 관계를 왜곡 하는 일반적인 단어의 존재. 정확 하 게 문서 및 쿼리의 관련성을 반영 하는 벡터 공간 모델을 직접 적용할 수 없습니다. 모든 Homomorphic 암호화는 암호 텍스트에 작동할 수 있는 암호화 알고리즘을 제공 합니다. 그리고 전체 준동형사상 암호화를 통해 한 손으로 지킬 수 있다 암호 텍스트 정보를 통계적으로 분석, 다른 한편으로, 암호화 정보 Chengmingwen 순서를 유지 하면서 첨가제 및 곱셈 작업 수 있습니다.
1. 암호화 저장 기술을 클라우드 스토리지 애플리케이션에서
대규모 고성능 스토리지 시스템 보안 요구 사항, 특히 애플리케이션에서 클라우드 스토리지 확장성과 고성능 스토리지 보안 기술, 가장 기본적인 보장 네트워크 환경 저장 응용 프로그램 (예: 클라우드 스토리지 응용 프로그램)를 촉진 하 고, 현재 네트워크 스토리지 영역 연구 핫스팟 되고있다. 클라우드 스토리지 애플리케이션에서 스토리지 보안 인증 서비스, 데이터 암호화 저장, 보안 관리, 보안 로깅 및 감사를 포함합니다.
액세스 제어 서비스 사용자 인증 및 권한 부여를 실현, 불법 접근 및 무단된 액세스를 방지 합니다. 주요 기능 포함: 사용자만 관리자 또는 작업을 할 파일의 라이선스 권한 소유자에 의해 인증 될 수 있습니다, 관리자만 사용자 관리, 데이터 백업, Hotspot 개체 마이그레이션 등의 필요한 관리 작업을 수행할 수 있지만 사용자 암호화 된 개인 데이터에 액세스 하지.
암호화 된 저장소는 지정 된 디렉터리와 파일을 저장, 기밀 보호의 중요 한 데이터 저장 및 전송 과정을 달성 하기의 암호화 됩니다. 보안 관리의 주요 기능은 사용자 정보 유지 관리 및 사용자 계정 등록 및 취소, 같은 기관에 권한이 부여 된 사용자, 사용자 권한 긴급에서 복구.
감사 및 보안 로그 모니터링 시스템 및 활성 사용자가 필요한 감사 정보를 제공 하는 시스템 관리자에 대 한 관련된 주요 활동 이벤트 기록 사용자 및 시스템 및 보안입니다.
사용자, 스토리지 암호화 서비스 위에서 설명한 스토리지 보안 서비스의 4 종류에서 특히 중요 하다. 암호화 된 저장소 공유 저장소 플랫폼에서 사용자의 개인 데이터의 기밀성을 보장 하는 핵심 기술 이다.
스토리지 시스템 및 저장 장치 네트워크 더 될로 스토리지 시스템 중요 한 데이터 기밀성을 보장 하면서 기술 공유 하는 적절 한 암호화 데이터를 제공 해야 합니다. 사용자의 개인 정보 보호 스토리지 보안 스토리지 시스템에 대 한 신뢰를 기반으로 해야 합니다. 그것은 네트워크 스토리지 시스템에 적용 가능한 암호화 저장 기술 연구, 제공 하는 엔드-투-엔드 암호화 저장 기술 및 주요 장기 저장 및 공유 메커니즘을 통해 기밀성 및 개인 정보 보호 정책 사용자 데이터의 키 저장소, 분배의 효율성 및 암호화 전략의 유연성의 보안을 향상 시킬 필요가 있다. 많은 양의 암호화 된 정보 저장소에서 암호화 된 검색 이며 정보 공유를 실현 하는 주요 수단 암호화 된 저장소에 해결 되어야 하는 문제 중 하나입니다.
2. 암호화 정보 검색 기술
암호화 된 정보 검색 연구 2000 년에, 노래 시작 했다 동부 표준시 Boneh 넣어 앞으로의 데이터 검색, 그리고 핵심 단어를 기반으로 보안 인덱스 검색의 알고리즘을 붙이고 다른 암호화 실용적인 알고리즘.
2.1 선형 검색 알고리즘
선형 검색 알고리즘에서 일반 텍스트 정보는 암호화는 대칭 암호화 알고리즘에 의해 먼저. 각 핵심 단어에 대 한 문자열의 길이 생성 암호화 정보에 해당 암호화 정보 난수 시퀀스의 길이 보다 작으면 이며 교정 순서를 결정 하기 위해 의사 난수 순서 및 암호화 정보를 생성. 의사 임의 시퀀스의 길이 및 테스트 시퀀스의 길이 암호 텍스트 정보의 길이. 의사 난수 순서 및 테스트 시퀀스 암호 텍스트 정보를 다시 암호화합니다. 검색 과정에서 사용자는 암호화 텍스트 정보 시퀀스에 해당 하는 일반 텍스트 정보를 전송 합니다. 서버 쪽에서 암호 텍스트 정보 시퀀스 선형 2 나머지 각 시퀀스와 결합 됩니다. 결과 확인 관계를 만족 하는 경우 다음 암호 텍스트 정보 시퀀스가 나타납니다, 그렇지 않으면, 암호 텍스트 정보가 존재 하지 않습니다.
선형 검색 방법은 암호화 정보 검색 알고리즘의 일종 이므로 통계 분석에 저항 하는 강한 능력이. 그러나 그것이 치명적인 단점, 즉, 연속이 검색 방법은 큰 데이터 집합의 경우 적용 하기 어려운 암호 텍스트 정보의 일치 한다.
2.2 키워드 기반 공개 키 검색
키워드에 기반 하는 공개 키 암호화 알고리즘 Boneh, 사용자 측면 스토리지 및 컴퓨팅 리소스가 부족 한 경우 원격 데이터베이스에 액세스 하 여 데이터 정보를 얻을 하는 것입니다 누구의 목표에 의해 제시 된다. 스토리지 및 컴퓨팅 자원의 분포는 비대칭, 즉, 사용자의 컴퓨터 저장 능력 실시간으로 그들의 요구를 충족 하지 않을 수 있습니다. 다른 한편으로, 사용자가 모바일 상황에서 저장, 색인 데이터 요구 또한 증가, 이메일 서비스 등. 이 특정 한 경우, 사용자의 개인정보 보호 될 필요가 있다. 암호화 된 데이터의 여러 다른 소스 이며이 문제를 해결 하려면 암호화 알고리즘은 공개 키 암호화를 사용 하 여.
알고리즘의 과정은 공개 키, 개인 키를 생성 하 고 저장된 일반 텍스트 키워드 검색 가능한 암호 텍스트 정보를 생성 하는 공개 키로 암호화 됩니다.
2.3 보안 인덱스
보안 인덱스 간단한 색인 통계에 취약 한 공격 이었다고 공원 및 다른 문제 해결 제안 했다. 메커니즘은 각 암호화에 사용 된 키가 사전에 생성 되는 역 해시 시퀀스 집합 암호화 된 인덱스 긴 필터에 배치 됩니다. 검색, 우리가 먼저 역 해시 시퀀스 키와 여러 트랩을 생성 하 고 천으로-폐의 테스트를 실시. 반환 된 암호화 문서 검색 문서를 해독 합니다.
이것은 새로운 사용자 결합 하 고 종료 이전 사용자와 다중 사용자 암호화 정보 검색에 대 한 해결책 이다. 그러나, 결함은 키 시퀀스의 많은 수를 생성, 필요한 각 검색의 계산 복잡도 선형으로 증가 검색 횟수 증가. 이것은 실용적인 응용 프로그램에 허용 하도록 어렵습니다.
위에서 언급 한 암호화 정보 검색 알고리즘에서 사용 하는 검색 모델 이므로 부울 모델 쿼리 및 문서를 검색할 수의 상관 관계 정도 따라 정렬할 수 없습니다. 특히 대용량 데이터 클라우드 저장 응용 프로그램의 경우 실제로 가능한 관련된 문서 수에 가장 관련성이 높은 문서를 하나 이상의 문제가 발견 해결 되어야 하는 하는 방법과 쿼리 키워드를 포함 하는 문서 수 있을 수 있습니다. 성숙한 벡터 공간 모델 암호화 된 문서 그리고 관련된 정렬에 적용할 수 있는 미결 문제 이다.
2.4 암호화 검색 알고리즘 관련성 순서
Swaminathan와 다른 개인 정보를 보호 하기 위해 정렬 검색 알고리즘을 앞으로 넣어. 이 알고리즘에서 각 문서에 키워드의 단어 주파수 보장된 암호화 알고리즘으로 암호화 됩니다. 암호화 된 문서는 제출 후 서버, 암호화 된 문서 포함 된 암호 텍스트를 먼저 검색 후 암호 텍스트 정보 해당 단어 주파수 파 오 알고리즘으로 암호화 하는 정렬 처리, 그리고 높은 값으로 암호화 된 문서를 사용자에 게 반환 하 고 사용자에 의해 해독.
이 방법을 사용 하면 지정된 된 수의 가능한 관련된 문서를 사용 하 여 암호화 된 문서를 정렬 하 고 다음 사용자에 게 가장 가능성이 관련된 문서를 반환 수 있습니다. 그러나,이 알고리즘 알고리즘만 사용 하 여 단어 주파수 정보는 문서에 여러 개의 쿼리 단어를 포함 하는 쿼리에 적합 하지 않습니다, 그리고 반전 문서 주파수 그리고 벡터 공간 모델의 직접 적용 되지 수 사용 하지 않을 수 있습니다. 전 문제를 해결 하기 위해 한 가지 방법은 첨가제 homomorphic 암호화 알고리즘으로 단어 주파수 정보를 암호화 하는 것입니다.
3. 전체 준동형사상 암호화에 따라 검색 방법
암호화 정보 검색 연구에서 결과의 순위는 검색 알고리즘의 성능을 측정 하는 중요 한 인덱스 중 하나입니다. 프로 모션 및 클라우드 컴퓨팅 기술에의 응용, 암호화 된 문서는 폭발에서 증가할 것 이다. 시퀀싱의 정확도 그 주요 목적은 검색 시스템의 서비스 품질과 검색 효율성을 향상 하는 검색 시스템의 성능에 대 한 객관적인 요구 된다. 기존 암호화 정보 검색 알고리즘 분석는 충분 하지 않습니다 리콜 및 두 가지 측면의 성능을 보장 하는 동안 예약 문제 및 정확도 고려 하는 발견 된다.
이 문제를 해결 하려면이 문서 클라우드 스토리지 응용 프로그램에 대 한 모든 homomorphic 암호화의 검색 방법을 제안 합니다. 모든 homomorphic 암호화의 검색 방법 정보 검색, 벡터 공간 모델을 사용 하 여 검색 된 문서와 정보를 단어와 반전된 문서 주파수를 쿼리할 수 간의 상관 관계를 계산 하는 다음 문서를 암호화 하 고 전체 준동형사상 메서드를 사용 하 여 인덱싱 방법을 확립 하. 인덱스 Xiangmiven 암호화 된 문서를 검색 하 고 서버에 업로드.
전체 homomorphic 암호화 검색 및 시퀀싱 프로세스는 그림 1에 표시 됩니다. 제출 하기 전에 검색, 검색 문 또한 앞에 단어를 세분화 및 형태소 분석, 하 고 키워드의 일반 텍스트 시퀀스 얻은 일반 텍스트 암호화. 클라우드 서버 암호 텍스트 시퀀스를 검색할 때 암호화 된 검색 단어를 전송 합니다.
문서 각 키워드의 무게 벡터에 의해 대표 된다 그리고 무게 주파수의 제품을 거꾸로 문서의 정규화 됩니다. 무게는 전체 homomorphic 암호화 후 반전된 문서 주파수와 주파수의 동작에 의해 얻어질 수 있다.
동일한 메서드는 검색 용어를 설명 하는 데 사용 됩니다, 그리고 둘 다의 내부 제품 상관 관계 정도 얻을 수 다음 크기, 정렬 및 사용자에 게 유효한 정렬 된 문서를 반환. 후에 사용자가 암호화 된 문서, 문서 원래 문서를 개인 키로 암호가 해독 됩니다.
일반 텍스트 데이터는 전체 homomorphic 암호화 알고리즘으로 암호화는 일반 텍스트 정보, 다시 시작 하지 않고 효과적으로 검색할 수 있습니다 즉, 가장 관련성이 높은 문서 반환 됩니다 사용자. 사용자의 데이터 보안을 보호 뿐만 아니라 또한 검색 성능이 향상 됩니다.
4. 결론 비고
이 종이에서 클라우드 스토리지에서 암호화 검색 기술의 중요성을 분석 하 고 연구 현황 및 암호화 검색 및 관련된 기술 문제의 종합적 분석. 이 기준이 종이 전체 homomorphic 암호화 검색 방법 앞으로 박 고 짧게 전체 Homomorphic 암호화 검색 방법의 기본 원리를 소개 한다. 기존 실험 데이터 표시 전체 Homomorphic 암호화 검색 방법을 다른 암호화 검색 알고리즘에 비해 어느 정도 검색 효율성을 향상 시킬 수 있습니다.