클라우드 컴퓨팅, 공용 클라우드 서비스의 현재 응용 프로그램 주위 모든 응용 프로그램의 일부 분 일 뿐인을 나타냅니다에 대 한 IT 지출 총. 이 주요 임무 응용 프로그램, 기업 예산의 대량에 대 한 계정, 공용 클라우드로 이동 하지 않는 한 변경 되지 않습니다.
공용 클라우드 응용 프로그램에서 가장 큰 병목 클라우드 스토리지의 높은 비용 될 것으로 보인다. 미션 크리티컬 응용 프로그램 현재 가격 비싸다 더 보다는 대부분의 사용자가 감당할 수 있는 저장 하는 데이터의 테라 바이트를 저장할 수 있습니다 하는 동안 웹 관련 클라우드 응용 프로그램 데이터의 메가바이트의 수백을 저장할 수 있습니다. 하지만 다행히도, 우리는이 클라우드 스토리지 비용 문제를 해결 하기 위해 두 가지 전략: 데이터 추상화 및 분산된 쿼리 형식 데이터 액세스.
비즈니스 인텔리전스 및 비용 분석 응용 프로그램에 데이터 추상화 방법 적용
비즈니스 인텔리전스 (BI) 및 분석은 구름의 두 가장 유망한 응용 컴퓨팅. 이러한 응용 프로그램은 그것 결정 중요 한 주위 클러스터와 기획자 및 의사 결정자 들 사이 배포 됩니다. 이것은 그들이 적합 한 클라우드 컴퓨팅 응용 프로그램, 하지만 기업 일반적으로 파일럿 비즈니스 인텔리전스 응용 프로그램 실행 적어도 30000 달러, 가격을 꽤 비싼은 추정.
건물 진짜, 하지만 너무 큰, 데이터는 우리는 앞으로 넣어, 데이터 추상화의 구체적인 구현 하는 두 개의 데이터 비용 관리 방법의 첫 번째입니다. 데이터 추상화 원시 회사 정보에서 하나 이상의 요약 데이터베이스를 생성 하는 메커니즘 이며 데이터베이스 크기 그것은 구름에 경제적으로 저장할 수 있도록 해야 합니다.
의료 업계에서 우리의 고객의 환자 정보 다이제스트 데이터베이스 진단 코드, 처리 코드, 및 나 이/성별 통해 300 번 이상 배 감소의 세트를 생성, 저장 하 고 클라우드 데이터 액세스의 비용 데이터 추상화의 1%만을 의미 했다.
만약 당신이 비용 관리의 효율적인 방법으로 데이터 추상화 방법, 분석 하 고 객체를 분석 하는 방법-깊이 연구를 해야 합니다. 대부분 bi 정보를 발견 하기 위해 하지 실행; 그들은 특정 패턴 또는 개발 동향의 어떤 종류를 찾고 있습니다. 대부분의 산업에 대 한 진단 및 의료 직업에서 치료 등 특정 변수를 중요 하다. 이러한 변수의 요약 데이터베이스를 만들면 자체 분석에 영향을 주지 않고 액세스를 가속화 하 여 비용을 줄일 수 있습니다. 특정 조합의 변수를 정의 하면 매우 적 추상화를 해야 하는 데이터에 조합의 세부 정보를 추출 하기가 이기도 합니다. 그 결과, 데이터 추상화에 따라 분석 데이터 센터에서 상세한 분석 작업에 사용할 수 있는 클라우드 응용 프로그램 된다.
구조화 되지 않은 데이터에 대 한 분산된 쿼리 액세스 방법을 사용 하 여
데이터 추상화 방법 분석 및 구조화 된 트랜잭션 데이터를 몇 가지 중요 한 변수 매개 변수의 응용 프로그램에 적용 됩니다. 그러나, 그것은 적용 되지 않습니다 전통적인 큰 데이터 구조화 되지 않은 포맷에 때문에 구조화 되지 않은 데이터의 추상화를 구현 하기 어렵습니다. 일부 기업은 이메일 특정 단어 또는 단어 조합 고속 데이터베이스를 만드는 응용 프로그램에 있는 성공적인 사례 수 하지만 필수 키워드/단어 조합 미리 알 수 있습니다. 대부분의 응용 프로그램에 대 한 보다 일반적인 접근은 필요 하다. 이 메서드는 두 번째 데이터 비용 관리 전략-분산 쿼리 데이터 액세스 방법.
일반적으로, 데이터 처리 작업 세 부분으로 나눌 수 있습니다: 실제 데이터, 데이터 위치를 찾기 위한 데이터베이스 관리 액세스 및 대용량 저장 장치에서 정보 저장소 액세스의 처리. 많은 양의 정보는 비용 이유를 위한 클라우드로 이동할 수 없습니다, 경우는 클라우드 정보를 문서에 의해 문서 액세스를 달성 하는 것 아니다. 최상의 솔루션은 클라우드, 이외의 어딘가에 데이터 및 쿼리 논리과 구름에 데이터 처리를 수 있도록 데이터의 하위 집합을 추출 하는 데이터베이스 관리 시스템 (DBMS) 쿼리 명령을 보내는. 기업 내에서 DBMS 엔진 기능을 보장 하 고만 이동 쿼리 및 결과 에/이즈 모 데이터 저장 및 액세스 비용을 상당히 줄일 수 있습니다.
그것은 상대적으로 간단 하 게 같은 기능 분할 사실에 대 한 응용 프로그램을 구성, 점점 더 많은 공급 업체는 DBMS 엔진 또는 스토리지/쿼리 기능을 포함 하는 장치를 제공 하는. 그러나, 그것은 문제가 있는 쿼리 구조 모든 데이터 정보를 제공 하지 않도록 하려면 응용 프로그램의 검토를 구축 하는 데 필요한. 여기, 파일럿 테스트 충분 하지 않습니다; 쿼리 논리 배달 전에 결과의 크기를 테스트 해야 합니다.
분산된 쿼리 처리의 문제를 인식
큰 데이터의 특별 한 상태는 가능성은 정보를 한 곳에 저장 되지 않습니다. 전자 메일, 인스턴트 메시징 및 공동 작업 정보는 일반적으로 저장 생성 어디 기업 수십 또는 수백 개의 사이트를 할 수 있습니다. 이것은 수시로 불린다 MapReduce 솔루션 아키텍처 또는 가장 일반적으로 사용 되는 오픈 소스 구현 하 둡 분산된 쿼리 처리 문제가 만듭니다.
하지만 구조적된 데이터 분산된 쿼리를 해결할 수 있습니다; 금융 회사 고객 주요 대도시 지역에서 30 개 이상의 데이터베이스에서 추출 된 데이터에서 경험적 결과 빌려 보고. 구조화 된 DBMS 분석을 위해 혼자 실행의 용이성을 위해 각 사이트에 쿼리 명령을 전송 하는 경우에 "합성" 여러 사이트에서 결과를 Sql/dbms 명령을 사용할 수 있습니다. 그 결과, 쿼리 명령을 완벽 하 게 작동 하도록 모든 곳에서 세분화는, 그렇지 않으면, 각 명령을 실행 필요 액세스 데이터를 다른 장소에서 다는 것을 확인 하는 문제는 고 비용 매우 높은 된다.
많은 사람들이 하이브리드 클라우드를 만드는 방법에 초점을 맞추고 있다, 하는 동안 "혼합된 데이터"를 만드는 것입니다 더 중요 한 작업 미션 크리티컬 애플 리 케이 션 클라우드 미래에 대 한. 저렴 한 로컬 저장소 리소스와 매우 유연한 클라우드 컴퓨팅의 사용을 최적화 하는 방법 없이 사용자가 그들의 큰 데이터는 전통적인 유지 하기 위해 그들을 강제로 것입니다 찾을 수 있습니다 그것은 아키텍처. 이 중요 한 응용 프로그램에 그것의 관련성을 잃고 구름을만 발생 하지 않습니다.
(책임 편집기: Fumingli)