그 클라우드 컴퓨팅은 우리의 대부분에 대 한 개념적 꿈, 주어진 누군가가 "저장의 모든 데이터는 클라우드 서비스에" 당신은 명확 하 게 그를 말할 수 없다 그들의 빅 데이터 전략에 대해 이야기 할 때 그들의 전략은 비전 솔루션 또는 단순히 일부 전문가 들은 산업 회의에서 반복.
대용량 데이터 클라우드 컴퓨팅 패러다임 사이 오버랩은 실제로 너무 광범위 조직의 기존 활용, 내부적으로 큰 클라우드 기반 데이터 배포를 위한 하 둡, NoSQL, 또는 엔터 프 라이즈-클래스 데이터 웨어하우스 환경 배포를 주장할 수 있다. 하지만 클라우드 컴퓨팅은 지금의 개념 더 광범위 하 게 이해 하는 "사설 클라우드" 배포로 공공 클라우드 컴퓨팅, SaaS, multi-tenant 호스팅 환경에 의해 보충 기억 하는 것이 중요 하다.
그러나, "클라우드 컴퓨팅"의 실제 정의 공공 구독 서비스의 범위를 제한 하는 경우 검색할 문제의 핵심: 큰는 데이터 응용 프로그램은 더 나은 공공 클라우드/SaaS 배포에 적합 하 고는 내부 배포 하드웨어 장치 등 고급 최적화 기능을 포함 하는 가상 서버 클러스터에 대 한 더 적절 한 결정을 해야 ) 。
즉: 당신은 언제 확장성, 탄력, 높은-성능, 비용, 신뢰성, 관리, 그리고 외부 서비스 공급자에 의해 관리 되는 대용량 데이터를 수집할 수 있을 것입니다? 다음 공용 클라우드에서 중요 한 대용량 데이터 관리의 몇 가지 예입니다.
엔터프라이즈 응용 프로그램은 이미 클라우드 서비스에서 호스팅: 경우, 많은 기업 (특히 중소 중소 기업) 이미를 사용 하는 외부 서비스 제공 업체에서 클라우드 기반 응용 프로그램에 대 한 트랜잭션 데이터 소스의 대부분 이미 있는 공용 클라우드. 또는 기업이 클라우드 플랫폼으로 깊은 역사 데이터 소스 있으면 그것은 수 있다 되어 축적 많은 양의 데이터. 어느 정도까지, 서비스 공급자 또는 파트너 손실 분석, 마케팅 최적화, 또는 오프 사이트 백업 및 고객 데이터 보관-그래서 그것은 구름 보다는 기업 내에서 저장 되는 호스트에 큰 데이터를 호스트 더 의미 있을 수 있습니다 가치 분석 서비스 등을 제공 합니다.
높은-용량 외부 데이터 원본 상당한 전처리 필요: 예를 들어 고객 감정 소셜 미디어 데이터를 모니터링 하는 경우 하지 하면 기업 내에서 용량 리소스 서버, 저장 장치, 및 대역폭의 활용. 이 공용 클라우드 기반 대용량 데이터 서비스에 의해 제공 된 서비스를 필터링 하는 소셜 미디어를 활용 하는 응용 프로그램의 명백한 예입니다.
엔터프라이즈의 내부 장치의 큰 데이터 처리 기능을 초과 하는 응용 프로그램 요구 사항: 기업 내에서 큰 로컬 데이터 플랫폼을가지고 하는 경우 전용 응용 프로그램 (예: 높은-용량 구조화 되지 않은 데이터 원본의 ETL 처리 하는 전용된 Hadoop 클러스터) 처리. 다음, 새로운 응용, 그리고 엔터 프 라이즈의 현재 큰 데이터 플랫폼은 새로운 응용 프로그램의 요구에 맞게 적합 하지 않습니다, 공용 클라우드 채택은 적합 한 솔루션입니다. (예를 들어 멀티 채널 마케팅, 소셜 미디어 분석, 지리적 공간 분석, 액세스할 수 보관, 복구 가능한 데이터, 과학 샌드박스), 온 디맨드 서비스는 더 많은 비용. 사실, 공용 클라우드 솔루션 수 있습니다 유일한 옵션 큰 처리 해야 하는 경우, 페타, 스트리밍 및 다중 구조 데이터 최대한 빨리.
유연한 공급 매우 크고 짧은 샌드 박스 구문 분석 프로젝트: 탐색적 데이터 집합 (샌드박스 라고도 함)을 필요로 하는 매우 짧은 데이터 과학 프로젝트를 하 고 그것의 순서의 크기는 평균 크기 보다 큰 경우 공용 클라우드 또는 경제만 가능한 옵션을 수 있습니다. 클라우드 기반 스토리지 및 처리 기능을 신속 하 게 프로젝트에 투자을 활용할 수 있습니다. 다음은 프로젝트의 끝에서 저장 및 처리 기능을 재정의할 수 있습니다. 나는이 구름에 맞게 구체적으로 "버블 세트" 배포 모델 호출 합니다.
이러한 작업을 수행한 경우 다음 큰 클라우드 기반 데이터의 전략적 문제가 아니다 프로젝트의 시작 부분에. 성장 세련, 가격/성능, 확장성, 유연성, 및 대용량 데이터 클라우드 기반 서비스의 관리와 함께이 문제는 프로젝트가 종료 될 때 발생 합니다. 점점 더 많은 응용 프로그램 및 공용 클라우드로 이동 하는 데이터와 함께 10 년 말까지 구축 하 고 대용량 데이터 배포 실행의 아이디어 오늘 자신의 서버 디자인으로 비현실적인 될 것입니다.
(책임 편집기: Fumingli)