맥킨 지는 빅 데이터 시대에와 서 처음: "모든 산업 및 필드 데이터에 의해 침투 되 고 데이터 생산에 매우 중요 한 요소가 되고있다." 처리 및 대용량 데이터의 발굴 생산성 성장의 새 풍조와 소비자 잉여의 물결을 의미 합니다. "
큰 데이터 개념 처음 4 "V" (볼륨 볼륨, 여러 다양 한, 값, 속도), 또는 4 개의 수준으로 큰 데이터의 특성을 표현 하는 IBM에 의해 정의 되었다: 첫째, 데이터의 볼륨은 크다. 대용량 데이터에 대 한 측정의 시작 단위는 적어도 P (1000 t), E (1 백만 t) 또는 Z (1 십억 t), 그리고 두 번째, http://www.aliyun.com/zixun/aggregation/18278.html "> 데이터 형식이 많다. 예, 블로그, 비디오, 사진, 지리 정보 고 등. 셋째, 값 밀도 낮은, 상업적 가치가 높습니다. 4, 처리 속도 빠르다입니다. 이 마지막 점은 일반적인 데이터 마이닝 기술부터 근본적으로 다르다.
일부 에너지를 포함 하는 탄광을 데이터를 비유 했습니다. 스팀의 성격에 따라 석탄 석탄, 무연탄, 지방 석탄, 불 쌍 한 석탄 및 다른 분류, 및 오픈 석탄 광산, 산 석탄 광산 비용의 동일 하지는. 마찬가지로, 큰 데이터는 "큰" 하지만 "유용한"이 지 않다. 마이닝 비용 수량 보다 더 중요 한 것은 콘텐츠, 가치.
대부분 서비스 어떤 전통적인 회사 필요 큰 데이터? 첫째, 몇 가지 예를 제공: 1 3 압력을 받고 인터넷을 직면 하 고 제품 또는 서비스 소비자 (정밀 마케팅)의 많은 수를, 긴 꼬리 기업 (서비스 변환)의 2 작고 아름 다운 모델을 제공 하는 전통적인 기업 (생존) 변환 해야 합니다.
엔터프라이즈의 대용량 데이터에 대 한 예측 있다: 데이터에서 점차 기업의 자산으로 데이터 업계 공급 체인 전통적인 기업 모델 개발 되며 결국에 "데이터 공급 체인." 형성 저기, 특히, 2 개의 명백한 현상: 1 외부 데이터의 중요성은 점점 더 내부 데이터를 초과. 인터넷에서 상호 연결, 단일 엔터프라이즈의 내부 데이터 및 전체 인터넷 데이터의 시대만 버킷 2, 처리 데이터 공급, 데이터 통합, 데이터 응용 프로그램 및 회사의 서비스에 대 한 다른 링크 분명 통합된 경쟁 우위를 해야 합니다 제공할 수 있습니다.