시장 조사 기관인 IDC에 따르면 2009와 2020 사이 44 시간으로 증가할 것으로 예상 하는 디지털 정보의 총 금액 것입니다 예상할 수 앞으로 10 년에 약 35.2ZB에 도달 하는 글로벌 데이터 사용 (1ZB = 1 십억 TB). 동시에 단일 데이터 집합의 파일 크기가 큰 처리 전원 요구 사항을 분석 하 고 이러한 데이터 세트를 이해의 결과로 증가할 것 이다.
Unisphere 연구에 의해 531 독립적인 오라클 사용자의 설문 조사는 기업의 90%는 급속 하 게 상승, 16% %와 50% 성장 이상 매년 발견. 많은 기업 성능에 런어웨이 데이터 성장의 영향 느낌과 응답자의 87% 성장 하는 데이터의 볼륨에 회사의 응용 프로그램 성능 문제를 비난 했다 발견 했습니다.
왜 사람들이 그렇게 큰 데이터에 관심이? 큰 데이터를 새로운 인프라를 소개 하는 획기적인 경제 및 기술 힘 지원 이다. 큰 데이터 솔루션 전통적인 컴퓨팅 및 저장소 제한을 제거합니다. 민간 및 공공 데이터를 성장, 획기적인 새로운 비즈니스 모델은 대용량 데이터 고객에 게 새로운 실질적인 매출 성장과 경쟁 우위를가지고 약속 나오고 있다.
Huashan 칼의 큰 데이터
"빅 데이터" 대형 또는 대규모 데이터로 번역 될 수 있다, 비록 큰 데이터와 대규모 데이터 간의 차이가 있다. 컴퓨터, 중국만 빈 수석 제품 관리자 말했다: "빅 데이터" "대규모 데이터"의 의미를 포함 하 고 데이터, 즉, 대량의 넘어 콘텐츠 "빅 데이터"는 "대량 데이터" + 데이터의 복합 형식. 거래 및 대화형 데이터 집합을 포함 하 여 큰 데이터 세트는 더 큰 또는 캡처, 관리, 저렴 한 비용 및 시간에 이러한 데이터 세트를 처리 하는 일반적인 기술 능력 보다 더 복잡 한. 큰 데이터는 세 가지 주요 기술 동향 구성: 대규모 트랜잭션 데이터, 거 대 한 대화형 데이터 대량 데이터 처리.
"빅 데이터의 균일 한 정의" 너희 Chenghui, 수석 부사장은 글로벌과 중국 대통령, 한 인터뷰에서 말했다. 구조화 되지 않은 데이터, 데이터, 데이터 다양화의 형태의 많은 수에 의해 특징의 다는 것을 일반적으로 믿어진다.
NETAPP 중국 제너럴 매니저 첸 웬 큰 데이터를 이해 하 고 a, B, c 3 요소를 포함 하 여: 큰 분석 (분석), 높은 대역폭 (대역폭) 및 대형 콘텐츠.
IBM 사용 3 "V" 기준으로 대용량 데이터에 대 한 큰 데이터의 두 가지 만족으로: 다양성 (다양 한), 볼륨 (음량), 그리고 속도. 다양성은 데이터 구조화 및 구조화 되지 않은 데이터를 포함 해야 의미 합니다. 볼륨 분석 매우 큰 것을 위해 함께 집계 되는 데이터의 양을 말합니다. 그러나 속도,, 데이터 처리 빨리 해야 의미 합니다.
대기업, 큰 데이터에 상승 일부 있기 때문에 컴퓨팅 파워는 저렴 한 비용, 사용 가능 및 시스템은 이제 멀티태스킹의 능력 이다. 둘째, 메모리의 비용 또한 급락은, 그리고 기업은 그 어느 때 보다 메모리에서 더 많은 데이터를 처리할 수 있습니다. 그리고 집계 컴퓨터 서버 클러스터로 쉽게 지 고 있다. 칼 Olofson, IDC의 데이터베이스 관리 분석가,이 세 가지 요소의 조합 큰 데이터를 양산 했다 생각 합니다.
Olofson 큰 데이터 "하지 항상 있다 수백 TB." 라고 실제 사용, 때로는 수백 기가바이트의 데이터 호출할 수 있습니다 그것의 제 3 차원에 주로 달려 있는 큰 데이터에 따라 즉, 속도 또는 시간 차원. 1 초에 300 GB의 데이터를 분석할 수 있습니다 및 일반적으로 1 시간 소요,이 거 대 한 변화의 결과 큰 가치를 추가 합니다. 큰 데이터 기술은이 세 가지 조건 중 두 개 이상을 달성 하는 저렴 한 응용 프로그램입니다. "
큰 데이터 정보를 보다 신속 하 게 가져오고 따라서 돌파구를 달성 하 여 다른 것 들을 만드는 것을 의미 합니다. 큰 데이터는 많은 양의 (일반적으로 구조화 되지 않은) 데이터를 저장, 관리, 및 데이터를 복구 하는 방법을 다시 우리 필요로 하로 정의 됩니다. 그래서 얼마나 큰 무엇입니까? 문제에 대해 생각 하는 한 가지 방법은 데이터를 소화 하 고 귀중 한 통찰력과 정보로 변환 하는 방법에 열쇠입니다 그래서 오늘 우리가 사용 하는 도구 중 그것을 처리할 수 있는 대규모입니다.
즉, 대용량 데이터의 다양 한 관심을 끌고있다 공급 업체, 2, 복잡 한 데이터 구조, 데이터 마이닝 프로세스의 관심에 대 한 이유의 다 수 어렵습니다, 둘째, 많은 양의 데이터를 그리고 빨리, 특히 높은 처리 적절 한 요구 사항을 업데이트.
(책임 편집기: 유산의 좋은)