& http://www.aliyun.com/zixun/aggregation/37954.html "> nbsp;
큰 데이터의 핵심 가치 저장 및 대규모 데이터의 분석 이다. 기존의 다른 기술과 "저렴 한, 빠르고 최적화 된"의 전반적인 비용에 비해 큰 데이터의 최적입니다.
이 기술을 자체적으로 사용 (와 같은 구글, 등)에 있을 때, 비용은 줄어들 것입니다, 고객에서 기술, 고객 또한 유익할 때 때문에 매우 수익성이 될 것입니다. 고객 하 고 스스로 동시에 혜택을 기술 이다 가장 상업적으로 귀중 한. 따라서, 큰 데이터는 그냥 구호, 소리의 빈 단어 하지만 다른 신흥 기술 처럼 상용화 과정 이다, 이제, 대용량 데이터 또는 작은 양모의 단계에 속하는, 너무 많은 사람들이 더 큰 데이터과 대 광고 의혹을 생각 하는 갈 것 이다.
그러나 큰 데이터의 핵심 가치를 논의 하면서 Hadoop 시스템의 기술에서 이탈 불가능 그래서 큰 데이터 표시 기술, 시스템은 이미 인정 사실, Hadoop의 기술에 국한 되지 않습니다.
, 대규모
가 키 큰 데이터를, 적은 양의 데이터는 IT 업계에는 많은 솔루션, 그래서 큰 데이터 기술 이점이 아니다.
, 스토리지
여기 많은 스토리지 기술에 대 한 필요성은, 두 번째 데이터 저장 장치 스토리지 서버 노드 증가, 데이터 손실 되지 수 있도록 기본 복사 기술으로, 확장할 필요가 있다.
3. 분석
대규모 데이터 분석 처리 분산 해야 합니다, 그렇지 않으면 시간 비용이 너무 큽니다. 분산된 기술, 고 전문적이 고 복잡 한. Hadoop 분산된 처리에 수십 또는 수백 개의 코드를 실행 해야 하 고 전문 프로그램에 기본 데이터 분석을 완료 하는 데 짧은 시간이 걸립니다. 물론, 대부분의 전문 대용량 데이터 분석 또는 필요 전문가 완료.
4. 우수한
Hadoop 시리즈 기술은 특별히 설계 되었습니다. 대규모 데이터 처리, IT 업계에서 최상위 기업 참여 기여도 및 관련된 기술 기여에 대 한 있다 완성 시스템 생태 원에 따라서 각 종류의 요구 만족 기본적으로 수 있습니다. Hadoop은 분산 기술의 나머지 부분에 우수한.
5. 빠른
1. 클러스터 처리 성능을 작동 차입 증가 함께 선형으로 확장 됩니다.
2. Java 언어 구현에 따라, 학습의 임계값은 크게 감소.
3. 배포 하 고 유지 하는 클러스터 (클러스터 구축 및 유지 관리 도구, 웹 인터페이스의 운영 차원 제공 하는 많은 상업적인 버전을 포함 하 여 많은 자동이 있다 함) 쉽게 되 고 있다.
6. 싸구려
1. IBM, 오라클, EMC, 또는 Windows 라이선스 같은 회사에서 비싼 하드웨어, 소프트웨어 및 서비스를 구입할 필요가 없습니다.
2. 사람이 나 기업 들이 기술 해야한다의 증가 수, 그것은 점점 싸게 구입 하거나 기술을 기반으로 관련
일반적 상업 제품을 사용자 지정, 대용량 데이터의 전체 비용 다른 기술 시스템을 기준으로 최적의.