Hadoop을 선택에 대 한 주요 이유는 다음 세 가지 포인트: 1. 비용 절감, 2. 생태 원 숙; 3. http://www.aliyun.com/zixun/aggregation/7432.html 수 "> 문제 해결.
하나, 어떤 문제를 해결 하기 위해 우리가 도울 수 있습니다.
지금 국내외에서 큰 회사에 상관 없이 대용량 데이터에 대 한 매우 열망, 지속적인 데이터 변경, 정보의 많은 수의 결과로 현대 정보의 비대칭으로 인해 데이터는 데이터 분석을 통해 얻어질 수 있다 모든 수집을 모든 수단을 할 것입니다.
많은 데이터의 소스, 큰 데이터 형식을 더 복잡 한 될 것 이며 시간이 점점 더 많은 데이터를 생산할 예정 이다. 그래서 데이터 저장 및 데이터 기반 컴퓨팅 병목으로 전통적인 데이터베이스를 만들 수 있습니다.
그리고 Hadoop이이 문제를 해결 하기 위해 태어났습니다. 하자 분산된 파일의 하단은 매우 강력한 확장성, 데이터를 통해 데이터에 대 한 손실, 손실 되지 않습니다 하지만 또한 뿐만 아니라, 컴퓨팅의 효율성을 향상 시킬 수 있습니다 데이터 스토리지의 다양 한. 다양 한 컴퓨팅 프레임 워크에 대 한 지원 또한, 뿐만 아니라 오프 라인 수 계산 온라인 실시간 계산에 영향을 수도 있습니다.
둘째, 성숙한 생태 원
생물권의 성숙 미래 개발, 즉 더 나은 시장 미래에 더 많은 qiantu 작업을 의미 합니다.
셋째, 왜 비용을 줄일 수 있습니다.
때 우리는 우리가 문제를 해결할 수 있는지, 우리는 비용을 먼저 고려해 야 합니다.
1. 하드웨어 비용
Hadoop의 아키텍처는 저가 서버를 기반으로, 때문에 비싼 서버를 지 원하는 하드웨어 필요 하지 않습니다.
2. 소프트웨어 비용
기본적으로 오픈 소스 제품 무료, 오픈 소스 계약, 수정 하 게 자유롭게, 제어 될 수 있습니다 훨씬 더 큰 될 것입니다.
3. 개발 비용
때문에 두 개발, 개발자에 대 한 작업 요구는 매우 높다.
4. 유지 보수 비용
때 대규모 클러스터 개발 및 유지 보수 비용 직접 강조 될 것 이다. 하지만 그것은 새로 개발된 된 시스템에 대 한 훨씬 저렴.
5. 기타 비용
Hadoop 서버 매우 낮은 비용으로 커뮤니티 서비스 이며 기본적으로 모든 사람에 게 사용할 수 있습니다. PB 수준 데이터의 혼란을 처리할 수 있습니다 그리고 분산된 처리 실패 후 데이터를 저장 하는 데 사용할 수 있습니다. Hadoop의 높은 확장성: 컴퓨터 클러스터 컴퓨팅 작업의 완료 사이의 데이터의 할당 다른 유형의 노드를 손쉽게 확장할 수 있습니다.
고 능률:, 노드 간에 데이터를 자유롭게 이동할 수 있습니다 및 처리 속도 매우 빠르다 그래서 각 동적 노드 균형을 유지할 수 있습니다.
높은 결함 허용: 데이터의 여러 복사본을 자동으로 저장 될 수 있다, 그리고 자주색 강 작업 재분배의 각 오류를 수 있을 것입니다.