많은 사람들의 마음에서 둡 빅 데이터와 동의어 것 같다. 당신이 큰 데이터와 Hadoop으로 탐구, 당신은 어떻게 둡은 대용량 데이터에 대 한 그냥 저장 도구에 대 한 깊은 이해를 해야 합니다. 하지만 그건 반드시 나쁜 것. 저렴 하 고 효율적인 스토리지로 Hadoop을 복용 하는 것은 Hadoop의 진화의 다음 단계에 대 한 그냥 완벽 한 출발점입니다. Hadoop 2.0, 이번이 여름 공개 될, 데이터 웨어하우스 및 구조화 되지 않은 데이터 풀에 이전 보다 더 접근 정보 만들 것입니다.
Hadoop 큰 배럴
큰 데이터 도구 되었다 하지만 데이터에 액세스 하려면 Java 응용 프로그램을 개발 하는 mapreduce 배울 수 어렵습니다 좋은 데이터 스토리지 시스템 이다.
물론, Hadoop에서 정보를 얻으려면 다른 방법이 있다. HBase 데이터는 데이터베이스 패러다임에서 데이터 작업을 사용자가 허용 하는 Hadoop의 일부입니다. 하이브 데이터 웨어하우스를 사용 하면 SQL Hivesql 쿼리 언어를 사용 하 여 쿼리를 만들 mapreduce 작업으로 그들을 번역 하는 것을 수 있습니다. 하지만 Hadoop은 여전히 단일 스레드 제한. MapReduce 작업, 하이브 쿼리, hbase 작업과 회전을가지고 간다.
가 때문에 많은 큰 데이터 공급 업체 데이터 컨테이너 으로만 Hadoop을 사용 하 고 효율성을 개선 하는 경향이, 그들은 그 데이터를 분석 하거나 그들의 자신의 도구를 개발. 그것은 큰 배럴으로 묘사, 비록 Hadoop 사용자 데이터 큰 호수 또는 심지어 데이터 바다 본 있다. 하지만 물건의 투명 한 크기는 작동 하지 않습니다, 그리고 Hadoop의 판매 포인트 그 제한에 영향을 미칠.
Hadoop의 개발 커뮤니티는 또한이 문제에 대해 크게 Hadoop은 새로운 버전
반복 해제 하는
사 솔루션
아 룬 목요일, Hadoop 2.0 릴리스 관리자, 가장 중요 한 변화는 MapReduce 프레임 워크 범위와 Hadoop에 적용 될 수 있는 소프트웨어의 범위를 확장 하는 아파치 원사로 업그레이드 됩니다. 원사 프로젝트 감독, 지향, 후자 내부적으로 데이터에 액세스 하는 여러 응용 프로그램 수 배치는 전에서 모든 Hadoop 1.0과 2.0의 차이 지적 아 룬 목요일
현재 MapReduce 시스템이 처리할 수 있는에서 이러한 기능을 분리 하 여 Hadoop 클러스터 리소스의 관리는 더 강력 하다. 주요 관리 스타일은 유사한 운영 체제의 작업의 처리, 즉, 더 이상 운영 한.
원사와
, 개발자는 외부 데이터를 통해 자만심 보다는 Hadoop, 내에서 직접 응용 프로그램을 개발할 수 많은 3-파티 도구 처럼.
목요일 말한다 이미 공급 업체 원사 프레임 워크 내에서 응용 프로그램 개발에 관심을 보이고 있다. 목요일에는 Hadoop 2.0의 강력한 베타 버전은 6 월 또는 7 월에 출시 될 것을 공식 버전은 8 월에 공개 될 수 있습니다 추정 하고있다.
원사의 약속은, 하는 경우 개발자는 네이티브 Hadoop 플랫폼에서 오대호 바다, 더 유연 하 고 유용한 정보에 대 한 검색을 편리 하 게 그것을 만드는 많은 데이터에 쉽게 액세스할 수 있을 것 이다. 다음으로, 큰 데이터는 더 유용 하 고 더 많은 인기 될 것입니다.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.