큰 데이터 "험담": 7 오해 Hadoop 및 큰 데이터를 구문 분석 하는

출처: 인터넷
작성자: 사용자
키워드: 빅 데이터 can가 십 실행

Hadoop, 경우 그것은 오픈 소스 세계에서 신화 하지만 지금은 업계 동반 하는 그것을 유도할 수 있는 소문 "색된" 보기와 함께 전략을 개발 하는 임원.

오늘, 볼륨 데이터의 놀라운 속도로 성장 하 고, 성장 IDC 애 널 리스트 보고서 2013 데이터 저장소에서 53.4%,at를 도달할 것 이다 & t 무선 데이터 지난 5 년 동안 200 시간, 인터넷 콘텐츠, 전자 메일, 알림 응용 프로그램에서의 증가 흐름 주장 소셜 뉴스 및 매일에 수신 된 메시지는 성장 크게, 많은 큰 회사는 큰 데이터에 집중 하는 이유.

의심의 여지가 그 Hadoop 주소 큰 데이터 요구에 대 한 투자의 주요 분야 중 하나 되고있다 이며 공개적으로 선전 Hadoop에 페이스 북과 같은 인터넷 거 인의 성공 또한 Hadoop에 먼저 집중 해야 합니다. 하지만 Hadoop 기술, 다차원 솔루션을 배포 하 고 다른 방법으로 사용할 수 있습니다. 여기 Hadoop 및 큰 데이터에 대 한 7 가지 오해 중 일부는 다음과 같습니다.

1. 대용량 데이터는 그냥 용량

큰 데이터를 다양 한 (다중), 다양성 (변수), 속도 (속도) 및 값 (값)는 종종 언급 볼륨 뿐만 아니라. 주요 요점은 큰 데이터 하지 볼륨 성장, 실시간 분석, 구조화 및 구조화 되지 않은 데이터 개발의 미래 더 및 더 나은 의사 결정을 위한 기업 Cio에 의해 사용 됩니다.

정리해 보면, 이득 값을 큰 데이터의 분석에만 아니다. 예를 들어 데이터 저장 및 분석 1PB 값 1GB 데이터를 실시간으로 분석 하는 만큼 귀중 하지 않을 수 있습니다 하 고 오래 된 데이터를 해 부 보다 더 가치가 있다 "신선한" 데이터에서 값을 가져올.

2. 전통적인 SQL Hadoop에 사용할 수 없습니다.

많은 공급 업체 Hadoop에 그들의 에너지를 정 진 하 고 때 그들은 그들의 마케팅 전략을 하다, 그것은 분명 MapReduce와 HDFs 하이브, 돼지와 Sqoop 결국 승진은 핸들 SQL 같은 언어 수로 제한 됩니다. 더 많은 기업 Hadoop 통해 데이터의 큰 금액을 관리 하 고 SQL 호환성, 중추적인 HD 처리 데이터베이스 및 Hadoop 2.0, Hadoop 향상 된 버전의 엔터프라이즈 데이터 분석 요구 사항에 최적화 된 SQL 병렬의 조합 이다.

3. Hadoop은 유일한 새로운 IT 데이터 플랫폼

그것에 올 때 데이터 플랫폼, 메인프레임 ERP, CRM, SCM 시스템으로 진화 하는 IT 포트폴리오에 대 한 장기 투자는. 빅 데이터 시대 얼굴 메인프레임 하지 않으려면, 아키텍처에 의해 버려진 많은 고객 속도, 규모와 고속 데이터 액세스를 해결 하기 위해 Vfabric Sqlfire 같은 대형 메모리 데이터 네트워크를 통해 비용의 문제가 발생 하는 동안 그것은 기존에 값을 투자 환경, 입증 해야 합니다 메인프레임 일괄 처리 또는 이러한 문제에 대 한 보고 하는 실시간 분석을 촉진 한다.

4. 가상화 성능 저하로 이어질 수 있습니다.

Hadoop은 원래 엔터티 서버에서 실행 되도록 설계 하지만 클라우드 컴퓨팅 개발로 많은 기업 클라우드 데이터 센터 역할을 하 고 싶 었. Hadoop의 가상화에 대 한 이유는 기업 그 가상 Hadoop 노드 같은 컴퓨팅 리소스를 확장 때 유용할 수 있습니다 성능에 대 한 데이터와 컴퓨팅을 분리, 인식 관리 인프라의 확장성을 고려해 먼저 야 그렇지 않으면, Hadoop 노드를 닫으면 모든 위의 데이터를 잃을 또는 데이터가 없는 빈 노드를 추가 합니다.

5. 하 둡 데이터 센터에만 실행할 수 있습니다.

SaaS 클라우드 서비스 솔루션에 대 한 많은 클라우드 서비스 구름 Hadoop, SQL, 의심할 여 지 없이 회사를 도움이 될 것입니다 시간과 돈을 절약 데이터 센터에서 건설 투자 실행을 허용 합니다. 특히 공공 구름에 대 한 자바 개발자 봄 Hadoop 및 다른 GitHub에 대 한 데이터 사용 사례에서에서 활용할 수 있습니다.

큰 데이터 복잡성

6. Hadoop 가상화에 대 한 경제적 가치가 있다

Hadoop은 사실 가상 계층을 추가 하는 상용 서버에서 실행 하는 동안 비용에 추가 값을 추가 많은 전망, 그것은 데이터 및 데이터 분석은 실제로 동적를 고려 하지 않습니다. 가상화 된 인프라는 또한 자동화 하 고 효율적으로 공유 인프라를 활용 하 여 opex (운영 비용)를 줄이고 capex (자본 지출) 직접 상용 하드웨어의 비용에 동등한 만들기 물리적 하드웨어의 수를 줄일 수도 있습니다.

7. Hadoop SAN 또는 NAS에서 실행할 수 없습니다.

Hadoop 로컬 디스크에 실행 되는 동안 10GB 이더넷, 포, 및 iSCSI 또한 성능 지원 뿐만 아니라 높은 대역폭 동안 중간 클러스터 작은 공유 SAN 환경에서 수행할 수 있습니다.

따라서 큰 데이터 산업 쫓는의 초점이 되었다, "오해"에 위의 7 개의 주요 데이터 목표 볼 문제. 다른 프로젝트 요구 사항 처럼 Hadoop 회사 더 큰 데이터 문제를 해결 하는 도구입니다. 여부 그것은 GemFire 또는 sqlfire 데이터 그리드, 또는 RABBITMQ 메시지 지향 미들웨어, 솔루션은 이제 훨씬 쉽게 보다 Hadoop 환경에서 구현 하는 완전 한 SaaS 직면 하 고.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.