Hadoop은 아니라 큰 데이터 처리 모든 릴리스 시간: 2012.05.30 15시 48분 소스: 디 순 작성자:
클라우드는 대용량 데이터 처리를 할 때, 과거에는, 서버 클러스터의 많은 수를 구입할 필요가 없습니다 제어 비용의 더 많은 사용을 큰 숫자를 처리 하는 임대 서버 컴퓨팅에 대 한 좋은 것. 헤비 급 분산 처리 하는 오픈 소스 프레임 워크, Hadoop은 대규모 데이터 처리의 분야에서 차이 만들었습니다 회사 하 고 Hadoop을 사용 하 여 그들의 자신의 미래 데이터 처리 청사진을 계획. EMC, 마이크로소프트, 오라클에서에서 거의 모든 높은-기술 공급 업체는 하 둡 기반으로 지난 몇 개월 동안 그들의 자신의 큰 데이터 전략을 발표 했다. 오늘 Hadoop 되고있다 뜨거운 단어 고객을 유치 하기 위해 쇼핑몰에 대 한.
Hadoop의 성장 개별 개발자, 신생 및 큰 기업에 의해 지원 되었습니다. 이것 또한 사용자 Hadoop을 사용 하 여 오랜 시간을 제공 합니다. 그러나, 다른 공급 업체 코드의 지속적인 개선으로 인해 제품 수 서로 함께 작동 하지. Hadoop의 현재 상태는 안 드 로이드와 매우 비슷합니다.
대부분의 기업이 정말 큰 데이터를 이해 하지 않습니다.
"빅 데이터"의 장점은 단지 규모, 하지만 성능, 데이터 집합의 차원 수에 아니다. 이 이해 하는 데 필요한 어떤 지원 또는 어떤 제품을 찾고, 현재 날씨와 다른 조건 납품 노선 및 일정에 어떻게에 영향을 사이트에 고객의 행동을 평가 하는 등 직접 분석을 위해 중요 하다. 이것은 서버 클러스터, 높은 성능 파일 시스템 및 병렬 처리 일 하는 곳 이다. 과거에는, 이러한 기술을 대기업에 의해 사용 될 너무 비싼 했다. 오늘, 가상화 및 비즈니스 하드웨어의 "큰 데이터"에 사용할 수 있는 작은 중소 기업 만드는 이러한 기술을 사용 하 여 비용 줄일.
작은 회사는 또한 "" 빅 데이터 분석에 클라우드를 사용 하는 또 다른 방법은 있다. 큰 데이터 클라우드 서비스 제공 하는 플랫폼 도구 분석의 신속 하 고 효율적인 실행을 위해 등장 하고있다.
Capgemini의 cto 인 조 코일 말한다 큰 데이터 향후 트렌드 될 것입니다 하지만 많은 기업 들이 무엇을 이해 하지 의미. 클라우드 컴퓨팅 및 빅 데이터의 개념은 가장 질문과 고객, 그리고 업계 Hadoop 기술의 열에서 오늘 다른 소리를 하고있다. 일부 제조 업체는 회사는 너무 미 쳤 어 둡에 대 한 개념을 가리킵니다. 개발 및 Hadoop 클러스터의 복잡성을 관리 해야 관련 실무자의 전문성, 지원 하 고 관련된 인력을 고용의 비용 비싸다. JP 모건 체이스 제너럴 매니저 래리 Feinsmith는 그들이 기꺼이 하지만 자격 갖춘된 전문가 고용 하지만 업계 관대 치료 보다 높은 10%를 제공 했다.
모든 산업 Hadoop 배포 해야
자체 제조 사업 및 제품 수명 주기 관리 일반적으로 제조 업계에 ERP 및 재고 시스템을 위한 관계형 및 비 관계형 데이터의 많은 양의 만듭니다. 회사는 완벽 한 대형 데이터 수집 및 분석 솔루션을 갖고 싶어 하지만 모든 기업 Hadoop 즉시 전환 해야 합니다.
GE 정보 플랫폼 부서에서 복잡 한 제조 데이터를 수집 하도록 테스트 소프트웨어를 구축 했다. 이동도 빠르게 개발 하기 위해 Proficy 역사가 4.5 소프트웨어 자체를 밀고 있다. Proficy 역사 제공 하는 메서드는 Hadoop을 사용 하 여 보다 더 신뢰할 수 있는 약속. GE의 기업 데이터 관리 부서의 브라이언 코 티 회사의 아웃-의-더-박스 솔루션을 제공, 하 둡에 비해 Hadoop의 장점은 그들은 저렴 하 고 Hadoop 보다 더 조 타 하는 동안 말한다.
GE는 기록 데이터의 많은 수는 생산 및 테스트 단계에서 온의 대부분. Proficy 역사가 제품 제조 및 파형, 같은 테스트에서 생성 된 관계형 및 비 관계형 데이터를 처리 하는 데 사용 하 고 예상 가능한 문제에 활용 될 수 있습니다.
예를 들어 터빈 엔진을 시작할 때 Proficy 역사가 고 수 있습니다 검색 해당 전자 서명을 볼. 어떻게 예외 때 정상적인 시동 때 발생 하는 부하 테스트? 당신은 전에 비슷한 상황 있었나요? 또한 제조 업체 선택 오류를 제외 하도록 그들에 대 한 우선 순위를 비슷한 시스템 오류를 발견 하면이 오류를 해결 하려면 소요 된 시간을 볼 수 있습니다. Proficy 역사 또한 과거의 기록 데이터, 과거에 비슷한 문제가 있다면 확인 하 고 앞으로 가능한 보고서를 생성 비교할 수 있습니다 다른 변칙. 브라이언 코 티는 말했다.
Proficy 소프트웨어의 새로운 버전은 더 큰 데이터를 처리 하도록 설계 되었습니다. Proficy의 이전 버전 지원 2 백만 탭, 그리고 Proficy는 최대 15 백만 탭을 지원 하는 오늘.
아마존의 클라우드 컴퓨팅 플랫폼에 HPCC 배포
아마존의 클라우드 컴퓨팅 플랫폼 HPCC에 실행 중인 소프트웨어를 조정 했다. HPCC는 LexisNexis 회사 오픈 소스 데이터 처리 프로그램을 시작 했다. 이동은 또한 오늘날의 인기 있는 Hadoop 아이디어 추가 대체 HPCC 시스템을 수 있습니다.
아 르만 에스칼란테, HPCC 시스템의 CTO HPCC 아직 하지 않지만 Hadoop 처럼 정부와 대기업을 유치 할 수, 그것은 또한 hadoop 마치 생태 개발 HPCC의 개발자를 자극 했다 9 월에 했다.
또한 낙관 HPCC 시스템에는 일부 애 널 리스트는 하지만 Hadoop 커뮤니티로 활기찬 수 HPCC 커뮤니티에 대 한 먼 길을 걸릴 것입니다. 아마존은 AWS 또는 구름 HPCC의 좋은 예를 가져왔다, 이제 HPCC AWS의 탄성 MapReduce를 지원 합니다. 아마존 미래 더 놀랄 나타납니다 말합니다.
기술적인 관점에서 아마존 웹 서비스는 이제 HPCC 처리 대용량 데이터의 일부만 실행-토르 데이터 정유 클러스터. 플랫폼은 또한 처리 데이터 록 시 신속한 데이터 배달 클러스터의 또 다른 방법은 포함 한다. 록 시, 데이터 웨어하우스 및 데이터 쿼리 계층, 아파치 하이브 및 HBase 처럼 작동합니다.
HBase와 하이브 Hadoop 프로젝트에 그들의 자신의 언어를 했습니다. HPCC 시스템 플랫폼 ECL (기업 제어 언어)로 알려진 언어를 사용 합니다.