Eckerson 웨인, 컨설턴트, 어디 개별 데이터 분석 및 Spreadmart (보고서 마트) 또한 그들을 지역 셀프 서비스 분석을 하면서 비즈니스 사용자에 의해 설립에 대 한 더 편리 하 게 제어를 제공 동적 환경 모니터링 플랫폼을 제공 하는 하 둡을 말한다.
Spreadmart는 스프레드시트 데이터 마트, 비즈니스 인텔리전스, 여러 개인 및 팀 만들 다른 스프레드시트의 분야에서의 약어입니다. 데이터가 일치 하지 않습니다, 때문에 그것은 사업에 문제를 많이 제공 합니다.
수십 년 동안, 모든 데이터 분석가 사용 셀프 서비스 분석 도구에 액세스 하 고 데이터를 조작, 추세 및 예외를 식별 비즈니스 인텔리전스 통찰력을 보여주는. 비록 도구의 종류는 수 년에 걸쳐 변경, 결과 거의 항상 같은: 독특한 규칙, 통계, 및 정의 기반으로 하는 Spreadmart 또는 데이터 그림자 시스템.
가장 큰 기업은 spreadmart, 각각의 시간에 어떤 시점에서 중요 한 또는 지역화 문제를 해결 하도록 설계 되었습니다의 수천 수만 있다. 비록 개별 사업 단위, Spreadmart 귀중 한 CEO 및 CFO. 그들은 같은 간단한 질문을 물어, "얼마나 많은 고객을가지고 우리는?" 그리고 그들은 충돌 답변 spreadmart에서 일치 하지 않는 데이터 데이터 분석가 및 사업 부서장에 의해 인용. 관리자 및 기업 임원 데이터 일관성 및 비즈니스 순서 복원 데이터 웨어하우스 규칙 설정 Spreadmart 현상 그것의 수천을 수 있게 되었습니다.
이 spreadmart 도구, BI 소프트웨어, 서비스를 Microsoft Excel과 access에서 다양 한 데이터를 사용 하 여 사람을 방지 하지 않으며 고급 수준 소프트웨어 사용 하 여 SAS, SPSS 통계 분석 및 데이터 마이닝에 대 한. 하지만 Spreadmart 부작용을 개선 하는 회사를 도울 수 있는 새로운 기술: Hadoop 클러스터.
오픈 소스 소프트웨어는 무료, 그리고 그것을 실행 하는 데 필요한 하드웨어, 저렴 하 고 분석가 그것을 사용 하는 SQL 이나 데이터 모델링 기술을 이해 하지 않아도. 그들은 수 있습니다 덤프 데이터를 Hadoop 및 다음 액세스, 처리, 고 Hadoop에 고급 언어 하이브 또는 돼지, 또는 호환 BI 및 데이터 통합 도구를 사용 하 여 데이터를 분석. Hadoop을 구현 하는 많은 이유가 있지만, 주된 이유 중 하나 데이터 분석 없이 셀프 서비스의 개입, 양성 이며 Hadoop 빠르게 되고있다 기본 Spreadmart 플랫폼 성숙한 분석가 부서장에 대 한.
Hadoop에 무료 관리
지금까지, 최소한의 통신 Hadoop 환경에서 데이터 관리를 구현 하는 방법을 계속 있다. 데이터 품질, 데이터 일관성, 적절 한 크기 및 메타 데이터 관리가이 용어는 아직 입력 하지 Hadoop의 사전. Hadoop은 여전히 새로운, 때문에 대부분의 회사는 여전히 생산 시설을 지원 하기 위해 그들의 능력을 평가 하 게 됩니다. 이것은 또한 그것의 주요 사용자, 비즈니스 분석가, 있다 결코 지나치게에 초점을 맞춘 기업의 데이터 거 버 넌 스 및 일관성, 그리고 평가 하 고 높은-품질 데이터에 대 한 필요 없이 경향을 분석 수 있기 때문에.
그래서, 경우 Hadoop은 모든 셀프 서비스에 대 한 무료 시스템, 분석가 비즈니스 사용자 수 있습니다 구현 덤프 하 고 힘 드는 관리, 미 쳤 어 둡 데이터 풀을 리플으로 설정 하지 것입니다 보증 무엇입니까 없이 데이터에 액세스 즉, hadoop 더 미래에 spreadmart의 수를 증가 또는 Spreadmart의 통합을?
질문에 응답은: 모두 것입니다.
회사 수 실제로 사용 하 여 Hadoop 저가 저장소로 그들의 모든 데이터, 즉, 데이터 풀에 대 한. 그 결과, Hadoop 시스템 기업에서 모든 분석가 및 비즈니스 단위에 대 한 원스톱 서비스 보다는 여러 응용 프로그램 및 시스템에서 데이터를 검색 하며 분석가 파서 데이터 풀에 필요한 모든 것을 얻을 수 있습니다. 이것은 spreadmart를 만들 쉽게.
그러나, 이것은 다양 한 Pc와 파일 서버에 많은 무료 제어 spreadmart 추가 하는 방법 하지만 Hadoop은 단일 위치에 데이터를 분석 하는 능력을 향상 시킬 가능성을 제공 한다: 더 큰 경제와 상당한 비용 절감을 제공 하는 거 대 한 분석 샌드 박스. 그것은 그것을 가능 하 게 하 고 실제로 어떤 분석가 보고 비즈니스 관리자는. Spreadmart를 고려 하는 한 가지 방법은 비즈니스 요구 사항 인스턴스화로 Spreadmart를 고려 하는 것입니다. 숨겨진된 Spreadmart 어려운 그것에 대 한 관리자, 사업에 중요 한 것을 분별 하 고 엔터프라이즈 보고의 요구 사항에 맞게 데이터 웨어하우스에서 데이터를 찾기 어려울 수 있습니다. 데이터 분석 데이터 호수에 집중 하 여 Hadoop 쉽게 이러한 문제 it와 비즈니스 파트너, 그리고 또한 적극적으로 그들의 요구를 충족.
데이터 분석 노바
그러나, Hadoop spreadmart 컬렉션을 유지 하기 위한 컨테이너 그냥 되지 않습니다. 그는 대부분의 기업 정보 분석에서의 요구를 충족할 수 있는 확장 가능 하 고 유연한 데이터 처리 플랫폼입니다. 그것은 데이터 처리에 스위스 군용 칼 처럼: 그것은 아무것도 할 수 있는 거의 그러나 가장 (일 적어도 아직은) 범용 도구입니다.
Hadoop의 모든 엔터프라이즈 데이터 웨어하우스 처럼 뿐 아니라 일부에 대 한 데이터를 저장할 수 있습니다. 원사 자원 관리, Hadoop 2, 마지막 시작 부분의을, 지 원하는 다양 한 데이터 및 분석 응용 프로그램, 실시간 SQL 쿼리 시스템, 그래픽 메모리 계산 및 스트리밍 분석 엔진에서 처리 할 수 있다. Hadoop의 2 성숙 하는 시간이 걸립니다, 하지만 미래는 분명: 기업 Hadoop 클러스터에 데이터를 저장 하 고 거기 처리 수 있습니다.
이것은 혁명 이다. 그것을 능숙 하 고 데이터 웨어하우스 관리자 곧 영향을 잘 알고 있을 것입니다. Hadoop 2 시스템의 도래와 함께 미래 분석 건축 이전 관계형 데이터베이스 보다 Hadoop 돌고 됩니다. 추가, 기존 분석 시스템 전문된 데이터베이스 해지고 결국 사라지고, Hadoop 성숙 하 고 그들의 기능을 병합 합니다.
적어도, 그것은 비전 이다. 개발 및 실험의 큰 거래는 대부분 기업 HADOOP2 데이터 풀에 그들의 현재 분석 생태계를 변경 하기 전에 필요 합니다. 기존 분석 시스템은 긴 수명: 그들의 가치는 완전히 평가 절 하를 하는 경우에 포함 된 자연과 엔터프라이즈의 관성 어렵게 그들을 포기 하는 회사. Hadoop 결코 그것의 약속을 이행할 수 있습니다 또는 다른 기술을 미래에 분석 상태로 바뀝니다.
하지만 Hadoop의 세계에서 그런 것 들 일이 항상. 오늘날, Hadoop에서 사실상 엔터프라이즈 데이터 저장소, 급속 하 게 되고있다 그리고 소음 모니터링 시스템 우선 Spreadmart 플랫폼 (또는 분석 샌드박스). 곧 그것은 분석 응용 프로그램 및 가장 분석 생태계를 구축 하기 위한 주요 플랫폼을 수 있습니다.