데이터 수백 테라바이트에서에서 자 랍니다, 우리이 전례 없는 도전을 해결 하기 위해 독특한 기술이 필요 합니다.
큰 시대에 도입 하는 빅 데이터 분석
전 세계 조직 가장 정확한 비즈니스 의사 결정 상상력에서 사실에서 온 알 았. 즉, 그들은 의사 결정 모델 및 내부 거래 시스템의 역사적 정보 데이터 분석에 따라 기술 지원을 사용 해야 합니다. 인터넷 클릭 데이터를 감지 데이터, 로그 파일, 모바일 데이터 풍부한 지리 공간 정보 및 네트워크와 관련 된 의견의 다양 한 종류와 다양 한 형태의 대량 정보 되고있다.
문제는 전통적인 데이터베이스 배포 데이터 또는 지원 고급 데이터 분석의 테라 바이트를 처리할 수 없습니다. 지난 10 년 이상, 대규모 병렬 처리 (MPP) 플랫폼 및 열 저장소 데이터베이스 열었습니다 데이터 분석의 새로운 라운드는 혁명의 역사. 그리고 우리는 기술 업그레이드가지고 알려진된 아키텍처 사이의 경계를 모호 하 게 보고 시작 하는 기술은 수 년에 걸쳐 진화 했다로. 더 중요 한 것은, 반구조적 및 구조화 되지 않은 정보를 다루는 NoSQL 플랫폼 서서히 등장 하기 시작 합니다.
큰 시대에 도입 하는 빅 데이터 분석
이 문서에서는, 우리가 날짜, EMC의 Greenplum, Hadoop, MapReduce 등 대용량 데이터 분석 제품 소개 합니다. 또한, 실시간 분석 플랫폼 수직, IBM 독립의 HP 이전 시간 수집 기반 지능형 분석 시스템과 Netezza DB2 관련된 제품. 물론, 마이크로소프트의 병렬 데이터 웨어하우스, 등에 회사, SAP의 사이 베이스 IQ 데이터 웨어하우스 분석 도구 이다. 여기, 업계의 큰 데이터 분석에서이 12 큰 제품을 봐 보자:
1. 모듈형 EMC 기기는 다양 한 데이터 형식 처리
2010 년에 Greenplum를 인수 및 다음, EMC Greenplum 데이터 컴퓨팅 어플라이언스 (시작 EMC의 스토리지 하드웨어를 사용 하 여 greenplum 대규모 병렬 처리 (MPP) 데이터베이스 복제 및 백업, 지 원하는 DCA)입니다. DCA는 SAS 등 모임의 파트너를 통해 Greenplum에 대 한 데이터베이스 지원을 확장합니다.
EMC 기기 대용량 데이터 분석을 지원
이 5 월 EMC 자체 Hadoop 소프트웨어 도구를 시작 하 고 회사 약속 모듈형 DCA,이 발표 Greenplum sql 관계형 데이터베이스를 지 원하는 것이 고 Hadoop 배포 같은 장치에서 지원 될 것 이다. 네트워크 데이터 및 구조화 되지 않은 데이터를 클릭과 같은, EMC, 하 둡의 도움으로 그것은 진짜 큰 데이터 분석의 어려움을 해결할 수 있다. 모듈형 DCA는 또한 모니터링 요구 사항에 맞게 같은 장치에서 대용량의 장기 보존 수 있습니다.
2. Hadoop MapReduce 정제 및 대용량 데이터
Hadoop은 분산 데이터 처리 시스템 구조 저장 및 구조화, 반 구조화 된 또는 구조화 되지 않은, 진정으로 큰 데이터 (일반적으로 수백 테라 바이트 또는 심지어 PB 수준 데이터) 응용 프로그램의 처리에 초점을 맞춘 오픈 소스. 네트워크 클릭 하 고 소셜 미디어 분석 응용 프로그램 응용 프로그램 요구 사항을 크게 운전. Hadoop 합니다 MapReduce (및 어떤 다른 환경) 이상적인 솔루션으로 큰 데이터 집합 처리.
MapReduce 수 여러 자식 문제에 큰 데이터 문제를 분해, 처리 노드, 수백 그들을 할당 한 다음 조립 하면 작은 데이터 집합에 쉽게 최종 결과 분석 하.
MapReduce 구조 차트
Hadoop 저가 하드웨어 제품을 위에 실행할 수 있으며 상업 저장 및 확장 하 여 데이터 분석 하는 대안이 될 수 있습니다. 그것은 많은 인터넷 거 인은, AOL, EHarmony (미국 온라인 데이트 사이트),이 베이, 페이 스 북, 트위터와 넷 플 릭 스 빅 데이터 분석을 위한 주요 솔루션 되고있다. 또한이 솔루션을 채택 고려 하 고 또한 jp 모건 체이스 등 전통적인 거 인이 있다.
3. HP 수직 전자 상거래 분석
에 의해 인수 되었다 HP이 2 월, 수직은 효율적인 데이터 저장과 빠른 쿼리 사용 하 여 저장소 데이터베이스에 대 한 실시간 분석 플랫폼입니다. 낮은 유지 보수 및 운영 비용으로 전통적인 관계형 데이터베이스 보다 빠른 배포, 운영 및 유지 보수를 얻을 수 있습니다. 데이터베이스는 또한 대규모 병렬 처리 (MPP)를 지원합니다. 인수 후 HP x86 기반 HP 수직 발사 하드웨어. MPP 확장성을 통해 수직 PB 수준 (예: AOL, 트위터, Groupon) 최고급 디지털 마케팅, 전자 상거래 고객에서 데이터 분석을 사용할 수 있습니다.
HP 수직 실시간 분석 플랫폼
사실, HP 인수, 메모리, 일련의 도입에 수직으로 일찍 빠른 분석 및 기타 혁신적인 제품 플래시. 그것은 관계형 데이터 고객 관리를 지원 하기 위해 Hadoop 링크를 추가 하려면 첫 번째 제품의 하나 이며 클라우드 배포 위험에 따라 첫 번째 제품 플랫폼 중 하나입니다. 현재, 수직 HP의 클라우드 서비스 자동화 솔루션을 지원합니다.
4. IBM 전송 및 평화 분석을 데이터 웨어하우스를 제공합니다.
지난 1 년, IBM DB2 스마트 분석 시스템 (왼쪽)에, 그래서 왜 샀 어 요 그것은 또 다른 Netezza 플랫폼 출시? 때문에 전 매우 확장 가능한 엔터프라이즈 데이터 웨어하우스 플랫폼, 수천의 사용자와 다양 한 유형의 응용 프로그램 작업을 지원할 수 있습니다. 예를 들어 콜 센터는 일반적으로 신속 하 게 고객의 역사 통화 기록을 다시 전화를 해야 하는 직원의 많은 수가 있다. 스마트 분석 시스템 제공 통합된 정보, IBM 전원 시스템에서 실행할 수 있는 미리 구성 된 Cognos BI 소프트웨어 모듈의 DB2 데이터베이스 (RISC 또는 X86 아키텍처).
스마트 분석 시스템 및 Netezza
Netezza는 디지털 마케팅 회사, 통신, 및 테라 바이트의 수백 또는 심지어 페타바이트의 데이터 확장성 분석 응용 프로그램을 제공 하는 다른 회사에 대 한 솔루션을 제공 하 고 있습니다. 대규모 병렬 처리를 지 원하는 IBM Netezza Twinfin 데이터 웨어하우스 장치 하루에 배포할 수 있습니다. Netezza 지원 여러 언어와 방법을 데이터베이스 분석, 자바, C, C + +, Python, 그리고 MapReduce. 동시에 그것은 또한 SAS, IBM SPSS, R 프로그래밍 언어와 같은 매트릭스 조작 방법을 지원합니다. IBM Netezza는 최근 더 많은 요구 사항을 충족 하는 높은-용량 장기 보관 장치를 추가 했습니다.
123 다음