인터넷 거 인 구글과 페이스 북 신기술 그들의 자신의 사업에서 훌륭한 결과 만들 수 있습니다 여부에 게 Cio 라는 관리와 큰 데이터를 분석 하 여 거 대 한 값을 달성 했다. 아이디어는 부분적으로 큰 데이터 맹렬 한 속도로 성장할 것 이다 예측 하는 산업 분석가 의해 권장 합니다. Wikibon는 2015 빅 데이터 시장 이동에서 $5 십억 조 2012 년에서에 이상의 $30 십억 조, 최대 $53.4 십억 조 (볼 수 있는 무료 보고서)는 2017 년까지 예측 합니다. IDC는 더 보수적인, 그리고 그들은 2015 $16.9 십억 조를 도달 하는 큰 데이터 시장 기대. 많은 IBM 고객 큰 데이터 여행을 시작 하 그들의 데이터 창 고, 관리 되는 직물 데이터의 가장 큰 컬렉션을 사용 하는. 이 문서는 엔터프라이즈 대용량 데이터 관리 우산으로 다양 한 기술을 통합 후 실제 비즈니스 가치를 달성 하는 어떻게 개설할 것 이다.
배포 큰 데이터 관리 기술
대용량 데이터 관리 배포에 대 한 기술 위치:
엔터프라이즈 데이터 웨어하우스
데이터 웨어하우스 장비
apache Hadoop 클러스터
로그 분석 및 복잡 한 이벤트 처리 기술을 기반으로 데이터 스트리밍
이동 하 고 관리 노드 간 데이터 통합 소프트웨어
IBM 제작 팀 "빅 데이터" 라는 무료 IBM 전자 책에 기술 초보자를 상세 하 고 깊이 있는 지도를 제공 합니다.
첫 번째 단계는 큰 데이터를 관리 하 고. 기업의 다양 한 알고리즘을 사용 하 여 데이터를 분석 하 고 점차 데이터의 인과 관계를 이해 하는 과정에서 값을 만듭니다. 그러나, 이러한 분석 알고리즘 엄격한 계산 수준에 있으며 대부분 대규모 병렬 처리 하드웨어 아키텍처에서 실행 되는 데이터 관리 기술과 호환 됩니다.
데이터 웨어하우스의 현대화를 실현
컴퓨팅 아키텍처에 배포 1 세대 데이터 웨어 하우스의 많은 대용량 데이터 분석에 대 한 요구 사항을 충족 하지 못했다. 데이터 웨어 하우스의 현대화와 IBM Netezza 데이터 웨어하우스 장비와 대칭적 다중 프로세서 하드웨어에서 실행 하는 이전 데이터베이스 관리 시스템의 교체, 지금 큰 데이터를 적용 하는 기업의 수백이 있다.
모바일 통신 시대에 양질의 네트워크 서비스의 지속적인 제공은 고객 만족을 위한 기초, 고객이 만족 하지 않은 경우 경쟁 업체에 설정 되어있을 것입니다. T-모바일 1 세대 데이터 웨어하우스 충분히 큰 그래서 그것은 완전히 전체 네트워크 이벤트를 이해 하는 회사의 데이터를 집계 하는. TB, 오라클 기반 데이터 웨어하우스 서비스의 품질을 이해 하는 회사에 도움이 거부의 한계를 넘어 왔다. 데이터 웨어하우스를 현대화 Netezza 소스를 사용 하 여 T-모바일, 하루 최대 17 십억 네트워크 레코드를 로드할 수 있습니다 그리고 탐구 서비스와 고객 만족의 품질에이 데이터를 분석할 수 있습니다. 데이터 웨어하우스는 현재 2 PB 데이터를 관리, 제공 한다 1300 기업 사용자에 대 한 분석 지원을 큰 성공을, 달성 했다 및 클라이언트 범위 원래 네트워크 작업 사용자 그룹 확장 하 고 수익 보안, 결제, 마케팅 및 고객 서비스 분야를 확장. 여기 크리스틴 Twiford, T-모바일 네트워크 기술 솔루션 부서 관리자, T-모바일 회사의 큰 데이터 여행 세부의 독점 비디오를 볼 수 있습니다.
데이터 웨어하우징 향상 장치를 사용 하 여
은행 및 기타 금융 회사는 엄격 하 게 산업 규정을 준수 하기 위해 그들의 컴퓨팅 자산을 제어 해야 합니다. 인 한 과제를 감안할 때 배포 및 규제 요구 사항에 맞게 현대 컴퓨터 시스템의 네트워킹 및 컴퓨터 데이터의 이해,이 이미 발굴 작업은 더 복잡 한 되고있다. 다른 산업 처럼 금융 산업 재고 관리 효율성 향상 종종 증분 하지만 비용 절감을 컴퓨팅 기술에 관심을 돌렸다. 예를 들어 은행 이전 수백 테라바이트의 대규모 데이터를 관리 하기 위해 40 개 이상의 시스템에 의존 합니다. 이 "시스템 설정 시스템" 기술 뿐만 아니라 처리 하기 어려운 하지만 또한 매우 비효율적입니다. 겉보기에 간단한 문제는 컴퓨터의 구성 및 관리 되는 데이터에 응답의 주를 걸릴 수 있습니다.
데이터 관리 전략을 재검토 후 은행 새로운 인프라 마스터 데이터 센터 IBM DB2 및 Netezza 디바이스와 공동 작업을 만들 하기로 결정 했습니다. D b 2의 대규모 확장성과 은행 이전 40 개 이상의 시스템을 통해 일반적인 데이터 모델 단일 통합된 데이터베이스에 배포 하는 데이터의 수백을 통합 합니다. 데이터 통합, 뿐만 아니라 DB2 도착 매우 높은 속도로 짧은 쿼리에 응답 하는 운영 데이터 저장소 (ODS)로 사용 됩니다. 통합 소프트웨어 신속 하 게 데이터에서 ODS로 마이그레이션합니다 Netezza 보고에 대 한 고급 분석 및. 은행의 데이터 구성 지금 전반적인 지배 구조 모델의 통제 이며 사업 근처 실시간 자산 재고에 대 한 모니터링 되 고.
Hadoop을 사용 하 여 데이터 웨어하우스
Hadoop은 매우 안정적이 고 확장 가능한 데이터 처리 시스템. 장점은 한 패턴 없이 데이터를 로드할 수 있습니다 그리고 그것은 대규모 처리 하 고 같은 구조화 되지 않은 분석 가능 (또는 다중 구조 1) 저렴 한 하드웨어를 사용 하 여 데이터. Hadoop은 일괄 처리에서 데이터를 처리할 수, 최적화, 없다도 랜덤 액세스 및 대화형 쿼리 지원지 않습니다. 이들은 Netezza 데이터베이스 시스템의 장점입니다.
Edmunds.com (온라인 자동차 판매 회사)의 Netezza 창 고와 (데이터 수신 엔진)으로 Hadoop을 사용 하며 Netezza Hadoop 어댑터 이러한 시스템 간에 데이터를 이동할 수도 있습니다. Hadoop은 대규모 구조화 되지 않은 데이터를 분석, 텍스트, 음성, 데이터 웨어하우스 외부 짹짹 등, 관계형 형식으로 변환 및 Edmunds.com 분석 팀은 비즈니스의 모든 측면에 소셜 미디어와 소비자 의견을 통합할 수 있도록 다음 Netezza에 구조화 된 데이터를 전송 하는 일을 담당 합니다. 여기 관련 세부 정보를 설명 하는 슬라이드 쇼를 얻을 수 있습니다.
실시간으로 복잡 한 이벤트 처리를 통해 확장된 데이터 웨어하우스
북 서 태평양 국립 연구소 (PNNL) 스마트 그리드 시범 프로젝트는 5 주에 걸쳐 11 전력 회사에서 60000 고객을 포함 하는 미국에서 가장 큰 지역 협력 프로젝트가 이다. 프로젝트 로그 분석 및 실시간 복합 이벤트 처리 (IBM Infosphere 스트림 사용) 및 데이터 웨어하우징 장비 (IBM Netezza)를 사용 하 여 큰 데이터를 관리 합니다. Infosphere 스트림은 각 통신 상태 또는 이벤트를 포함 한 메시지의 수백만 분석, 파워 그리드 제어 시스템에서 계단식 고 정전으로 이어질 수 있는 다양 한 문제를 감지할 수 있습니다. 위의 데이터 식별, 실시간으로, 눈에 보이지 않는 추세와 다른 패턴 하 Netezza, netezza 이벤트 역사를 관리 하 고 더 깊이 분석을 실행 하 게 다음 보내집니다. 이러한 분석 데이터는 전력 네트워크의 안정성을 향상 하 고 역동적인 새로운 데이터 관리 플랫폼의 운영 비용을 줄일 수 있습니다. Netezza 분석 데이터 제어 시스템 데이터 실시간 분석 정제 Infosphere 스트림을 다시. 론 멜 튼, 스마트 그리드 시범 프로젝트의 감독이의 자세한 설명, 여기 시청 하시기 바랍니다.
소셜 컴퓨팅의 시범 프로젝트로, PNNL 스마트 그리드 시범 프로젝트 많은 기업의 운영 능력을 넘어 이지만 그 데이터 관리 플랫폼은 실시간 복합 이벤트 처리의 가치를 연구 하는 최고 정보 책임자를 매우 계몽. 병합 Infosphere 흐름과 Netezza 새로운 종류의 금융 시장을 포함 하는 응용 프로그램에 대 한 데이터 관리 플랫폼을 만들어 거래 분석, 사기 탐지, 네트워크 서비스 품질 분석, 네트워크 위협 탐지, 자산 모니터링, 및 마케팅 활동 관리. 이들 및 다른 응용 프로그램은 더 재고 및 자산으로 널리 이용 되는 IP 구현 하는 것 있을 것입니다.
결론
우리는 새로운 유형의 엔터프라이즈 데이터 플랫폼을 신흥 찾으십시오. 관리 하 고 대규모 동적 및 정적 데이터 분석 기술에 대 한 구조화 된 데이터 저장소를 활용 하 여 조직 모든 사용 가능한 데이터의 활용을 스스로 팔 수 있습니다. 이 새로운 대형 데이터 관리 플랫폼은 분산된 플랫폼, 하지만 다른 플랫폼, 전문화 및 최적화에 대 한 자신의 작업에 대 한 각 플랫폼 하지만 완전히 통합 연동 작업 및 공유 데이터 및 분석 결과. 데이터 웨어하우스에서 큰 데이터 투어 여 큰 관리 되는 데이터 저장 및 엔터프라이즈 데이터 통합, 보안 및 거 버 넌 스 기술 및 경험의 중앙 초점을 대표 하는 효과적인 방법입니다.