빅 데이터 시대와 서는 조용히 우리의 삶에 영향 하고있다. IDC는 최근 연구, 1 백만 새로운 링크 공유 페이스 북에서 20 분 마다 하 고 10 백만 사용자 리뷰 해제 됩니다. 페이스 북과 다른 모든 인터넷 사이트, 인터넷 애플 리 케이 션, 점차적으로 되고있다 전체 데이터 수집, 분석, 처리 및 부가 가치 아키텍처.
중국에서는, 소셜 네트워크에에서 있습니다. 시 나 부사장 왕 Gaofei는 Sina Weibo는 300 백만 이상의 사용자를 등록, 하루 안에 모든 10 중국의 해당 하는 100 백만 이상의 마이크로 블로그 콘텐츠를 게시 하는 일반 사용자, microblog 매일 게시 하는 사람이 될 것입니다 했다. 각 사용자에 대 한 평균 온라인 시간 60 분, 및 활성 사용자의 60%, 모바일 단말기에 의해 로그인 이며 사진을 공유 하는 모든 원본 콘텐츠 모바일 단말기에서의 40%. 소셜 네트워크의 영향력 아래 사용자 수 소비 하 고 언제 든 지 데이터를 만드는 어떤 장소 든 지, 또는 모바일 장치를 통해 어떤 상태에서.
소셜 네트워크와 모바일 인터넷의 개발 구조화 되지 않은 데이터를 많이 양산 하고있다, 이것은 전통적인 구조, 그리고 일반적인 이미지, 동영상, 음악, 오피스 문서, 웹 페이지, microblogs, 인스턴트 메시징, 및 구조화 되지 않은 데이터에 속하는 모든 센서에서 생성 된 데이터에서 데이터 형식의 다른 종류 이다. 소프트웨어 및 서비스 부문의 인텔 아시아 태평양 연구 및 개발 (주), 제너럴 매니저에 따르면 제너럴 매니저 현재 양의 데이터 닥터 그가 Jingxiang, 중국의 생산 2003 년에 인간 문명의 총 수 매 48 시간 동일, 미래 인터넷 및 지능형 도시 개발,이 수치는 훨씬 더 놀라운 것 그리고 많은 구조화 되지 않은 데이터를 데이터 수집 디바이스 등의 센서에 의해 제작.
또한, 전통적인 기업 또한 큰 데이터 얼굴 도전. 가트너에 따르면 기업 데이터의 80% 구성 하는 5 년에서 800%로 증가할 것 이다. 그룹, 지역 사회, 그리고 소셜 네트워크에서 업무 외 데이터는이 추세의 주요 부분을 수 있습니다. 구조화 되지 않은 데이터의 폭발적 증가 기존의 데이터베이스, 도전 그리고 Hadoop 글로벌 IT 업계의 좋아하는 되고있다.
Hadoop은 리눅스, 이후 가장 성공적인 오픈 소스 소프트웨어 라고 100% 분산 파일 시스템, 그리고 그것의 가장 큰 장점은 저장 하 고 구조화 되지 않은 데이터를 계산 하는 것입니다. Hadoop을 만들 수 있는 비용 효율적인 X86 서버 구성 고성능 클러스터, 무부하, 그냥 증가 하는 데이터의 양을 컴퓨팅에 맞게 해당 노드를 추가 하는 때 필요의 사용, 저가 스토리지 및 컴퓨팅은 대용량 데이터의 원동력.
Hadoop 꿈의 전통적인 데이터베이스
Hadoop, 달리 데이터베이스 태어난 날짜에서 기업에서 구조화 된 데이터의 일상적인 관리를 수행 합니다. 데이터베이스의 수동 관리, 파일 시스템 및 데이터베이스 시스템의 3 단계를 겪고 있다 그리고 데이터베이스 시장 동향의 영향을 받아 새로운 방향으로 변하고 있다. IDC에 따르면, 2011 글로벌 데이터 볼륨은 1.8zb에 도달 했습니다, 그리고 2020 년 글로벌 데이터 빅뱅의 시대를 입력 합니다 즉 35ZB를 도달할 것 이다. 전통적인 데이터베이스 공급 업체는 그들의 자신의 큰 데이터 솔루션을 시작 했습니다 그리고 이러한 솔루션 공통 핵심어 둡.
하 둡 분산 시스템 인프라, 주로 hdfshttp://xilele.cctv.com/pinpai/dongtai/yiliao/491659.htm, MapReduce 및 HBase의 구성 쉽게 개발 하 고 큰 데이터 처리를 실행할 수 있는 소프트웨어 플랫폼입니다. Hadoop은 데이터베이스에 동일 하지 않습니다, 그들 사이의 가장 큰 차이점은 데이터베이스는 구조화 된 데이터를 다루는 좋은 그리고 Hadoop은 구조화 되지 않은 데이터를 다루는 좋은, 데이터 형식을 다양화 큰 데이터의 특징 중 하나. Hadoop은 Hadoop 데이터베이스 사용 하는 경우 데이터베이스에 대 한 새로운 하늘을 만들 데이터베이스 공급 업체에 대 한 모두와 기회 이다. 다음 저자, 하 둡을 지 원하는 데이터베이스의 고 짧게 그것의 큰 데이터 전략을 분석.
오라클: 오라클은 데이터베이스 업계에서 선도적인 위치 그리고 Oracle 데이터베이스 가장 인기 있는 관계형 데이터베이스 제품 중 하나입니다. 오라클은 더에 초점을 맞춘 구조화 된 도구와 RDBMS 플랫폼, 하지만 오라클 또한 지난 1 년 동안 빅 데이터 시대로 이동 하기 시작 했다 더 중대 한 중국에 대 한 Sishing, 글로벌 부사장과 기술 일반 매니저는 말했다. 실제로, 오라클은 Hadoop의 잠재력을 알고 큰 데이터 처리, Hadoop 기반 대형 응용 프로그램, 오픈 소스 아파치 하 둡, 오라클 NoSQL 데이터베이스 포함의 소개와 함께 오라클 데이터 통합 Hadoop 응용 프로그램 어댑터, 오라클 Hadoop 로더, 그리고 오픈 소스 R, Apache Hadoop 시리즈 소프트웨어를 제공 하는 Cloudera 회사와 협력.
IBM DB2:IBM는 관계형 데이터베이스, 출생 및 데이터베이스의 개발에 중요 한의 창조 자 이다 하지만 큰 데이터의 새로운 시대에서 기존 관계형 데이터베이스 또한 혁신과 도전을 충족 합니다. Wangyun, 한 동료 IBM의 중국 연구소와 최고 기술 책임자 말했다 2012 중국 데이터베이스 기술 회의에서 전통적인 방법으로 대용량 데이터를 처리할 수 없습니다 하 고 전통적인 관계형 데이터베이스 OLTP 기능에서 유래 하 고 큰 데이터는 새 응용 프로그램 및 OLAP, 구체화 하는 동안 정확 하 게 데이터를 기록할 수 있었다 이 때문에 관계형 데이터베이스 큰 데이터를 충족 하지 않습니다. IBM는 Hadoop 및 스트림 컴퓨팅 대규모 데이터 분석 처리를 해결 하기 위해 새로운 경로 통해 두 가지 구성 요소를 포함 하 여 큰 데이터 플랫폼을 발표 했다.
SQL 서버: 마이크로 소프트, 세계 최고의 소프트웨어 회사, 데이터베이스 분야에서 명성을 했습니다. Microsoft SQL Server 2012 Hadoop 완벽 하 게 저장 하 고 모든 종류의 데이터, 구조화 및 실시간 데이터를 포함 하 여 데이터를 처리 하는 고객을 소개 합니다. 또한, 마이크로소프트 또한 Windows Azure 플랫폼 및 완전 한 큰 데이터 솔루션 Windows 서버에서 Hadoop을 제공 합니다. 일 노, 아시아 태평양 연구 및 개발, 마이크로소프트의 최고 기술 책임자 말합니다, 마이크로소프트와 Hadoop 고성능의 강력한 조합 및 Hadoop의 확장성과 마이크로 소프트의 제품의 간단 하 고 쉽게 배포의 전통적인 장점 있습니다.
SAP: SAP 회사 될 데이터베이스 업계 떠오르는 스타 시작 2010 SAP 수집 사이 베이스, 이후 세계적으로 유명한 기업 관리 소프트웨어 제공 업체입니다. SAP 하나 SAP와 SAP 사이 베이스 데이터베이스에 따라 대용량 데이터 전략을 형성 하는 2012 년에 주요 개발 지역 중 하나로 데이터베이스 기술을 촬영 하고있다. 이 전략의 특히 중요 한 부분은 이다 둡. SAP 하나와 SAP 사이 베이스 IQ와 Hadoop의 통합, 그것은 Hadoop과 같은 대형 데이터 소스에 액세스할 수를 강화 하 고 전처리 깊이 통합된 인프라를 제공 합니다.
EMC GREENPLUM:EMC는 세계적인 정보 저장 서비스 공급자, SAP, 2010 년에 Greenplum를 취득 하 고 그것의 데이터베이스 시장을 개발 하기 시작 하는 비슷한입니다. 현재, Greenplum의 데이터베이스 제품은 저장 되 고 구조화 되지 않은 데이터 가져오기에 대 한 Greenplum에서 분석 될 수 있는 기업 구조 데이터를 해결 하는 데 사용 되는 전통적인 greenplum 데이터베이스 및 Greenplum HD (Hadoop), 포함 한다. 중국, "빅 데이터는 비즈니스 변화에 대 한" 더 중대 한 중국의 EMC 데이터 컴퓨팅 제품 사업부의 핵심, Liuweiguang, 일반적인 매니저의 EMC의 시장 전략 Greenplum Hadoop 버전의 EMC의 출시는 전체 신뢰의 저자 말했다는 Hadoop의 향후 개발 전망.
위에서 언급 한 5 개의 주류 데이터베이스 뿐만 아니라 더 많은 전통적인 데이터베이스 공급 업체는 Teradata, 인포, Pentaho, Talend 및 다른 데이터베이스, 데이터 웨어하우스 및 비즈니스 인텔리전스 서비스 제공 업체를 포함 하 여 Hadoop 캠프 합류 하는. 또한, Hadoop NoSQL 데이터베이스의 주요 아키텍처 중 하나입니다.