큰 데이터에 관해서, 많은 사람들이 처음 구글, 바이두, 알리바바 같은 인터넷 회사의 생각. 큰 데이터 분석에서 인터넷 회사는 실제로 업계의 최전선에 걸어, 그 기운 또한 업계의 큰 데이터 샤인 가려진. IDC "4 V" 큰 데이터 정의: 볼륨 더 큰 용량을 나타냅니다, 다양 한 다양 한 데이터, 속도 빠른 처리 속도 나타내는 나타내고 값 의미 큰 데이터 더 많은 가치를 만들 수 있습니다. 천진 난다 일반 데이터 기술 유한 회사 (이 하 일반 이라고) 최고 기술 책임자 Vounie 말했다 면 "4V" 표준, 업계 대형 데이터 및 데이터, 데이터 형식 및 동일한 수준의 데이터 처리 속도의 인터넷 대용량 데이터 유일한 차이점은 업계의 큰 데이터는 인터넷에서 데이터 보다 더 밀도입니다. 그 결과, 업계의 큰 데이터 큰 인터넷 데이터 보다 데이터베이스 공급 업체에 더 많은 비즈니스 기회를 제공합니다.
데이터베이스 3 포인트 세계
되돌아 소스 아키텍처 데이터 처리의 변경의 경우, 그것은 유명한 미국의 데이터베이스 과학자 마이클 돌 블 레이 크 (마이클 Stonebraker)에서 종이 함께 시작 하는 데 필요한. 마이클 스톤 블 래이 크는 산업 기술의 추세 여러 아키텍처와 여러 응용 프로그램이 하나의 아키텍처에서 모든 응용 프로그램을 변환 하는 그의 종이에서 지적 했다. 큰 데이터 및 클라우드 컴퓨팅의 맥락에서이 이론을 데이터베이스 시장의 큰 분열을 주도하 고 있다: 데이터베이스 시장 oldsql (전통적인 데이터베이스), Newsql (새 데이터베이스) 및 NoSQL (비 관계형 데이터베이스)를 포함 하 여 3 개의 야영지로 분할.
기술적인 관점에서 Oldsql의 전형적인 기능은 관계형 행 저장 및 SMP (대칭 다중 처리 아키텍처)입니다. Oldsql의 대표 제품은 TimesTen, 알 티 베이스, solidDB 및 Exadata를 포함 한다. 전통적인 관계형 데이터베이스 Oldsql으로 표시 대용량, 고성능 및 여러 데이터 형식에 대 한 큰 데이터의 요구에 맞지 않을 수 있습니다. 요구에 맞게 더 나은 클라우드 컴퓨팅 및 대형 데이터의, Newsql NoSQL, 밖으로 서와 최신 생활의 많은.
NoSQL의 기술은 이다 주로 구글, 야 후, 아마존, 인터넷 회사에서 페이스 북에. NoSQL 제품 키 값, MapReduce, MPP (대규모 병렬 처리) 및 기타 핵심 기술에 널리 사용 됩니다. 인터넷 빅 데이터 응용 프로그램에서 NoSQL 지배적인 위치를 차지합니다.
Vounie Newsql 데이터베이스 매우 높은 상업 가치 있으며, 주류 데이터베이스 제품 카테고리 될 것입니다. "데이터베이스 산업은 전환점에 큰 데이터의 요구에 의해 구동 기술 변화." 세계적으로, 적어도 30 신흥 데이터베이스 공급 업체와 약 50 새 제품 시장으로 쏟아져 있으며 여러 데이터베이스 제조 업체에 의해 시장의 전통적인 독점 결국 끊길 것 이다. "Newsql, 관계형 모델에 따라 저장 구조, 컴퓨팅 아키텍처, 메모리 사용 등 핵심 기술 혁신은," Vounie 말했다. 미래에 Newsql와 NoSQL 모든 응용 프로그램을 제공 하는 프레임 워크의 oldsql을 변경 됩니다 있고 제품의 세 가지 범주는 각각 해당 응용 프로그램 종류 및 고객 기반. "
사용자의 높은 처리 성능에 대 한 강한 수요가 데이터베이스 업계에서 혁신을 주도 했다. Newsql, 제품의 성능을 더욱 향상 NoSQL Oldsql 3 캠프의 다양 한 분산 컴퓨팅, 분산된 파일 시스템, 메모리 기술 등 새로운 기술 채택한 고 적극적으로 대용량 메모리, 플래시 및 고속 네트워크 연결 기술 (를 포함 하 여 몇 가지 새로운 하드웨어를 채택 백만 기가 비트가 더 네트 그리고 InfiniBand)입니다. 대조적으로, 널리 열 저장 기술에서 일반적으로 사용 되는 newsql 제품 NoSQL 제품 등의 큰 데이터의 요구를 충족 하는 기술에 NoSQL 및 newsql 개선 키 값 기술을 사용 합니다. Vounie 말했다: "NoSQL 및 대용량의 데이터의 처리에 Newsql으로 나타났습니다 강한 능력 확장을." 주요 NoSQL의 장점은 구조화 되지 않은 데이터의 처리에 전체 데이터 형식에 대 한 newsql 지원 되는 동안 정교한. 또한, Newsql은 실시간, 복잡 한 분석, 인스턴트 쿼리 및 확장성에 nosql 보다 더 유리. "
전통적인 관계형 데이터베이스를 확장 하 여 병렬 처리, 대규모 데이터 처리 하기가 그래서 쉽지 않다.입니다. 큰 산업 데이터 응용 프로그램에서 분석 데이터 관리 시스템 NTU 일반 Gbase 8a 기존의 데이터베이스를 대체 합니다. 현재, 많은 공공 클라우드 데이터베이스는 HBase, BigTable 같은 NoSQL 기술을 기반으로 합니다. 이 제품은 비 선형, 분산, 측면 확장 및 인터넷 업계의 다른 기술적 특성은 클라우드 컴퓨팅 및 대형 데이터 처리에 매우 적합 하지만 응용 프로그램 종류는 비교적 간단. 대규모 기업 데이터 응용 프로그램 데이터베이스는 데이터의 일관성을 보장 하 고 쉽게 사용할 수 있는 복잡 한 데이터는 여러 테이블 협회 분석 기능이 필요 합니다. 이 수요는 직접 클라우드 아키텍처에 기반한 새로운 데이터베이스 기술의 개발을 촉진 합니다. 기존의 데이터베이스를 바탕으로,이 새로운 유형의 데이터베이스 EMC Greenplum, HP 수직 및 Gbase 8a MPP 클러스터를 포함 하 여 시스템의 확장성을 개선 하기 위해 아무것도 공유 클러스터를 사용 합니다.
Vounie 데이터베이스의 미래 개발 동향: 크로스 플랫폼 통합을 달성 하기 위해 더 큰 MPP 및 데이터 관리 기술 클러스터를 사용 하 여 모든 데이터 형식에 대 한 더 나은 지원을 제공 하기 위해 큰 데이터 통합 기계는 인기가 있을 것입니다.
중국의 큰 데이터 제조 업체에 대 한 기회
데이터베이스 시장 지난 세기의 80 's에서 형성 되었다. 과거에 30 년 이상, 글로벌 데이터베이스 미국 제조 업체 (주로 주요 처리 하는 데이터베이스 제품)에 의해 기본적으로 시장 독점, 뿐만 아니라 중국어 데이터베이스 제조업체 돌파구를 찾기 어렵다, 심지어 독일과 일본의 제조 업체에 고 심하고 있다. 클라우드 컴퓨팅 및 대형 데이터의 증가 함께 새로운 유형의 분석 클래스의 응용 프로그램을 주로 다루는 데이터베이스 증가 관심을 받고 있다. 큰 데이터 중국 데이터베이스 제작자 전통적인 데이터베이스 공급 업체에 도전 하는 기회를 부여 하고있다.
2013 년 큰 데이터 응용 프로그램의입니다. 기자에 따르면 이해, 중국의 세 가지 주요 통신 사업자, CCB 본부, 우편 준비 은행, Huaxia 은행, PetroChina 그리고 다른 단위 또는 올해 큰 데이터, 제품 테스트 및 응용 프로그램 계획의 기술 선택의 첫 번째 절반에 완료 될 것입니다. "우리의 큰 데이터베이스 제품 Gbase 8a 입력 했습니다 테스트 목록이이 프로젝트에 대 한," Vounie 말했다. "
중국 시장, 인터넷 큰 데이터 및 업계 데이터에 두 시장 공존, 그리고 개발을 위한 거 대 한 공간. 인터넷 시장 및 기업 금융, 통신 등에 의해 표시 되는 엔터프라이즈 수준의 시장은 실제로 두 가지 시장. "인터넷 기업 및 기업에서 그것에 대 한 매우 다른 수요가 있다. "서버 제조업체의 머리 고 말했다. 일반적으로, 인터넷 회사는 큰 여부 하드웨어 또는 소프트웨어 큰 데이터 등, 자신의 개발에 경사 된다 그들의 자신의 연구 및 개발 직원의 숫자와 오픈 소스 소프트웨어. NTU, 나타내는 중국 데이터베이스 제조업체는에 익숙해지고 상업 기업 처리 하 고 관계형 데이터베이스에 초점을 맞추고 짧은 시간에 큰 인터넷 데이터 시장에서 돌파구를 찾을 하기가 어렵습니다. 다른 한편으로, 업계의 빅 데이터 시장 NTU 같은 제조 업체에 게 기회를 많이 충분히 큰 이다.
Vounie 4 가지 범주로 업계의 빅 데이터 시장: 비즈니스 클래스, 카테고리 관리, 규제 범주 및 전문 카테고리. 비즈니스 클래스, 통신 요금, 재무 청구서, 경우 전원 파견 및 스마트 그리드 모두 구조화 된 데이터에 따라 대용량 데이터 응용 프로그램에 속해 있습니다. 차이나 모바일, 지방 성 300 t B 년 데이터의 추가 됩니다. 이 업계 큰 데이터를 보여줍니다 유망 시장.
기업 사용자의 가장 중요 한 데이터베이스의 성능입니다. 다른 전통적인 데이터 처리, 큰 분석의 주요 특징 중 하나는 데이터를 실시간으로 처리 하입니다. 남쪽 일반 Gbase 8a 큰 데이터 플랫폼은 분석의 위치는 응용 프로그램 클래스 및 전체 데이터 처리, 그것의 가장 큰 밝은 반점은 높은 성능을. Gbase 8a은 주로 두 가지 기술에 의존, 고성능을 얻을 수 있다: 하나는 열 저장소 데이터베이스, 다른 새로운 공유 아무것도 + MPP 아키텍처 기술 이다. 행 저장소 데이터베이스와 달리 Gbase 8a 열 저장소 데이터베이스에서 테이블의 각 열은 물리적으로 별도로 저장 하 고 각 열은 패킷, 구성 열에 액세스 하 고 쿼리만 I/O를 생성. 따라서, 테이블, Gbase 8a 열 저장소 데이터베이스의 더욱 더 많은 I/O 효율에에서 열 많을 성능 이점. 또한, Gbase 8a MPP 클러스터 아키텍처는 대용량 데이터를 처리 하기 위한 가장 적합 한 아키텍처가입니다. 전통적인 공유 디스크 아키텍처와 비교해, 그것은 더 측면 확장성과 높은 성능, 있으며 동적으로 조정 될 수 있습니다.
인터넷 대형 데이터에 데이터의 90% 이상 구조화 되지 않은 데이터, 큰 데이터는 주로 구조적 데이터 처리 기반 산업에 속한다. 얼굴 큰 데이터도 전에 일에서 태어난, 전통적인 기업 들은 이제 큰 데이터 압력, 더 복잡 하 고 더 가변 데이터 구조와 함께 직면 하 고 있는 그 인터넷 회사와 비교. 업계 큰 데이터 응용 프로그램에 관계형 데이터베이스 여전히 주류, 그러나 그것의 기술적인 의미는 새로운 변화, 열 저장소 데이터베이스, 분산된 계산 이며 새로운 기술 시작에 광범위 하 게 응용 프로그램을 가져옵니다.
Vounie는 제품 관점, 국내 새 데이터베이스와 같은 출발선에서 고 비용에 외국에서 유사한 제품, 로컬 서비스 및 외국 제품 보다 체계의 사용자 지정 더 이점이 있다, 산업 동향, "x 86 + 리눅스" 아키텍처와 클라우드 컴퓨팅은 점차적으로 허용 산업 사용자에 의해 더 많은 중국 회사는 외국 제품에 대 한 의존도 감소, 더 비용 효율적인 솔루션을 찾을 수 시작 하 고 정보 보안 및 독립적인 혁신의 관점에서 대규모 국내 데이터 솔루션 정부 업계에서 몇 가지 주요 프로젝트에서 점점 더 인기가 되고있다.
관련된 링크
남 일반의 큰 newsql 클러스터 데모
3 월 8 일, 남쪽 큰 일반 천진 하이 타이 그린 개발 자료에서에서 "국내 새로운 큰 데이터 플랫폼 오픈 날" 활동 개최. 남쪽 큰 일반 보여 그들의 gbase 업계 큰 데이터 대규모 클러스터 플랫폼, 처리 하 고 다양 한 비즈니스 분석 사업 현장 데모, 200는 TB의 산업 데이터 처리 프로그램 데모는 특히 눈길을 끄는 실시 고객 및 파트너에 게. 이 데모에서는 80 고급 서버, 5 백만 기가 비트 스위치, 7 캐비닛에 걸친 사용 합니다. Vounie 기자는 테스트 플랫폼 네트워크 배포에서 테스트 복잡성 또는 데이터 양을 측정, 가장 큰 국내 newsql 클러스터 환경 이라고. 테스트 결과 보여 플랫폼 PB 수준 데이터 쿼리 및 분석, 업계에서 큰 데이터 분석을 위한 신뢰할 수 있는 플랫폼을 지원할 수 있습니다.