2012 년에 클라우드 컴퓨팅, 보다 훨 개념 있었다면 그 것 큰 데이터. 큰 데이터 응용 프로그램은 광범위 하 게, 특히 인터넷, 모바일 인터넷 및 현재 특성에 가장 일치 하는 다양 한 감지 네트워크의 도래와 함께. 엔터프라이즈의 일일 비즈니스 결정을 데이터 분석에서 가치를 발견 하는 방법? 큰 데이터 응답을 줄 것 이다. 최근, 대만 Jingcheng 그룹 클라우드 센터와 ETU 브랜드 감독 Cus 유 기자, 미국, 그리고 큰 데이터만 4, 5 년의 시간 들에 대해 이야기를 미국 뒤에 전체 아시아 지역 개발의 초기 단계에 아직도 현재 큰 데이터입니다.
해부학 큰 데이터
대용량 데이터에 대 한 이야기를 중국에서 더 많은 데이터 수집, 저장, 처리 수준에 머물 하지만 또한 실제 데이터 분석 및 통찰력 응용 프로그램 경우의 부족. Courio 큰 데이터 입력 보다 강력한 성장 기간은 아마도 2014 교차 될 수 있는, 낙관적인 이상, 프로그램 시장에 프로젝트 시장에서 완료 하는 필요를 시장 말했다. 아시아 지역에서 큰 데이터는 응용 프로그램의 컴퓨팅 프로젝트 수가 매우 작은 있습니다.
해부학 값과 큰 데이터의 전망, 우리 정 및 대용량 데이터의 의미가 명확 하 게 이해를 해야 합니다. 현재, 전통적인 기업에 있는 모든 데이터의 15% 그리고 나머지 85%에 대 한 엔터프라이즈 관리 소프트웨어 유일한 계정에 관련 된 구조화 된 데이터는 다양 한 정보 활동, 전자 상거래, 것 들, 인터넷에에서 반구조적 및 구조화 되지 않은 데이터 또는 기업에서 외부 소셜 네트워크에서 온다. 이 추가 분석을 위해이 큰 데이터 처리 플랫폼 사용을 해야합니다.
일반적으로 큰 데이터를 더 정확 하 게 해석 하 세 "V"를 사용할 수 있습니다: 첫 번째 V는 볼륨을 어느 정도 커야; 두 번째 v는 속도, 최신 데이터 분석 혜택을 보여만 실시간 3 v는 여러 데이터 형식 또는 구조에 대 한 다양 한. 함께,이 3 개의 v 삼각형 라인을 그릴 수 있습니다, 그리고 각 사용 장면이 세 축에 타원을 그릴 수, 다른 제조 업체 동일 하지 않습니다 타원형 모양을 그릴 수 있습니다, 그리고 이러한 큰 데이터 분석 처리의 범위를에 속해 있다.
그러나, 큰 데이터의 이해에서 현재 업계는 여러 오해, 예를 들어 데이터 저장 기술, 그것 저장 되어야 하며, 동시에 처리 이며 두 번째는 인터넷에서 하지만 뿐만 아니라 인터넷에 대 한 유래는 대용량 데이터, 모든 산업에서 큰 응용 프로그램 값은 큰 Courio, 3는 그냥 bi, 큰 데이터 전통적인 bi는 구조화 된 데이터 및 반구조적 및 구조화 되지 않은 데이터를 해결 하기 위해 가난한 능력이 좋습니다. 이 신화를 벗어나려 하지 않고 큰 데이터에 잃기 쉽습니다.
Hadoop 모두 한 기계
때문에 대부분의 산업 및 기업의 대용량 데이터에 대 한 필요에 대해 명확 하지 않습니다, 하나의 프로젝트에 큰 데이터 응용 프로그램의 방문을 추진 하 여 급속 한 대중화와 응용 프로그램을 달성 하기 어렵습니다. 큰 데이터 통합 기계 ETU 기기, 소프트웨어, 하드웨어 데이터 분석, 솔루션의 처리 통합에서 기업에 제공할 수 있습니다, 그리고 표준 제품 형태로 큰 데이터 응용 프로그램을 홍보할 수 있습니다. 따라서, 올해에, 중간 Jingcheng 그룹 클라우드 센터 공식적으로 시작 큰 데이터 솔루션을 제공 하는 각 응용 프로그램 시나리오에 대 한 아시아 ETU 브랜드 큰 데이터 제품.
Hadoop의 한-그만 제품으로 Etu 기기 라고 "기기" 때문에 그것은 모두 한 기계 제품, 장비 최적화 하드웨어도 소프트웨어, 하지만 소프트와 하드, 조합. ETU 기기 사용자 하지 신속 하 게 배포, 계산 하 고, 저장할 수 높은 Hadoop 기술이 필요 하 고 10 분 이내 100 노드를 배포. 이 매우 큰 데이터 사이클의 엔터프라이즈 응용 프로그램 단축.
마스터 노드와 두 개의 작업 노드 작은 ETU 기기 클러스터 아키텍처에 의하여 이루어져 있다. 데이터 및 작업은에서 실행 작업 노드 마스터 노드는 전체 클러스터 리소스 할당 예약에 대 한 책임. 데이터 볼륨은 더 하 고 더 큰, 현재 건축과 용량 처리할 수 없습니다, 그냥 작업 노드 추가, 클러스터에서 실행 없이 가동 중지 시간을 직접 확장 될 수 있다, 최대 2000 단위 규모 주위를 확장할 수 있습니다. Oracle 및 IBM는 시장에서의 대규모 데이터 통합 제품과 비교해, ETU 더 많은 유연성, 사용자 지정 된 제품 및 유연성의 오라클 제품 부족 이다.
대규모 데이터 응용 프로그램
대용량 데이터의 분석은 더 긴급 한, 때문에 큰 데이터 응용 프로그램의 요구의 가장 확실 한 분야 이므로 데이터 구조화 되지 않은 데이터 수준에 집중 된다. ETU 정밀 추천 시스템 ETU 추천자 발행이 의도 알고,이 분산된 클라우드 컴퓨팅 장점을 사용 하 여 큰 데이터 통합 기술, 기반, 사용자 동작 로그, 그리고 다른 사용자가 결과 완전 자동화 된 집합의 렌더링에서 데이터 수집, 분석, 맞춤된 추천, 생산에 대 한 다 수 수집 시장 인사에 대 한 필요가 참여, 사용자 검색 및 구매 동시에 권고를 생산 하기 위해 실제 행동에 전적으로 기반으로, 어떤 시스템의 컴퓨팅 확장을 시간과 스토리지 기능에서 트래픽의 성장 전기 비즈니스 사용자의 특성의 수평 확장에 큰 데이터에 따라.
그것은이 제품 중국에서 전기 사업 분야에 적용 된 보고. Cus 기자 전기 사업 분야 뿐만 아니라 운영자 이제 이러한 큰 데이터 처리 작업을 많이 할 수 사용할 수 있습니다, 예를 들면, 그들은 휴대 전화 상관 결국에서 ipad 태블릿 컴퓨터를 사용 하 여 이러한 사용자의 끝에 3g 모바일 네트워크를 통해 알고 싶은 정보를 보러 갔다 어디? 이것은 후속 부가 서비스 할 연산자입니다. 네트워크 또는 통신 장비 최적화에 대 한 장비 더 비싼 경우, 그것은 어느 정도까지 최적화할 수 있습니다 수 있습니다 연산자 비용을 저장 하. 그래서 이러한 것 들이 실제로 큰 데이터 자체를 사용할 수 있는 장소.
또한, 금융 산업 할 리스크 관리로 이동 수 있습니다, 같은 대용량 데이터 처리 분석을 통해 신용의 양에 따라 은행 수는 사용자의 금액을 설정할 수 있습니다. 또, 다른 나라에서 법률 부분, 다른 감독 단위 다른 감독 요구, 같은이 얻어질 수 있다 큰 데이터에서 있을 때 특정 위험, 사용자 스스로 지원 하 고 위반 하지 하는 방법, 증거를 추출 해야 합니다. 또한, 의학, 제조 및 기타 산업에 큰 데이터는 다양 한 응용 프로그램, 하지만 지금은 개발의 초기 단계에서 기업 큰 데이터 응용 프로그램에 입력 하지 않은 대규모 투자의 단계.
현재, 큰 데이터 기술 및 솔루션은 더 많은, 하지만 클라이언트 쪽 미지근한 상황 될 것으로 보인다. 발전에서 큰 데이터 응용 프로그램을 방해 하 고는 무슨 이와 관련, Courio 3 개의 요점이이 상황을 주도, 하나 산업에서 지침의 성공적인 응용 프로그램의 부족 이며 두 번째는 엔터프라이즈는 큰 데이터에 잘 알고 그것은 기술, 새로운 기술, 같은 기술 하려고 용 감 인터넷 회사와는 달리 일반적으로 확인, 테스트를 몇 년을가지고이 기술을 상용화, 결국 수 있는지 여부 초기 단계에서 세 번째 재능 차이, 지금은 대규모 데이터 재능 생태 완벽 하지 않습니다.
(책임 편집기: 유산의 좋은)