확산 전류의 흐릿한 정의 충분 하지 않습니다 큰 데이터의 혜택을 Hortonworks 회사에서 임원 말한다. 오늘 우리는 보러 그들의 눈에 어떤 큰 숫자는 모든에 대해, 산업의 관점에서.
그래서 큰 데이터 무엇입니까? 이 일반적인 기술자-용량, 속도, 그리고 데이터 다양성-은 거의 업계 규칙을 설명 하는 고전적인 3V 모델을 사용 합니다. 하지만 인기 있는 정의 정말 큰 데이터 플랫폼 사용자에 게 실제 혜택을 설명 하기 위해 너무 막연 한.
데이비드 McJannet, Hortonworks, 마케팅의 부사장 현실 세계를 큰 데이터의 혜택 보다 현실적인 설명 모든 생 하는 새로운 메커니즘을 확장에 더 도움이 되는 주장 한다.
"빅 데이터 뭔가가 절대로 불분명," mcjannet는 인터뷰에서 기자 들 과입니다. "실용적인 관점에서 이것은 회사는 이전에 집중 하지 않고, 새로운 분석 응용 프로그램의 작업에 대 한 기준으로 주로 데이터의 새로운 종류." "
물론, 전 세계 큰 데이터의 명확한 개념을 홍보 Hortonworks의 이동은 또한 그것의 자신의 고려 사항이 있다. Hadoop 에코 시스템에서 주요 촉매제, 캘리포니아 기반 기업 소프트웨어 회사 저장 하 고 많은 양의 그들의 제품을 판매 하 고 수익을 수 있도록 데이터 분석 비즈니스 사용자를 설득 시킬 수 이며이 신흥 분야 고객은 과거에 간과 되어.
그래서 그들은 (는 객관적인 관점에서) 다른 정의 제안: 대용량 데이터의 목적은 "더 나은 고객 서비스를 제공 하 고 경쟁 우위를 홍보를 새 데이터 형식에 기반 하는 새로운 분석 응용 프로그램을 구축".
이 겉보기에 간단한 정의 기업 "빅 데이터의 이전 퍼지 이해를 넘어 이동"를 도울 수 있다.
물론, 큰 데이터, 그래서 hortonworks 회사 분류 그들의 특정 소스에 따라 5 가지 서로 다른 데이터 범주 사이 아무 유사성 있다: 소셜 미디어, 서버 로그, 웹 클릭 스트림, 장치/센서 및 지리.
그러나 엔터프라이즈 사용자가이 정보를 어떻게 사용 합니까?
소셜 미디어 데이터를 먼저 보세요. 회사는 지금 사용 하 여 페이 스 북, 트위터와 같은 소셜 네트워킹 사이트 사용자가 뭔가 대해 "기분"에 대해 배울 수, McJannet 말했다. 예를 들어 영화 제작자 같은 데이터에 기반 하는 새로운 영화 평가 대해 배울 하 고 소셜 미디어 사용자의 의견에 따라 마케팅 캠페인을 최적화할 수 있습니다.
서버 로그 도움말 시스템 관리자를 식별 하 여 중요 한 문제 해결 데이터를 Hadoop을 사용 합니다. McJannet 예제: "만약 내가 내 사이트에 모든 단일 인바운드 요청을 추적 하 고 지리적 구역에 따라 오버레이, 내가 판단할 수 있다 더 나은 내 큰 고객은 집중 하 고 그들은 잠재적인 보안 문제를 직면 수 있습니다." "
클릭 스트림 데이터 Hadoop 가져온 전통적인 데이터 관리 시스템의 과부하 상태 정보를 효율적으로 관리 하는 사용자를 도울 수 있다.
"만약 내가 내 웹사이트--에서 모든 스트리밍 데이터를 캡처할 수 있습니다, 물론, 이런 거 대 한 데이터 기록을 신속 하 게 기존 데이터베이스-투명 한 번의 클릭에 의해 생성 된 데이터를 채울 것입니다" McJannet 설명 합니다, 그리고 "다음 Hadoop에 그것을 유지... 나는 매우 흥미로운 응용 프로그램을 프로 파일링 정보에 따라 만들 도움이 됩니다. "
장치 데이터 숨은 데이터 소스의 큰 부분 이기도합니다.
"장치 확실히 단위, 냉장고, 트럭, 심지어 가정용 기계, 에어컨 등의 일반적인 분야의 광범위를 포함 하는 데이터의 큰 소스 중 하나" mcjannet 지적 이다. "같은 프로세스 이어질 것입니다 폭발적인 데이터 증가. "
현재,의 10 억에 도달 하는 세계의 휴대 전화 그래서 모바일 데이터 수집 장비는 광범위 한 시장 개발 공간 있다. "전화를 통해 갈 때마다 타워 사이 정보 변환 되 고 데이터의 일부 조각을 생성 됩니다. 누군가가 프로 파일링 응용 프로그램을 만드는 경우, 그 정보는 귀중 한 자료, "McJannet 말했다 수. 있습니다
지리적 데이터 이기도 하지 만큼, 공간 기술 및 군 신청에서 서만 10 년전까지 합니다. 지금 그것은 상용 응용 프로그램에 대 한 개발의 새로운 방법을 발견 했다.
예를 들어 운송 회사 10-60 초 마다 각 차량의 위치 데이터 추적 수 및 PB 수준 축적 관련 정보.
"비즈니스 프로세스에 지리적으로 관련 데이터를 사용 하려는 경우 먼저 응용 프로그램을 만들 수 있습니다 고려해 야 및 귀중 한 정보를 그들 로부터 추출할 수 있을 것입니다," McJannet 마칩니다.