기계 큰 데이터는 Hadoop에서 분리 하지 수 없습니다.

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터를 멀리에서 말할 수 있는

데이터 소스에 따라 큰 데이터는 주로 세 종류 포함: 사업 운영, 인간 행동에서 데이터 및 컴퓨터 데이터에서 데이터. 현재, 대부분의 사람들은 처리 및 데이터의 처음 두 종류의 분석에 대 한 이야기. 2004 년에 설립 된, Splunk 회사는 회사의 처음부터 독특한 컴퓨터 데이터 처리 및 분석에 집중 되었습니다. Splunk 회사 제품 기자와 인터뷰에서 부사장 Sanjaymehta 마케팅 기계 큰 데이터 미래에 개발을 위한 매우 광범위 한 잠재는 말했다.

대형 컴퓨터 데이터에 사용할 수 있는

기계 데이터 란? 사람들의 각 활동 고객 행동의 명확한 기록, 트랜잭션 처리, 서비스 수준, 응용 프로그램 동작의 사용을 포함, 컴퓨터 데이터에서 흔적을 나뭇잎과, 로그 파일, 센서 데이터 등, 컴퓨터 데이터는. "시스템에서 생성 된 데이터는 빠른, 가장 복잡 한 그리고 가장 가치 있는 큰 데이터의 부분" Sanjaymehta 말한다. 그러나, 기존 데이터 분석, 관리 및 모니터링 솔루션은 데이터의이 유형에 대 한 설계 거의. "

컴퓨터 데이터 처리의 어려움이 다음 세 가지 측면: 기계는 서로 다른 소스에서 파생 된 그리고 그것은 이러한 다양 한 소스를 관련 된 매우 복잡 한; 컴퓨터 데이터는 주로 구조적, 그것은 미리 정의 된 아키텍처는 처리 하기 어려운, 컴퓨터 데이터는 실시간 처리에 대 한 매우 까다로운. Splunk의 제품 엔진, 효과적으로 컴퓨터 데이터의 문제를 해결할 구조화 되지 않은 시간 시리즈 기계 데이터를 수집 하 고 수 있는 게 인덱스의 사용 하는 컴퓨터 데이터 라고 합니다. Sanjaymehta는 Splunk 사람들이 생각할 수 있는, 네트워크 트래픽, 웹 서버, 사용자 지정 응용 프로그램, 응용 프로그램 서버, 가상 컴퓨터 관리 프로그램, GSP 시스템 고도 주식 시장 소스, 소셜 미디어, 그리고 구조적된 데이터베이스 같은 모든 소스에서 데이터를 읽을 수 있다. 그리고 실시간으로 그들을 통해 파악 비즈니스 상황, 전체의 심층 분석 시스템 및 인프라 옳은 결정을 무슨 일이 있었는지.

Hadoop의 사용의 용이성 향상

Hadoop을 사용 하 여 저렴 한 비용에 데이터를 저장 하 고 싶은지 일부 고객의 우리에 게. 문제는 그 배포 하 둡 고 그것을 기반으로 더 많은 가치를 얻을 쉽지 않다. 인력 및 Hadoop 배포 배포 된 서비스의 금액 일반 소프트웨어 배포 시간 20 시간을 있을 수 있습니다. Hadoop의 역할을 최대화 하려는 경우 hadoop 적어도 13 프로젝트를 통합 해야 합니다. 다른 많은 고객 Hadoop 플랫폼에서 데이터의 양을 너무 커서 지에 마이그레이션할 수 반영 합니다. "2012 년 10 월, 우리 도입 사용자가 쉽게 하 고 쉽게 splunkenterprise와 Hadoop, 간에 데이터를 전송 하도록 허용 하는 Splunkhadoopconnect," Sanjaymehta 말했다.

Splunkhadoopconnect 전송 Hadoop 및 Splunk 제품 플랫폼 사이 채널 그리고 Hadoop 플랫폼에서 장기 저장을 위한 Splunk 플랫폼에 데이터를 저장 하는 사용자 수 있습니다. Hadoop에 데이터 분석 및 시각화에 대 한 splunk 실시간으로에서 전송할 수 있습니다.

많은 고객에 대 한 까다로운 문제는 Hadoop에 데이터의 양이 너무 크면 자유로이 이동 하는.

2013 년 6 월 22 일, Splunk 덩어리 베타-대화형 데이터 탐사 분석 및 Hadoop 플랫폼에 대 한 시각화를 제공 하는 splunkanalyticsforhadoop 발표. 이 Hadoop 플랫폼을 사용 하 여 사용자에 대 한 더 많은 편의 제공 합니다.

Splunkanalyticsforhadoop Hadoop 3 필수 기능에 데이터에 대 한 동일한 플랫폼에서 대화식 데이터 탐색, 분석 및 시각화를 제공 하는 모든 기능을 갖춘 통합된 제품 이다. "Splunkanalyticsforhadoop은 간단 하 고 사용 하기 쉬운 인터페이스를 뿐만 아니라 전문가 사용할 수 있지만 일반 관리자 액세스 하 고 데이터 분석에 사용할 수 있는 사용자를 제공 한다." 그것은 이해 하 고 데이터를 분석 하는 몇 개월 걸릴 수 있습니다 그리고 Splunkanalyticsforhadoop를 사용 하 여 이제는 그냥 한 시간 또는 심지어 몇 분. "Sanjaymehta 말했다.

Splunkanalyticsforhadoop는 Splunk 가상 인덱싱 기술 (특허에 대 한 적용)을 사용 하 여 첫 번째 제품 이다. 그것은 완벽 하 게 모든 Splunk의 기술, Splunk 검색 처리 언어 (SPL)를 포함 하 여 사용 하는 사용자 수 있습니다. 대화식 탐색, 분석, 및 이러한 데이터는 Splunkindex에 저장 되어 어디서 나, 그냥 저장 된 데이터의 시각화 수 있습니다. Sanjaymehta 말했다: "미래에 우리 넣어 것입니다 더 많은 기술 혁신 피드백하 둡 커뮤니티. 현재, 우리 덩어리 시험에 참여 하는 특정 사용자가 초대 하는.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.