Hadoop의 저렴 하 고 큰 데이터 처리를 사용 하는 방법

출처: 인터넷
작성자: 사용자
키워드: nbsp 큰 데이터를 이미 사용 하는 방법

큰 데이터 올해의 구름을 될 것입니다. 이것은 불가 피한 결과 이다: 시간이 지남에 점점 더 많은 데이터 세트를 생산 하는 기업, 고객 구매 환경 동향, 현장 방문 및 습관, 고객 검토 데이터, 등 어떻게 넣을 수 있습니다 당신이 너무 많은 데이터 포괄적인 형태로? 전통적인 BI (비즈니스 인텔리전스) 도구 ( 관계형 데이터베이스 및 데스크톱 수학 패키지 사업에 이러한 많은 양의 데이터 처리 하는 방식의 비트입니다. 물론, 데이터 분석 산업 또한 개발 도구와 프레임 워크 데이터 연구자와 애 널 리스트는 큰 데이터 집합을 발굴 및 정보 부하를 견딜 수 있도록 있다.

더 큰 회사에 대 한 대규모 데이터 처리가 아무것도 새로운 합니다. 트위터와 링크 드 인, 예를 들어 이미 잘 알려진 사용자가 큰 데이터에 있습니다. 두 회사는 각각 창 동향을 파악 하 고 그들의 큰 데이터를 활용 하 여 뚜렷한 경쟁 우위를 형성 했다. 중소 기업 CIO에 대해 그래서 뭐? 다행히도, 거기 도구를 사용 하면, 여러분의 손끝에 사용할 수 있습니다 또는 좀 더 구체적으로, 없이 대용량 데이터 처리를 지원 하기 위해 비즈니스 분석가 혼 수.

이러한 도구 중 하나, 무료 Java 기반 Apache Hadoop 프로그래밍 프레임 워크입니다. 프레임 워크는 1.5로 지난 1 년 동안 큰 데이터 분야에서 상당한 시장 접근을 얻고 있다. 글로벌 업계 전문가 및 사용자가 사실상 데이터 마이닝 표준 Hadoop를 호출합니다. 존재에 다른 큰 데이터 제품의 성능을 보고 아파치 Hadoop1.0 버전 2011 년 11 월에 릴리스 되었습니다 하는 사실을 감안할 때, 그것은 참으로 놀라운 Hadoop는 그러한 인정을 받았습니다. Hadoop은 인기 Hortonworks CEO 에릭 Baldeschwieler 그것은 2017 년에 세계의 데이터의 절반 이상이 처리할 것 이다 예측. 기회는 Hadoop 어떻게든 내년에 조직을 접근 합니다.

Hadoop은 주로 개발자를 위한 것입니다. 그것의 주요 프레임 워크 MapReduce 프로그래머 분산된 컴퓨터 그룹에서 데이터의 대량 처리를 지원 합니다. 단점은 매우 무거운 제품입니다. 또한, Hadoop 데이터 소비자와 데이터 변환기에서 데이터 웨어하우스를 운영 하 고 직접 기술 군중을 구분 합니다.

중소 기업 CIO의 예산 제약을 감안할 때, 대규모 데이터의 도전을 극복할 수 있도록 몇몇 제안은 여기 있다:

추세를 간과 하지 마십시오.

큰 데이터 사라지지 않습니다, 그리고 큰 데이터 분석 및 전환 기능 및 데이터 분석 동향은 무시할 수 없습니다. Hadoop 및 기타 큰 데이터 제품의 구조와 기능을 이해 하는 시간이 걸릴. 데이터가 회사에 향상을 가져올 수 있는 방법에 대해 생각 합니다.

자격 갖춘된 데이터 과학자에 대 한 예산 공간을 찾아.

이 사람들은 양방향 심포니의 타악기. 시장에서 자격 갖춘된 데이터 과학자는 매우 부족 한. Hadoop 세계 의회 에서도 지난해 11 월, 훈련이 되었다 큰 주제. 교육 예산의 자유를 사용 하 여 최고의 사람을 고용 하 고 최고 수준의 데이터 분석 실력을 유지.

데이터 집합의 많은 수에 대 한 저장소 힌트를 이해 합니다.

큰 데이터는 실제로 마이닝 거 대 한 양의 데이터 여러 위치 및 구조상 방 벽에 의해 방해 되 고 없이 근처 실시간 속도로 여러 데이터베이스에서. 이 스토리지 인프라에서 작동 하는 방법 복잡. 될 수 있는 클라우드 스토리지 보다 유연 하 고 민첩이 테이블 노예? 종류와 Hadoop 처리 능력을 활용 하는 저장소 요구의 우선 순위를 데이터 마이닝 전략 팀과 함께 작업.

Hadoop을 사용 하 여 준비 도구입니다.

이 분야에서 마이크로소프트의 데뷔 이해와 Hadoop 엑셀 Hadoop sql 서버 통합을 제공할 수 있는 결과의 어떤 종류를 보고 실험. 또한 IBM의 도구는 더 나은 데스크톱 및 최종 사용자 소프트웨어에 귀하의 기존 입력에 적합 한 참조를 보세요.

큰 데이터에 대 한 경연 대회는 이미 시작 했다. 당신은 수 있다 느껴 지 뒤에 데이터 마이닝 변경. 데이터를 무시 하는 Cio 분석 실제로 그들의 경력을 걸고 있다. 그러나, 큰 데이터 필드에 뛰어 든 하 고 중요 한 통찰력을 추출 Cio는 전세계 그들의 손에 있을 것입니다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.