Mahout 및 Hadoop: 기계 학습의 기초

출처: 인터넷
작성자: 사용자
키워드: 기계 학습 데이터 과학자를 통해 매우

컴퓨팅 종종 이해 데이터 기계 학습에 의존 하는 동안 데이터를 분석 하는 데 사용 됩니다. 몇 년의 매우 원격 하 고 대부분 개발자에 게 어려운 기계 학습이 되었습니다.

이건 아마 가장 유익 하 고 인기 있는 기술 중 하나 지금. 의심의 여지가-개발자 기계 학습 기술 될 수 있는 무대입니다.

그림 1: 기계 학습의 구성

기계 학습 간단한 데이터 검색 및 저장의 합리적인 확장입니다. 다양 한 컴퓨터를 더 만들기 위해 구성 요소를 개발 하 여 지능형 학습 및 행동.

기계 학습 기록 데이터를 발굴 하 여 미래 트렌드를 예측 가능 하 게. 당신은 아직 그것을 실현 하지 않을 수 있습니다 하지만 이미 사용 하는 기계 학습과 많은 혜택. 기계 학습, 검색 엔진 결과, 온라인 추천, 광고, 사기 탐지, 스팸 필터링 등의 많은 보기가 있다.

기계 학습 의사 결정에 대 한 데이터에 의존합니다. 직감, 하지만 중요 한 것은 경험적 데이터를 넘어 어렵다입니다.

기계 학습의 모든 측면

기계 학습 일 지라도 시작 하면, 다음과 같은 질문이 발생.

1. 감독 및 자율 학습

2입니다. 분류

3. 마르코프 모델, 베이지안 네트워크, 등등.

Mahout 및 둡

Apache Mahout 프로젝트의 목적은 학습 라이브러리 확장 기계 것입니다.

어느 정도의 대용량 데이터 분석 및 Hadoop 사이 오버랩이 있다

Hadoop, 오픈-소스 프로젝트를 무료로 배울 수 전체 기계를 얻을 수 있습니다. 더 많은 콘텐츠를 참조.

http://mahout.apache.org/

Mahout 내장 클러스터링, 분류 및 협업 필터링 알고리즘 이:

1. 추천 시스템 매트릭스 분해에 따라

2. K-평균, 퍼지 k-means 클러스터링 알고리즘

3. 암시적 디리클레 할당 알고리즘

4. 단일 값 분해

5. 논리 회귀 분류자

6. (무료) 나 이브 베이지안 분류자

7. 무작위 숲 분류자

내가 버클리에가 주 대학에가 고 발견 그들은 좋은 수업을 많이 했다.

더 많은 시간을가지고 노력 하겠습니다. 난 그것에 대해 생각 하 고 다음 주소에서 MIT 온라인 과정을 시작 하기로 결정:

Http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-867-machine-learning-fall-2006/index.htm

Azure는 기계 학습의 민주화

기계 학습 한 번 필요한 정교한 데이터 과학자 뿐 아니라 하이 엔드 컴퓨터 소프트웨어. 현재 기계 학습에 대 한 즉, 예측 분석, 필요한 것은 완벽 하 게 관리 되는 클라우드 서비스 이다.입니다.

오신 것을 환영 합니다 ML 스튜디오

드래그-앤-드롭 (끌어서 놓기) 및 일부 데이터 흐름 다이어그램을 사용 하 여 수행할 수 있습니다 몇 가지 실험을과 같은 일반적으로 큰 알고리즘을 사용 하는 코드를 작성.

데이터 과학자 r 코드 작성

통계 및 데이터 마이닝, R은 인기 있는 오픈 소스 프로젝트입니다. 좋은 소식은 그 r ML 스튜디오에 쉽게 통합 될 수 있습니다. 나는 기계 학습 기능 언어, F 등의 사용에 있는 많은 친구 #. 하지만 분명히, R은 여전히이 분야에서 지배.

테스트 및 데이터 마이닝의 조사 연구의 인기는 최근 몇 년 동안에서 증가 되었습니다 보여줍니다. R 로스 Ihaka 오클랜드의 대학, 뉴저지의 로버트 신사에 의해 발명 되었다 그리고 현재 R 코어 팀 챔버 개발 구성원 중 하나는 연구 개발에 의해 개발 되고있다. R의 이름은 주로 처음 두 R 작가의 이니셜 기반으로 합니다. R는 주로 C 언어 및 포트란으로 작성 된 GNU 프로젝트.

데이터 분석

다음 프레임 워크는 기계 학습 예측을 이해 하는 방법을 제공 합니다. 일반적으로, 그것은 수익 또는 비용 제한 결정 지원을 제공 하기 위해 리소스를 사용 하 여 제한 하는 방법에 관해서. 예측 등 공급망을 최적화 하는 소비 모델을 포함 합니다.

데이터를 분석 하는 방법

기계 학습을 이해 하는 가장 좋은 방법은 3 질문 분석을 분해 하는 것입니다.

1. 무슨 일이?

역사적인 관점에서

2. 어떻게 됩니까?

A) 미래를 예측

3. 다음 수행 해야 합니까?

A) 규범 및 지침

분석 과정에서 어떤 역할을 재생 합니까?

1. 정보 근로자

A 자주 사용 셀프 서비스 도구 파워 Bi:office 365는 분석 하 고 데이터 깊은 트랜잭션 예측 시각화 BI Excel과 Office 365를 통해 식별 능력을 정보 근로자를 제공 하는 셀프 서비스 트랜잭션 정보 솔루션.

2. it 전문가

(a) 데이터 변환, 데이터 웨어하우징, 데이터 분석 큐브 작성 및 데이터 모델링

3. 데이터 과학자

기술 및 기술, 코딩, 수학, 통계 및 확률을 포함 하 여의 깊은 수준

b 확률 일련의 기술을 통해 예측 하는 데 사용할 수 있습니다 (예를 들어 다음 18 시간에 가격 증가의 확률은 42%)

c) 몬테카를로 (Monte Carlo) 시뮬레이션와 같은 모델 매개 변수화

d 데이터 과학자의 품질

I. 도메인 지식

Ii. 취소 과학적 방법의 이해: 목표, 가정, 유효성 검사, 투명성

Ⅲ. 수학 및 통계에 좋은

Iv. 호기심과 강력한 능력을 생각 하

V. 그래픽 설명 및 통신 기술

Vi. 고급 컴퓨팅 및 데이터 관리 기능

학문적 배경

학교를 입력 하 고 데이터 과학자 될 배울 하려면 다음 과정을 선택할 수 있습니다.

1. 응용된 수학

2. 컴퓨터 과학

3입니다. 경제학

4입니다. 통계

5입니다. 공학

산업 데이터 과학에서 혜택은 다음과 같습니다.

1. 금융 서비스

2입니다. 통신

3. 정보 기술

4입니다. 제조

5입니다. 공공 유틸리티

6입니다. 공중 보건

7입니다. 시장

"TechTarget 중국 원본 콘텐츠, 저작권, 공인된 중국 대형 데이터 자료는 무단 전재를 거부 했다." 그렇지 않으면 techtarget 중국 그것의 법적 책임을 추구 하는 권리를 유지 합니다. 】

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.