Cloudera는 Hadoop 오릭스에 대 한 기계 학습 오픈 소스 도구를 제공

출처: 인터넷
작성자: 사용자
키워드: 기계 학습 현재 추천 시스템 오픈 소스 도구 추천 엔진

지난해 Myrrix, 런던-기반 시작-회사 구입 때 Cloudera 거의 기계 학습에서 회사의 기술 승진 Cloudera, Hadoop 게시자 다량 관심사를 일으키지 않았습니다. 하지만 Myrrix의 기술 및 그의 설립자 숀 오 웬의 가치 및 기계 학습에 영향 과소평가 될 수 없습니다.

오 웬은 현재 오픈 소스 기계 학습 프로젝트-오릭스 (Oryx, Cloudera 또한 판매 임 팔 라, 임 팔 라 라는 제품)를 개발 했다.

오릭스의 목표는 Hadoop 사용자 빌드 및 배포 스팸 필터링 및 추천 엔진 등 실시간으로에서 쿼리할 수 있는 기계 학습 모델입니다. 데이터 흐름을 계속, 오릭스는 자기 갱신을 지원 합니다.

오릭스에서 모델링 또는 배포, 수요에 확장할 수 있습니다 그리고 오 웬 오릭스와 탐구 분석 및 운영 분석의 가장 큰 차이 Hadoop의 전통적인 "스위트 스폿"로 이것을 본다.

오 웬 Hadoop-apache Mahout에 기계 학습을 배포 하기 위한 전통적인 기술 끝에 왔다 믿고 있다.

"Mahout MapReduce만 일괄 처리 작업의 한계를 해결할 수 있는 첫 번째 세대에 의해 제한 됩니다, 사용자가 빌드 및 실행, 시스템을 학습 하는 기계 작업을 많이 할 필요가 그리고 Myrrix mahout을 다시, 모든 오래 된 문제를 해결. Mahout 약 저장을 아직도 가진다면 Cloudera Myrrix를 구매 하지 됩니다. 오릭스는 코드의 거의 90 %Myrrix에서 유래 하 고 일부 코드 "오 웬 말했다 Cloudera에서 온다.

오픈 소스 추천 엔진을 모두 사용할 수 있다?

기계 학습 알고리즘의 도서관은 오릭스 위치, 오 웬 4 핵심 포인트에 초점을 맞추고: 회귀, 분류, 클러스터링 및 협업 필터링 (권장). 권장된 시스템은 매우 인기가 그리고 오 웬 오릭스 배포 추천 시스템을 사용 하 여 그들을 돕기 위해 여러 Cloudera 고객 협력.

추천 시스템을 개발 하기 위한 표준 도구로 오릭스의 연습 추천 시스템은 거의 주류 웹사이트, 그리고 전기 및 콘텐츠 사이트는 사이트의 사용자 경험 및 전환 속도 개선 하기 위해 추천 시스템을 필요로 프로젝트에 관심의 큰 거래를 줄 것 이다. 하지만 추천 엔진 기술로 가장 큰 문제는 표준 및 오픈 소스 도구의 부족.

전용 기술 표준화를 추천 하는 회사만 오릭스, 다른 클라우드 컴퓨팅 시작 회사 박격포 데이터 또한 적극적으로 사용자 추천 엔진 기술의 개발을 추진 하 고 그것의 오픈 소스 추천 프레임 워크의 장점을 보여. 다른 회사를 주입 하지 오픈 소스 AI API 인터페이스를 통해 추천 시스템을 자동화 하려고 하지만 실험실, 기대 합니다.

아직 제품

오 웬 모든 믿는 Cloudera의 고객 (및 대부분의 Hadoop 사용자) 결국 배포 하는 운영 시스템 분석 시스템-아니 그냥 추천, 오릭스는 구현 도구를 미래에 될 수 있다 하지만 오릭스는 순간에만 실험적인 프로젝트입니다.

오 웬 여전히 아파치 점화 프로젝트에 기여자로 시간을 많이 지출 하 고 그 불꽃 다음-세대 큰 데이터 응용 프로그램에 대 한 인기 있는 기술 되었기 때문에 주요 처리 프레임 워크로 서 MapReduce 대신 촉발 하는 오릭스를 다시 작성 하 고 싶어. 성능 및 속도 mapreduce에 우수 하 고 사용 하기 쉬운, 때문에 스파크는 현재 큰 사용자와 참가자 지역 사회가 있다. 즉, 그 불꽃은 더 낮은 대기 시간, 실시간 처리, 그리고 오릭스 개발 기반 실시간 기계 학습 시스템을 포함 하 여 큰 데이터 응용 프로그램에 대 한 반복 계산의 다음 세대의 요구.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.