키워드:큰 데이터 기계 학습 오픈 소스 Hadoop 쇼 군 golearn h2o mllib
스팸 필터링, 얼굴 인식, 추천 엔진-기계 학습 유일한 방법 이다 큰 데이터 집합 및 예측 분석 및 패턴 인식을 수행 하기 위해 그들을 사용 하려는 경우. 그리고 점점 더 많은 개발자는 이제 과학이 컴퓨터 수 배울, 분석 하 고 데이터를 조작 하지 독립적으로 사전 계획 없이 기계 학습에 염려 한다.
기계 학습 기술의 증가 또한 뿐만 아니라 하드웨어 비용 저렴 지 고 더 강력한, 하지만 자유 소프트웨어 서 그 기계 학습 지 때문에 쉽게 배포 독립형 또는 대규모 클러스터에 중요 한 기계 학습 라이브러리의 다양성 어떤 언어나 환경 처럼, 당신이 좋아하는 무엇을 얻을 수는 것을 의미 합니다.
1입니다.
Scikit-자세히
파이썬 함수 사용과 풍부한 라이브러리의 용이성 때문에 수학, 자연과학 및 통계에 대 한 선호 하는 프로그래밍 언어 되고있다. Scikit-배울 건물-numpy scipy matplotlib-수학 및 과학에 대 한 기존 파이썬 패키지에. 결과 라이브러리는 대화형 작업 응용 프로그램 사용할 수 있습니다 또는 다른 소프트웨어와 재사용에 포함. 그래서 그것은 완전히 오픈 하 고 재사용 가능한 BSD 라이센스 도구 상자를 얻을 수 있습니다.
오래 되 고 가장 존경 할 만한 기계 학습 도서관에서 쇼 군 C로 작성 된 1999 년에 만들어진 + +, 국한 되지 않는 c + + 작업. 꿀 꺽 꿀 꺽 라이브러리 때문에 쇼 군 쉽게 사용할 수 자바, 파이썬, c#에서, 루비, R, 루아, 옥타브, Matlab 언어와 환경.
존중, 쇼 군이 다른 경쟁. 또 다른 C + + 기계 학습 도서관, Mlpack, 2011 년, 다른 경쟁사 (더 완전 한 집합이 Api) 보다 사용 하기 쉽고 빠른에 주장에 등장.
프로젝트: 쇼 군 Github:https://github.com/shogun-toolbox/shogun
3입니다. 어 코드 framework/aforge.net
협정, 한입니다. 기계 학습 및 신호 처리 프레임 워크 닷넷, Aforge.net 확장 이전 프로젝트와 비슷합니다. 그건 그렇고, 신호 처리 여기 이미지 및 오디오, 그림 또는 얼굴 탐지의 실행의 원활한 바느질 같은 기계 학습 알고리즘의 시리즈를 말합니다. Visual의 집합이 포함 되어 있습니다 그것은 이미지 스트림 (예: 비디오)에 처리 알고리즘, 그리고 개체 및 기타 기능을 이동의 추적을 달성 하기 위해 사용할 수 있습니다. 협정은 또한 기계 결정 트리 시스템에 신경 네트워크에서 학습의 일반적인 라이브러리를 제공 합니다.
프로젝트: 어 코드 framework/aforge.net github:https://github.com/accord-net/framework/
4입니다. Mahout
Mahout 프레임 워크는 항상, 하 둡 연관 되었습니다 하지만 대부분의 알고리즘의 Hadoop에서 실행할 수 있습니다. 그들은 결국 Hadoop 또는 독립 실행형 응용 프로그램으로 Hadoop에서 분리를 마이그레이션할 수 있는 프로젝트에 대 한 유용 합니다.
Mahout의 단점 중 하나: 현재 고성능 점화 프레임 워크를 지 원하는 몇 가지 알고리즘, mapreduce 프레임 워크를 오래 사용 하는 대신 점점. 프로젝트 현재 기반 mapreduce 알고리즘을 허용 하지 않습니다 고 높은 성능을 달성 하 고 싶은 개발자 대신 대신 Mllib을 사용 합니다.
프로젝트: mahout
5입니다. Mllib
아파치 자신의 스파크와 Hadoop 기계 학습 도서관, 대규모 및 고속 mllib를 위한 모든 일반적인 알고리즘 및 유용한 데이터 형식을 주장 한다. 어떤 Hadoop 프로젝트 처럼 자바는 Mllib에 기본 언어 이다 하지만 파이썬 사용자 Mllib NumPy 라이브러리 연결 (또한 Scikit-자세히), 사용할 수 있습니다 그리고 스칼라 사용자 mllib에 대 한 코드를 작성할 수 있습니다. Hadoop 클러스터를 설정할 수 없습니다, mllib Hadoop 없이 불꽃에 배포할 수 있습니다-뿐만 아니라 EC2 또는 Mesos에.
프로젝트: mllib
국가 대형 데이터 혁신 프로젝트 선택 활동은 지금 풀 스윙, 세부 여기를 클릭.
2014 중국 큰 데이터 기술 회의 (기술 컨퍼런스 2014, 2014 BDTC)는 14 크라운 프라 자 호텔, 새로운 운 남, 2014 년 12 월 12 일에 개최 됩니다. 유산 후 7 강 수, "중국의 큰 데이터 기술 컨퍼런스" 2008 년 이후 현재 가장 영향력 있는, 가장 큰 대규모 데이터 필드 기술 이벤트입니다. 이 세션에만 수 없습니다 이순신 Liu와 Apache Hadoop Tez 프로젝트 관리 위원회 Bikas 위원 Apache Hadoop 제출자 uma maheswara Rao G (프로젝트 관리 위원회의 회원)에 대해 배울 수 없습니다. 사 및 일반 대용량 데이터의 다른 공유 Tencent, 알리, Cloudera, 링크 드 인, NetEase 및 기타 기관에서 드라이 제품의 수십의 공유 뿐만 아니라 최신 성과 및 개발 동향의 소스 프로젝트를 엽니다. 현재 티켓 구매에 대 한 몇 가지 할인 티켓을 확인 하 고 있습니다.
"CSDN 큰 데이터" 마이크로-편지 공개 번호, 실시간의 이해 최신 큰 데이터 진행에 무료 가입!
CSDN 큰 데이터를 큰 데이터 정보, 기술에 집중 하 고 경험을 공유 하 고 토론, Hadoop, 스파크, 임 팔 라, 폭풍, HBase, MongoDB, SOLR, 기계 학습, 지능형 알고리즘 및 기타 관련 큰 데이터 뷰, 대용량 데이터 기술, 대용량 데이터 플랫폼, 대용량 데이터 연습을 제공 하 큰 데이터 산업 정보 및 기타 서비스.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.