오픈 소스 클라우드 컴퓨팅 기술 시리즈 (4) (Cloudera 설치 구성 Hadoop 0.20 최신 버전 구성)

출처: 인터넷
작성자: 사용자
키워드: Nbsp; 이름 nbsp; 이름

다음, 우리는 경험 Cloudera 0.20의 최신 버전을 계속.

wget Hadoop-0.20-conf-pseudo_0.20.0-1cloudera0.5.0 ~ lenny_all.deb

wget Hadoop-0.20_0.20.0-1cloudera0.5.0 ~ lenny_all.deb

데비안: ~ # Dpkg-i Hadoop-0.20-conf-pseudo_0.20.0-1cloudera0.5.0 ~ lenny_all.deb

Dpkg-i Hadoop-0.20_0.20.0-1cloudera0.5.0 ~ lenny_all.deb

그것은 간단입니다. 그래

설치를 어디서 해야할지 경우 사용할 수 있습니다.

데비안: ~ # dpkg-l hadoop 0.20

분명 설치 디렉터리 구조를 볼 수 있습니다.

시작:

데비안: ~ # cd/etc/init.d/hadoop-0.20-
Hadoop 0.20 datanode Hadoop 0.20 namenode Hadoop 0.20-tasktracker
Hadoop 0.20 jobtracker Hadoop 0.20-secondarynamenode
데비안: ~ # cd/etc/init.d/hadoop-0.20-

debian:~#/etc/init.d/hadoop-0.20-namenode 시작

debian:~#/etc/init.d/hadoop-0.20-namenode 상태
Hadoop 0.20 namenode가 실행

debian:~#/etc/init.d/hadoop-0.20-datanode

시작

debian:~#/etc/init.d/hadoop-0.20-datanode 상태
Hadoop 0.20 datanode 실행

debian:~#/etc/init.d/hadoop-0.20-jobtracker 시작

debian:~#/etc/init.d/hadoop-0.20-jobtracker 상태
Hadoop 0.20 jobtracker 실행

debian:~#/etc/init.d/hadoop-0.20-tasktracker 시작

debian:~#/etc/init.d/hadoop-0.20-tasktracker 상태
Hadoop 0.20 tasktracker 실행

부팅 완료입니다.

다음 일반 예제 테스트를 수행할 수 있습니다.

테스트 가치가 무엇입니까

데비안: ~ # Sqoop-도움말
사용법: hadoop Sqoop.jar org.apache.hadoop.sqoop.Sqoop (옵션)

데이터베이스 연결 옵션:
-연결 (jdbc-uri) 지정 JDBC 연결 문자열
-드라이버 (클래스 이름) JDBC 드라이버를 수동으로 지정
-를 사용 하 여 클래스 이름 (사용자 이름) 설정된 인증 사용자 이름
- 비밀 번호 (암호) 설정된 인증 암호
-로컬                    사용 하 여 로컬 가져오기 빠른 경로 (MySQL만)

가져오기 제어 옵션:
-테이블 (tablename)를 표 읽기
-열 (열, 열, 열...) 내보낼 테이블
-열 순서-의해 테이블의 열 (열 이름)을 사용 주문 결과
-hadoop-홈 (dir) 재정의 $HADOOP _home
-테이블 대상
-창 고-dir (dir) HDFS 경로 sequencefile로 SequenceFiles에 데이터를 가져옵니다.
-텍스트로 일반 텍스트 (기본)
-모든 테이블 데이터를 가져옵니다. 모든 데이터베이스의 테이블에
가져오기 & nbsp; (무시--열과-순서-테이블)

코드 생성 옵션:
생성 된 코드에 대 한-outdir (dir) 출력 디렉터리
-bindir (dir) 컴파일된 개체에 대 한 출력 디렉터리
-생성 전용 정지 후 코드 생성; 가져오지 않음

추가 명령:
-데이터베이스에 출구 목록 테이블 목록 테이블
-목록 데이터베이스 목록 모든 사용할 수 있는 데이터베이스와 출구
-디버그-sql SQL 및 출구 (문) 실행 '문'

일반 Hadoop 명령줄 옵션:
일반 옵션 지원
응용 프로그램 구성 파일을 지정 하는-conf < 구성 파일 >
-D < 속성 값 = > 주어진 값 사용 속성
-fs < 로컬 | namenode:port >는 Namenode 지정
JT-< 로컬 | jobtracker:port > 지정 일 추적기
-< 파일의 쉼표로 구분 된 목록 > 파일 지정 지도 복사는 쉼표로 구분 된 파일 클러스터를 줄일
-libjars < 항아리의 쉼표로 구분 된 목록 > 지정 하는 쉼표로 구분 된 jar 파일을 클래스 경로에 포함.
-아카이브 < 기록 보관소의 쉼표로 구분 된 목록 > 쉼표로 구분 된 아카이브 계산 맥에 unarchived를 지정 하인즈입니다.

일반 명령 라인 구문이입니다.
빈/hadoop 명령을 [genericoptions] [commandoptions]

최소한 연결을 지정 해야 합니다--테이블 및-모든 테이블.
또는, 지정할 수 있습니다-생성 전용 또는 추가 중
명령입니다.

Apt-get은 설치 mysql 서버 설치 데비안 아래 MySQL의 공동 테스트를 수행할 수 있습니다.

이전 문서를 참조 하는 테스트 경험, 완전 한 경험을 가질 수 있습니다 여기. Cloudera의 출현은 정말 Hadoop 및 드라이브 오픈 소스 개발 클라우드 컴퓨팅의 구성을 단순화 합니다.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.