[轉]Windows平台下安裝Hadoop

來源:互聯網
上載者:User

標籤:des   style   blog   http   java   os   io   檔案   

1、安裝JDK1.6或更高版本

  官網下載JDK,安裝時注意,最好不要安裝到帶有空格的路徑名下,例如:Programe Files,否則在配置Hadoop的設定檔時會找不到JDK(按相關說法,設定檔中的路徑加引號即可解決,但我沒測試成功)。

2、安裝Cygwin

  Cygwin是Windows平台下類比Unix環境的工具,需要在安裝Cygwin的基礎上安裝Hadoop,:http://www.cygwin.com/

  根據作業系統的需要下載32位或64的安裝檔案。

  1)、雙擊下載好的安裝檔案,點擊下一步,選擇install from internet

  
  2)、選擇安裝路徑

  3)、選擇local Package Directory

  4)、選擇您的Internet串連方式

  5)、選擇合適的安裝源,點擊下一步

  

  6)、在Select Packages介面裡,Category展開net,選擇如下openssh和openssl兩項

  

    如果要在Eclipe上編譯Hadoop,需要安裝Category為Base下的sed

  

    如果想在Cygwin上直接修改hadoop的設定檔,可以安裝Editors下的vim

  

  7)、點擊“下一步”,等待安裝完成。

3、配置環境變數

  在“我的電腦”上點擊右鍵,選擇菜單中的“屬性",點擊屬性對話方塊上的進階頁簽,點擊”環境變數"按鈕,在系統變數列表裡雙擊“Path”變數,在變數值後輸入安裝的Cygwin的bin目錄,例如:D:\hadoop\cygwin64\bin

4、安裝sshd服務

  雙擊案頭上的Cygwin表徵圖,啟動Cygwin,執行ssh-host-config -y命令

  

  執行後,會提示輸入密碼,否則會退出該配置,此時輸入密碼和確認密碼,斷行符號。最後出現Host configuration finished.Have fun!表示安裝成功。

  輸入net start sshd,啟動服務。或者在系統的服務裡找到並啟動Cygwin sshd服務。

    可能會遇到無法安裝和啟動sshd服務的問題,可參考此串連http://www.cnblogs.com/kinglau/p/3261886.html。

  另外如果是Win8作業系統,啟動Cygwin時,需要以管理員身份運行(右鍵表徵圖,選擇以管理員身份運行),否則會因為許可權問題,提示“發生系統錯誤5”。

5、配置SSH免密碼登入

  執行ssh-keygen命令產生密鑰檔案

  如所示,輸入:ssh-keygen -t dsa -P ‘‘ -f ~/.ssh/id_dsa,注意-t -P -f參數區分大小寫。

  ssh-keygen是產生密鑰命令

  -t 表示指定產生的密鑰類型(dsa,rsa)

  -P表示提供的密語

  -f指定產生的密鑰檔案。

  注意:~代表目前使用者的檔案夾,/home/使用者名稱

  

  執行此命令後,在你的Cygwin\home\使用者名稱 路徑下面會產生.ssh檔案夾,可以通過命令ls -a /home/使用者名稱  查看,ssh -version命令查看版本。

  執行完ssh-keygen命令後,再執行下面命令,就可以產生authorized_keys檔案了。

  cd ~/.ssh/

  cp id_dsa.pub authorized_keys

  如所示:

  

  然後執行exit命令,退出Cygwin視窗

6、再次在案頭上雙擊Cygwin表徵圖,開啟Cygwin視窗,執行ssh localhost命令,第一次執行該命令會有提示,輸入yes後,斷行符號即可。如所示

  

7、安裝Hadoop

   hadoop官網下載http://hadoop.apache.org/releases.html。

  把hadoop壓縮包解壓到/home/使用者名稱 目錄下,檔案夾名稱更改為hadoop,可以不修改,但後邊在執行命令時稍顯麻煩。

  (1)單機模式配置方式

    單機模式不需要配置,這種方式下,Hadoop被認為是一個單獨的Java進程,這種方式經常用來調試。

  (2)偽分布模式

    可以把偽分布模式看作是只有一個節點的叢集,在這個叢集中,這個節點既是Master,也是Slave,既是NameNode,也是DataNode,既是JobTracker,也是TaskTracker。

    這種模式下修改幾個設定檔即可。

    配置hadoop-env.sh,記事本開啟改檔案,設定JAVA_HOME的值為你的JDK安裝路徑,例如:

    JAVA_HOME="D:\hadoop\Java\jdk1.7.0_25"    

    配置core-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration>  <property>    <name>fs.default.name</name>    <value>hdfs://localhost:9000</value>  </property>  <property>    <name>mapred.child.tmp</name>    <value>/home/u/hadoop/tmp</value>  </property></configuration>

配置hdfs-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration>  <property>  <name>dfs.replication</name>  <value>1</value></property></configuration>

配置mapred-site.xml

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration>  <property>    <name>mapred.job.tracker</name>    <value>localhost:9001</value>  </property>  <property>    <name>mapred.child.tmp</name>    <value>/home/u/hadoop/tmp</value>  </property></configuration>

 

8、啟動Hadoop

  開啟Cgywin視窗,執行cd ~/hadoop命令,進入hadoop檔案夾,如:

  

  啟動Hadoop前,需要先格式化Hadoop的檔案系統HDFS,執行命令:bin/hadoop namenode -format

  注意namenode要小些,否則如果輸入NameNode,會提示錯誤,找不到或無法載入主類NameNode。執行正確命令後如所示:

  

  輸入命令 bin/start-all.sh,啟動所有進程,如:  

 

接下來,驗證是否安裝成功

開啟瀏覽器,分別輸入下列網址,如果能夠正常瀏覽,說明安裝成功。

http://localhost:50030,斷行符號開啟MapReduce的web頁面,如(頁面部分):

 

http://localhost:50070,斷行符號開啟HDFS的web頁面,如(頁面部分):

 

第一次啟動後,如果都不能瀏覽,或不能瀏覽某一個,退出Cygwin,重新開啟Cygwin,執行bin/start-all.sh命令。

如果只想啟動MapReduce,可執行bin/start-mapred.sh命令。

如果只想啟動HDFS,可執行bin/start-dfs.sh命令。

 

參考文獻:

本文參考和引用了《Hadoop實戰》(陸嘉恒)中的章節“2.3在Windows上安裝與配置Hadoop”。

特此聲明,如果涉及到著作權問題,請告知。

 

http://www.cnblogs.com/kinglau/archive/2013/08/20/3270160.html

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.