（三）配置Hadoop1.2.1+eclipse(Juno版)開發環境，並運行WordCount程式

最後更新：2015-01-21 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

標籤：

配置Hadoop1.2.1+eclipse(Juno版)開發環境，並運行WordCount程式

一、 需求部分

在ubuntu上用Eclipse IDE進行hadoop相關的開發，需要在Eclipse上安裝hadoop的開發外掛程式。最新釋放出的hadoop包含源碼的包，以 hadoop-1.X為例，包含相關的eclipse外掛程式的源碼，因此可以針對自己的eclipse版本來編譯一個合適hadoop的eclipse外掛程式。下面將詳細介紹外掛程式的編譯安裝過程，以及在Eclipse上配置hadoop開發外掛程式的過程。

二、環境

VMware® Workstation 10.04
Ubuntu14.04 32位
Java JDK 1.6.0
Hadoop1.2.1
Eclipse: Juno Service Release 2 Version

三、編譯hadoop1.2.1與Eclipse-Juno外掛程式

1) 安裝ant

sudo apt-get install ant

2) 修改編譯設定檔

l 在hadoop解壓目錄下，找到src\contrib\eclipse-plugin\build.xml，修改以下幾行：

</fileset>

</path>

</path>

......

<jar

jarfile="${build.dir}/hadoop-${name}-${version}.jar"

manifest="${root}/META-INF/MANIFEST.MF">

</jar>

</target>

l 找到src\contrib\build-contrib.xml，添加以下幾行：

  <property name="version" value="1.2.1"/>

  <property name="ivy.version" value="2.1.0"/>

  <property name="eclipse.home" location="..."/>

eclipse的路徑請換成你主機上的eclipse存放路徑。

3) 然後，開啟命令列，進入目錄\src\contrib\eclipse-plugin，輸入ant編譯，如果一切正常就編譯通過了。

最後可以在{hadoophome}\build\contrib\eclipse-plugin路徑下找到編譯好的外掛程式。

4) 幾個注意點：

l 一定要在網路環境下進行，如果需要設定上網代理，可以在src\contrib\build-contrib.xml中添加如下幾行：

<target name="proxy" >

    <property name="proxy.host" value=""/>

    <property name="proxy.port" value="80"/>

    <property name="proxy.user" value=""/>

    <property name="proxy.pass" value=""/>

    <setproxy proxyhost="${proxy.host}" proxyport="${proxy.port}"

      proxyuser="${proxy.user}" proxypassword="${proxy.pass}"/>

</target>

在xml檔案中的ivy相關檔案的下載任務中，添加以上代理任務的依賴，配置為：

<target name="ivy-download" depends="proxy" description="To download ivy " unless="offline">

    <get src="${ivy_repo_url}" dest="${ivy.jar}" usetimestamp="true"/>

  </target>

l 如果出現編譯提示類的版本不匹配的問題，請確認你的java版本大於1.6。

四、配置hadoop1.2.1與Eclipse開發環境

得到的hadoop1.2.1-Eclipse開發外掛程式（jar包）後，將它放置在eclipse/plugins目錄下，並重啟eclipse即可。這裡要注意一點，有時候eclipse會出現載入外掛程式失敗的情況，如果出現，就用eclipse -clean命令啟動，啟動後在Eclipse的右上方應該出現了一隻藍色的大象logo。

五、運行WordCount程式

啟動Eclipse後，File->New->Project.如果出現Map/Reduce Project選項，選擇後next，輸入Project name完成後，說明外掛程式安裝成功了。如果出現了Map/Reduce Project選項，但是next後提示錯誤，說明你使用的外掛程式不可行。

下面在window->preferences選項裡配置hadoop目錄

然後啟動hadoop，點擊eclipse下方選項黃色小象，在下方空白處右鍵，New hadoop location..

上面左方的Map/Reduce Master設定Host和Port對應的是你hadoop安裝目錄下conf下mapred-site.xml檔案設定的host和port，右邊的DFS Master對應的是core-site.xml。設定好後finish，然後就能在eclipse裡面瀏覽並操作HDFS了。

下面我們試著運行一個wordcount演算法。

在剛才建的map/reduce project下的src檔案夾上右鍵，New->class

然後把hadoop安裝目錄下的src/examples/org/apache/hadoop/examples內的WordCount.java內的代碼copy到工程中的WordCount.java裡。

注釋第一行。儲存。

在ubuntu的Documents下建立檔案input，並輸入內容：

my name is sun bin bin,what is your name?

然後將input檔案上傳到HDFS中：

bin/hadoop fs -put /home/binbin/Documents/input. //注意最後面的.

檔案就上傳到HDFS了，重新整理eclipse中的myhdoop下的目錄就可以看到

然後開始運行。在建立的WordCount.java上面右鍵，Run as->run configurations

左邊的java application右鍵New

arguments設定參數：

要確保HDFS中不存在output目錄，否則會拋出異常。點擊Run on Hadoop.

運行結束後，在左方的DFS Locations/myhadoop裡面就能看輸出結果了（要右鍵重新整理），或者在終端通過命令列查看。

因為本wordcount演算法只對空格做間隔符號，所以會出現bin,what計為一個單詞的情況。

參考：

http://www.cnblogs.com/alex-blog/p/3160619.html

http://blog.sina.com.cn/s/blog_7deb436e0101kh0d.html

（三）配置Hadoop1.2.1+eclipse(Juno版)開發環境，並運行WordCount程式

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

（三）配置Hadoop1.2.1+eclipse(Juno版)開發環境，並運行WordCount程式

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support