聲明:Hadoop相關資料,最好參考官方文檔,根據需要,選擇參考不同版本:
目前的版本,http://hadoop.apache.org/docs/current/
版本列表,http://hadoop.apache.org/docs/
本文採用的是Hadoop版本為0.20.2,系統為Mac OS X 10.7.5。
0. 下載Hadoop
https://archive.apache.org/dist/hadoop/core/hadoop-0.20.2/
1. Java環境搭建:
略
2. 將Hadoop解壓縮:
$ tar xvzf hadoop-0.20.2.tar.gz
3. $ vim hadoop-0.20.2/conf/hadoop-env.sh,配置JAVA_HOME:
添加雙引號內部分,“export JAVA_HOME=/System/Library/Java/JavaVirtualMachines/1.6.0.jdk/Contents/Home”
4. 為Hadoop修改環境變數,(1)、(2)任選一:
(1) 全域修改:
$ vim /etc/paths
添加雙引號內部分,“/Users/waterforest/Hadoop/hadoop-0.20.2/bin”
(2) 使用者修改:
$ vim ~/.profile
添加雙引號內部分,”export PATH=$PATH:/Users/waterforest/Hadoop/hadoop-0.20.2/bin“
測試1:
$ hadoop version
看到以下內容則表示配置成功:
Hadoop 0.20.2Subversion https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707Compiled by chrisdo on Fri Feb 19 08:07:34 UTC 2010
測試2:
$ cd hadoop-0.20.2
$ mkdir input
$ cp conf/*.xml input
$ hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
$ cat output/*
看到以下內容,則表示配置成功:
1dfsadmin