首先我的OS是ubuntu 12.10.
1、記住最好先裝Open jdk。要是先裝了Sun的其實也行,就是後面配置的時候優先順序要設定的高一點,設定個3000神馬的,這樣才能識別為自動項。
2、我很沒出息的下載的是.deb包,而不是原始碼。因為簡單使用
dpkg -i hadoop1.0.4.deb
就可以完成安裝。當然安裝之前的準備工作還是要做的。這邊我要提醒大家注意的就是自己在裝ubuntu系統的時候要注意home目錄的安裝許可權,否則和我一樣二逼兮兮到最後沒辦法建立新的使用者,當然這個問題我還沒有解決。估計只能重裝系統了。
具體可以參考http://www.cnblogs.com/tippoint/archive/2012/10/23/2735532.html 或者Hadoop實戰那本書
3、使用dpkg安裝之後有幾個路徑需要記住,一個是
這個裡面都是Hadoop相關的設定檔。所謂的偽分布式配置啦之類的東西都在這裡
記住,一定要重新設定該檔案夾的owner,如果owner不是hadoop的話
chown -R hadoop:hadoop /etc/hadoop
第二個檔案目錄是這個
這個就是examples還有一些lib啊之類所在
也要Chown的!!!!!
4、若是使用
hadoop fs -ls
的時候報錯,類似與無法連結local host的那種,首先檢查是不是namenode配置的問題。如果不是那就是因為預設的hadoop會把一些臨時檔案放在/tmp檔案夾下面。這樣每次重啟之後namenode相關的資訊就會丟失,這個時候就會導致無法連結的問題。
我們需要重新設定tmp目錄。在你喜歡的地方建立haoop_tmp檔案夾存放臨時檔案
然後在/etc/hadoop/coresite.xml中
<property> <name>hadoop.tmp.dir</name> <value>~/hadoop_tmp</value> <description>A base for other temporary directories</description> </property>
一定要記得給這個剛剛建立額hadoop_tmp也要chown!!!!!!不然後面會一直有permission denied的問題!!!!!!!!!!!!!!
5、最後,在使用wordcont的時候。上傳本地檔案到hdfs上的命令如下
hadoop fs -put [src] [dest]
獲得Haoop上面的檔案的命令是
hadoop fs -get [src] [dest]
要是還有什麼其他的問題下次接著記下來