目的:
cloudera manager server安裝hadoop叢集的服務大大簡化了安裝過程,即使不懂linux的人之需要滑鼠點一點就可以安裝和管理,但是cloudera manager server所有的安裝過程都是線上的,如果某地網速過慢或者無法連網,就需要離線來安裝cloudera manager server。下面我來介紹一下我安裝的步驟
環境:
ubuntu 12.04 64位系統(其他系統安裝原理也是類似的)
大概思路:
看cloudera manager server的安裝過程的提示可以看出,cm是把它官網的源加入到本地,然後執行apt-get install來安裝,所以很容易的想到把官網上的源下下來,然後在區域網路建立一個源,筆者也是這麼做的。
具體步驟:
1,下載官網上的源,筆者使用wget這個工具,具體命令如下:
wget -mc
http://archive.cloudera.com/cdh4/ubuntu/precise/amd64/cdh/
wget -mc http://archive.cloudera.com/cm4/ubuntu/precise/amd64/cm/
大家仔細分析下這兩個源就知道這是什麼了
2,下載好的源建立伺服器
筆者使用nginx伺服器,覺得配置和使用都很簡單,網上有很多教程,大家可以搜搜
我是參考這個部落格http://www.cnblogs.com/zhangzhang/archive/2012/06/11/2544621.html來配置
還有一點說明就是如果訪問伺服器是403 forbid的話把nginx的設定檔的使用者和使用者組都改成root
假設建立好了源 比如源建在192.168.1.2這個機子 只需要在每台機子的/etc/apt/sources.list裡面加入:
deb [arch=amd64] http://ip/cm4/ubuntu/precise/amd64/cm precise-cm4 contrib
deb-src http://ip/cm4/ubuntu/precise/amd64/cm precise-cm4 contrib
然後apt-get update一下 就會發現用apt-get install hadoop什麼都存在了
3,離線安裝cloudera manage server
在上一篇部落格裡面已經介紹了cm線上的安裝辦法,按道理說現在也這樣安裝就沒有問題,因為源都在本地了。但是經過查看記錄檔知道,cm安裝過程中還要從其他網址下載東西比如mysql和postsql,ssh等,這些都需要我們下好,然後手動安裝(當然,你可以把這些下好,然後加入到源裡面,就可以安裝,但是筆者對於源不是很熟悉,希望這樣成功的人能留言告知下具體做法)。
在執行 cloudera-manager-installer.bin需要先安裝這些
4,離線安裝hadoop叢集
需要安裝hadoop服務的機子需要安裝如下:
ntp
mysql
還有ssh
(以上的這些檔案都是筆者線上安裝時,得到的檔案,這些檔案儲存在/var/cathe/apt/archives檔案夾裡面)
注意問題:
1,如果只有一台機子測試時,需要修改/etc/hosts,把本機ip和主機名稱加入即可
2,有時候firefox顯示會有問題,可以改用chrome即可