【大資料】Hadoop初上陣(安裝真是坑坑坑)
剛剛裝完了偽分散式的Hadoop,來寫一下感謝,並記錄一下遇到的bug。
我是按著我們學校的發的大資料教程敲的,但是遇到一大堆bug,估計是選錯hadoop版本了,書上寫的用hadoop-2.7.3而我用的是hadoop-2.7.5,反正總結一下吧
首先用的是Ubuntu系統(也就是Linux系統)進行安裝。整個安裝過程比比想象之中簡單。主要是應付Ubuntu系統的英文操作介面,這個花了我將近1個多小時。還有學習一些指令
1、Ubuntu類似於Window的cmd在哪裡?
2、如何給Ubuntu新增JAVA的path環境
3、下java8到Linux上,檔案格式是.rpm還是tar.gz
4、如何用sudo開啟~/.bashrc 的記事本,而不是直接在終端裡出現文字(一開始用的是vim命令)?
5、Ubuntu如何把檔案移入到系統檔案目錄?
6、hadoop原始碼bin目錄下找不到start-all.sh來啟動hadoop?
7、[email protected]'s password: localhost: Permission denied, please try again.這個錯誤是什麼鬼???
總共遇到了以上7坑,真的是浪費時間,整整一個下午就過去了。。。
1、Terminal(終端)右鍵桌面就寫著Open Terminal
2、
sudo gedit ~/.bashrc
//在開啟的檔案末尾加上
//export PATH='自己所要填的路徑':$PATH
source ~/.bashrc
sudo gedit ~/.bashrc是開啟配置檔案
source ~/.bashrc是讓更改的.bashrc配置的環境可以立刻使用
# 加到PATH末尾
export PATH=$PATH:/path/to/your/dir
# 加到PATH開頭
export PATH=/path/to/your/dir:$PATH
3、tar.gz是一個壓縮檔案,rmp可以解壓成deb然後成為可執行檔案,在Ubuntu上有圖形介面安裝
下面是如何打包一個目錄: # tar -cvf archive_name.tar directory_to_compress 如何解包: # tar -xvf archive_name.tar.gz
我選擇了rpm檔案格式的java。
下載好後,需要把rmp->轉換->deb的可執行檔案
安裝alien轉換軟體
apt-get install alien
將RPM包轉換為deb安裝包
sudo alien --scripts *.rpm
這個過程會很長,很長,我中途不耐煩直接Ctrl+C停止,害的有得重跑一遍
4、用sudo gedit 檔名就可以開啟
5、因為書上把hadoop解壓的檔案弄到了系統資料夾,弄了半天沒有弄進去。後來還是決定在其它盤上跑,但這個問題是解決了的
[[email protected] ~]# cd /tmp
[[email protected] tmp]# cp ~/.bashrc bashrc
[[email protected] tmp]# cp -R ~/.bashrc bashrc
注意上面那個是cd,而下面是用的cp,我一直寫成了cd,狂報錯。。。。
6、這個我認為應該是我安裝hadoop版本的問題,我在sbin目錄下找到了這個檔案,然後按照這個目錄下的檔案執行,完全沒有問題
7、第7個錯誤很頭大。
cd ~/.ssh
ssh-keygen -t dsa -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
//新增下面兩行
eval "$(ssh-agent -s)"
ssh-add