windows10下 eclipse連線虛擬機器中的Hadoop偽分散式叢集
在windows用eclipse連線hadoop之後,可以便於進行mapreduce開發,非常方便,如果在虛擬機器裡面用eclipse的話 ,emmmmmm,你會卡到懷疑人生。
首先需要去下載eclipse,這個直接官網就ok link:https://www.eclipse.org/downloads/
還需要下載eclipse連線hadoop的外掛
hadoop-eclipse-kepler-plugin-2.x |
去下載符合你hadoop版本的外掛
然後放入eclipse安裝目錄下的plugins目錄下
然後下載hadoop(必須跟你的虛擬機器中的hadoop版本相同)
解壓到win系統中
之後再去設定windows的hadoop環境變數
需要設定HADOOP_HOME 和在Path中加入%HADOOP_HOME%\bin
(java環境不用說,肯定是必備的)
這個時候你去開啟eclipse就可以設定hadoop路徑了
開啟window-->Perferences
之後就能在perferences看到hadoop mapreduce選項了
開發環境設定
之後File--->New Project-->Map/recude project
能開發最關鍵的還是要匯入需要的包
- hadoop-2.7.1/share/hadoop/mapreduce下的所有jar包(子資料夾下的jar包不用)
- hadoop-2.7.1/share/hadoop/hdfs/下的hadoop-hdfs-2.7.1.jar
- hadoop-2.7.1/share/hadoop/yarn下的所有jar包(子資料夾下的jar包不用)
- hadoop-2.7.1/share/hadoop/common下的hadoop-common-2.7.1.jar
- hadoop-2.7.1/share/hadoop/common/lib下的slf4j-api-1.7.10.jar,slf4j-log4j12-1.7.10.jar
- hadoop-2.7.1/share/hadoop/tools下的所有jar包
- 這些全部都要匯入
然後還要下載壓縮檔案hadoop-common-2.x-bin解壓後將winutils.exe檔案加入到目錄hadoop-2.6.0/bin下,將hadoop.dll檔案加入到Windows下目錄C:\Windows\System32,重啟計算機後生效。hadoop-common-2.2.0-bin該檔案對應的是64位版的Hadoop,若Hadoop是32位版的,請自行下載相應的32位版的檔案。
hadoop主要基於linux編寫,這個winutil.exe主要用於模擬linux下的目錄環境。因此hadoop放在windows下執行的時候,需要這個輔助程式才能執行
然後就是連線hadoop
window->Perspective->Map/Reduce
location name隨便填
Map/Reduce Master Host填你的namenode ip地址 埠號在mapred.site.xml中有設定,如果沒設定,就是預設50020
DFS Master 埠也要在core-site.xml裡面看
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
然後就ok