1. 程式人生 > >hadoop-虛擬機配置與hadoop基本配置

hadoop-虛擬機配置與hadoop基本配置

efi shuff lap 目錄 測試 rep 成功 apach eno

一、虛擬機設置

環境:centos6.4

vmware網絡適配器:橋接模式,禁用vmnet8

vim /etc/sysconfig/network-scripts/ifcfg-eth0

網關的設置參考外部機器的默認網關

技術分享圖片
DEVICE=eth0
TYPE=Ethernet
UUID=57cd273b-3bed-4378-957f-fe1552b5212d
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static
IPADDR=192.168.1.130
PREFIX=24
GATEWAY=192.168.1.1
DNS1=192.168.1.1
DEFROUTE=yes
IPV4_FAILURE_FATAL
=yes IPV6INIT=no NAME="System eth0" HWADDR=00:0C:29:22:0D:E9 LAST_CONNECT=1540218650
View Code

關閉防火墻:service iptables stop,chkconfig iptables off。

確保外部機器和虛擬機能相互ping通,就可以使用xhell操作虛擬機了。

更改hostname:vim /etc/sysconfig/network --> HOSTNAME=hadoop-server-00

配置集群的hosts:vim /etc/hosts

192.168.1.130 hadoop-server-00
192.168.1.131 hadoop-server-01
192.168.1.132 hadoop-server-02

修改下次啟動不使用圖形界面:vim /etc/inittab --> id:5:initdefault: --> id:3:initdefault:

完成以上操作後重啟虛擬機,重啟後可能不會自動連接網絡,需要手動連接一下:ifup eth0

二、配置jdk

技術分享圖片
mkdir /usr/local/apps
tar -zxf jdk-8u191-linux-x64.tar.gz -C /usr/local/apps/
vim /etc/profile
export JAVA_HOME=/usr/local/apps/jdk1.8.0_191
export PATH=$PATH:$JAVA_HOME/bin
View Code

保存退出後執行 source /etc/profile,並且驗證jdk是否配置成功。

三、配置hadoop

下載地址:

http://archive.apache.org/dist/ 解壓:tar -zxf hadoop-2.4.1.tar.gz -C /usr/local/apps/ 進入hadoop的配置目錄:/usr/local/apps/hadoop-2.4.1/etc/hadoop 1.修改hadoop的環境信息:vim hadoop-env.sh
export JAVA_HOME=/usr/local/apps/jdk1.8.0_191/

2.修改hadoop運行的公共配置:vim core-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop-server-00:9000/</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/apps/hadoop-2.4.1/tmp/</value>
</property>
</configuration>

3.修改hdfs相關的配置:vim hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

4.修改mapreduce相關配置:mv mapred-site.xml.template mapred-site.xml,vim mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

5.修改yarn相關配置:vim yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop-server-00</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

6.修改從節點:vim slaves,修改其中的localhost為:

hadoop-server-00

四、啟動hadoop

1.格式化hdfs:

/usr/local/apps/hadoop-2.4.1/bin
./hadoop namenode -format

2.手動啟動hadoop:cd /usr/local/apps/hadoop-2.4.1/sbin/

./hadoop-daemon.sh start namenode

jps查看是否啟動。接著啟動datanode:

./hadoop-daemon.sh start datanode

啟動secondarynamenode:

./hadoop-daemon.sh start secondarynamenode

查看端口:netstat -nltp,其中50070為外部web訪問的端口,可以嘗試訪問一下:http://192.168.1.130:50070

3.啟動yarn的進程:cd /usr/local/apps/hadoop-2.4.1/sbin

./yarn-daemon.sh start resourcemanager
./yarn-daemon.sh start nodemanager

五、使用腳本啟動

先關閉之前手動啟動的進程,然後進入目錄:cd /usr/local/apps/hadoop-2.4.1/sbin/

./start-dfs.sh

多次提示輸入密碼和信任(可以設置ssh信任關系後就不需要輸入密碼了),完成後使用jps可以看到已經啟動了3個進程。

在登錄方生成密鑰對,然後將公鑰復制給目標主機,在目標機器上將公鑰加入授權文件:~/.ssh/authorized_keys(該文件權限為600)

1.生成密鑰對:ssh-keygen

2.加入目標機器的授權文件:ssh-copy-id hadoop-server-01

在本機生成:ssh-keygen,把公鑰傳到本機:ssh-copy-id hadoop-server-00,完成後在登錄本機(ssh hadoop-server-00)就不需要密碼了。

測試使用腳本啟動(不需要輸入密碼),先停止進程:./stop-dfs.sh,jps

./start-dfs.sh,如果還需要密碼說明信任關系設置的不對,需要檢測。

./start-yarn.sh,啟動yarn進程

如果看到5個進程都啟動成功了,說明配置ok。

hadoop-虛擬機配置與hadoop基本配置