2. 搭建Hadoop並設定ssh免密登入

阿新 • • 發佈：2021-02-15

技術標籤：spark學習之路 hadoop 大資料 linux

一、搭建Hadoop

2.2 建立本地祕鑰並將公共祕鑰寫入認證檔案

三、最後附上資源

一、搭建Hadoop

1. 下載Hadoop的.tgz檔案

2. 傳到Linux並解壓到制定資料夾

sudotar-zxvfhadoop-2.10.1.tar.gz-C/usr/local/lib/Hadoop

在此之前，建立單獨的目錄

sudo mkdir /usr/local/lib/Hadoop

3. 配置環境變數

vim /etc/profile

export HADOOP_HOME=/usr/local/lib/Hadoop/hadoop-2.10.1

export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

4. 用source使之立刻生效

source/etc/profile

5. 驗證安裝成功

hadoop version

6. 修改配置檔案

進入 ${HADOOP_HOME}/etc/hadoop/ 目錄下，修改以下配置：

6.1 hadoop-env.sh（配置環境變數）

#25行

export JAVA_HOME=/usr/local/lib/java/jdk1.8.0_181

#33行

export HADOOP_CONF_DIR=/usr/local/lib/Hadoop/hadoop-2.10.1/etc/hadoop

6.2 core-site.xml（核心配置檔案）

<configuration>
 <!--預設檔案系統的名稱 -->
 <property>
 <name>fs.defaultFS</name>
 <value>hdfs://nitgod01:9000</value>
 </property>
 <!--指定HDFS執行時的臨時目錄 -->
 <property>
 <name>hadoop.tmp.dir</name>
 <value>/usr/local/lib/Hadoop/data/tmp</value>
 </property>
</configuration>

6.3 hdfs-site.xml（HDFS的節點配置）

指定副本系數、namenode、datanode檔案存放位置和hdfs操作許可權：

<configuration>

 <property>

 <!--指定hdfs儲存資料副本的數量，包括自己，預設為3-->

 <!--偽分散式模式的話，此值必須為1-->

 <name>dfs.replication</name>

 <value>3</value>

 </property>

 <property>

 <!--namenode檔案存放位置,可以指定多個目錄實現容錯，用逗號分隔-->

 <name>dfs.namenode.name.dir</name>
          <value>file: /usr/local/lib/Hadoop/dfs/namenode_data</value>

 </property>

 <property>

 <!--datanode檔案存放位置-->

 <name>dfs.datanode.data.dir</name>

 <value>file: /usr/local/lib/Hadoop/dfs/datanode_data</value>

 </property>

 <property>

 <!--設定hdfs操作許可權，false表示任何使用者都可以在hdfs上操作檔案-->

 <name>dfs.permissions</name>

 <value>false</value>

 </property>

</configuration>

6.4 mapred-site.xml（配置MapReduce）

<configuration>
 <property>
 <!--指定mapreduce執行在yarn上-->
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
</configuration>

6.5 yarn-site.xml（配置YARN的節點資訊）

<configuration>

 <property>

 <!--指定yarn的老大resourcemanager的地址-->

 <name>yarn.resourcemanager.hostname</name>

 <value>nitgod01</value>

 </property>

 <property>

 <!--NodeManager獲取資料的方式-->

 <name>yarn.nodemanager.aux-services</name>

 <value>mapreduce_shuffle</value>

 </property>

 <property> 

 <name>yarn.resourcemanager.webapp.address</name> 

 <value>nitgod01:8088</value> 

 </property> 

<!-- Site specific YARN configuration properties -->

</configuration>

6.6 slaves（配置所有從屬節點的主機名或 IP 地址）

nitgod01
nitgod02
nitgod03

7. 關閉防火牆

#檢視防火牆狀態

sudofirewall-cmd--state

（如果sudo: firewall-cmd：找不到命令，則說明防火牆沒裝，不需要關閉）

#關閉防火牆:

sudosystemctlstopfirewalld.service

8. 初始化

cd${HADOOP_HOME}/bin
sudo./hdfsnamenode-format 
#或 sudo./hadoopnamenode-format

9.啟動HDFS和YARN

cd${HADOOP_HOME}/sbin
sudo./start-dfs.sh
sudo./start-yarn.sh

10. 驗證是否啟動成功

方法一：執行 jps 檢視 NameNode 、 DataNode、SecondaryNameNode、ResourceManager、NodeManager 服務是否已經啟動：

sudo /jdk路徑/bin/jps
11637ResourceManager
11734NodeManager
11241DataNode
11146NameNode
12075Jps
11436SecondaryNameNode

方法二：訪問HDFS和YARN的web UI頁面是否啟動

訪問nitgod01:50070 HDFS頁面

訪問nitgod01:8088 YARN頁面

其中，nitgod01是我主節點的主機名/IP

二、設定SSH免密登入

Hadoop搭建好後，啟動時總需要輸入從節點的密碼。一般設定ssh免密登入

1. 作用

配置ssh免密登入後就不需要每次啟動節點都輸入密碼了

2. 步驟

2.1 每臺機器上配置IP

vim /etc/hosts

192.168.186.128 nitgod01

192.168.186.129 nitgod02

192.168.186.130 nitgod03

2.2 建立本地祕鑰並將公共祕鑰寫入認證檔案

1. 每臺機器建立私鑰，公鑰（為系統當前使用者生成）

ssh-keygen -t rsa -P ''

這時~/.ssh目錄下會生成私鑰和公鑰的鍵值對 id_rsa 和 id_rsa.pub

(rsa和dsa是兩種加密方式)

2.將公鑰寫入認證檔案authorized_keys中，cat是把文字內容拷貝到文章末

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

不過我死活搞不好，所以直接手動把私鑰檔案整合了

1. 找到/root/.ssh下的id_rsa.pub（儲存的是每臺機器的私鑰，用rsa加密的）

2. 把每個節點id_rsa.pub裡面內容整合在一起（到authorized_keys中）

2. 將整合完的authorized_keys檔案覆蓋到各節點

三、最後附上資源

hadoop-2.10.1.tar：連結：https://pan.baidu.com/s/1SAeIovLq_8t71V-p0LsxnQ提取碼：j5cp

也可以在我主頁找一下資源，我都上傳了的

2. 搭建Hadoop並設定ssh免密登入

技術標籤：spark學習之路hadoop大資料linux 目錄一、搭建Hadoop 1. 下載Hadoop的.tgz檔案

windows terminal 設定ssh免密登入

1.下載Windows Terminal 需要安裝vs2019 其他要求和配置還有美化檢視github 2.點選設定

hadoop-SSH免密登入配置

一：配置基礎環境一、修改主機名修改 master 機器主機名 [root@server ~]# hostnamectl set-hostname master-wzg

CentOs7.3 Hadoop 使用者 ssh 免密登入

環境三臺虛擬機器(IP)： 192.168.252.121 192.168.252.122 192.168.252.123 1.修改主機名修改三臺主機名，以此類推，node1，node3，node3

SSH免密登入指令碼

此指令碼用於配置SSH免密登入,適合在節點較多的叢集中使用通過cut獲取/etc/hosts中配置的對映主機名生成列表

Git 常用命令以及SSH免密登入

1、Git 常用命令 git init —— 初始化本地倉庫 (.git資料夾就是本地倉庫 git add [檔名] —— 將檔案提交到暫存區git commit [檔名] —— 將檔案提交到本地倉庫，在跳出的檔案中寫入黃色字型完成提交說明

Hadoop之叢集機器免密登入操作

1 先檢查叢集中的機器中ssh是否存在 :yum -yinstallssh 2 如果不存在就搜尋ssh : yum list | grep ssh ,搜尋到的ssh為 :openssh-clients.X86_64

配置SSH免密登入

配置SSH免密登入環境：在虛擬機器的 Linux 系統下的 CentOS 6.8 做 Hadoop 完全分散式的 SSH 免密登入（其他版本或產品原理應該是類似的）

mac上配置ssh免密登入遠端伺服器

一般ssh登入遠端伺服器都是需要賬號密碼的，每次登入都要輸入賬號密碼比較麻煩，為了方便，可以配置免密登入，ssh免密登入及其原理看這裡

ssh免密登入

ssh免密登入簡單講: 就倆命令, 先ssh-keygen生成金鑰再ssh-copy-id user@host分發公鑰就好.

實現SSH免密登入

實現兩臺機器之間的免密登入為了運維的效率有時會設定一臺機器可以免密登入其他部分主機。

基於SSH免密登入叢集配置

基於SSH免密登入叢集配置最近搭建Flink叢集，為了方便需要配置叢集基於SSH的免密登入訪問；在配置過程中遇到一些坑點，在這裡做個筆記，記錄配置過程和遇到問題，希望對大家有所幫助。

windows配置ssh免密登入linux

客戶端(windows)要做的事情預設機器上已安裝git，若沒有，請先安裝git 檢視本地是否有ssh公鑰資料夾，若沒有，則建立資料夾

CentOS 8配置SSH免密登入

技術標籤：CentOScentosssh 目錄 1、測試SSH 2、建立金鑰 3、上傳公鑰 4、加密方式 1、測試SSH

Windows 配置 ssh 免密登入 Linux 伺服器

技術標籤：經驗總結sshlinuxwindows伺服器每次登入伺服器都要輸入密碼很麻煩，所以進行免密登入配置之後就可以跳過輸入密碼的步驟，直接登入伺服器。

VSCode遠端SSH免密登入配置實現

最近更新了VS Code之後，發現Remote-ssh拓展裡的埠轉發功能沒了，很傷心，在探索的同時，順手配置了一下VS Code ssh免密登入，以省去每次連線遠端資料夾時輸入兩次密碼的煩惱。

Git配置ssh免密登入

一、在使用者目錄下的.ssh目錄下生成祕鑰與公鑰如果使用者目錄下沒有.ssh目錄，則需要新建一個

ssh免密登入失效處理

目錄解決方法免密登入設定完成了,ssh連線其他伺服器能免密成功,但是在某個伺服器上一直不成功,每次都必須輸入密碼

SSH免密登入另一臺伺服器配置及注意事項

一、伺服器生成ssh-key 1. 執行命令$ ssh-keygen -t rsa -P \"\"回車後會在 ~/.ssh/ 下生成兩個檔案：id_rsa 和 id_rsa.pub，這兩個檔案是成對出現的

配置多臺伺服器之間ssh免密登入

使用scp 或者 rsync命令在多臺Linux伺服器之間同步檔案時需要輸入密碼，除了使用expect實現自動化互動以外，還有一種方法就是配置伺服器之間ssh免密登入，本文記錄一下具體配置過程。

2. 搭建Hadoop並設定ssh免密登入

一、 搭建Hadoop

1. 下載Hadoop的.tgz檔案

2. 傳到Linux並解壓到制定資料夾

3. 配置環境變數

4. 用source使之立刻生效

5. 驗證安裝成功

6. 修改配置檔案

7. 關閉防火牆

8. 初始化

9.啟動HDFS和YARN

10. 驗證是否啟動成功

二、 設定SSH免密登入

1. 作用

2. 步驟

2.1 每臺機器上配置IP

2.2 建立本地祕鑰並將公共祕鑰寫入認證檔案

不過我死活搞不好，所以直接手動把私鑰檔案整合了

三、 最後附上資源

相關推薦

一、搭建Hadoop

二、設定SSH免密登入

三、最後附上資源