hadoop安裝簡要指南

阿新 • • 發佈：2018-12-11

自己安裝hadoop時遇到了很多坑，這裡把驗證成功的方法記錄一下。

1. 部署叢集

首先你需要有幾臺伺服器，將它們的name和ip都記錄下來，然後將它們記錄到每一臺機器的/etc/hosts檔案中，比如：

192.168.119.128 namenode 192.168.119.129 datanode1 192.168.119.130 datanode2

然後需要配置這幾臺機器之間的免密登入，這一步非常非常容易出錯，一定要當心。首先先生成每臺機器的金鑰：

ssh-keygen -t rsa -P ‘’

然後將所有機器下/root/.ssh/id_rsa.pub的內容貼上到authorized_keys檔案，放在每臺機器的/root/.ssh/目錄下。然後各個機器之間ssh來回登入一下，將首次免密登入需要輸入的yes給搞定（不來回登入一下的話，之後hadoop安裝可能會報錯）。

2. 安裝hadoop

安裝hadoop時記住自己的使用者名稱，不要隨便用sudo！用sudo建立的目錄是管理員許可權，普通使用者無法建立檔案。在每一臺機器上建立hadoop的工作資料夾，比如：

mkdir /root/hadoop mkdir /root/hadoop/tmp mkdir /root/hadoop/var mkdir /root/hadoop/dfs mkdir /root/hadoop/dfs/name mkdir /root/hadoop/dfs/data

然後下載一個hadoop放到namenode機器上然後解壓縮，依次修改如下檔案：

hadoop-2.8.0/etc/hadoop/slaves，新增datanode的名字

datanode1
datanode2

hadoop-2.8.0/etc/hadoop/hadoop-env.sh，新增

export   JAVA_HOME=/usr/java/jdk1.8.0_66

hadoop-2.8.0/etc/hadoop/core-site.xml，在configuration之間新增

   <property>
        <name>hadoop.tmp.dir</name>
        <value>/root/hadoop/tmp</value>
   </property>
   <property>
        <name>fs.default.name</name>
        <value>hdfs://namenode:9000</value>
   </property>

hadoop-2.8.0/etc/hadoop/hdfs-site.xml，在configuration之間新增

<property>
   <name>dfs.name.dir</name>
   <value>/root/hadoop/dfs/name</value>
</property>
<property>
   <name>dfs.data.dir</name>
   <value>/root/hadoop/dfs/data</value>
</property>
<property>
   <name>dfs.replication</name>
   <value>2</value>
</property>
<property>
      <name>dfs.permissions</name>
      <value>false</value>
</property>

複製hadoop-2.8.0/etc/hadoop/mapred-site.xml.template為mapred-site.xml，新增

<property>
   <name>mapred.job.tracker</name>
   <value>hdfs://namenode:49001</value>
</property>
<property>
      <name>mapred.local.dir</name>
       <value>/root/hadoop/var</value>
</property>
<property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
</property>

hadoop-2.8.0/etc/hadoop/yarn-site.xml，新增

<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>namenode</value>
   </property>
   <property>
        <name>yarn.resourcemanager.address</name>
        <value>${yarn.resourcemanager.hostname}:8032</value>
   </property>
   <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>${yarn.resourcemanager.hostname}:8030</value>
   </property>
   <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>${yarn.resourcemanager.hostname}:8088</value>
   </property>
   <property>
        <name>yarn.resourcemanager.webapp.https.address</name>
        <value>${yarn.resourcemanager.hostname}:8090</value>
   </property>
   <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>${yarn.resourcemanager.hostname}:8031</value>
   </property>
   <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>${yarn.resourcemanager.hostname}:8033</value>
   </property>
   <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
   </property>
   <property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>8182</value>
        <discription>單個任務最大可申請記憶體,預設8182MB</discription>
   </property>
   <property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>2.1</value>
   </property>
   <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>2048</value>
        <discription>該節點可使用記憶體</discription>
</property>

然後使用scp命令將hadoop資料夾複製到其他所有節點上。

3. 啟動hadoop

執行初始化指令碼：

hadoop-2.8.0/bin/hadoop namenode -format

啟動hadoop：

hadoop-2.8.0/sbin/start-all.sh

可是使用如下命令檢視啟動後的狀態：

hadoop-2.8.0/bin/hadoop dfs admin -report檢視hadoop狀態

使用50060埠可以檢視hadoop overview，使用8088埠可以檢視hadoop叢集情況。

hadoop安裝簡要指南

自己安裝hadoop時遇到了很多坑，這裡把驗證成功的方法記錄一下。 1. 部署叢集首先你需要有幾臺伺服器，將它們的name和ip都記錄下來，然後將它們記錄到每一臺機器的/etc/hosts檔案中，比如： 192.168.119.128 namenode

SPHINX 文檔寫作工具安裝簡要指南 - windows 版 - 基於python

use install 基礎 content tar min bsp scrip tro 此教程基於本地己安裝好 PYTHON 並配置過全局變量；一定具備相應的基礎再操作；上傳圖片以免產生誤導，以下為文字描述，按下列操作即可：下載 get-pip.py腳本;

hive安裝簡要指南

這裡記錄一下hive安裝的步驟，主要參考 https://blog.csdn.net/jssg_tzw/article/details/72354470 hive需要把元資料儲存在資料庫中，預設的derby不能多程序訪問，因此這裡使用mysql來儲存。centos2.7 預設是沒有mys

spark安裝簡要指南

這裡記錄一下spark安裝的步驟。首先安裝好hadoop，然後下載spark on hadoop，解壓縮到namenode上。將spark-2.1.1-bin-hadoop2.7/conf/spark-env.sh.template改為spark-env.sh

Hadoop安裝指南

1. 修改hosts和hostname 在ubuntu上，/etc/hosts 儲存IP地址和域名的對應關係，/etc/hostname 儲存本機的主機名。我們可以在hosts檔案里加入這樣的對映 ip_address1 master ip_address2 slave1 ip_

mac osx 系統 brew install hadoop 安裝指南

mac osx 系統 brew install hadoop 安裝指南 brew install hadoop 配置 core-site.xml:配置hdfs檔案地址（記得chmod 對應資料夾，否則無法正常啟動hdfs）和namenode的rpc通行埠配置mapred-site.xm

android studio 1.5版安裝簡要爬坑指南

小弟剛接觸android 開發，下載安裝配置開發環境弄了好久，寫下一些坑，希望幫助遇到同樣問題的同學。以下為window下安裝教程：（首先你要安裝好java，教程網上一找一大堆，很快的） 1.下載android studio： android中文社群下載，http://w

hadoop安裝

簡介系統官方文檔 lock tsl star tfs replica 控制曾經的學習筆記 1.Hadoop簡介： a) 分布式存儲系統HDFS 分布式存儲系統提供了高可靠性、高擴展性和高吞吐率的數據存儲服務 b) 分布式計算框架MapReduce 分布式計

hadoop--安裝

環境變量 efault port openjdk all 變量 sta java sudo 1、安裝java sudo apt-get install default-jre sudo apt-get install default-jdk 2、添加環境變量 export

hadoop安裝教程

集群 manager 生成 tle 數據訪問這樣的 pen 映射關系 apache hadoop的核心 Hadoop的核心就是HDFS和MapReduce，而兩者只是理論基礎，不是具體可使用的高級應用，Hadoop旗下有很多經典子項目，比如HBase、Hive等，

Hadoop學習------Hadoop安裝方式之(一)：單機部署

root權限出錯密碼登錄例子 .tar.gz sta /usr 成功 tput Hadoop 默認模式為單機(非分布式模式)，無需進行其他配置即可運行。非分布式即單 Java 進程，方便進行調試。 1、創建用戶 1.1創建hadoop用戶組和用戶一般我們不會

Hadoop學習------Hadoop安裝方式之(三)：分布式部署

之間 root用戶 jar .sh author tables eth1 report 標識這裏為了方便直接將單機部署過的虛擬機直接克隆，當然也可以不這樣做，一個個手工部署。創建完整克隆——>下一步——>安裝位置。等待一段時間即可。我這邊用了三臺虛擬

hadoop安裝筆記

yar keys alt ssh密鑰 ssh bsp pla oop ubunt 環境是ubuntu java啥的有yum apt-get install default-jdk update-alternatives --display Java hadoop解壓縮就行

centos7中基於hadoop安裝hive(CentOS7+hadoop2.8.0+hive2.1.1)

root drive notepad lds opts 裝配 -- 3.2 window 1下載hive 下載地址：http://hive.apache.org/downloads.html 點擊上圖的Download release now! 如圖：

Openstack 安裝部署指南翻譯系列之網絡

openstack 翻譯網絡網絡包括兩種類型，網絡選項1：提供商網絡（Provider networks）和網絡選項2：自助網絡（Self-service networks），其中網絡選項2：自助網絡（Self-service networks）能夠實現更加高級的網絡功能，能夠實現網絡選項1的所有功能，因此

Openstack安裝部署指南翻譯系列之硬件需求

openstack 翻譯1.1.1.1. 控制節點控制器節點運行身份服務，鏡像服務，計算的管理部分，網絡的管理部分，各種網絡代理和儀表板。它還包括支持服務，如SQL數據庫，消息隊列和NTP。可選地，控制節點運行塊存儲，對象存儲，編排和計量服務的部分。控制器節點至少需要兩個網絡接口。1.1.1.2. 計算節點計

Openstack 安裝部署指南翻譯系列之 Horizon服務安裝（Dashboad）

openstack 翻譯 horizon安裝1.1.1.1. Horizon服務安裝（Dashboad）本節介紹如何在控制器節點上安裝和配置儀表板。儀表板所需的唯一核心服務是身份服務。您可以使用儀表板與其他服務（如鏡像服務，計算和網絡）結合使用。您還可以在具有獨立服務（如對象存儲）的環境中使用儀表板。註意：本

Openstack 安裝部署指南翻譯系列之 Keystone服務安裝（Identity）

openstack 翻譯 keystone安裝OpenStack系統由分開安裝的幾個關鍵服務組成。這些服務可根據其他雲需求一起工作，包括計算（Compute），身份（Identity），網絡（Networking），鏡像（Image），塊存儲（Block Storage），對象存儲（Object Storag

Openstack 安裝部署指南翻譯系列之 Cinder服務安裝（Block Storage）

openstack 翻譯 cinder安裝1.1.1.1. Cinder服務安裝（Block Storage）塊存儲服務（cinder）為訪客實例提供塊存儲設備。存儲設置方法由塊存儲驅動程序確定，或者在多後端配置的情況下確定驅動程序。有各種可用的驅動程序：NAS / SAN，NFS，iSCSI，Ceph等。塊

Openstack 安裝部署指南翻譯系列之概況

openstack 翻譯概況Openstack項目是支持所有類型的雲環境的一個開源雲計算平臺。該項目旨在簡單實施，大規模可擴展性和豐富的功能。來自世界各地的雲計算專家為項目做出了貢獻。OpenStack通過各種互補服務提供基礎設施即服務（IaaS）解決方案。每個服務都提供了一個便於集成的應用程序編程接口（AP

hadoop安裝簡要指南

1. 部署叢集

2. 安裝hadoop

3. 啟動hadoop

相關推薦