Hadoop3-偽分散式模式安裝

阿新 • • 發佈：2019-02-01

今天無意間看到Hadoop3去年年底就release了，今天就準備裝個環境看看。

安裝配置

首先從下面的地址下載安裝包

這裡我下載的是hadoop-3.0.0.tar.gz包，解壓安裝。

$ tar zxvf hadoop-3.0.0.tar.gz
$ cd hadoop-3.0.0/

編輯etc/hadoop/hadoop-env.sh檔案，設定JAVA_HOME環境變數,

export JAVA_HOME=/opt/jdk8

修改配置檔案 core-site.xml

<configuration>
  <property>
    <name> 
fs.defaultFS</name>
    <value>hdfs://<hostname>:9000</value>
  </property>
</configuration>

修改配置檔案 hdfs-site.xml，因為是偽分散式模式，所以設定複製為1。

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property> 

</configuration>

執行 HDFS

格式化 HDFS

第一次啟動 HDFS 時，需要做一次格式化才行。

$ bin/hdfs namenode -format

啟動 HDFS

$ sbin/start-dfs.sh

啟動 HDFS 後，可以通過瀏覽器訪問下面的地址檢視HDFS狀態。

執行 MapReduce 作業

先建立當前使用者在 HDFS 中的家目錄，如下

$ bin/hdfs dfs -mkdir /user
$ bin/hdfs dfs -mkdir /user/<username>

準備資料，執行測試並檢視結果

$ bin/hdfs dfs -mkdir input
$ bin/hdfs dfs -put etc/hadoop/*.xml input
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar grep input output 'dfs[a-z.]+'
$ bin/hdfs dfs -cat output/*

刪除上面測試結果

$ bin/hdfs dfs -rm output/*
$ bin/hdfs dfs -rmdir output/

停止 HDFS

$ sbin/stop-dfs.sh

執行 YARN

修改 etc/hadoop/mapred-site.xml 檔案

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
      <name>yarn.app.mapreduce.am.env</name>
      <value>HADOOP_MAPRED_HOME=/apps/hadoop-3.0.0</value>
    </property>
    <property>
      <name>mapreduce.map.env</name>
      <value>HADOOP_MAPRED_HOME=/apps/hadoop-3.0.0</value>
    </property>
    <property>
      <name>mapreduce.reduce.env</name>
      <value>HADOOP_MAPRED_HOME=/apps/hadoop-3.0.0</value>
    </property>
</configuration>

修改 etc/hadoop/yarn-site.xml 檔案

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

啟動 YARN

$ sbin/start-yarn.sh

啟動後可以通過下面地址檢視作業請求

執行 MapReduce 作業

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar grep input output 'dfs[a-z.]+'
$ bin/hdfs dfs -cat output/*

停止 YARN

$ sbin/stop-yarn.sh
http://192.168.0.192:8088/cluster

問題

在測試YARN的過程中，開始總出現類似下面的錯誤，導致作業都執行失敗

[2018-01-30 22:40:02.211]Container [pid=22658,containerID=container_1517369701504_0003_01_000028] is running beyond virtual memory limits. Current usage: 87.9 MB of 1 GB physical memory used; 2.6 GB of 2.1 GB virtual memory used. Killing container.

最後發現是機器記憶體不夠，導致yarn的配置在我的機器上不合理，所以修改了一下 etc/hadoop/yarn-site.xml 檔案，新增下面兩個配置專案，然後重啟yarn就可以了。

 <property>
   <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    <description>Whether virtual memory limits will be enforced for containers</description>
  </property>
 <property>
   <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>4</value>
    <description>Ratio between virtual memory to physical memory when setting memory limits for containers</description>
  </property>

Hadoop3-偽分散式模式安裝

今天無意間看到Hadoop3去年年底就release了，今天就準備裝個環境看看。安裝配置首先從下面的地址下載安裝包這裡我下載的是hadoop-3.0.0.tar.gz包，解壓安裝。 $ tar zxvf hadoop-3.0.0.tar

Windows 下 Zookeeper 單機模式和偽分散式模式安裝

安裝jdk 安裝Zookeeper. 在官網http://mirrors.hust.edu.cn/apache/zookeeper/下載zookeeper.我下載的是zookeeper-3.4.10版本。解壓zookeeper-3.4.10至D:\dev\zookeep

Hadoop 3.1.1偽分散式模式安裝

Hadoop 3.1.1偽分散式模式安裝更多資源 github: https://github.com/opensourceteams/hadoop-java-maven-3.1.1 視訊 Hadoop 3.1.1偽分散式模式安裝(bilibili視訊) : htt

Hadoop偽分散式模式安裝

環境資訊作業系統：Ubuntu 17.04 64bit安裝步驟1. 安裝配置JDK1.1 複製到/opt/bigdata/目錄下，解壓cp ~/Downloads/jdk-8u161-linux-x64.tar.gz /opt/bigdata/ cd /opt/bigdata

【HBase基礎教程】1、HBase之單機模式與偽分散式模式安裝

在這篇blog中，我們將介紹Hbase的單機模式安裝與偽分散式的安裝方式，以及通過瀏覽器檢視Hbase的使用者介面。搭建hbase偽分散式環境的前提是我們已經搭建好了hadoop完全分散式環境，搭建hadoop環境請參考：【Hadoop基礎教程】4、Hadoop

Hadoop-2.9.2單機版安裝（偽分散式模式）

一、環境硬體：虛擬機器VMware、win7 作業系統：Centos-7 64位主機名： hadoopServerOne 安裝使用者：root軟體：jdk1.8.0_181、Hadoop-2.9.2 二、安裝jdk 1.建立hadoop目錄，並賦許可權chmod 777 hadoop2.下載jdk-

Hadoop CDH5 手動安裝偽分散式模式

CDH5已經使用了Hadoop2.2.0 重新弄個虛擬機器重頭裝一下由於Cloudera強烈建議使用rmp包或者apt-get的方式安裝，一時半刻我都沒有找到手動安裝的說明，在安裝的遇到多個問題，稍作記錄首先環境要求 JDK1.7_u25+

【分散式】hadoop安裝篇（7）Hadoop 3的偽分佈模式安裝

準備$ sudo apt-get install ssh $ sudo apt-get install pdsh我們還需要設定pdsh的rcmd，執行下面內容。或建立/etc/pdsh/rcmd_default，裡面填入sshecho "ssh" > /etc/pdsh

hadoop-hive本地和偽分散式模式的安裝

前言：關於虛擬機器安裝hive,hadoop的資料林林總總,對於初學者很難甄別; 如下是按照官方doc,一步步經過實踐的一種方法,思路比我搜到網上的帖子更清晰；初學，難免有錯誤的地方，敬請指正。一、虛擬機器hadoop的安

【分散式】hadoop安裝篇（4）Hadoop 2.x的偽分佈模式安裝

Hadoop偽分佈模式，是在一個單機上模擬Hadoop分散式環境，需要安裝的包括： HDFS：包括NameNode和DataNode Yarn：是執行mapReducede容器，包括ResourceManager和NodeManager準備$ sudo apt-get ins

cdh版本的hadoop安裝及配置(偽分散式模式) MapReduce配置 yarn配置

安裝hadoop需要jdk依賴，我這裡是用jdk8jdk版本：jdk1.8.0_151hadoop版本：hadoop-2.5.0-cdh5.3.6hadoop下載地址：連結：https://pan.baidu.com/s/1qZNeVFm 密碼：cilnjdk下載地址：連結：

安裝Hadoop及配置偽分散式模式的Hadoop

一．實驗目的 1. 掌握Linux虛擬機器的安裝方法。 2. 掌握Hadoop的偽分散式安裝方法。二．實驗內容（一）Linux基本操作命令 Linux常用基本命令包括： ls,cd,mkdir,rm,man,cat,ssh,yum,vim,vi等。（二）安裝JDK Hadoop是Java實現的，執行在J