Hadoop集群搭建筆記

阿新 • • 發佈：2017-10-01

reduce ati prompt ucc xshell 格式化 load obj apache

1、安裝虛擬機

VMware workstation

CentOS 鏡像

安裝Linux虛擬機：（在Win7上）

1）安裝VMwareWorkstations（可修改配置）

2）添加CentOS鏡像（啟動安裝 ->配置網絡）

網絡配置：NAT模式

網絡重啟：service network restart

關閉系統：shutdown -h now

2、遠程連接

Xshell5

Xftp5

3、在Linux上搭建Hadoop集群

下載軟件

1. Jdk：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2. Hadoop包:http://apache.fayea.com/hadoop/common/hadoop-2.7.2/

步驟：

1、修改/etc/hosts

CentOS修改主機名(hostname) 需要修改兩處:一處是/etc/sysconfig/network,另一處是/etc/hosts

2、配置JDK

安裝：rpm -ivh jdk-8u101-linux-x64.rpm

vi /etc/profile
JAVA_HOME
source /etc/profile
java -version

3、配置SSH（免密碼登錄）

ssh-keygen -t rsa
cat xxx.pub >> authorized_keys
 
chmod 644 authorized_keys
ssh IP/HOSTNAME

4、安裝及配置Hadoop

tar zxf hadoop-2.7.2.tar.gz
cd /opt/hadoop-2.7.2/etc/hadoop/

core-site.xml

<property>
    <name>fs.default.name</name>
    <value>hdfs://bigdata:9000</value>
  </property>
 
 <property>
    <name>hadoop.tmp.dir</name>
 
    <value>/opt/hadoop-2.7.2/current/tmp</value>
  </property>
 <property>
    <name>fs.trash.interval</name>
    <value>4320</value>
  </property>

hdfs-site.xml

<property>
   <name>dfs.namenode.name.dir</name>
   <value>/opt/hadoop-2.7.2/current/dfs/name</value>
 </property>
 <property>
   <name>dfs.datanode.data.dir</name>
   <value>/opt/hadoop-2.7.2/current/data</value>
 </property>
 <property>
   <name>dfs.replication</name>
   <value>1</value>
 </property>
 <property>
   <name>dfs.webhdfs.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>dfs.permissions.superusergroup</name>
   <value>staff</value>
 </property>
 <property>
   <name>dfs.permissions.enabled</name>
   <value>false</value>
 </property>

yarn-site.xml

<property>
   <name>yarn.resourcemanager.hostname</name>
   <value>bigdata</value>
 </property>
 <property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
 </property>
 <property>
   <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
   <value>org.apache.hadoop.mapred.ShuffleHandler</value>
 </property>
 <property>
   <name>yarn.resourcemanager.address</name>
   <value>bigdata:18040</value>
 </property>
<property>
   <name>yarn.resourcemanager.scheduler.address</name>
   <value>bigdata:18030</value>
 </property>
 <property>
   <name>yarn.resourcemanager.resource-tracker.address</name>
   <value>bigdata:18025</value>
 </property> <property>
   <name>yarn.resourcemanager.admin.address</name>
   <value>bigdata:18141</value>
 </property>
<property>
   <name>yarn.resourcemanager.webapp.address</name>
   <value>bigdata:18088</value>
 </property>
<property>
   <name>yarn.log-aggregation-enable</name>
   <value>true</value>
 </property>
<property>
   <name>yarn.log-aggregation.retain-seconds</name>
   <value>86400</value>
 </property>
<property>
   <name>yarn.log-aggregation.retain-check-interval-seconds</name>
   <value>86400</value>
 </property>
<property>
   <name>yarn.nodemanager.remote-app-log-dir</name>
   <value>/tmp/logs</value>
 </property>
<property>
   <name>yarn.nodemanager.remote-app-log-dir-suffix</name>
   <value>logs</value>
 </property>

mapred-site.xml

<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>
<property>
  <name>mapreduce.jobtracker.http.address</name>
  <value>bigdata:50030</value>
</property>
<property>
  <name>mapreduce.jobhisotry.address</name>
  <value>bigdata:10020</value>
</property>
<property>
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>bigdata:19888</value>
</property>
<property>
  <name>mapreduce.jobhistory.done-dir</name>
  <value>/jobhistory/done</value>
</property>
<property>
  <name>mapreduce.intermediate-done-dir</name>
  <value>/jobhisotry/done_intermediate</value>
</property>
<property>
  <name>mapreduce.job.ubertask.enable</name>
  <value>true</value>
</property>

slaves

bigdata

hadoop-env.sh

JAVA_HOME

5、格式化HDFS

hdfs namenode -format

‘16/09/0403:07:30 INFO common.Storage: Storage directory /opt/hadoop-2.7.2/current/dfs/namehas been successfully formatted.’

6、啟動Hadoop集群

/opt/hadoop-2.7.2/sbin/start-all.sh

7、驗證Hadoop集群

1）jps

關閉防火墻 或者 在防火墻的規則中開放這些端口

hdfs http://bigdata:50070

yarn http://bigdata:18088

Hadoop集群搭建筆記

reduce ati prompt ucc xshell 格式化 load obj apache 1、安裝虛擬機 VMware workstation CentOS 鏡像安裝Linux虛擬機：（在Win7上） 1）安裝VMwareWorkstations（可

Hadoop集群搭建(非HA)

圖形界面網絡模式 jdk 初始 hadoop2 orm 一個程序猿添加 1.準備Linux環境 1.0先將虛擬機的網絡模式選為NAT 1.1修改主機名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=i

Hadoop集群搭建(三) Hbase

hbase hadoop hdfs 前面已經完成Zookeeper和HDFS的安裝，本文會詳細介紹Hbase的安裝步驟。以及安裝過程中遇到問題的匯總。Hadoop集群搭建(一) ZookeeperHadoop集群搭建(二) HDFS下面開始Hbase的安裝。Hbase的服務器規劃192.168.6

Hadoop集群搭建

hadoop集群 manage 臨時 status shuffle centos6 添加 jdk8 ast 1.集群簡介 Hadoop集群具體來說包括兩個集群：HDFS集群和YARN集群，兩者邏輯上分離，但物理上常在一起。 HDFS集群：負責海量數據的存儲，集群中的角色主要

Hadoop學習之路（四）Hadoop集群搭建和簡單應用

get allocated reduce plugins caching handle ces -h per 概念了解主從結構：在一個集群中，會有部分節點充當主服務器的角色，其他服務器都是從服務器的角色，當前這種架構模式叫做主從結構。主從結構分類： 1、一主多從

Hadoop學習之路（五）Hadoop集群搭建模式和各模式問題

數據場景模式問題沒有問題：重裝故障 style 分布式集群的通用問題當前的HDFS和YARN都是一主多從的分布式架構，主從節點---管理者和工作者問題：如果主節點或是管理者宕機了。會出現什麽問題？群龍無首，整個集群不可用。所以在一主多從的架構中都會

Hadoop集群搭建二（Linux虛擬機）

AI .org vmware 完成 devices 所有版本選擇 windows 點擊搭建Linux虛擬機 VMware虛擬機安裝Linux 系統 1、首先打開網易開源鏡像站: http://mirrors.163.com/ 當然，大家也可以使用阿裏開源鏡像站

4.Hadoop集群搭建之啟動

urn 生成狀態 CP data 其他 sla site 驗證配置好Hadoop、HDFS、YARN、Zookeeper集群後，需要按照順序啟動。前期準備配置好Hadoop、HDFS、YARN、Zookeeper集群先stop掉所有的hadoop服務使用jp

BigData--hadoop集群搭建之zookeer安裝

其他 ron fault ntp time pro art 變量 tick Zookeeper安裝 cd /opt/ tar -zxvf zookeeper-3.4.10.tar.gzmv zookeeper-3.4.10 /opt/zookeeper修改配置文件cd /

codis集群搭建筆記

pro shutdown remove 筆記 eve shu .html down 啟動一、安裝Linux虛擬機二、安裝go運行環境 https://www.cnblogs.com/xmzncc/p/6218694.html wget http://mirrors.fl

hadoop集群搭建前的準備

linux .gz 域名映射 restart ava 技術成功配置環境 bcb 1. 修改主機名： [root@localhost home]# sudo vi /etc/sysconfig/network 修改主機名： 2. 設置系統默認啟動級別： [root@lo

hadoop 集群搭建-suse linux 11

初始 cto hadoop ha rop default gen webhdfs buffer etc 好久都沒寫了啊。感覺自己都不像是一個搞技術都了。來個存貨吧！ hadoop 集群搭建 3臺機器 suse 系統規劃 IP 主機名 hostname hadoop

vmware搭建hadoop集群完整過程筆記

器）修改文件權限配置環境 chmod 出現問題 2.6.0 img key文件無權限搭建hadoop集群完整過程筆記一、虛擬機和操作系統　　環境：ubuntu14+hadoop2.6+jdk1.8 　　虛擬機：vmware12 二、安裝步驟：先在一臺機器上

【原創 Hadoop&Spark 動手實踐 5】Spark 基礎入門，集群搭建以及Spark Shell

min util man 操作 because tro txt library all Spark 基礎入門，集群搭建以及Spark Shell 主要借助Spark基礎的PPT，再加上實際的動手操作來加強概念的理解和實踐。

hadoop偽分布式集群搭建與安裝（ubuntu系統）

log 結束實的變量開啟 web 路徑 har ont 1：Vmware虛擬軟件裏面安裝好Ubuntu操作系統之後使用ifconfig命令查看一下ip; 2：使用Xsheel軟件遠程鏈接自己的虛擬機，方便操作。輸入自己ubuntu操作系統的賬號密碼之後就鏈接成

Flume 學習筆記之 Flume NG高可用集群搭建

哈哈 process bind under hdf ora chan lsp max Flume NG高可用集群搭建：架構總圖：架構分配：角色 Host 端口 agent1 hadoop3 52020 collect

ubuntu16.04搭建hadoop集群環境

address hadoop 集群所有 ipv ret 加載文件 keygen -- manager 1. 系統環境Oracle VM VirtualBoxUbuntu 16.04Hadoop 2.7.4Java 1.8.0_111master：192.168.19.12

Amabari搭建Hadoop集群(一)

hdp ambari 一、系統環境1.系統版本[root@manager ~]# cat /etc/centos-release CentOS Linux release 7.4.1708 (Core)2.主機規劃主機名IP地址角色manager192.168.10.131ambari-serverv

Amabari搭建Hadoop集群(二)

amabr hdp 一、進入登陸頁面1.在瀏覽器中輸入ambari-server端地址，初始賬戶和密碼都是admin2.登陸後進入向導界面，點擊Launch Install Wizard3.設置集群名稱二、安裝相關組件1.選擇HDP版本，註意選擇使用本地源2.輸入其他節點的主機名或IP，並選擇SSH配

Hadoop偽分布式集群搭建

。。；一、HDFS偽分布式環境搭建 Hadoop分布式文件系統(HDFS)被設計成適合運行在通用硬件(commodity hardware)上的分布式文件系統。它和現有的分布式文件系統有很多共同點。但同時，它和其他的分布式文件系統的區別也是很明顯的。HDFS是一個高度容錯性的系統，適

Hadoop集群搭建筆記

1、安裝虛擬機

2、遠程連接

3、在Linux上搭建Hadoop集群

相關推薦