從零開始搭建hadoop叢集

阿新 • • 發佈：2018-11-23

創作不易，請勿抄襲，轉載請註明出處。如有疑問，請加微信 wx15151889890，謝謝。
[本文連結:]https://blog.csdn.net/wx740851326/article/details/https://blog.csdn.net/wx740851326/article/details/83749163

本文主要記敘瞭如何在centos7.2上搭建cdh平臺，使用mysql為元資料管理庫（官方推薦），安裝了Spark2和Kafka元件。

一、軟體準備

cdh5.13.3-centos7.tar.gz cm5.13.3-centos7.tar.gz
SPARK2_ON_YARN-2.3.0.cloudera3.jar
SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel
CDH-5.13.3-1.cdh5.13.3.p0.2-el7.parcel
KAFKA-3.1.0-1.3.1.0.p0.35.parcel
SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel.sha
CDH-5.13.3-1.cdh5.13.3.p0.2-el7.parcel.sha
KAFKA-3.1.0-1.3.1.0.p0.35.parcel.sha JDK：jdk-8u181-linux-x64.tar.gz

二、修改作業系統配置

關閉selinux

vi /etc/selinux/configvi /etc/selinux/config
將SELINUX=enforcing改為SELINUX=disabled

關閉防火牆
systemctl stop firewalld
systemctl disable firewalld
service iptables stop
chkconfig iptables off
安裝必須的yum包
yum -y install postgresql-server
yum -y install postgresql
yum -y install httpd
yum -y install perl
yum -y install bind-utils
yum -y install libxslt
yum -y install cyrus-sasl-gssapi
yum -y install redhat-lsb
yum -y install cyrus-sasl-plain
yum -y install portmap
yum -y install fuse
yum -y install fuse-libs
yum -y install nc
yum -y install python-setuptools
yum -y install python-psycopg2
yum -y install MySQL-python
yum -y install mod_ssl
yum -y install ssh
yum -y install ntp
yum -y install wget
移除自帶的openjdk

rpm -qa |grep jdk
yum -y remove 《》 #移除包
移除自帶的mariadb

rpm -qa |grep mariadb
yum -y remove 《》 #移除包
修改hosts檔案

vi /etc/hosts
配置主機名ip地址
設定交換空間為0

echo “vm.swappiness=0” >> /etc/sysctl.conf
提升hdfs的讀寫效率
配置ssh 免密通道

ssh-keygen -t rsa一鍵回車
ssh-copy-id -i hadoop01
ssh-copy-id -i hadoop02
ssh-copy-id -i hadoop03
ssh hadoop01
ssh hadoop02
ssh hadoop03
配置ntp伺服器

vi /etc/ntp.conf
master上配置server 127.127.1.0
slaver上配置 server
安裝jdk

將jdk的壓縮包放置在/usr/java/jdk1.8
tar -zvxf jdk-8u181-linux-x64.tar.gz
mv jdk1.8.0_181 jdk1.8
vi /etc/profile 寫入以下指令碼
export JAVA_HOME=/usr/java/jdk1.8
export JAVA_HOME=/usr/java/jdk1.8
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
完成後source /etc/profile
javac java –version檢驗安裝情況
解壓cdh檔案至/var/www/html/下(master)

tar -zvxf cdh5.13.3-centos7.tar.gz
tar -zvxf cm5.13.3-centos7.tar.gz

配置本地yum源

vi /etc/yum.repos.d/cm.repo
[cloudera-manager]
name=Cloudera Manager
baseurl= http://hadoop01:/cm/5.13.3/
gpgcheck = 0
enabled = 1
vi /etc/yum.repos.d/cdh.repo
[cloudera-cdh5]
name=CDH
baseurl= http://hadoop01:/cdh/5.13.3/
enable=1
gpgcheck = 0
配置服務開機自啟動

service ntpd start
chkonfig ntpd on
service iptables stop
chkconfig iptables off
service httpd start
chkconfig httpd on
機器重啟
檢查ntp,http服務是否啟動成功
檢查ntp服務是否正常
ntpq -pntpq -p

三、資料及CDH服務安裝

安裝mysql，建立相應的資料庫並賦權(master)

wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm
rpm -ivh mysql-community-release-el7-5.noarch.rpm
yum install -y mysql-server
yum install -y mysql-devel
yum install -y mysql-connector-java
service mysqld start
/usr/bin/mysql_secure_installation
create database cm default character set utf8;
create user ‘cm’@’%’ identified by ‘123456’;
grant all privileges on cm.* to ‘cm’@’%’ with grant option; flush privileges;

create database hive default character set utf8;
create user ‘hive’@’%’ identified by ‘123456’;
grant all privileges on hive.* to ‘hive’@’%’;flush privileges;

create database rm default character set utf8;
create user ‘rm’@’%’ identified by ‘123456’;
grant all privileges on rm.* to ‘rm’@’%’;flush privileges;

create database sentry default character set utf8;
create user ‘sentry’@’%’ identified by ‘123456’;
grant all privileges on sentry.* to ‘sentry’@’%’;flush privileges;

create database oozie default character set utf8;
create user ‘oozie’@’%’ identified by ‘123456’;
grant all privileges on oozie.* to ‘oozie’@’%’;flush privileges;

create database hue default character set utf8;
create user ‘hue’@’%’ identified by ‘123456’;
grant all privileges on hue.* to ‘hue’@’%’;flush privileges;

create database nms default character set utf8;
create user ‘nms’@’%’ identified by ‘123456’;
grant all privileges on nms.* to ‘nms’@’%’;flush privileges;
安裝cm例項和cm-server(master)

yum install -y cloudera-manager-daemons cloudera-manager-server

指定cm的資料庫

/usr/share/cmf/schema/scm_prepare_database.sh -h 192.168.1.67 mysql cm cm 123456

啟動server服務訪問master主機的7180埠地址

service cloudera-scm-server start
service cloudera-scm-server status 檢視程序啟動的狀態
異常則去日誌目錄下檢視
tail -30f /var/log/cloudera-scm-server/cloudera-scm-server.log
成功則訪問 10.16.8.67:7180

四、CM安裝CDH

訪問10.16.8.67:7180
此時需要資料使用者名稱密碼，使用者名稱是admin，密碼輸入即會為初始密碼。
頁面1勾選方框同意使用者協議
頁面2選擇free 點選繼續
配置主機地址輸入主機名稱
全部勾選，繼續
choose method 選擇 use packages
version of cdh選擇 cdh5
select 都選擇 custom repository
url輸入的是yum配置的地址
不勾選 install oracle java se… 繼續
此處為kerber安裝所必須的java安全包，沒有kerberos不需要安裝，有kerberos初次安裝也不要安裝，等環節裝好再啟用kerberos
不勾選single… 直接繼續
root安裝所有主機接受相同的root密碼輸入root的密碼繼續
等待安裝完成，選擇core with spark
角色分配

分配角色 Hdfs角色分配如下：

Hive角色分配如下：

Hue角色分配入下：

Cloudera Managerment service角色分配如下：

Oozie spark yarn角色分配如下：

Zookeeper角色分配如下：

說明：
主角色由master承擔
所有機器都是datanode
Namenode首次分配在master上，ha之後分配到slave1上
所有機器都安裝zkserver
Gateway的角色在所有主機上都要有
Cdh的監控服務安裝到master

繼續
指定元資料管理庫

五、安裝spark,kafka

將parcel檔案都放在master主機的/opt/cloudera/parcel-repo下（.torrent檔案會自動生成，不用管）
將SPARK2_ON_YARN-2.3.0.cloudera3.jar檔案放在master主機的/opt/cloudera/csd下
在cdh的parcel包管理介面重新整理，依次分配和啟用CDH5，kafka，Spark2（必須先啟用CDH5）
在各主機配置內修改java_home為/usr/java/jdk1.8(因為spark2需要jdk1.8支援，cdh自帶的為1.7)
重新部署配置，然後重啟（啟用或者配置修改後都需如此操作）
重啟服務

重啟服務才能看到Spark2服務

service cloudera-scm-server restart
service cloudera-scm-agent restart

重啟完成後重新登入http://master:7180
新增kafka服務

在這裡插入圖片描述

第一次可能會啟動失敗，失敗後直接在首頁點選kafka的小扳手檢視原因，點選配置修改配置，再次啟動kafka

在這裡插入圖片描述

修改完成後，若啟動失敗，則去檢視日誌，很有可能是id問題：

檢視角色日誌報錯：kafka.common.InconsistentBrokerIdException: Configured broker.id 33 doesn’t match stored broker.id 59 in meta.properties
解決辦法：需把配置裡的引數改為59，再啟動
在這裡插入圖片描述

9.新增spark2服務
分配角色
在這裡插入圖片描述

至此，我們的安裝就都已經完成啦。

六、安裝測試

測試spark服務
/var/lib/hadoop-hdfs下建立data檔案，內寫入’1\n2\n3’
檔案上傳至hdfs
cd /var/lib/hadoop-hdfs
hadoop fs -put data /user/spark/
啟動spark2-shell進入命令列
su hdfs
spark2-shell
val lines = sc.textFile("/user/spark/data")
lines.count
lines.first
能夠執行即可，若獲取不到資源，可修改下配置：

修改yarn的配置
scheduler.maximum-allocation-mb、
nodemanager.resource.memory-mb
改為8GB
測試kafka服務
使用命令建立topic
kafka-topics --create --zookeeper hadoop01,hadoop02 --replication-factor 1 --partitions 1 --topic test
檢視top是否建立成功
kafka-topics --list --zookeeper hadoop01,hadoop02
最後檢驗機器服務
執行jps，看是否和如下圖所示一致

其中DFSZFailoverController是我在做了ha之後才有的服務，無需關注，至於如何配置HA，請參考我的其他文章，謝謝。

從零開始搭建hadoop叢集

創作不易，請勿抄襲，轉載請註明出處。如有疑問，請加微信 wx15151889890，謝謝。 [本文連結:]https://blog.csdn.net/wx740851326/article/details/https://blog.csdn.net/wx740851326/article

從零開始搭建hadoop分散式叢集環境：（一）新建hadoop使用者以及使用者組

搭建hadoop叢集環境不僅master和slaves安裝的hadoop路徑要完全一樣，也要求使用者和組也要完全一致。因此第一步就是新建使用者以及使用者組。對於新手來言，新建使用者使用者組，並賦予適當的許可權無疑是最大的問題。下面請跟隨我來新建使用者以及使用者組

從零開始搭建Redis 叢集，三主三從模式

文章引用 https://www.cnblogs.com/mafly/p/redis_cluster.htmlRedis 叢集簡介Redis 是一個開源的 key-value 儲存系統，由於出眾的效能，大部分網際網路企業都用來做伺服器端快取。Redis 在3.0版本前只支援單

【HADOOP】| 環境搭建：從零開始搭建hadoop大數據平臺（單機/偽分布式）-下

虛擬機克隆成功之前藍色 ref pin highlight .gz xml文件因篇幅過長，故分為兩節，上節主要說明hadoop運行環境和必須的基礎軟件，包括VMware虛擬機軟件的說明安裝、Xmanager5管理軟件以及CentOS操作系統的安裝和基本網絡配置。具體

從零開始的Hadoop大資料叢集（偽）搭建，全免費VirtualBox虛擬機器Ubuntu版，學習向，超詳細---（一）

在公司工作了一段時間了，大資料平臺都是公司的運維人員搭建維護的，自己也想親自搭建一套，純粹為了學習和提高自己，也為了以後自己研究用。公司的環境不太適合亂來，自己的就可以隨意玩了。寫這個也是為了記錄自己學習的過程，同時給大家提供一個參考，想要學習大資料的也

從零開始學習--kafka叢集搭建的兩種方式

目錄（第一種常規版，第二種bitnami版）一、下載kafka安裝包二、安裝三、配置四、執行一、下載kafka安裝包準備好kafka安裝包，官網下載地址： http://kafka.apache.org/do

# 從零開始搭建Hadoop2.7.1的分散式叢集

Hadoop 2.7.1 (2015-7-6更新)，Hadoop的環境配置不是特別的複雜，但是確實有很多細節需要注意，不然會造成許多配置錯誤的情況。儘量保證一次配置正確防止反覆修改。網上教程有很多關於Hadoop配置的，但是每一個教程都對應了一個版本資訊，有

從零開始搭建大資料平臺系列之（2.1）—— Apache Hadoop 2.x 偽分散式環境搭建

JDK 版本：jdk 1.7.0_67 Apache Hadoop 版本：Hadoop 2.5.0 1、安裝目錄準備 ~]$ cd /opt/ opt]$ sudo mkdir /opt/modules opt]$ sudo chown beifeng:b

CentOS7 從零開始搭建 Hadoop2.7叢集

序言準備四臺安裝好CentOS Minimal 的機器，且已經配置網路環境。（只需要記住四臺機器的IP地址，主機名後面設定）機器1：主機名 node， IP: 192.168.

從零開始搭建K8S--如何監控K8S叢集日誌

開發十年，就只剩下這套架構體系了！ >>>

大資料學習之旅2——從零開始搭hadoop完全分散式叢集

前言本文從零開始搭hadoop完全分散式叢集，大概花費了一天的時間邊搭邊寫部落格，一步一步完成完成叢集配置，相信大家按照本文一步一步來完全可以搭建成功。需要注意的是本文限於篇幅和時間的限制，也是為了突出重點，一些很基礎的操作就不再詳細

Redis詳解（十）------ 從零開始搭建叢集

　　在上一篇部落格我們介紹了------Redis哨兵(Sentinel)模式,哨兵模式主要是解決高可用問題,在master節點宕機時,slave節點能夠自動切換成為master節點　　本篇部落格我們來介紹Redis的另外一種模式------叢集模式. 　　PS：我這裡搭建演示的版本是redis-5.0.5

從零開始搭建android框架系列（轉）

bsp andro hup 開始 blank class and lan com 網址：從零開始搭建android框架系列 githup：https://github.com/CameloeAnthony/Ant從零開始搭建android框架系列（轉）

從零開始搭建框架SSM+Redis+Mysql（二）之MAVEN項目搭建

blog 目的定位 enc style log onf project 集成從零開始搭建框架SSM+Redis+Mysql（二）之MAVEN項目搭建廢話不說，直接擼步驟！！！ 1.創建主項目：ncc-parent 選擇maven創建項目，註意在創建項目中，packi

從零開始搭建VUE項目

vue-cli ffffff -s 內容 nbsp 部分腳本 ssr 項目配置前言：此樣板面向大型，嚴肅的項目，並假定您對Webpack和vue-loader有些熟悉。請務必閱讀vue-loader的常見工作流配方的文檔。如果您只想嘗試vue-load

從零開始搭建ELK+GPE監控預警系統

elasticsearch logstash kibana redis grafana prometheus exporter consul前言本文可能不會詳細記錄每一步實現的過程，但一定程度上可以引領小夥伴走向更開闊的視野，串聯每個環節，呈現予你不一樣的效果。業務規模8個平臺100+臺服務器10+個集群分

從零開始搭建輕量級個人XSS平臺

提示不可應用編輯狀態 red rip 權限以及 signature 一、前言決定搭建XSS平臺是因為自己想深入學習一下XSS相關的知識，多多進行實踐，上網搜索了一下XSS平臺有很多，但是總覺得不是很安全，這個畢竟敏感信息要傳輸到陌生人的服務器上，而且服務器端測試

從零開始搭建系統3.4——緩存組件開發

搭建 html OS get gpo target 開發 href 系統從零開始搭建系統3.4——緩存組件開發從零開始搭建系統3.4——緩存組件開發

從零開始搭建系統2.7——Quartz安裝及配置

get AR blank 安裝 pos html uart body cnblogs 從零開始搭建系統2.7——Quartz安裝及配置從零開始搭建系統2.7——Quartz安裝及配置

從零開始搭建系統1.2——Nginx安裝及配置

clas target nginx 1.2 targe nginx安裝 ref href 從零開始從零開始搭建系統1.2——Nginx安裝及配置從零開始搭建系統1.2——Nginx安裝及配置

從零開始搭建hadoop叢集

一、軟體準備

二、修改作業系統配置

三、資料及CDH服務安裝

四、CM安裝CDH

五、安裝spark,kafka

六、安裝測試

相關推薦