CDH完全安裝文件（含Spark2、）

阿新 • • 發佈：2018-12-19

本文主要記敘瞭如何在centos7.2上搭建cdh平臺，使用mysql為元資料管理庫（官方推薦），安裝了Spark2和Kafka元件。

一、軟體準備

cdh5.13.3-centos7.tar.gz cm5.13.3-centos7.tar.gz SPARK2_ON_YARN-2.3.0.cloudera3.jar SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel CDH-5.13.3-1.cdh5.13.3.p0.2-el7.parcel KAFKA-3.1.0-1.3.1.0.p0.35.parcel SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel.sha CDH-5.13.3-1.cdh5.13.3.p0.2-el7.parcel.sha KAFKA-3.1.0-1.3.1.0.p0.35.parcel.sha JDK：jdk-8u181-linux-x64.tar.gz

二、修改作業系統配置

關閉selinux

vi /etc/selinux/configvi /etc/selinux/config 將SELINUX=enforcing改為SELINUX=disabled

關閉防火牆 systemctl stop firewalld systemctl disable firewalld service iptables stop chkconfig iptables off
安裝必須的yum包 yum -y install postgresql-server yum -y install postgresql yum -y install httpd yum -y install perl yum -y install bind-utils yum -y install libxslt yum -y install cyrus-sasl-gssapi yum -y install redhat-lsb yum -y install cyrus-sasl-plain yum -y install portmap yum -y install fuse yum -y install fuse-libs yum -y install nc yum -y install python-setuptools yum -y install python-psycopg2 yum -y install MySQL-python yum -y install mod_ssl yum -y install ssh yum -y install ntp yum -y install wget
移除自帶的openjdk

rpm -qa |grep jdk yum -y remove 《》 #移除包
移除自帶的mariadb

rpm -qa |grep mariadb yum -y remove 《》 #移除包
修改hosts檔案

vi /etc/hosts 配置主機名ip地址
設定交換空間為0

echo “vm.swappiness=0” >> /etc/sysctl.conf 提升hdfs的讀寫效率
配置ssh 免密通道

ssh-keygen -t rsa一鍵回車 ssh-copy-id -i hadoop01 ssh-copy-id -i hadoop02 ssh-copy-id -i hadoop03 ssh hadoop01 ssh hadoop02 ssh hadoop03
配置ntp伺服器

vi /etc/ntp.conf master上配置server 127.127.1.0 slaver上配置 server
安裝jdk

將jdk的壓縮包放置在/usr/java/jdk1.8 tar -zvxf jdk-8u181-linux-x64.tar.gz mv jdk1.8.0_181 jdk1.8 vi /etc/profile 寫入以下指令碼 export JAVA_HOME=/usr/java/jdk1.8 export JAVA_HOME=/usr/java/jdk1.8 export PATH=$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar 完成後source /etc/profile javac java –version檢驗安裝情況
解壓cdh檔案至/var/www/html/下(master)

tar -zvxf cdh5.13.3-centos7.tar.gz
tar -zvxf cm5.13.3-centos7.tar.gz

配置本地yum源

vi /etc/yum.repos.d/cm.repo [cloudera-manager] name=Cloudera Manager baseurl= http://hadoop01:/cm/5.13.3/ gpgcheck = 0 enabled = 1 vi /etc/yum.repos.d/cdh.repo [cloudera-cdh5] name=CDH baseurl= http://hadoop01:/cdh/5.13.3/ enable=1 gpgcheck = 0
配置服務開機自啟動

service ntpd start chkonfig ntpd on service iptables stop chkconfig iptables off service httpd start chkconfig httpd on
機器重啟
檢查ntp,http服務是否啟動成功
檢查ntp服務是否正常 ntpq -pntpq -p

三、資料及CDH服務安裝

安裝mysql，建立相應的資料庫並賦權(master)

wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm rpm -ivh mysql-community-release-el7-5.noarch.rpm yum install -y mysql-server yum install -y mysql-devel yum install -y mysql-connector-java service mysqld start /usr/bin/mysql_secure_installation create database cm default character set utf8; create user ‘cm’@’%’ identified by ‘123456’; grant all privileges on cm.* to ‘cm’@’%’ with grant option; flush privileges;

create database hive default character set utf8; create user ‘hive’@’%’ identified by ‘123456’; grant all privileges on hive.* to ‘hive’@’%’;flush privileges;

create database rm default character set utf8; create user ‘rm’@’%’ identified by ‘123456’; grant all privileges on rm.* to ‘rm’@’%’;flush privileges;

create database sentry default character set utf8; create user ‘sentry’@’%’ identified by ‘123456’; grant all privileges on sentry.* to ‘sentry’@’%’;flush privileges;

create database oozie default character set utf8; create user ‘oozie’@’%’ identified by ‘123456’; grant all privileges on oozie.* to ‘oozie’@’%’;flush privileges;

create database hue default character set utf8; create user ‘hue’@’%’ identified by ‘123456’; grant all privileges on hue.* to ‘hue’@’%’;flush privileges;

create database nms default character set utf8; create user ‘nms’@’%’ identified by ‘123456’; grant all privileges on nms.* to ‘nms’@’%’;flush privileges;
安裝cm例項和cm-server(master)

yum install -y cloudera-manager-daemons cloudera-manager-server

指定cm的資料庫

/usr/share/cmf/schema/scm_prepare_database.sh -h 192.168.1.67 mysql cm cm 123456

啟動server服務訪問master主機的7180埠地址

service cloudera-scm-server start service cloudera-scm-server status 檢視程序啟動的狀態異常則去日誌目錄下檢視 tail -30f /var/log/cloudera-scm-server/cloudera-scm-server.log 成功則訪問 10.16.8.67:7180

四、CM安裝CDH

訪問10.16.8.67:7180 此時需要資料使用者名稱密碼，使用者名稱是admin，密碼輸入即會為初始密碼。
頁面1勾選方框同意使用者協議
頁面2選擇free 點選繼續
配置主機地址輸入主機名稱
全部勾選，繼續
choose method 選擇 use packages version of cdh選擇 cdh5 select 都選擇 custom repository url輸入的是yum配置的地址
不勾選 install oracle java se… 繼續此處為kerber安裝所必須的java安全包，沒有kerberos不需要安裝，有kerberos初次安裝也不要安裝，等環節裝好再啟用kerberos
不勾選single… 直接繼續
root安裝所有主機接受相同的root密碼輸入root的密碼繼續
等待安裝完成，選擇core with spark
角色分配

分配角色 Hdfs角色分配如下： Hive角色分配如下： Hue角色分配入下： Cloudera Managerment service角色分配如下： Oozie spark yarn角色分配如下： Zookeeper角色分配如下：

說明：
主角色由master承擔
所有機器都是datanode
Namenode首次分配在master上，ha之後分配到slave1上
所有機器都安裝zkserver
Gateway的角色在所有主機上都要有
Cdh的監控服務安裝到master

繼續指定元資料管理庫

五、安裝spark,kafka

將parcel檔案都放在master主機的/opt/cloudera/parcel-repo下（.torrent檔案會自動生成，不用管）
將SPARK2_ON_YARN-2.3.0.cloudera3.jar檔案放在master主機的/opt/cloudera/csd下
在cdh的parcel包管理介面重新整理，依次分配和啟用CDH5，kafka，Spark2（必須先啟用CDH5）
在各主機配置內修改java_home為/usr/java/jdk1.8(因為spark2需要jdk1.8支援，cdh自帶的為1.7)
重新部署配置，然後重啟（啟用或者配置修改後都需如此操作）
重啟服務

重啟服務才能看到Spark2服務

service cloudera-scm-server restart
service cloudera-scm-agent restart

重啟完成後重新登入http://master:7180
新增kafka服務

在這裡插入圖片描述

第一次可能會啟動失敗，失敗後直接在首頁點選kafka的小扳手檢視原因，點選配置修改配置，再次啟動kafka

在這裡插入圖片描述修改完成後，若啟動失敗，則去檢視日誌，很有可能是id問題：檢視角色日誌報錯：kafka.common.InconsistentBrokerIdException: Configured broker.id 33 doesn’t match stored broker.id 59 in meta.properties 解決辦法：需把配置裡的引數改為59，再啟動在這裡插入圖片描述

9.新增spark2服務分配角色在這裡插入圖片描述

至此，我們的安裝就都已經完成啦。

六、安裝測試

測試spark服務 /var/lib/hadoop-hdfs下建立data檔案，內寫入’1\n2\n3’ 檔案上傳至hdfs cd /var/lib/hadoop-hdfs hadoop fs -put data /user/spark/ 啟動spark2-shell進入命令列 su hdfs spark2-shell val lines = sc.textFile("/user/spark/data") lines.count lines.first 能夠執行即可，若獲取不到資源，可修改下配置：

修改yarn的配置 scheduler.maximum-allocation-mb、 nodemanager.resource.memory-mb 改為8GB
測試kafka服務使用命令建立topic kafka-topics --create --zookeeper hadoop01,hadoop02 --replication-factor 1 --partitions 1 --topic test 檢視top是否建立成功 kafka-topics --list --zookeeper hadoop01,hadoop02
最後檢驗機器服務執行jps，看是否和如下圖所示一致其中DFSZFailoverController是我在做了ha之後才有的服務，無需關注，至於如何配置HA，請參考我的其他文章，謝謝。

CDH完全安裝文件（含Spark2、）

本文主要記敘瞭如何在centos7.2上搭建cdh平臺，使用mysql為元資料管理庫（官方推薦），安裝了Spark2和Kafka元件。一、軟體準備 cdh5.13.3-centos7.tar.gz cm5.13.3-centos7.tar.gz SPARK

IDEA 在某個工程下一個module如何使用另一個module中的資源文件（.xml .prop等）

blog mave 一個 pid 技術 mage module 如何使用依賴關系問題如題，經google，解決方案有四種，選擇了比較直觀有效的一種羅列如下：因為項目采用maven管理，所以我們可以在module2下的pom.xml制定<resource

只查看ett.txt文件（共100行）內第25到35行的內容的八種解決方法

查找內容試題：只查看ett.txt文件（共100行）內第25到35行的內容解答：方法一：head -35 /data/ett.txt |tail -11方法二：sed -n ‘25,35p‘ /data/ett.txt方法三：grep -C5 30 /data/ett.txt方法四：grep -A10 25

SQL2014清除日誌文件（DBName_Log過大）

dbn tab -s .net rec ima sys -1 png SQL2005：Backup Log DBName with no_log ‘這裏的DBName是你要收縮的數據庫名。GOdump transaction DBName with no_log --

yum無法安裝軟件（python版本問題）

imp led pos yourself there round org share req 遇到如下問題：[root@sa yum.repos.d]# yum repolistThere was a problem importing one of the Python

mysql5.7配置文件（僅供參考）

type packet nod def lock sort commit timestamp sql [client] port = 3306 socket = /tmp/mysql.sock default-character-set = utf8 [mysqld]

對於maven創建spark項目的pom.xml配置文件（圖文詳解）

mapr cati ID encoding pil tar error: 而是 releases 　不多說，直接上幹貨！ http://mvnrepository.com/ 　　這裏，怎麽創建，見　　這裏，我重點說下spa

解決下載ftp文件過程中，瀏覽器直接解析文件（txt,png等）的問題

filename map 需要 etc home 3.0.0 var att esp 搭建了一個ftp服務器，供用戶進行上傳下載，在下載過程中發現，一些文件，例如txt,jpg,png,pdf等直接被瀏覽器解析了。在瀏覽器中顯示其內容，沒有下載。下面通過網上查詢得到一些解

input[type=file]上傳文件（格式判斷、文件大小、上傳成功後操作）

type=file *** chang change 文件 == asd 使用 jpg var isUploadImg = false; //在input file內容改變的時候觸發事件******************上傳圖片

Tushare學習文件（十電影票房）

import tushare as ts 1.實時票房 ts.realtime_boxoffice() BoxOffice 實時票房（萬） Irank 排名 MovieName 影片名 boxPer 票房佔比（%） movieD

Win10使用Tex Live和VS Code和Latex Workshop外掛編寫Latex文件（未完成版本）

首先取Tex Live官網下載安裝包：https://www.tug.org/texlive/acquire-netinstall.html 我下載的是 http://mirror.ctan.org/systems/texlive/tlnet/install-tl-windows.exe 不過我記得這

Springboot文件（中文，英文）

中文文件地址： https://my.oschina.net/geekidentity/blog/872888 英文文件地址： https://docs.spring.io/spring-boot/docs/current/reference/pdf/spring-boot-reference.pdf

java 按字節讀寫二進制文件（Base64編碼解碼）

h+ lee bean 字節數組 inpu 讀取 write bytearray 轉換工具類最近在做項目時遇到這樣一個需求：依次讀取本地文件夾裏所有文件的內容，轉為JSON，發送到ActiveMQ的消息隊列, 然後從MQ的消息隊列上獲取文件的信息，依次寫到本地。常見的文

nRF52832 BLE_DFU空中升級OTA（一）安裝軟件（SDK14.2.0）

bin x文件 dde 工具 hub ref 是否 tar 文件夾準備工作，需要安裝好幾個軟件，詳細的過程請參考下面的文章（http://www.cnblogs.com/iini/p/9314246.html）這裏說的非常詳細，而且也有工具在雲盤，對於初學者非常友好。我這

Docker 文件（關於Docker CE）

關於Docker CE Docker社群版（CE）非常適合希望開始使用Docker並嘗試使用基於容器的應用程式的開發人員和小型團隊，Docker CE有三種類型的更新渠道，stable，test和nightly： Stable為你提供一般可用性的最新版本 Te

python合併多個word文件（帶圖片等）

文章目錄安裝python3.6和pywin32包執行程式碼安裝python3.6和pywin32包 python官網下載python3.6版本，exe檔案直接安裝。利用pip安裝pywin32包

C# 插入超連結到PDF文件（3種情況）

超連結可以實現不同元素之間的連線，使用者可以通過點選被連結的元素來啟用這些連結。具有高效、快捷、準確的特點。本文中，將分享通過C#程式設計在PDF文件中插入超連結的方法。內容包含以下要點：插入網頁連結插入外部文件連結插入文件頁面跳轉連結工具下載安裝後，注意將Spire.Pdf.dll引用到程式

Tushare學習文件（一交易資料）

1.復權資料 ts.get_h_data('002337') #前復權 ts.get_h_data('002337', autype='hfq') #後復權 ts.get_h_data('002337', autype=None) #不復權 ts.get_h_dat

POI 追加寫入word文件，POI如何寫入word文件（親測有效），POI報錯Fail to save: an error occurs while saving the package

一、POI寫入word文件首先參考W3Shool的教程(上述快速指南)的“Apache POI Word - 文件”一節，對於建立文件和寫入段落都有清晰的闡釋。我不再贅述。但是其寫入段落的方式每次都會覆蓋曾經寫入的內容。那麼經過我探索一番要這麼處理... 二、POI

學習筆記：利用markdown寫readme文件（Udacity學城）

週末逛知乎等資訊平臺的時候，無意間瞭解到Udacity學城有一期關於利用markdown撰寫readme文件的教程，想到CSDN部落格也提供了markdown編輯功能，而自己到現在還不會用，看著自己寫的醜陋的部落格，決定趁此機會學習一下。於是乎，在學習過程中寫了

CDH完全安裝文件（含Spark2、）

一、軟體準備

二、修改作業系統配置

三、資料及CDH服務安裝

四、CM安裝CDH

五、安裝spark,kafka

六、安裝測試

相關推薦