大資料基礎配置（jdk,hadoop,zookeeper,kafka）

阿新 • • 發佈：2022-04-19

版本如下：

jdk:           jdk1.8.0_131
mysql:       5.5.54
hadoop:     2.8.1
zookeeper:3.4.10
kafka:       2.11-2.4.1
網盤連結 連結: https://pan.baidu.com/s/1XUhqSbKnzREBOTo5W_gl1Q 提取碼: rfp8

安裝jdk :linux安裝jdk-8u65-linux-x64.tar.gz - 御本美琴初號機 - 部落格園 (cnblogs.com)

安裝hadoop:linux配置hadoop偽叢集 - 御本美琴初號機 - 部落格園 (cnblogs.com)

安裝zookeeper:

　　　　zookeeper-3.4.10.tar.gz

　　1.上傳至opt目錄下解壓

tar -zxvf zookeeper-3.4.10.tar.gz

　　2.進入zookeeper ，建立儲存資料的資料夾

　　3.進入conf目錄

[root@hdp1 conf]# mv zoo_sample.cfg zoo.cfg

vim zoo.cfg

dataDir=/opt/zookeeper-3.4.10/data  （儲存資料地址）

在檔案下面新增  hdp1 2 3  為主機名稱
 server.1=hdp1:2888:3888 
 server.2=hdp2:2888:3888 
 server.3=hdp3:2888:3888

　　4.vim data 預先建立好的資料夾

vim myid  (儲存zookeeper的編號)

寫入  
1

　　5.分發到虛擬機器2和3

　　為了方便，我是用指令碼進行分發，由於使用的是最小安裝的linux，所以無法使用第一種，在這裡兩種方法都列出，大家自己選擇

##第一種



#!/bin/sh
# 獲取輸入引數個數，如果沒有引數，直接退出
pcount=$#
if((pcount==0)); then
        echo no args...;
        exit;
fi
# 獲取檔名稱
p1=$1
fname=`basename $p1`
echo fname 
=$fname
# 獲取上級目錄到絕對路徑
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir
# 獲取當前使用者名稱稱
user=`whoami`
# 迴圈
for((host=2; host<=3; host++)); do
        echo $pdir/$fname $user@slave$host:$pdir
        echo ==================slave$host==================
        rsync -rvl $pdir/$fname $user@hdp$host:$pdir
done
#Note:這裡的slave對應自己主機名，需要做相應修改。另外，for迴圈中的host的邊界值

　　使用方法為：先給檔案執行許可權，然後在後面加上引數

　　第二種：也是最小安裝使用的方法，使用scp

scp -r zookeeper-3.4.10/ root@hdp2:$PWD

hdp2 為要分發到的虛擬機器

　　6.修改分發好的虛擬機器myid

進入到我們之前建立的檔案data下的myid中 依次修改標號為2、3
根據你的虛擬機器數量而定

　　7.啟動zookeeper

/opt/zookeeper-3.4.10/bin/zkServer.sh start   (開啟)
/opt/zookeeper-3.4.10/bin/zkServer.sh stop   (關閉)

為了方便也可以使用指令碼

/opt/zookeeper-3.4.10/bin/zkServer.sh $1
ssh hdp2 "source /etc/profile;/opt/zookeeper-3.4.10/bin/zkServer.sh $1"
ssh hdp3 "source /etc/profile;/opt/zookeeper-3.4.10/bin/zkServer.sh $1"

　　8.檢視是否啟動成功

使用jps即可檢視

也可以使用指令碼檢視所有虛擬機器正在執行的狀態

echo "=====================hdp1==================="
jps
echo "=====================hdp2==================="
ssh hdp2 "source /etc/profile; jps"
echo "=====================hdp3==================="
ssh hdp3 "source /etc/profile; jps"

安裝kafka：

　　kafka_2.11-2.4.1

　1.解壓到opt

　2.修改配置檔案

vim    kafka_2.12-1.0.0/config --> server.properties

broler.id=0    標誌當前機器在叢集中的唯一標識 別的虛擬機器依次配置

listeners=PLAINTEXT://hdp1:9092    提供的地址  依次修改

log.dirs=/opt/kafka_2.11-2.4.1/kafka_logs   設定日誌地址

zookeeper.connect=hdp1:2181,hdp2:2181,hdp3:2181

\#刪除topic功能使能 沒有就新增

delete.topic.enable=true

　3.分發並修改

還有兩臺機器
scp -r /opt/kafka_2.11-2.4.1/ root@hdp2:$PWD

scp -r /opt/kafka_2.11-2.4.1/ root@hdp2:$PWD

更改hdp2和hdp3中broler.id，listeners，使id唯一，listener對應各節點ip

　4.簡單使用，cd 到kafka的bin目錄下

　　　啟動關閉服務　

./kafka-server-start.sh -daemon ../config/server.properties

./kafka-server-stop.sh -daemon ../config/server.properties

　　建立主題 test

./kafka-topics.sh --bootstrap-server hdp1:9092,hdp2:9092,hdp3:9092 --create  --topic test

　　　建立一個分割槽，一個副本

./kafka-topics.sh --create --zookeeper 192.168.224.111:2181 --partitions 1 -- replication-factor 1 --topic test

　　　檢視主題

./kafka-topics.sh --bootstrap-server hdp1:9092,hdp2:9092,hdp3:9092 --list

　　　啟動生產者　

./kafka-console-producer.sh --broker-list hdp1:9092,hdp2:9092,hdp3:9092 --topic test

　　啟動消費者

./kafka-console-consumer.sh --bootstrap-server hdp1:9092,hdp2:9092,hdp3:9092 --topic test

需要注意，應該先啟動zookeeper在啟動kafka，關閉時也應該先關閉kafka再關閉zookeeper

大資料基礎配置（jdk,hadoop,zookeeper,kafka）

版本如下： jdk:jdk1.8.0_131 mysql:5.5.54 hadoop:2.8.1 zookeeper:3.4.10 kafka:2.11-2.4.1網盤連結連結: https://pan.baidu.com/s/1XUhqSbKnzREBOTo5W_gl1Q 提取碼: rfp8

Python工程師的大資料之路（七a）Hadoop,ZooKeeper,HIVE,Spark叢集部署

技術標籤：大資料 JDK,Hadoop,ZooKeeper,HIVE,Spark一波流安裝 1、環境說明2、網路配置和免密登入3、環境變數4、MySQL安裝5、解壓Java,Hadoop,ZooKeeper,HIVE,Spark6、配置檔案6.1、Hadoop配置6.2、ZooKeeper配

【原創】大資料基礎之Hadoop（3）hdfs diskbalancer

hdfs單個節點內多個磁碟不均衡時（比如新加磁碟），需要手工進行diskbalancer操作，命令如下

大資料運維（37） Hadoop+Hive+HBase+Kylin 偽分散式安裝

問題導讀 1.Centos7如何安裝配置？ 2.linux網路配置如何進行？ 3.linux環境下java如何安裝？

大資料運維（46）hadoop 2.10叢集搭建

hadoop官方文件： 1 https://hadoop.apache.org/docs/ 安裝hadoop叢集配置DNS解析或hosts檔案：

大資料運維（45）zookeeper 3.4叢集搭建

安裝zookeeper之前先安裝java： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 tar-xfjdk-8u231-linux-x64.tar.gz-C/usr/local/

2020阿里最新大資料面試題集合：Spark+Zookeeper+Hadoop+HBase

Hadoop面試題講述HDFS上傳檔案和讀檔案的流程？HDFS在上傳檔案的時候，如果其中一個塊突然損壞了怎麼辦？NameNode的作用？4.NameNode在啟動的時候會做哪些操作？NameNode的HA？Hadoop的作業提交流程？Hado

dubbo學習實踐（5）之Dubbo-Admin元資料中心配置（zookeeper&Redis&Consul）

1、Dubbo2.7.8元資料中心配置zookeeper版前面文章已經寫到了dubbo-admin管理平臺的docker版配置及dubbo服務註冊與呼叫，這篇文章記錄dubbo元資料中心配置

eclipse基礎篇（jdk/Maven/tomcat的配置與使用）

使用eclipse（jdk/Maven/tomcat的配置與使用）步驟：第一步：下載jdk: 百度搜去官網上面下載

伺服器必備基礎配置（Ubuntu）

本文目的記錄真實環境中伺服器必須配置；配置VPN 推薦使用L2TP或IPSec方式建立VPN，成熟的標準方案，擁有較好的安全性。

大資料實踐解析（上）：聊一聊spark的檔案組織方式

摘要：在大資料/資料庫領域，資料的儲存格式直接影響著系統的讀寫效能。Spark針對不同的使用者/開發者，支援了多種資料檔案儲存方式。本文的內容主要來自於Spark AI Summit 2019中的一個talk【1】，我們將整個talk分

Java應用伺服器之tomcat基礎配置（一）

　　前文我們聊到了java相關重要元件和它們之間的關係以及jdk、tomcat部署回顧請參考https://www.cnblogs.com/qiuhom-1874/p/13302938.html；今天我們來聊一聊tomcat的配置使用相關話題；

Java應用伺服器之tomcat基礎配置（一）（轉載）

Java應用伺服器之tomcat基礎配置（二）

　　前文我們聊了下tomcat的配置檔案相關格式和元件簡介以及webapp目錄結構，manger部署和host managera部署，回顧請參考https://www.cnblogs.com/qiuhom-1874/p/13307892.html；今天我們來詳細聊一聊server.xml中的

JDK配置（win10電腦為例）

前提：安裝完JDK後，這裡講JDK安裝後的配置 1.找到操作頁面右擊“此電腦”，選擇“屬性”，“高階系統設定”------“環境變數”2.JDK環境配置，分三步（1）在系統變數框處，點選新建，輸入變數名 JAVA_H

大資料運維（49）Linux上安裝部署Zabbix

環境準備 OS：CentOS 7 安裝步驟一，關閉selinux和iptables [root@localhost ~]# systemctl stop firewalld.service [root@localhost ~]# setenforce 0

全國信標委釋出《大資料標準化白皮書（2020版）》（附下載）

大資料是新時代最重要的“數字金礦”，是全球數字經濟發展的核心動能。近日，“2020全國大資料標準化工作會議暨全國信標委大資料標準工作組第七次全會”在北京召開。會議上釋出了《大資料標準化白皮書

大資料運維（62）Redis高階應用

1.安全性設定密碼： vi /alidata/server/redis-3.2.1/redis.conf 1 [[email protected]]#vi/alidata/server/redis-3.2.1/redis.conf

大資料快速入門（05）：MapReduce 程式設計模型賞析

一、Hadoop 誕生的**故事（上圖是 Doug Cutting，hadoop 之父） 1985年，Cutting 畢業於美國斯坦福大學。

大資料機器學習（四）K-近鄰演算法

K-近鄰演算法（K-nearest neighbor，KNN）實質：找k個最近的鄰居，人多取勝（問題是k值該取多少怎麼確定）三個基本要素：

大資料 基礎配置 （jdk,hadoop,zookeeper,kafka）

安裝jdk :linux安裝jdk-8u65-linux-x64.tar.gz - 御本美琴初號機 - 部落格園 (cnblogs.com)

安裝hadoop:linux配置hadoop偽叢集 - 御本美琴初號機 - 部落格園 (cnblogs.com)

安裝zookeeper:

1.上傳至opt目錄下解壓

2.進入zookeeper ，建立儲存資料的資料夾

3.進入conf目錄

4.vim data 預先建立好的資料夾

5.分發到虛擬機器2和3

6.修改分發好的虛擬機器myid

7.啟動zookeeper

8.檢視是否啟動成功

安裝kafka：

1.解壓到opt

2.修改配置檔案

3.分發並修改

4.簡單使用 ，cd 到kafka的bin目錄下

啟動關閉服務

建立主題 test

建立一個分割槽，一個副本

檢視主題

啟動生產者

啟動消費者

相關推薦

大資料基礎配置（jdk,hadoop,zookeeper,kafka）

　　1.上傳至opt目錄下解壓

　　2.進入zookeeper ，建立儲存資料的資料夾

　　3.進入conf目錄

　　4.vim data 預先建立好的資料夾

　　5.分發到虛擬機器2和3

　　6.修改分發好的虛擬機器myid

　　7.啟動zookeeper

　　8.檢視是否啟動成功

　1.解壓到opt

　2.修改配置檔案

　3.分發並修改

　4.簡單使用，cd 到kafka的bin目錄下

　　　啟動關閉服務　

　　建立主題 test

　　　建立一個分割槽，一個副本

　　　檢視主題

　　　啟動生產者　

　　啟動消費者