02.spark-spark分散式安裝

阿新 • • 發佈：2021-08-11

1.規劃 三臺伺服器

s101 //master(程序)
s102 ~ s104 //worker(程序)

2.在每個主機上分別安裝spark

3.配置spark(每個節點進行相同操作)
3.1)在spark的conf目錄下建立hadoop的core-site.xml和hdfs-site.xml軟連線
$>xcall.sh ln -s /soft/hadoop/etc/hadoop/core-site.xml /soft/spark/conf/core-site.xml
$>xcall.sh ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml /soft/spark/conf/hdfs-site.xml

3.2)配置JAVA_HOME環境變數

$>cd /soft/spark/conf
$>cp spark-env.sh.template spark-env.sh
$>nano spark-env.sh
...
export JAVA_HOME=/soft/jdk
...

2）新增JAVA_HOME環境變數

[centos@s101 /soft/spark/sbin]$nano spark-config.sh

#java JDK
export JAVA_HOME=/soft/jdk

3.3)修改slaves檔案
$>cd /soft/spark/conf
$>cp slaves.template slaves
$>nano slaves
s102
s103
s104

3.4)分發配置檔案

$>xsync.sh spark-env.sh
$>xsync.sh slaves

4.啟動spark叢集
4.1)啟動hadoop叢集
xzk.sh start //啟動zk
start-dfs.sh //啟動hdfs
4.2)啟動spark
$>cd /soft/spark/sbin
$>./start-all.sh

5.webui
http://s101:8080

5上傳本地檔案到hdfs

[centos@s101 /home/centos]$hadoop fs -mkdir /user/centos/download

檢視當前目錄資訊
        hdfs dfs -ls /
        
上傳檔案
        hdfs dfs -put /本地路徑 /hdfs路徑

6.啟動spark shell，連線到spark叢集
$>spark-shell --master spark://s101:7077
$>sc.textFile("/user/centos/data/1.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect()

http://s101:8080 檢視執行情況

02.spark-spark分散式安裝

Spark學習之路五、Spark偽分散式安裝

02.spark-spark分散式安裝

Spark學習筆記（二）Spark2.3 HA叢集的分散式安裝圖文詳解

Spark學習之路二、Spark HA叢集的分散式安裝

Spark 偽分散式 & 全分散式安裝指南

Zeppelin-在flink和spark叢集的安裝

spark | ubuntu16.20安裝spark-2.1.0

一文搞定Spark叢集的安裝（Standalone模式）

Spark 完全分散式搭建

【Spark研究】極簡 Spark 入門筆記——安裝和第一個迴歸程式

Window 10 WSL 下hadoop 偽分散式安裝

Hadoop基礎（三十三）：Zookeeper 分散式安裝部署

Zookeeper分散式安裝部署

Spark——Spark Streaming 對比 Structured Streaming

【大資料】Hadoop的偽分散式安裝

【大資料】Hadoop的全分散式安裝

大資料運維（37） Hadoop+Hive+HBase+Kylin 偽分散式安裝

最全面的CentOS下hadoop的偽分散式安裝

Hadoop分散式安裝配置免密免使用者名稱登入

大資料規整-3-hadoop的偽分散式安裝

02.spark-spark分散式安裝

相關推薦