Spark叢集安裝方式2

阿新 • • 發佈：2019-04-21

環境: jdk1.8、hadoop-2.7、spark-1.6、三臺centos7(如下List-1所示)

List-1 如下30上部署master;31上部署worker1;32上部署worker2

192.168.33.30 master
192.168.33.31 worker1
192.168.33.32 worker2

將jdk1.8、hadoop-2.7、spark-1.6資料夾放到三臺機器的/opt下

修改spark的conf下的spark-env.sh檔案(如果不存在，則cp spark-env.sh.template spark-env.sh)，修改為如下List-2，這個修改三臺機器上都要做:

List-2

export JAVA_HOME=/opt/jdk1.8
export SPARK_DIST_CLASSPATH=$(/opt/hadoop-2.7.7/bin/hadoop classpath);

為什麼List-2中需要將hadoop的classpath加入到其中，是因為spark自1.4之後，編譯都是沒有將hadoop的classpath編譯進去的，所以必須在spark-env.sh中指定hadoop中的所有jar包。

在master機器上，spark安裝目錄，執行如下，之後在控制檯就會打印出一些日誌，從日誌中可以看到master url和MasterWebUI

List-3

/bin/spark-class org.apache.spark.deploy.master.Master

在worker1/worker2，spark安裝目錄，執行如下，之後看MasterWebUI就會看到worker加入進去了

List-4

/bin/spark-class org.apache.spark.deploy.worker.Worker spark://192.168.33.30:7077

到此我們的叢集啟動完成了。

接下來介紹另一種啟動方式：

在master的spark安裝目錄下，執行如下，檢視日誌/opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out，可以看到master url和masterWebUrl:

List-5

[root@master spark-mjduan]# sbin/start-master.sh 
starting org.apache.spark.deploy.master.Master, logging to /opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out

在workerr1/worker2上，spark安裝目錄，執行如下:

List-6

[root@node2 spark-mjduan]# sbin/start-slave.sh spark://192.168.33.30:7077
starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-node2.out

之後看masterWebUrl，可以看

Spark叢集安裝方式2

Spark叢集安裝方式2

Spark叢集安裝搭建

【Spark】Ubuntu16.04 spark 叢集安裝（standalone模式）

hadoop3節點叢集安裝，spark叢集安裝

Spark叢集安裝和WordCount編寫

Spark叢集安裝及Streaming除錯

redis叢集安裝（2臺機器）

Hadoop+Spark叢集安裝步驟詳解

spark叢集安裝與配置

大資料叢集安裝系列2：Hadoop HA 模式安裝

Spark叢集安裝和使用

Spark叢集安裝

spark-2.2.0 叢集安裝部署以及hadoop叢集部署

Spark-2.3叢集安裝

Spark入門實戰系列--2.Spark編譯與部署（中）--Hadoop編譯安裝

Centos7.2 編譯安裝方式搭建 phpMyAdmin

文件安裝的2中方式

Kafka：ZK+Kafka+Spark Streaming集群環境搭建（三）安裝spark2.2.1

Linux下安裝spark叢集

Proxmox5.2叢集安裝Ceph

Spark叢集安裝方式2

相關推薦