spark叢集安裝部署

阿新 • • 發佈：2021-12-21

1.在官網下載spark安裝包

# wget https://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz

2.解壓

# tar -zxvf spark-2.4.8-bin-hadoop2.7.tgz -C /home/hadoop/app

3.修改配置

# cd  /home/hadoop/app/spark-2.3.1-bin-hadoop2.7/conf/
# cp spark-env.sh.template spark-env.sh
# cp slaves.template slaves
# cp spark-defaults.conf.template spark-defaults.conf
# vim spark-env.sh

新增
export HADOOP_CONF_DIR=/home/hadoop/app/hadoop-2.7.5/etc/hadoop
export HADOOP_HOME=/home/hadoop/app/hadoop-2.7.5
export JAVA_HOME=/opt/jdk1.8.0_202
export SPARK_HOME=/home/hadoop/app/spark-2.3.1-bin-hadoop2.7
export SCALA_HOME=/home/hadoop/app/scala-2.11.8
export SPARK_LOG_DIR=/home/hadoop/app/spark-2.3.1-bin-hadoop2.7/logs
export SPARK_PID_DIR=/home/hadoop/app/spark-2.3.1-bin-hadoop2.7/logs/pid

修改spark-defaults.conf
# vim spark-defaults.conf

新增
spark.eventLog.enabled                             true
spark.eventLog.dir                                 hdfs://ns1/spark/eventLog
spark.rdd.compress                                 true
spark.driver.mebaiwanry                                4G
spark.yarn.historyServer.address                   dba-01:18080
spark.history.ui.port                              18080
spark.history.fs.logDirectory                      hdfs://ns1/spark/eventLog
spark.yarn.maxAppAttempts                          4
spark.yarn.stagingDir                              hdfs://ns1/spark/stagingDir

spark.yarn.singleContainerPerNode                  false
spark.yarn.allocator.waitTime                      60s
spark.logConf                                      true
spark.ui.killEnabled                               false
spark.streaming.backpressure.initialRate           1000
spark.streaming.kafka.maxRatePerPartition         10000
spark.streaming.blockInterval                     1000
spark.streaming.backpressure.enabled              true
spark.streaming.receiver.maxRate                  10000
spark.streaming.kafka.maxRetries                  10
spark.default.parallelism                         64
spark.streaming.dynamicAllocation.enabled         false
spark.streaming.dynamicAllocation.minExecutors    1
spark.streaming.dynamicAllocation.maxExecutors    50
spark.shuffle.service.enabled             true
spark.dynamicAllocation.enabled           true
spark.dynamicAllocation.minExecutors      1
spark.dynamicAllocation.maxExecutors      20
spark.driver.maxResultSize  4g

修改slaves
# vim slaves
新增
dba-01
dba-02
dba-03

4.建立目錄

# cd /home/hadoop/app/spark-2.3.1-bin-hadoop2.7
# mkdir -p logs/pid
# hdfs dfs -mkdir -p /spark/stagingDir
# hdfs dfs -mkdir -p /spark/eventLog

5.傳輸到其他節點

# cd /home/hadoop/app
# scp -r spark-2.3.1-bin-hadoop2.7 hadoop@dba-02:/home/hadoop/app
# scp -r spark-2.3.1-bin-hadoop2.7 hadoop@dba-03:/home/hadoop/app
# scp -r spark-2.3.1-bin-hadoop2.7 hadoop@dba-04:/home/hadoop/app
# scp -r spark-2.3.1-bin-hadoop2.7 hadoop@dba-05:/home/hadoop/app

6.任意一個節點啟動spark叢集

# cd /home/hadoop/app/spark-2.3.1-bin-hadoop2.7/sbin
# ./start-all.sh

7.新增spark環境變數

# vim /etc/profile
export SPARK_HOME=/home/hadoop/app/spark-2.3.1-bin-hadoop2.7
export PATH=$SPARK_HOME/bin

# source /etc/profile

spark叢集安裝部署

1.在官網下載spark安裝包 # wget https://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz

TIDB 4.0、Hadoop2.7.2、Spark 2.4.0 叢集安裝部署方案

1.概述為什麼這份文件裡面我們要安裝這麼多叢集呢？我這裡大至說一下原因，TIDB4.0我們主要是用於儲存大量資料用的，也就是永久化儲存，而Spark是面向記憶體的。這使得Spark能夠為多個不同資料來源的資料提供近乎實

【Kubernetes系列】第3篇 Kubernetes叢集安裝部署

本文介紹瞭如何通過Kubespray來進行部署高可用k8s叢集，k8s版本為1.12.5。 1、部署手冊

centos7下zookeeper+kafka叢集安裝部署

centos7下zookeeper叢集安裝部署 1.安裝環境（如下圖示例）（三臺虛擬機器）： Host Ip Software Port Usage

zookeeper + kafka 叢集安裝部署教程（linux環境下）

說明：教程使用4臺伺服器，1臺用作zookeeper，3臺用kafka 必備條件:jdk kafka自帶zookeeper 也可以使用kafka內建的zookeeper

nacos單機，叢集安裝部署

nacos單機啟動準備下載nacos安裝包下載地址準備centos環境（本次測試使用docker）

Redis——6.0叢集安裝部署

前言 redis叢集化部署主要用於大型快取架構，一般的小型架構，使用redis主從配置 + sentinel哨兵叢集應付系統壓力，

kafka——叢集安裝部署(自帶zookeeper)

技術標籤：kafkalinuxkafka kafka系列文章第一章 linux單機安裝kafka 第二章 kafka——叢集安裝部署(自帶zookeeper)

k8s-叢集安裝部署

技術標籤：容器kubernetes運維linux kubernetes叢集安裝檔案網盤自取：https://pan.baidu.com/s/1cMepm0ZWndeIZOJX981UTg

Kafka叢集安裝部署

1 叢集安裝部署 1、下載安裝包（http://kafka.apache.org） https://archive.apache.org/dist/kafka/1.1.0/kafka_2.11-1.1.0.tgz

Spark叢集安裝配置—Spar2.4.5-Centos7

一、實驗環境二、下載安裝三、核心檔案配置四、啟動程式 ----------------------------------------------------------

zookeeper + kafka叢集安裝部署文件

部署環境服務所屬ip和佔用的埠 zookeeper 192.169.1.71:2181 kafka1 192.169.1.71:9092 kafka2 192.169.1.70:9092

flink實時計算叢集安裝部署

1.官網下載flink安裝包 # wget https://archive.apache.org/dist/flink/flink-1.13.1/flink-1.13.1-bin-scala_2.11.tgz

flink叢集安裝部署

flink叢集安裝部署 yarn叢集模式快速開始在yarn上啟動一個一直執行的flink叢集

clickhouse叢集安裝部署文件

clickhouse 叢集安裝部署文件一、環境準備 CentOS系統三臺測試機 Host： 192.168.2.211、 192.168.2.212、 192.168.2.213

Consul安裝部署（Windows單機、Docker叢集）

1. Consul簡介 ??Consul 是一個支援多資料中心分散式高可用的服務發現和配置共享的服務軟體，由 HashiCorp 公司用 Go 語言開發，基於 Mozilla Public License 2.0 的協議進行開源。 Consul 支援健康檢查，並允許 HTT

ol7.7安裝部署4節點hadoop 3.2.1分散式叢集學習環境的詳細教程

準備4臺虛擬機器，安裝好ol7.7，分配固定ip192.168.168.11 12 13 14，其中192.168.168.11作為master，其他3個作為slave，主節點也同時作為namenode的同時也是datanode，192.168.168.14作為datanode的同時也作為secon

ol7.7安裝部署4節點spark3.0.0分散式叢集的詳細教程

為學習spark，虛擬機器中開4臺虛擬機器安裝spark3.0.0 底層hadoop叢集已經安裝好，見ol7.7安裝部署4節點hadoop 3.2.1分散式叢集學習環境

Zeppelin-在flink和spark叢集的安裝

Zeppelin-在flink和spark叢集的安裝該教程主要面向Zeppelin的入門者。不需要太多的關於 Linux, git, 或其它工具的基礎知識。如果你按照這裡的方法逐項執行，就可以將 Zeppelin 正常執行起來。

centos7.8 安裝部署 k8s 叢集

centos7.8 安裝部署 k8s 叢集目錄centos7.8 安裝部署 k8s 叢集環境說明Docker 安裝k8s 安裝準備工作Master 節點安裝 k8s版本檢視安裝 kubelet，kubeadm，kubectl下載映象初始化 Master啟動測試參考文章

spark叢集安裝部署

1.在官網下載spark安裝包

2.解壓

3.修改配置

4.建立目錄

5.傳輸到其他節點

6.任意一個節點啟動spark叢集

7.新增spark環境變數

相關推薦