Spark叢集安裝配置—Spar2.4.5-Centos7

阿新 • • 發佈：2021-08-05

一、實驗環境

二、下載安裝

三、核心檔案配置

四、啟動程式

----------------------------------------------------------

一、實驗環境

可以先完成以下環境配置，也可直接安裝：
1.1 Hadoop2.7叢集安裝配置
1.2 Anaconda3安裝配置
1.3 系統：Centos7，hadoop使用者（和Hadoop叢集同個使用者）

二、下載安裝

2.1 下載地址：spark-2.4.5-bin-hadoop2.7.tgz
2.2 進入檔案存放目錄，解壓縮：

$ sudo tar -zxvf ./spark-2.4.5-bin-hadoop2.7.tgz -C /usr/local/hdfs/
$ cd /usr/local/hdfs/
$ sudo mv ./spark-2.4.5-bin-hadoop2.7 ./spark2.4.5
$ sudo chown -R hadoop ./spark2.4.5
$ sudo ln -s /usr/local/hdfs/spark2.4.5 ~/hdfs/spark

2.3 配置環境變數

$ vi ~/.bash_profile

SPARK_HOME=/home/hadoop/hdfs/spark
export SPARK_HOME
PATH=$SPARK_HOME/bin:$PATH
export PATH

$ source ~/.bash_profile

在任何介面輸入hive，然後連續按兩下Tab鍵，顯示下面內容則設定成功：

$ spark
spark  spark-class   sparkR   spark-shell   spark-sql   spark-submit

三、核心檔案配置

$ cd ~/hdfs/spark/conf
$ sudo cp ./slaves.template  ./slaves
$ sudo cp ./spark-env.sh.template  ./spark-env.sh
$ sudo cp ./spark-defaults.conf.template ./spark-defaults.conf
$ sudo chown -R hadoop /usr/local/hdfs/spark2.4.5

3.1 slaves

$ vi ./slaves

增加所有的spark executor的機器

Master
Slave2
Slave3
....

3.2 spark-config.sh

& vi $SPARK_HOME/sbin/spark-config.sh

在空白處增加JAVA_HOME路徑：

export JAVA_HOME=/usr/jvm/jdk1.8

3.3 spark-env.sh

$ vi ./spark-env.sh

在最後面加上如下一行：

export HADOOP_CONF_DIR=/usr/local/hdfs/hadoop/conf

3.4 spark-defaults.conf

$ start-all.sh
$ hdfs dfs -mkdir /spark_lib
hdfs dfs -mkdir /spark-logs
$ hdfs dfs -put ~/hdfs/spark/jars/* /spark_lib
$ #stop-all.sh
$ vi ./spark-defaults.conf

在後面空白增加：

spark.master    yarn                                # 告訴spark現在使用的是yarn模式
#spark.yarn.jars hdfs://Master:9000/spark_lib/*.jar  # spark jar包所在的目錄  
#spark.yarn.stagingDir   hdfs://Master:9000/tmp      # spark執行的時候臨時目錄存放的檔案

spark.history.provider            org.apache.spark.deploy.history.FsHistoryProvider
#spark.history.fs.logDirectory     hdfs://Master:9000/spark-logs
spark.history.fs.update.interval  10s
spark.history.ui.port             18080
spark.eventLog.enabled true
#spark.eventLog.dir hdfs://Master:9000/spark-logs

“#”標記需要修改的地方，“Master”為NameNode主機名

3.5 yarn-site.xml

關閉檢查真實的記憶體

sudo vi $HADOOP_HOME/etc/hadoop/yarn-site.xml

在原有Hadoop配置上，增加以下：

<property>
    <name>yarn.resourcemanager.address</name>
    <value>Master:8032</value>
</property>

<property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>Master:8031</value>
</property>

<property>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>Master:8030</value>
</property>

<property>
    <name>yarn.nodemanager.pmem-check-enabled</name>                       
    <value>false</value>
</property>

<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
</property> 

<property>
    <name>yarn.acl.enable</name>
    <value>0</value>
</property>

3.6 mapred-site.xml

$ vi $HADOOP_HOME/etc/hadoop/mapred-site.xml

在原有Hadoop配置上，增加以下：

<property>
	<name>mapreduce.jobtracker.address</name>
	<value>Master:54311</value>
	<description>MapReduce job tracker runs at this host and port.
	</description>
</property>

各Master為自己NameNode地址
把配置檔案複製到各節點上
for i in {slave01,slave02}; do scp /usr/local/hdfs/spark2.4.5 $i:/usr/local/hdfs/; done

四、啟動程式

$ #start-all.sh
$ $SPARK_HOME/sbin/start-all.sh

使用jps檢視,有Master和Workers則啟動成功：

$ jps
71601 SecondaryNameNode
71347 DataNode
71827 ResourceManager
72405 Master      
71212 NameNode
71964 NodeManager
72508 Worker
72734 Jps

$ spark-shell

啟動成功後如圖所示，會有 “scala >” 的命令提示符；並且 “master = yarn” 表示執行在yarn上

Spark context available as 'sc' (master = yarn, app id = application_1628143668230_0003).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 2.4.5
      /_/
Using Scala version 2.11.12 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_301)
Type in expressions to have them evaluated.
Type :help for more information.

scala>

Spark叢集安裝配置—Spar2.4.5-Centos7

一、實驗環境二、下載安裝三、核心檔案配置四、啟動程式 ----------------------------------------------------------

kylin安裝配置-kylin-2.5.0-Centos7

軟體要求 Kylin 安裝二、Kylin 安裝 1,下載地址 2，進入檔案儲存目錄 tar -zxvf ./apache-kylin-2.5.0-bin-hbase1x.tar.gz -C 檔案儲存路徑

Hadoop的叢集（全分散式）安裝配置—Hadoop2.7.3-Centos7

此處例如三臺主機： NameNode：Master DataNode：slave2、slave3 一、環境準備 1.1 建立使用者

python 下 CMake 安裝配置 OPENCV 4.1.1的方法

CMake 安裝配置 OPENCV 4.1.1 解決各種問題方法一 python 可以直接pip install opencv-contrib-python==3.4.x.x 安裝，老版本的庫包含SIFT等演算法。但是，python不支援GPU的，對於JAVA等其他語言想呼叫opencv或者想

ETCD叢集安裝配置及簡單應用老版本

一、環境準備 CentOS Linux release 7.3.1611 (Core) etcd-v3.2.6 二、ETCD下載 https://github.com/coreos/etcd/releases/download/v3.2.6/etcd-v3.2.6-linux-amd64.tar.gz

MySQL PXC叢集安裝配置

1、關閉防火牆 [root@node04 ~]#systemctl disable firewalld [root@node04 ~]#systemctl stop firewalld

hadoop叢集安裝配置Kerberos（二）：hadoop叢集配置 kerberos 認證

技術標籤：大資料linuxhadoopkerberos 目錄前言一、配置 SASL認證證書二、修改叢集配置檔案

Hadoop的偽分佈安裝配置—Hadoop2.7.3-Centos7

一、環境準備 1.1 建立使用者 1.2 關閉防火牆 1.3 免密登入 1.4 JDK安裝二、下載安裝

基於virtual box虛擬機器的Hadoop叢集安裝配置教程

本文記錄參考 http://dblab.xmu.edu.cn/blog/2775-2/ 搭建hadoop分散式叢集的過程前置已在一臺虛擬機器配置好了偽分散式hadoop系統

Zookeeper 叢集安裝配置

Zookeeper 是什麼？ Zookeeper是一個分散式協調服務的開源框架。主要用來解決分散式叢集中應用系統的一致性問題，例如怎樣避免同時操作同一資料造

spark叢集安裝部署

1.在官網下載spark安裝包 # wget https://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz

Hadoop叢集安裝配置教程

Hadoop叢集安裝配置教程連結：https://pan.baidu.com/s/1rDyTLQKA5MvfVWc8CtoL_g 提取碼：8v19

[喵咪MQ(3)]RabbitMQ叢集安裝配置

[喵咪MQ(3)]RabbitMQ叢集安裝配置在各項生產環境使用中,容災總是一個很重要的話題,如果單點故障會導致整個系統奔潰或者是丟失資料是不是好氣好氣的,領導會追著你問這是怎麼了?你只能說是我們沒有經驗什麼什麼元件故

CentOS7下的Zabbix4.4安裝配置

1、Zabbix 介紹 Zabbix 是一個基於 WEB 介面的提供分散式系統監視以及網路監視功能的企業級的開源解決方案。能監視各種網路引數，保證伺服器系統的安全運營；並提供柔軟的通知機制以讓系統管理員快速定位/解決存在的

TIDB 4.0、Hadoop2.7.2、Spark 2.4.0 叢集安裝部署方案

1.概述為什麼這份文件裡面我們要安裝這麼多叢集呢？我這裡大至說一下原因，TIDB4.0我們主要是用於儲存大量資料用的，也就是永久化儲存，而Spark是面向記憶體的。這使得Spark能夠為多個不同資料來源的資料提供近乎實

Centos7.4 安裝配置 redis

一、安裝redis 1、設定redis的倉庫地址，執行命令：　　yum install epel-release 　　出現下圖即設定成功

centOS7下Spark安裝配置

環境說明：作業系統： centos7 64位 3臺 centos7-1 192.168.190.130 master centos7-2 192.168.190.129 slave1

安裝高可用spark叢集--多個Master，配置zookeeper

前面我已經安裝了spark叢集，叢集的規劃是一個Master，三個Worker，L1上安裝Master，L3,L4,L5上安裝Worker，安裝過程與細節請看我得另外一篇部落格：https://blog.csdn.net/weixin_43866709/article/details/8838800

CentOS7 安裝配置 MySQL 5.7

1. 下載 yum 原始檔 mysql80-community-release-el7-2.noarch.rpm 　　https://dev.mysql.com/downloads/repo/yum/

CentOS7.5安裝配置Jenkins

一. 硬體配置： 1 GB的RAM 50 GB的驅動器空間二. 系統環境： [root@Jenkins ~]# cat /etc/redhat-release

Spark叢集安裝配置—Spar2.4.5-Centos7

一、實驗環境

二、下載安裝

三、核心檔案配置

四、啟動程式

----------------------------------------------------------

一、實驗環境

二、下載安裝

三、核心檔案配置

3.1 slaves

3.2 spark-config.sh

3.3 spark-env.sh

3.4 spark-defaults.conf

3.5 yarn-site.xml

3.6 mapred-site.xml

四、啟動程式

相關推薦