spark2.1叢集安裝

阿新 • • 發佈：2019-01-02

規劃

cancer01 master/worker

cancer02 worker

cancer03 worker

cancer04 worker

cancer05 worker

準備

su hadoop

安裝scala

每臺機器上

cd /usr/local

wget http://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.tgz

tar zxf scala-2.11.8.tgz

mv scala-2.11.8 scala

chown -R hadoop:hadoop scala

vim /etc/profile

export SCALA_HOME=/usr/local/scala

export PATH=$PATH:$SCALA_HOME/bin

source /etc/profile

安裝spark

wget http://d3kbcqa49mib13.cloudfront.net/spark-2.0.1-bin-hadoop2.7.tgz

tar zxf spark-2.0.1-bin-hadoop2.7.tgz

mv spark-2.0.1-bin-hadoop2.7/usr/local/spark

chown -R hadoop:hadoop spark

vim /etc/profile

export SPARK_HOME=/usr/local/spark

export PATH=$PATH:$SPARK_HOME/bin

source /etc/profile

配置

cd /usr/local/spark/conf

mv spark-env.sh.template spark-env.sh

vim spark-env.sh

export SCALA_HOME=/usr/local/scala

exportHADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

export SPARK_MASTER_IP=192.168.11.134

export SPARK_MASTER_PORT=12345

exportSPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

複製

在cancer02|03|04|05上建立/usr/local/spark目錄

scp –r spark [email protected]:/usr/local/

scp –r spark hado[email protected]:/usr/local/

啟動

$HADOOP_HOME/sbin/start-all.sh

$SPARK_HOME/sbin/start-all.sh

或者

$SPARK_HOME/sbin/start-master.sh

$SPARK_HOME/sbin/start-slaves.sh

驗證

執行

./bin/run-example SparkPi 2>%1 | grep "Piis roughly"

./bin/spark-submitexamples/src/main/python/pi.py 2>%1 | grep "Pi is roughly"

執行（scala python）

./bin/spark-shell

Scala樣例：

val textFile =sc.textFile(“file:///usr/local/spark/README.md”);

textFile.count();

textFile.first();

val linesWithSpark = textFile.filter(line=> line.contains("Spark"));

linesWithSpark.count();

textFile.filter(line =>line.contains("Spark")).count();

配置conf/spark-env.sh

export SPARK_HOME=/var/lib/myspark/spark

export JAVA_HOME=/usr/java/jdk1.7.0_80

exportHADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop

exportPATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

exportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

exportYARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

exportSPARK_LIBARY_PATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib/native

SPARK_MASTER_HOST=10.20.24.199

#web頁面埠

SPARK_MASTER_WEBUI_PORT=28686

#Spark的local目錄

SPARK_LOCAL_DIRS=/hadoopdata1/sparkdata/local

#worker目錄

SPARK_WORKER_DIR=/hadoopdata1/sparkdata/work

#Driver記憶體大小

SPARK_DRIVER_MEMORY=4G

#Worker的cpu核數

SPARK_WORKER_CORES=16

#worker記憶體大小

SPARK_WORKER_MEMORY=64g

#Spark的log日誌目錄

SPARK_LOG_DIR=/var/lib/myspark/spark/logs

spark2.1叢集安裝

規劃 cancer01 master/worker cancer02 worker cancer03 worker cancer04 worker cancer05 worker 準備 su hadoop 安裝scala 每臺機器上 cd /usr/local wget

Windows 2016 容錯移轉叢集安裝 (1) 叢集安裝

技術分享 ges 建立 nbsp spa 9.png ima tom ear Windows 2016 容錯移轉叢集安裝 (1) 叢集安裝環境:. 網域 - 網域控制站RADIO-AP-1.xxx.com LAN 11.131.113.71

hbase 0.98.1叢集安裝

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

jstorm2.1.1 叢集安裝

一、基礎環境： JDK　　　：1.8.0_65 （要求1.6+） ZooKeeper：3.4.10 Jstorm2.1.1 主機數：3（要求3+，且必須是奇數，因為ZooKeeper的選舉演算法）

hadoop2.8.3 + hive2.3.3 + hbase0.98.24 + spark2.1.3安裝

安裝虛擬機器安裝檔案：CentOS-6.6-x86_64-bin-DVD1.iso 自定義硬體記憶體增加到8G，處理器修改為4核自動安裝永久修改hostname vim /

Spark2.X 叢集安裝（原生版詳細）

Spark叢集安裝搭建最簡單的三臺主機的叢集。hadoop001 Master hadoop002 Workerhadoop003 Worker詳細步驟如下。1.下載spark安裝包下載地址spark官網：http://spark.apache.or

DOCKER學習（二）--Kubernetes(v1.12.1)叢集安裝

本文使用Kubeadm安裝Kubernetes kubeadm是Kubernetes官方提供的用於快速安裝Kubernetes叢集的工具，伴隨Kubernetes每個版本的釋出都會同步更新，kubeadm會對叢集配置方面的一些實踐做調整，通過實驗kubeadm可以學習到

Spark2.1.0安裝和配置

Spark主要使用HDFS充當持久化層，所以完整地使用Spark需要預先安裝Hadoop Spark在生產環境中，主要部署在安裝Linux系統的叢集中。在Linux系統中安裝Spark需要預先安裝JDK、Scala等所需要的依賴。由於

CentOS7+Hadoop2.7.2(HA高可用+Federation聯邦)+Hive1.2.1+Spark2.1.0 完全分散式叢集安裝

本文件主要記錄了Hadoop+Hive+Spark叢集安裝過程，並且對NameNode與ResourceManager進行了HA高可用配置，以及對NameNode的橫向擴充套件（Federation聯邦） 1VM網路配置將子網IP設定為192.168.1.0：將閘道器設定

Linux安裝Spark叢集(CentOS7+Spark2.1.1+Hadoop2.8.0)

[plain] view plain copy print?{SPARK_HOME}/bin  </span></span></li></ol></div><pre code_snippet_id="2398

第5章選舉模式和ZooKeeper的叢集安裝 5-1 叢集的一些基本概念

xx就是我們的master，也就是我們的主節點。心跳機制，當有一個節點掛掉之後，整個叢集還是可以工作的。選舉模式，我們現在的master是正常執行的，但是在某些情況下它宕機了宕機了，那麼這個時候它這個叢集裡面就少了master，沒有master兩個slave需要去競爭。競爭完之後slave1把slave2給幹

spark2.2.2安裝和叢集搭建

1.環境準備安裝Hadoop-2.7.2 安裝scala-2.11.8 安裝jdk-1.8.0_171 準備安裝包:spark-2.2.2-bin-hadoop2.7.tgz,並解壓至hadoop使用者目錄. tar zxvf spark-2.2.2-bin-hadoop2.7.tgz mv spa

Hive 2.1.0叢集安裝

Hive 2.1.0叢集安裝 1.配置伺服器 1個主節點：master(192.168.20.191)，2個（從）子節點， node1(192.168.20.192)， node2(192.168.20.193) 2.將jdbc的jar包放到$HIVE_HOME下 cd

redis3.2.1叢集介紹及在Linux作業系統上安裝

一、redis叢集介紹點選開啟連結 Redis3.0版本之後支援Cluster. 二、redis叢集安裝準備工作： 1. 安裝兩臺虛擬機器，模擬6個節點，一臺機器3個節點，創建出3 master、3 salve 環境。 &nbs

CentOS7安裝spark2.0叢集

1、虛擬機器執行環境： JDK： jdk1.8.0_171 64位 Scala：scala-2.12.6&n

spark2.1.0 on yarn with CDH5.8.0 安裝實戰

Spark 版本釋出很快，CDH整合最新Spark版本需要一定時間，並且CDH 整合的Spark版本不支援Spark-sql。本文件的目的在目前cdh平臺整合最新spark，方便測試和使用最新功能。 spark-env.sh #HADOOP_CONF_DIR ha

K8S運維筆記-單節點叢集安裝(1.11版本)

使用kubeadm安裝K8S 安裝kubeadm 更新安裝源 cat <<EOF > /etc/yum.repos.d/kubernetes.repo [kubernetes] nam

elasticsearch2.3.1單機和叢集安裝2合1及elasticsearch的使用

特點: 1.倒排索引(也就是分詞後做索引) 2.安裝過程非常簡單,解壓縮就能用 3.沒有明確主節點,搭建叢集增加節點即可(叢集最好3個或3個以上節點) 4.查詢非常快速安裝過程如下: 說明: 1建議不要使用註冊使用者root,如果用root會啟動不起來(除非進

Spark學習筆記（1）—— Spark 介紹，叢集安裝

1 Spark 介紹 Spark是一種快速、通用、可擴充套件的大資料分析引擎，2009年誕生於加州大學伯克利分校AMPLab，2010年開源，2013年6月成為Apache孵化專案，2014年2月成為Apache頂級專案。目前，Spark生態系統已經發展成為一個

1.Hadoop叢集安裝部署

Hadoop叢集安裝部署 1.介紹（1）架構模型（2）使用工具 VMWARE cenos7 Xshell Xftp jdk-8u91-linux-x64.rpm hadoop-2.7.3.tar.gz 2.安裝步驟（1）部署master 建立一臺虛擬機器 Xftp傳輸jdk、hadhoop安裝

spark2.1叢集安裝

相關推薦