spark2.2.2安裝和叢集搭建

阿新 • • 發佈：2018-11-06

1.環境準備

安裝Hadoop-2.7.2
安裝scala-2.11.8
安裝jdk-1.8.0_171
準備安裝包:spark-2.2.2-bin-hadoop2.7.tgz,並解壓至hadoop使用者目錄.

tar zxvf spark-2.2.2-bin-hadoop2.7.tgz
mv spark-2.2.2-bin-hadoop2.7 spark

2.修改配置檔案

.bash_profile

#新增
export SPARK_HOME=/home/hadoop/spark
export PATH=$SPARK_HOME/sbin:$PATH

spark-env.sh(從spark-env.sh.template拷貝)

#jdk安裝目錄
export JAVA_HOME=/usr/local/jdk1.8.0_171

#scala安裝目錄
export SCALA_HOME=/usr/local/scala-2.11.8

#hadoop安裝目錄
export HADOOP_HOME=/home/hadoop/hadoop

#hadoop配置檔案目錄
export HADOOP_CONF_DIR=/home/hadoop/hadoop/etc/hadoop

#master節點ip
export SPARK_MASTER_IP=192.168.163.101

#每個worker節點能夠最大分配給exectors的記憶體大小
export SPARK_WORKER_MEMORY=1g

#每個worker節點所佔有的CPU核數目
export SPARK_WORKER_CORES=1

#每臺機器上開啟的worker節點的數目
export SPARK_WORKER_INSTANCES=1

slaves(從slaves.template拷貝)

centos7-1
centos7-2
centos7-3

修改完成後,將spark目錄拷貝至各節點.

3.啟動

啟動hdfs

spark依賴hdfs,yarn可以不啟動.

start-dfs.sh

啟動spark

spark/sbin/start-spark.sh

檢視程序

#主節點
Master
#工作節點
Worker

UI介面
http://192.168.163.101:8080

spark-shell

spark/bin/spark-shell

檢視spark jobs

spark2.2.2安裝和叢集搭建

1.環境準備安裝Hadoop-2.7.2 安裝scala-2.11.8 安裝jdk-1.8.0_171 準備安裝包:spark-2.2.2-bin-hadoop2.7.tgz,並解壓至hadoop使用者目錄. tar zxvf spark-2.2.2-bin-hadoop2.7.tgz mv spa

zookeeper3.4.8安裝和叢集搭建

1.環境準備建立zookeeper使用者. 準備安裝包: zookeeper-3.4.8.tar.gz. 拷貝至安裝目錄並解壓 tar zxvf zookeeper-3.3.6.tar.gz mv zookeeper-3.3.6 zookeeper 2.配置檔案 zookeeper/c

Kafka2.10安裝和叢集搭建

1.安裝前準備 jdk1.8.0_171 kafka_2.10-0.10.0.0.tgz 將壓縮包解壓至kafka使用者目錄. 2.配置檔案 config/server.properties #修改一下幾項,其他不動 #唯一標識，叢集內各個broker.id不能重複 broker.i

在CDH上用外部Spark2.2.1安裝和配置 CarbonData

表示相關 iyu top arch slaves path 中央倉庫 tar -zcvf 在CDH上用外部Spark2.2.1 （hadoop free版本）standalone 模式安裝和配置 CarbonData ===================

Hadoop2.7.2安裝與叢集搭建

1.環境準備 jdk需要1.7以上版本64位. 建立hadoop使用者. 在hadoop使用者目錄下解壓安裝包hadoop-2.7.2.tar.gz 2.配置免密碼登入各節點分別執行生成公鑰和私鑰:ssh-keygen -t rsa 四次enter. 將公鑰新增進公鑰庫:cat

redis安裝和主從搭建（redis學習筆記2）

redis安裝環境 redis是C語言開發，建議在linux上執行。安裝redis需要先將官網下載的原始碼進行編譯，編譯依賴gcc環境，如果沒有gcc環境，需要安裝gcc yum install gcc-c++ 2. 下

Centos7 實現Hadoop-2.9.1分散式叢集搭建和部署（三臺機器）

一、準備三臺虛擬機器hadoop 192.168.131.128 localhost131 192.168.131.131 localhost134 192.168.131.134(以上是我的三臺虛擬機器的hostname 和 ip)hadoop 是 master 的 hos

Hadoop 3.1.2 下載安裝和分布式搭建的準備

mir -s 準備 authorize ima 安裝授權更改 pre 官方有詳細文檔：https://hadoop.apache.org/docs/r3.1.2/hadoop-project-dist/hadoop-common/SingleCluster.html

oracle 11g ocp 筆記（2）-- 安裝和創建數據庫

apu 數據庫管理工具 OS 靜默 software app %s 變量多個 1.了解數據庫管理工具 1.2 OUI(Oracle Universal Installer) ·OUI產品清單(inventory)位置 Windows:

Hive1.2.2的安裝和配置

man host 方法 location 可能啟動 ast option method Hadoop環境搭建筆記整理（四)——Hive1.2.2的安裝和配置蘇洛爾寂 www.bdqll.top，別看了啥也沒有 1 人贊了該文章一、

2-MySql安裝和基本管理

本節掌握內容： MySQL的介紹安裝、啟動 MySQL破解密碼 MySQL中統一字元編碼 MySQL是一個關係型資料庫管理系統，由瑞典MySQL AB 公司開發，目前屬於 Oracle 旗下公司。MySQL 最流行的關係型資料庫管理系統，在

CentOS6.8下Nagios-4.2.0安裝和配置

因此 figure 問題 usermod linux文件 httpd的配置 pen kconfig etc 1實驗目標掌握Nagios的安裝 2實驗環境主機名：Nagios-Server 操作系統：CentOS release 6.8 (Final) IP地址：19

centos7--(2)解除安裝和安裝yum包

1、centos版本 CentOS Linux release 7.5.1804 (Core) 3、解除安裝原來的yum [[email protected] 下載]# rpm -qa|grep yum yum-3.4.3-158.el7.centos.n

實戰基於Spring Boot 2的WebFlux和mLab搭建反應式Web

Spring Framework 5帶來了新的Reactive Stack非阻塞式Web框架：Spring WebFlux。作為與Spring MVC並行使用的Web框架，Spring WebFlux依賴了反應式流介面卡(Reactive Streams Adapter)，在Netty和Servlet3.1的

redis筆記2--資料持久化和叢集

資料持久化資料持久化的用處： 1.恢復資料。 2.減少資料的運算，如：從關係型資料庫載入資料到redis後，redis服務重啟時不需要在去關係型資料庫獲取資料，直接讀取硬碟上的備份即可

Sphinx 2.2.3 安裝和配置，英文數字中文搜尋

注：專案中，中文分詞比較少，所以直接使用原版Sphinx 一元分詞作者：凨.FOX 編譯前，先要把mysql安裝好。開始安裝sphinx tar zxvf sphinx-2.2.3-beta.tar.gz cd sphinx-2.2.3-beta ./configu

spark-2.2.0安裝和部署

Spark下載為了方便，我直接是進入到了/usr/local資料夾下面進行下載spark-2.2.0 wget https://d3kbcqa49mib13.cloudfront.net/spark-2.2.0-bin-hadoop2.7.tgz Spark安裝之前的準備檔案的解壓與

【容器】CentOS7.2下安裝和使用jetty-9.4.0

緣起一直使用tomcat做容器。但最近玩了玩spring boot，看到內部整合的jetty蠻好玩，然後來自己搭建個jetty。通過配置和使用，目的也是為了讓自己掌握另一種容器，以後方便為業務遷移微服務來服務吧。準備 A：下載資源選擇最新的tg

Spark 2.4 之 standalone 叢集搭建

本文參考官方文件： http://spark.apache.org/docs/latest/spark-standalone.html 1.預先搭建3臺hadoop 的叢集 SERVER INFO version

Hadoop之——Hadoop2.5.2 HA高可靠性叢集搭建(Hadoop+Zookeeper)前期準備

今天是十一長假的第三天，節前，很多朋友發來私信說，網上基於HA的Hadoop叢集，動不動就是7、8臺伺服器，甚至是10幾臺伺服器，自己的電腦Hold不住這麼多虛擬機器啊！有什麼辦法可以將伺服器縮減為3臺嗎？今天，我就為大家帶來一篇如何在3臺CentOS 虛擬機器上搭建基於

spark2.2.2安裝和叢集搭建

1.環境準備

2.修改配置檔案

3.啟動

相關推薦