spark單機模式和叢集模式安裝

阿新 • • 發佈：2019-03-01

浪費了“黃金五年”的Java程式設計師，還有救嗎？ >>>

1.spark單機模式安裝

實現步驟：

1）安裝和配置好JDK

2）上傳和解壓Spark安裝包

3）進入Spark安裝目錄下的conf目錄

複製conf spark-env.sh.template 檔案為 spark-env.sh

在其中修改，增加如下內容：

SPARK_LOCAL_IP=伺服器IP地址

Spark單機模式啟動

在bin目錄下執行：sh spark-shell --master=local

啟動後發現列印訊息

Spark context Web UI available at http://localhost:4040//Spark的瀏覽器介面

看到這個頁面單機模式也就安裝成功了

2.叢集模式安裝

實現步驟：

1）上傳解壓spark安裝包

3）配置spark-env.sh檔案

配置示例：

#本機ip地址

SPARK_LOCAL_IP=spark01

#spark的shuffle中間過程會產生一些臨時檔案，此項指定的是其存放目錄，不配置預設是在 /tmp目錄下

SPARK_LOCAL_DIRS=/home/software/spark/tmp

export JAVA_HOME=/home/software/jdk1.8

4）在conf目錄下，編輯slaves檔案

配置示例：

spark01

spark02

spark03

5）配置完後，將spark目錄傳送至其他節點，並更改對應的 SPARK_LOCAL_IP 配置

啟動叢集

1）如果你想讓 01 虛擬機器變為master節點，則進入01 的spark安裝目錄的sbin目錄

執行： sh start-all.sh

2）通過jps檢視各機器程序，

01：Master +Worker

02：Worker

03：Worker

3）通過瀏覽器訪問管理介面

http://192.168.222.22:8080

4）通過spark shell 連線spark叢集

進入spark的bin目錄

執行：sh spark-shell.sh --master spark://192.168.222.22:7077

6）在叢集中讀取檔案：

sc.textFile("/root/work/words.txt")

預設讀取本機資料這種方式需要在叢集的每臺機器上的對應位置上都一份該檔案浪費磁碟

7）所以應該通過hdfs儲存資料

sc.textFile("hdfs://hadoop01:9000/mydata/words.txt");

注：可以在spark-env.sh 中配置選項 HADOOP_CONF_DIR 配置為hadoop的etc/hadoop的地址使預設訪問的是hdfs的路徑

注：如果修改預設地址是hdfs地址則如果想要訪問檔案系統中的檔案需要指明協議為file 例如 sc.t

spark單機模式和叢集模式安裝

浪費了“黃金五年”的Java程式設計師，還有救嗎？ >>>

大資料之Spark（八）--- Spark閉包處理，部署模式和叢集模式，SparkOnYarn模式，高可用，Spark整合Hive訪問hbase類載入等異常解決，使用spark下的thriftserv

一、Spark閉包處理 ------------------------------------------------------------ RDD,resilient distributed dataset,彈性(容錯)分散式資料集。分割槽列表,function,dep Op

IntelliJ IDEA（Ultimate版本）的下載、安裝和WordCount的初步使用（本地模式和叢集模式）

　　不多說，直接上乾貨！　　IntelliJ IDEA號稱當前Java開發效率最高的IDE工具。IntelliJ IDEA有兩個版本：社群版(Community)和旗艦版(Ultimate)。社群版時免費的、開源的，但功能較少，旗艦版提供了較多的功能，是收費的，可以試用30天。　　強烈推

IntelliJ IDEA（Community版本）的下載、安裝和WordCount的初步使用（本地模式和叢集模式）

　　不多說，直接上乾貨！　　對於初學者來說，建議你先玩玩這個免費的社群版，但是，一段時間，還是去玩專業版吧，這個很簡單哈，學聰明點，去搞到途徑啟用！可以看我的部落格。包括：　　IntelliJ IDEA（Community）的下載　　 IntelliJ IDEA（Commun

Scala IDE for Eclipse的下載、安裝和WordCount的初步使用（本地模式和叢集模式）

　　不多說，直接上乾貨！這篇部落格是，　　是在Scala IDEA for Eclipse裡maven建立scala和java程式碼編寫環境。本博文包括：　　Scala IDE for Eclipse的下載　　 Scala IDE for

ZooKeeper 單機模式和叢集模式的環境搭建

ZooKeeper環境搭建下載最新穩定版的 Zookeeper Standalone Operation 1、將下載的 ZooKeeper 解壓，進入 conf 目錄，複製一份 zoo_sample.cfg 的配置檔案命名為 zoo.cfg

Redis 單點模式和叢集模式程式碼測試及問題記錄

前言：Redis的測試有一些講究，如果你是先安裝叢集再來測試會出現很多意想不到的問題。單個redis-server測試很簡單就是照著API搞就行，但是如果是先搭建叢集環境而使用叢集節點（單個IP和埠）來操作就不適用了。叢集的特點就是分擔服務端的壓力，此時採用Redis一般

通過策略模式來實現redis的單機版和叢集版的轉換

（1）首要介面JedisClient package com.wine.jedis; public interface JedisClient { String set(String key, String value); String get(String key); Boo

Centos7安裝Nacos單機模式以及叢集模式(包含nignx安裝以及實現叢集)的相關配置

Nacos 致力於幫助您發現、配置和管理微服務。Nacos 提供了一組簡單易用的特性集，幫助您快速實現動態服務發現、服務配置、服務元資料及流量管理。 Nacos支援三種部署模式單機模式 - 用於測試和單機試用。叢集模式 - 用於生產環境，確保高可用。多叢集模式 - 用於多資料中心場景。一、Naco

CentOS 7 安裝Redis單機版和叢集

Redis下載 http://download.redis.io/releases/redis-4.0.11.tar.gz 一、單機版搭建 1.上傳壓縮包到 /usr/download (我自定義放安裝包的目錄) 2.安裝gcc編譯環境，命令 yum install gcc-c++

redis的叢集模式和哨兵模式

redis的叢集模式和哨兵模式 redis中叢集模式 redis叢集模式配置支援3.0及以上的版本。目的提高redis的可用性，但是隻能保證一定程度的高可用。 redis-cluster原理 Redis 叢集有16384個雜湊槽,每個key通過CRC16校驗後對16384取模來決定放置哪個槽.叢集的每個節點負

Spark自帶的叢集模式（Standalone），Spark/Spark-ha叢集搭建

#1、Spark自帶的叢集模式對於Spark自帶的叢集模式，Spark要先啟動一個老大（Master）,然後老大Master和各個小弟（Worker）進行通訊，其中真正幹活的是Worker下的Executor。關於提交任務的，需要有一個客戶端，這個客戶端叫做D

Zookeeper的安裝單機版和叢集版

自己寫部落格,很大一部分原因是因為自己安裝過的軟體也老是忘記安裝步驟,每次都是百度的,寫下來供自己參考,當然,有什麼不足的地方,請大神批評指正!!!!!都是搞技術的,有錯指出來就行,歡迎各位騷擾!!!! Zookeeper的單機版安裝從官網上下載zookeeper的安裝

【Spark篇】---SparkStreaming+Kafka的兩種模式receiver模式和Direct模式

一、前述 SparkStreamin是流式問題的解決的代表，一般結合kafka使用，所以本文著重講解sparkStreaming+kafka兩種模式。二、具體 1、Receiver模式原理圖： receiver模式理解：在SparkStreaming程式執行起來後，Executor中會有r

kafka_2.11-1.0.0單機和叢集的安裝和配置

單機安裝配置：首先下載kafka安裝包 tar -zxvf kafka安裝包 cd config vim server.properties kafka需要zookeeper進行管理 kafka有一個內建的zookeeper叢集，建議不用 se

Spring Cloud - Nacos註冊中心入門單機模式及叢集模式

近幾年微服務很火，Spring Cloud提供了為服務領域的一整套解決方案。其中Spring Cloud Alibaba是我們SpringCloud的一個子專案，是提供微服務開發的一站式解決方案。包含微服務開發的必要元件，基於SpringCloud 符合SpringCloud標準,是阿里

[CentOS 7系列]忘記密碼的“救星”——單用戶模式和救援模式

linux 操作系統用戶 system 忘記密碼 init是Linux系統操作中不可缺少的程序之一。是一個由內核啟動的用戶級進程。內核啟動（已經被載入內存，開始運行，並已初始化所有的設備驅動程序和數據結構等）之後，就通過啟動一個用戶級程序init的方式來啟動其他用戶級的進程或服務。所

使用Xcode-debug模式和release模式

哪裏 eas containe cin white ces item proc mman 在開發過程中，我們常常須要用到NSLog輸出一些信息，甚至有的開發過程。必須在控制臺查看輸出，有經驗的程序猿通過控制臺輸出就能知道整個數據交互的一個流程。可是一個

activeMQ隊列模式和主題模式的Java實現

ons javax try nfa port 實現 catch n) tac 一、隊列模式生產者 import javax.jms.Connection; import javax.jms.ConnectionFactory; import javax.jms.Dest

單例模式和工廠模式

必須 order pac border 聲明並且 span lin 實例對象 PHP------單例模式和工廠模式

spark單機模式 和 叢集模式 安裝

相關推薦

spark單機模式和叢集模式安裝