Spark叢集搭建與並驗證環境是否搭建成功(三臺機器)

阿新 • • 發佈：2019-01-02

在之前hadoop的基礎上，進行Spark分散式叢集：

(1)下載Spark叢集需要的基本軟體，本篇需要的是：Scala-2.10.4、spark-1.4.0-bin-hadoop

(2)安裝Spark叢集需要的每個軟體

(3)啟動並檢視叢集的狀況

(4)t通過spark-shell測試spark工作

1.Spark叢集需要的軟體

在前面構建好的hadoop叢集的基礎上構建spark叢集，這裡需要的軟體主要是：Scala-2.10.4、spark-1.4.0-bin-hadoop，從網上可以下載到這兩個版本的安裝包，以防萬一，我這裡提供下載地址：http://pan.baidu.com/s/1kVFtn9d

密碼：6o36

2.安裝Scala與Spark

2.1 安裝scala

在Master節點上，開啟終端執行命令：mkdir /usr/llib/scala,進入到下載檔案目錄下，解壓scala壓縮檔案，執行類似於下圖操作：

把解壓的scala檔案移動到建立的目錄下！

修改環境變數，操作截圖如下：

執行下圖所示操作，使環境配置修改生效，並檢測scala是否安裝成功！

在命令列，直接輸入scala進入scala命令互動介面，操作如下截圖：

關於Slave1與Slave2的操作截圖如下所示：

由於gedit無法使用，所以通過scp命令進行了複製！

2.2 安裝Spark

進入到下載目錄下，解壓spark壓縮檔案：

開啟終端，執行命令：mkdir /usr/local/spark，移動解壓的spark檔案，操作截圖：

配置spark環境變數，操作截圖如下：

執行如下命令，是修改配置生效：

進入到spark的conf目錄下，把spark-env.sh.template檔案拷貝到spark-env.sh，並進行編輯，操作截圖如下：

spark-env.sh配置成功後！

接下來配置spark的conf下slaves檔案，把Worker節點都新增進去，順序執行操作截圖如下：

上述是對於master節點的spark配置，關於slave1與slave2節點的操作截圖如下：

3.啟動並檢視叢集狀況

在master節點上執行命令啟動hadoop服務，啟動之後，執行jps檢視程序，三臺機器截圖如下：

hadoop啟動成功後，在master節點上，進入到spark的sbin目錄下，執行命令：./start-all.sh

會在主節點看到Master與Worker程序，在slave1與slave2看到worker程序！進入到spark叢集的文字介面，訪問：http://master:8080，看到三個worker，截圖如下：

進入spark-shell，然後在http://master:4040，截圖如下：

Spark叢集搭建與並驗證環境是否搭建成功(三臺機器)

在之前hadoop的基礎上，進行Spark分散式叢集： (1)下載Spark叢集需要的基本軟體，本篇需要的是：Scala-2.10.4、spark-1.4.0-bin-hadoop (2)安裝Spar

Spark本地開發與遠端除錯環境搭建

先決條件遠端除錯環境搭建過程詳述開啟Intellij IDEA，File->New ->Project 選擇Scala，然後next 配置好JDK、Scala版本，填入專案名稱，然後Finish 4.匯入spark-assembly-1.5.0

Java環境搭建與配置、以及Tomcat搭建與配置

首先配置Java jdk環境列如：jdk1.8.0 ； 1.首先windows+e開啟檔案管理系統，找到系統屬性，點選“高階系統設定” ，再點選環境變數； 2.在系統變數裡邊新建：JAVA_HOME 填寫安裝jdk的絕對路徑； 3.然後再新建：CLASSPATH 填

spark叢集安裝與配置

Spark有三種執行模式，分別為： local模式-只執行在本地，相當於偽分散式 standalone模式-這種模式只需要安裝Spark即可，使用自帶的資源管理器 Spark on yarn/mesos模式-這種模式Spark將使用yarn/mesos作為資源管理器一般來

關於selenium庫與webdriver Chrome環境的搭建

selenium 好的系統環境插件 spa ins 移動 web har 在pycharm裏面默認就可以通過pip來安裝selenium庫，但是在在安裝PhantomJS時需要手動去下載開發庫，然後將其下的bin目錄添加至系統環境變量。但是需要註意，最好直接將Phant

傲視Kubernetes(二)：Docker映象搭建與本地Kubernetes環境搭建

主要內容： 1、Docker與Kubernetes的關係 2、SpringBoot微服務的Docker映象建立 3、Kubernetes本地環境搭建一、Docker與Kubernetes的關係在說明Docker與Kubernetes的關係之前，要先同步一下Docker定義--Docker是什麼？Docke

搭建Hadoop分散式叢集------修改三臺機器的配置檔案

該篇文章，繼續ssh免密登入之後進行講解操作！ Step_1：修改Master主機的core-site.xml檔案：修改前：修改後： Step_2：把修改Master主機的core-site.

Centos7 實現Hadoop-2.9.1分散式叢集搭建和部署（三臺機器）

一、準備三臺虛擬機器hadoop 192.168.131.128 localhost131 192.168.131.131 localhost134 192.168.131.134(以上是我的三臺虛擬機器的hostname 和 ip)hadoop 是 master 的 hos

三臺機器搭建Hadoop叢集

上的各種守護程序的。這就必須在節點之間執行指令的時候是不需要輸入密碼的形式，故我們需要配置SSH運用無密碼公鑰認證的形式，這樣NameNode使用SSH無密碼登入並啟動DataName程序，同樣原理，DataNode上也能使用SSH無密碼登入到 NameNode。

懵懵懂懂搭建雙機RAC環境(本能搭建)

起源：無知者無畏的IT小新兵接手了一個整合資料庫的活，作為甲方人員，具體的技術工作自然有相應的人員去完成，IT小新兵需要做的只是梳理各方需求，同時將整合工作和部門內部的流程結合起來。手頭資源：兩臺刀片BL685C，兩個未滿的刀框C7000，以及一批可以調動和詢問的工程師。

CentOS6.5源碼搭建LAMP--基於module方式實現php（單臺機器）

centos6.5 源碼搭建lamp 基於module方式實現php 單臺機器源碼搭建LAMP軟件包下載源：搜狐鏡像源：http://mirrors.sohu.com/apache下載網：http://mirror.bit.edu.cn/apache/pcre官網：http://www.pcre.org/a

Navicat從mysql導完整表（包括表結構與其中數據）到另一臺機器的mysql中

網上操作數據表 tail 研究新的完成新建文件碰到一個需要把數據表從本地mysql導入到服務器的mysql中的問題，在網上搜了下，沒有發現說的很清楚的操作，很多操作都是利用命令行來實現，自己研究了一下，發現Navicat有自己的導入導出功能，可以比較容易的實現

Spark叢集環境搭建並測試

不在此處介紹spark了，直接上步驟， spark環境需要jdk 、Scala環境、下載hadoop 和是spark，jdk的安裝十分簡單，下面介紹其他三個步驟。環境介紹三臺虛擬機器 hadoop1 192.168.46.129 centos 2g ha

Spark本地開發環境搭建與遠端debug設定

快速看完《Spark大資料處理技術、應用與效能優化》前四章後，對Spark有了一個初步的瞭解，終於踏出了第一步，現在需要在Spark叢集中做些測試例子，熟悉一下開發環境和開發的流程。本文主要總結了如何在本地使用Maven搭建開發環境以及如何進行遠端debug。由於採用的Spark是

Spark叢集環境搭建

本文作者：賀聖軍，叩丁狼高階講師。原創文章，轉載請註明出處。現在在大資料的生態圈的離線的處理主要使用的是MapReduce和Hive技術,但是對於實時處理分析,越來越多的企業使用的Spark作為企業的記憶體處理計算框架,相對於MapReduce,Spark主要有以下一些特

Spark叢集環境搭建中所遇到的問題

1. 安裝好JDK後，檢視java版本出現以下提示：解決方法：在終端輸入以下兩條命令： (1) sudo update-alternatives --install /usr/bin/javac javac /home/fhb/spark

最全SPARK環境（叢集、windows、linux）的搭建

Spark叢集環境搭建 -0. 前提：配置好Hadoop和JAVA的開發環境 -1. 上傳Spark和Scala壓縮包（到~/software資料夾中） -2. 解壓壓縮包 $ tar -zxvf ~/software/sp

SparkML (一) Spark的環境搭建與執行

做Spark也有段時間了，主要是平臺方面的東西原始碼也改過些。不過總覺得還是應用才是王道，加上現在AI日趨火爆，抽點時間學習下SparkML吧。—前言我部落格裡SparkML系列的文章是基於Spark機器學習這本書(Nick Pentreath著),把每章重

Linux下基於Hadoop的大資料環境搭建步驟詳解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安裝與配置）

Linux下基於Hadoop的大資料環境搭建步驟詳解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安裝與配置）系統說明搭建步驟詳述一、節點基礎配置二、H

Ubuntu下搭建spark叢集開發環境

之前在windows下搭建了一個spark的開發環境，但是後來發現如果想要搞spark streaming的例子的話在Linux下使用更方便，於是在Ubuntu下面搭建一下spark開發環境，記錄以做備忘之用。 2 . . 3 .之後利用XSheel5將下載的壓縮包傳遞

Spark叢集搭建與並驗證環境是否搭建成功(三臺機器)

1.Spark叢集需要的軟體

2.安裝Scala與Spark

2.1 安裝scala

2.2 安裝Spark

3.啟動並檢視叢集狀況

相關推薦