搭建Spark環境(Standalone部署模式)

阿新 • • 發佈：2019-03-22

分享圖片安裝位置 amd64 nod 通過如果 p s 免密碼登錄 64位

搭建Spark的單獨（Standalone）部署模式

Standalone單獨部署（偽分布或全分布），不需要有依賴資源管理器。主要學習單獨（Standalone）部署中的偽分布模式的搭建。

實驗環境

個人筆記本安裝。
內存：至少4G
硬盤：至少空余40G
操作系統: 64位 Windows系統
VMware 12+

實驗步驟

1、總體步驟如下：

安裝前的準備

技術分享圖片

搭建

技術分享圖片

2、詳細步驟如下

安裝前的準備

①安裝Linux

下載Ubuntu 16.04，下載地址：http://ftp.sjtu.edu.cn/ubuntu-cd/16.04.5/

（a）Desktop --> 桌面版，默認帶了界面
ubuntu-16.04.5-desktop-amd64.iso

（b）Server --> 服務器版，默認沒有帶界面
ubuntu-16.04.5-server-amd64.iso

②關閉防火墻

查看防火墻狀態：

  $ sudo ufw status
  Status: inactive

關閉防火墻：

  $ sudo ufw disable

防火墻在系統啟動時自動禁用

  $ sudo ufw status
  Status: inactive

查看防火墻狀態：

  $ sudo ufw status
  Status: inactive

③確認openssh-client、openssh-server是否安裝

  $ dpkg -l | grep openssh

如果沒有安裝，則安裝：

  $ sudo apt-get install openssh-client
  $ sudo apt-get install openssh-server

④設置免密登錄

通過ssh-keyen生成一個RSA的密鑰對

  $ ssh-keygen -t rsa -P ''

公鑰追加到~/.ssh/authorized_keys文件中

  $ ssh-copy-id -i  ~/.ssh/id_rsa.pub  主機名(如上面都node1)

測試免密碼登錄：

  $ ssh node1

⑤安裝JDK

解壓到根目錄：

  $ tar zxvf jdk-8u144-linux-x64.tar.gz -C  ~

建一個軟鏈接（方便使用）

  $ ln  -s  jdk-8u144-linux-x64  jdk

配置環境變量：

  $ vi  ~/.bashrc
  （註意！等號兩側不要加入空格）
  export JAVA_HOME=/home/hadoop/jdk
  export PATH=$JAVA_HOME/bin:$PATH
  export CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:.

使得變量生效：

  $ source  ~/.bashrc

⑥安裝Scala

將Scala的安裝包通過Xshell、Xftp上傳到Linux。

  (解壓)
  $ tar zxvf  scala-2.11.12.tgz   -C   ~
  (創建軟連接)
  $ ln  -s   scala-2.11.12  scala
  (配置環境變量)
  $ vi  ~/.bashrc

  export SCALA_HOME=~/scala
  export PATH=$SCALA_HOME/bin:$PATH
  (使環境變量生效)
  $ source  ~/.bashrc

⑦安裝Anoaconda3

上傳Anaconda的安裝包，執行安裝。

  $ sh Anaconda3-5.2.0-Linux-x86_64.sh

許可協議，按ENTER繼續，顯示許可協議，按q到達“是否同意”，輸入yes，同意。如下圖所示：

技術分享圖片

安裝位置，查看文件即將安裝的位置，按enter，即可安裝。如下圖所示：

技術分享圖片

環境變量，加入環境變量，輸入yes。如下圖所示：

技術分享圖片

不安裝VSCode，輸入no。如下圖所示：

技術分享圖片

    source  ~/.bashrc

**⑧安裝pyspark**

安裝pyspark

    $ conda install pyspark

搭建Spark偽分布

①安裝包解壓、配置環境變量

  $ tar  -zxvf  spark-2.4.0-bin-hadoop2.7.tgz  -C ~

創建超鏈接：(便於使用)

  $ ln   -s   spark-2.4.0-bin-hadoop2.7    spark

增加環境變量（如果已經安裝過hadoop，這步可以省略，避免沖突）

  $ vi ~/.bashrc

  export SPARK_HOME=/home/hadoop/spark
  export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

  $ source  ~/.bashrc

②修改配置文件

進入Spark配置文件所在目錄，修改spark-env.sh文件。

  $ cd ~/spark/conf
  $ cp spark-env.sh.template spark-env.sh
  $ vi spark-env.sh

  export JAVA_HOME=/home/hadoop/jdk
  export SPARK_MASTER_HOST=node1
  export SPARK_MASTER_PORT=7077

  #識別到python
  export PYTHON_HOME=/home/hadoop/anaconda3
  export PATH=$PYTHON_HOME/bin:$PATH

修改slaves文件。

  $ cp slaves.template slaves
  $ vi slaves

將裏面在localhost改完主機名

  # A Spark Worker will be started on each of the machines listed below.
  #localhost
  node1

③啟動

  $ cd ~/spark
  $ sbin/start-all.sh

④驗證

（a）查看進程驗證

  $ jps
  顯示如下進程：
  1398 Worker
  1327 Master

（b）打開網頁http://[IP地址]:8080

（c）打開pyspark驗證

  pyspark --master  spark://node1:7077

conda

conda簡介

  一個工具，用於包管理和環境管理
  包管理與pip類似，管理Python的第三方庫。
  環境管理能夠允許用戶使用不同版本Python，並能靈活切換

conda基本命令

查看版本：

  conda --version  或： conda -V

創建環境:

  conda create --name test

創建制定python版本的環境:

  conda create --name test2 python=2.7
  conda create --name test3 python=3

創建包含某些包的環境：

  conda create --name test4 numpy scipy

創建指定python版本下包含某些包的環境

  conda create --name test5 python=3.5 numpy scipy

刪除某個環境

  conda remove --name test  --all

列舉當前所有環境：

  conda info --envs
  conda env list

進入某個環境：

  conda activate test

退出當前環境

  conda deactivate

搭建Spark環境(Standalone部署模式)

分享圖片安裝位置 amd64 nod 通過如果 p s 免密碼登錄 64位搭建Spark的單獨（Standalone）部署模式 Standalone單獨部署（偽分布或全分布），不需要有依賴資源管理器。主要學習單獨（Standalone）部署中的偽分布模式的搭建。實驗

解決Spark standalone部署模式cores為0的問題

在docker中執行spark程式，發現docker日誌列印如下內容： [Timer-0] o.a.spark.scheduler.TaskSchedulerImpl : Initial job has not accepted any resources; check your

CentOS 7.4 yum方式搭建LNMP環境，部署WordPress博客，並安裝XCache模塊

LNMP wordpress xcache 一、演示環境：IP安裝的程序包版本192.168.1.221nginx（epel源）1.12.2php5.4.16php-fpm（FastCGI進程管理器）php-mysql（PHP連接MySQL時需要用到的驅動）192.168.1.222mariadb

Spark環境安裝部署及詞頻統計例項

Spark是一個高效能的分散式計算框架，由於是在記憶體中進行操作，效能比MapReduce要高出很多．具體的我就不介紹了，直接開始安裝部署並進行例項測試首先在官網下載http://spark.ap

三臺主機搭建lnmp環境、部署zabbix

環境說明系統平臺 IP 服務 CentOS7redhat7 192.168.102.11 nginx CentOS7redhat7

Spark環境安裝部署教程

Package type Source code: Spark 原始碼，需要編譯才能使用，另外 Scala 2.11 需要使用原始碼編譯才可使用Pre-build with user-provided Hadoop: “Hadoop free” 版，可應用到任意 Hadoop 版本Pre

亞馬遜雲搭建LAMP環境並部署WordPress

個人主頁：http://52.77.220.140/blog/ 亞馬遜雲新註冊使用者，憑信用卡繫結，可免費1年，可以快速搭建，熟悉LAMP環境，瞭解WordPress部落格。搭建方式，參考亞馬遜幫助文件： http://docs.aws.amazon.com/zh_c

搭建Jenkins環境，部署web專案

Jenkins： Jenkins是一個功能強大的應用程式，允許持續整合和持續交付專案，無論用的是什麼平臺。這是一個免費的原始碼，可以處理任何型別的構建或持續整合。整合Jenkins可以用於一些測試和部署技術。Jenkins是一種軟體允許持續整合。本次演示環

搭建lnmp環境，部署php動態網站

搭建LNMP 前言：“N”代表Nginx與apache的作用一樣，都是為了搭建網站伺服器，由俄羅斯人lgor sysoev開發，其特點是佔有記憶體少，併發能力強，單臺物理伺服器可支援3萬-5萬個併發請求，中國使用nginx網站使用者有：百度、京東、新浪、網易、騰訊、淘寶等。

Spark環境搭建（多種模式）

個人部落格原文連結 Spark環境的搭建相比於Hadoop叢集的搭建還是比較簡單的，而且跟Hadoop叢集的搭建流程也很相似，只是沒有Hadoop叢集那麼多的配置檔案要修改。本文中，我將詳細介紹Spark的本地模式、Standalone模式（偽分佈）、Standalone模式（全分佈）、

spark 環境搭建及幾種模式測試

spark 環境搭建及幾種模式測試 spark安裝部署spark安裝前的環境準備需要安裝jdk、scala、hadoop作為前提環境。 1、安裝jdk1.7 先解除安裝自帶的jdk，防止自帶的jdk和安裝的出現衝突。而且自帶的版本較低不能滿足現在軟體對jdk的要求。使用

計算利器Spark——Spark的Standalone環境搭建及使用

轉載請註明出處：http://blog.csdn.net/dongdong9223/article/details/84836391 本文出自【我是幹勾魚的部落格】 Ingredients： Java：Java SE Development Kit 8u1

【Spark】Spark的Standalone模式安裝部署

Spark執行模式 Spark 有很多種模式，最簡單就是單機本地模式，還有單機偽分散式模式，複雜的則執行在叢集中，目前能很好的執行在 Yarn和 Mesos 中，當然 Spark 還有自帶的 Standalone 模式，對於大多數情況 Standalone 模

Spark的standalone模式部署

Spark執行模式 Spark 有很多種模式，最簡單就是單機本地模式，還有單機偽分散式模式，複雜的則執行在叢集中，目前能很好的執行在 Yarn和 Mesos 中，當然 Spark 還有自帶的 Standalone 模式，對於大多數情況 Standalone 模式就足夠了，如果企業已經有 Yarn 或者 Mes

Spark的Standalone模式安裝部署

Spark執行模式 Spark 有很多種模式，最簡單就是單機本地模式，還有單機偽分散式模式，複雜的則執行在叢集中，目前能很好的執行在 Yarn和 Mesos 中，當然 Spark 還有自帶的 Standalone 模式，對於大多數情況 Standalone 模式就足夠了，如

Spark的運行模式(1)--Local和Standalone

而且 images sla 分享 cli 調度 eight cluster 我們 Spark一共有5種運行模式：Local，Standalone，Yarn-Cluster，Yarn-Client和Mesos。 1. Local Local模式即單機模式，如果在命令語句中

Spark環境搭建（四）-----------數據倉庫Hive環境搭建

apr 程序版本擴展 arch 表名數據集 .tar.gz 自定義 Hive產生背景 1）MapReduce的編程不便，需通過Java語言等編寫程序 2） HDFS上的文缺失Schema(在數據庫中的表名列名等)，方便開發者通過SQL的方式處理結構化的數據，而不需

Intellij Idea搭建Spark開發環境

submit split des 出現 license tor lan jar word 在Spark高速入門指南 – Spark安裝與基礎使用中介紹了Spark的安裝與配置。在那裏還介紹了使用spark-submit提交應用。只是不能使用vim來開發Spark應用

Ubuntu Spark 環境搭建（轉）

vim 能夠 span 有用 var sca 把他要點查看在安裝Spark之前，我們需要在自己的系統當中先安裝上jdk和scala 可以去相應的官網上下載： JDK：http://www.oracle.com/technetwork/java/javase/downl

[k8s]k8s 1.9(on the fly搭建) 1.9_cni-flannel部署排錯 ipvs模式

wap sch byte cer ica 同步 disable cred 0.12 角色節點名節點ip master n1 192.168.14.11 節點1 n2 192.168.14.12 節點2 n3 192.168.14.13 htt

搭建Spark環境(Standalone部署模式)

搭建Spark的單獨（Standalone）部署模式

實驗環境

實驗步驟

1、總體步驟如下：

2、詳細步驟如下

conda

相關推薦