docker for spark

阿新 • • 發佈：2018-11-05

專案需求，有一個spark-streaming的程式，讀kafka的資料，需要構建一個不使用hadoop的spark

以下建立的映象參考網路，可以稍加修改就可以使用不同的版本。

可單獨啟動master,worker來構建一個standaline的叢集。

也可以預設啟動，啟動後，構建的是一個master,兩個worker的叢集。

使用的檔案如下：

start-spark spark-2.2.1-bin-hadoop2.7.tgz Dockerfile

#start-spark
#!/bin/bash

if [[ "${1}" = 'master' ]]; then
  # Start Spark Master
       spark 
-class org.apache.spark.deploy.master.Master -h $(hostname) 2>&1 >/data/sparklog-server.log 
elif [[ "${1}" = 'worker' ]]; then
  # Start Spark Worker
    spark-class org.apache.spark.deploy.worker.Worker  spark://$2:7077 2>&1 >/data/sparklog.log
else
  #start master and two workers
    nohup  spark 
-class org.apache.spark.deploy.master.Master -h $(hostname) 2>&1 >>/data/sparklog-server.log &
    #sleep 5 to wait spark-server start
    sleep 3
    nohup spark-class org.apache.spark.deploy.worker.Worker  $(cat /etc/hosts|grep spark_master|cut -f 1):7077 2>&1 >/data/sparkwlog1.log &
    nohup spark 
-class org.apache.spark.deploy.worker.Worker  $(cat /etc/hosts|grep spark_master|cut -f 1):7077 2>&1 >/data/sparkwlog2.log 
  exit 1
fi

Dockerfile

FROM openjdk:8-jre

MAINTAINER [email protected]


WORKDIR spark 
COPY spark*.tgz ./
RUN  tar zxf spark*.tgz && mv spark-2.2.1-bin-hadoop2.7/* ./ \
     && rm -fr spark-2.2.1-bin-hadoop2.7 && rm spark*.tgz

EXPOSE 6066 7077 8080 8081


# Copy start script
COPY start-spark /usr/bin/start-spark
RUN  chmod +x /usr/bin/start-spark

ENV SPARK_HOME /spark
ENV PATH /spark/bin:$PATH 
ENV PATH /spark/sbin:$PATH

#volume /data
VOLUME /data

#entrypoint
CMD ["start-spark","all"]

使用方法：

構建 docker build -t spark .

1.啟動master

#start spark master

注意：--net 是我自己已經建立的一個橋接網路
docker run --rm -it --name spark_master　-p 7077:7077 -p 8080:8080 --net loginsight -h spark_master spark start-spark master

2.啟動worker

docker run --rm -it --net loginsight --name spark_worker1 spark start-spark worker $(docker inspect -f '{{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' spark_master)

3.預設啟動

docker run --rm -it --name spark_master -p 7077:7077 -p 8080:8080 --net loginsight -h spark_master spark

docker for spark

專案需求，有一個spark-streaming的程式，讀kafka的資料，需要構建一個不使用hadoop的spark 以下建立的映象參考網路，可以稍加修改就可以使用不同的版本。可單獨啟動master,worker來構建一個standaline的叢集。也可以預設啟動，啟動後，構建的是一個master,

Get Docker for CentOS and Installing Docker

man inux can all pac nload require sys ont 1、OS requirements To install Docker, you need the 64-bit version of CentOS 7. 2、Uninstall old

利用docker 部署 spark項目的端口問題

spark 大數據 hadoop docker利用Docker 安裝項目：local模式要設置sparklocal.spark.driver.hostyarn模式中只設置sparklocal.spark.driver.host和可以啟動，但是無法執行任何語句，需要再設置sparkyarn.spark.dri

Docker for Windows

5.6 load for get cnblogs -type none nload 一個下載docker 　　　　for windows: docker 　　　　安裝，win鍵+R => cmd => docker 　　　　

docker for Centos

基於 htm ref update systemctl blog mct start 啟動 linux 版本比較多... 這裏只對Centos 和 redhat 作為事例, docker是基於ubuntu 進行開發的,所以建議大家在ubuntu 上面進行docker學習do

Docker For Mac沒有docker0網橋

容器參數因此 idg 進行 nta 無法訪問 daemon 這一在使用Docker時，要註意平臺之間實現的差異性，如Docker For Mac的實現和標準Docker規範有區別，Docker For Mac的Docker Daemon是運行於虛擬機(xhyve)中的

Docker for windows : 安裝Redis

exec test dock -- exe repos sql Go image 一、創建並運行容器 docker run -d -it --name redis d4f259423416 PS C:\Users\K-Jso> docker images -

使用WSL連接Docker for Windows

general 6.0 ssl ole out 電腦安裝docker ali nta 在Windows下安裝Docker for Windows Cotana搜索功能，打開Windows的Hype-v功能（註：會影響Virtualbox和Vmware的使用）並重啟電腦。

What’s new for Spark SQL in Apache Spark 1.3（中英雙語）

block htm park -h apache HA log -a -- 文章標題 What’s new for Spark SQL in Apache Spark 1.3 作者介紹 Michael Armbrust 文章正文參考文獻

《11招玩轉網絡安全》之第一招：Docker For Docker

選擇自帶網絡安全 exe b-s 停止 1-57 模式 mirror 玩轉×××那些工具，缺少了虛擬機怎麽行，除了用虛擬機虛擬整個系統，Docker也不能缺少，讀者只需要知道，Docker只虛擬Linux系統中的某個程序就可以了。本節就來介紹Linux下安裝設置Dock

docker for windows 使用mssql2017

bsp localhost 數據庫 mss microsoft 設置 doc lin dock 確實有些坑，本來之前坑都踩過了，但是時間一久就忘記了，這次換電腦又都踩了一遍。幾個要點（坑）: 1.docker安裝時默認就好。然後C盤必須設置共享，否則後面做文件夾掛載時

Docker for Centos7 push ISO fail

log source refers 一個 gin cto dig user fff 1.首先需要到hub docker創建賬號和密碼由於我們生活在富強而自立的×××，所以所以要掛一個代理才能順利註冊，因為註冊的時候需要有一個google的驗證插件。2.修改鏡像名稱前方高能：

Kitematic - VirtualBox is not installed. Docker for windows 10

com box spa issues delet virt docke pan win Kitematic - VirtualBox is not installed. Docker for windows 10 https://github.com/docker/kit

Docker for Windows安裝與Linux+PHP開發環境搭建（二）

Docker for Windows安裝與Linux+PHP開發環境搭建（二）上一篇講了docker安裝與環境搭建的步驟，這一次主要是介紹過程中遇到的錯誤情形及其錯誤處理方法： 1）.執行docker pull local.registry.com:5000/php 或其他連線本地

Docker for Windows安裝與Linux+PHP開發環境搭建（一）

Docker是什麼? 簡單得來說，Docker是一個由GO語言寫的程式執行的“容器”(Linux containers， LXCs); 目前雲服務的基石是作業系統級別的隔離，在同一臺物理伺服器上虛擬出多個主機。Docker則實現了一種應用程式級別的隔離; 它改變我們基本的開發、操作單元，

docker學習筆記：簡單構建Dockerfile【Docker for Windows】

參考與入門推薦：https://www.cnblogs.com/ECJTUACM-873284962/p/9789130.html#autoid-0-0-9 最近學習docker，寫一個簡單構建Dockerfile的筆記。我的系統：Windows 10 Docker版本：Docker for Win

使用Docker執行spark

獲取docker映象 sudo docker pull sequenceiq/spark:1.6.0 執行docker容器 sudo docker run -it --name spark --rm sequenceiq/spark:1.6.0 /bin/bash 執行作

docker for mac 建立私有倉庫

拉取映象 docker pull registry 執行registry run -d -p 5000:5000 -v /Users/huangenai/docker/registry:/var/lib/registry registry -d後臺執行

docker for mac 創建私有倉庫

index left 0.0.0.0 log 本地 int bsp 找到 cat 拉取鏡像 docker pull registry 運行registry run -d -p 5000:5000 -v /Users/huangenai/docker/registry

基於Docker的Spark環境搭建理論部分

1.映象製作方案我們要使用Docker來搭建hadoop,spark,hive及mysql叢集，首先使用Dockerfile製作映象，把相關的軟體拷貝到約定好的目錄下，把配置檔案在外面先配置好，再使用docker and / docker run，拷貝移動到hadoop,spark

docker for spark

相關推薦