spark中webUI的啟動、除錯、配置歷史伺服器，spark-Master-HA等

阿新 • • 發佈：2019-02-11

Spark WEBUI
【Jobs,Stages,StorageLevel,Environment,Executors,SQL,Streaming 】
4040埠可以看到當前application中的所有的job,點選job可以看到當前job下對應的stage,點選stage出現stage下的task。

上傳檔案：

hdfs dfs -put /root/test/words /spark/data/

進入到Scala程式設計：去bin目錄下：

./spark-shell --master spark://node01:7077

8080：sparkmaster

7077:sparkmaster提交的埠

8081：sparkworker的webUI埠

4040：web的埠

執行（必須要在active狀態下啟動）：

sc.textFile("hdfs://node01:8080/spark/data/words").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect()

Local：預設的是1

叢集，預設的是2

定義：

Val Rdd1= sc.textFile("hdfs://node01:8080/spark/data/words")

觸發執行：

Rdd1.cache()

Cache是一個懶運算元，需要觸發：

Rdd1.count()

Reducebykey:預聚合的

解除安裝清空記憶體：

Rdd1.unpersist(),解除安裝掉記憶體中的資料

提交：

./spark-shell --master spark://node01:7077 --conf spark.eventLog.enabled=true --conf spark.eventlog.dir=hdfs://node01:8080/spark/log --name aaa

在這之前需要在spark資料夾下建立log檔案

./spark-shell --master spark://node01:7077 --name bbb

檢視歷史，在sbin目錄下：

./start-history-server.sh

18080：歷史伺服器的埠

8088：yarn的埠

8080：spark叢集的master埠

7077：spark提交的時候的埠號

4040：option的埠

6379：redis的埠

設定以壓縮格式儲存：

在conf目錄下：

Spark-dafaults.conf檔案下：

壓縮格式儲存提交：

./spark-shell --master spark://node01:7077 --name ccc

在hdfs下檢視檔案：

Hdfs dfs -cat /root/test/words

檢視歷史記錄：

首先配置：

Conf下default下：

spark.history.fs.logDirectory hdfs://node01:8080/spark/log

然後去sbin目錄下啟動：

./start-history-server

歷史伺服器埠：18080

在hdfs上檢視檔案內容：

Hdfs dfs -cat /spark/log/app-...
spark-Master-HA

基於zookeeper，在standby的條件下的，與yarn，等無關

在conf下的spark-env.sh檔案下設定：

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dsp

ark.deploy.zookeeper.url=node02:2181,node03:2181,node04:2181 -Dspark.deploy.zookeeper.dir=/MasterHA0723"

複製分發：

scp ./spark-env.sh node04:`pwd`

在node01下

啟動所有

在node02下設定master為node02，並單獨啟動master

這樣：node01為alive

Node02為standby備用

當node01被掛了的時候，node02起來頂替

啟動執行：

./spark-submit --master spark://node01:7077,node02:707

7 --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 100

Master啟動起來之後，都是driver和executor之間活動，master之間的來回切換不影響

spark中webUI的啟動、除錯、配置歷史伺服器，spark-Master-HA等

spark中webUI的啟動、除錯、配置歷史伺服器，spark-Master-HA等

VS中生成、清理專案、除錯、開始執行（不除錯）、Debug 和 Release等之間的差別

idea使用總結-快捷鍵、除錯及配置

JAVA WEB快速入門之從編寫一個JSP WEB網站了解JSP WEB網站的基本結構、除錯、部署

HTTPS配置入門：Nginx、Node.js配置HTTPS伺服器

iOS開發-追蹤異常、除錯、檢查記憶體洩漏

python學習-基礎-錯誤、除錯、測試

Xamarin 跨移動端開發系列（01） -- 搭建環境、編譯、除錯、部署、執行

全面解析HTTP/2：歷史、特性、除錯、效能

ssh連線上騰訊雲、華為雲Linux伺服器，一會就自動斷開

win10中使用vmware安裝ubuntu並配置java伺服器

linux配置resin伺服器，啟動專案

Asp.net中Web.config連線字串及配置資料庫sqlserver，詳細

解決VB可執行程式啟動錯誤: "應用程式配置不正確，應用程式未能啟動"

android中的五大布局(控件的容器，可以放button等控件)

啟動YARN，並執行MapReduce程式，歷史伺服器，日誌聚集

Centos7 配置DHCP伺服器，電腦可以獲取IP，手機卻無法獲取IP

Hadoop配置歷史伺服器及日誌聚合

oracle資料庫客戶端安裝完後，配置環境變數，安裝檢查jdk等，讓客戶端能連線上資料庫的流程

Eclipse配置Tomcat伺服器，通用方法

spark中webUI的啟動、除錯、配置歷史伺服器，spark-Master-HA等

相關推薦