（8）Spark 2.0.0 檢視job 歷史日誌

阿新 • • 發佈：2019-02-10

1.引言

在使用Spark的時候，有時候我們會關注job的歷史日誌，但是在Spark中預設情況下，歷史日誌是關閉的，在本篇部落格中主要介紹一下如何啟動spark的歷史日誌。

博主的環境為：

作業系統為Centos6.7
Hadoop版本為2.6.1
Hadoop安裝目錄為：/usr/local/hadoop
HDFS的地址為：hdfs://localhost:9000
Spark的版本為：2.0.0，且Spark是偽分佈安裝。

2. 啟動Spark歷史日誌

2.1 安裝Spark

2.2 修改配置檔案`spark-defaults.conf`

//將模板檔案修改為配置檔案 

cp spark-defaults.conf.template spark-defaults.conf
//修改的配置資訊
spark.eventLog.enabled true 
//設定hdfs的目錄，需要和自己hadoop的目錄匹配
spark.eventLog.dir hdfs://localhost:9000/var/log/spark 
spark.eventLog.compress true

這裡寫圖片描述

2.3 修改配置檔案spark-env.sh

//配置檔案最後加入
export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs:/localhost:9000/var/log/spark"

這裡寫圖片描述

2.4 建立日誌目錄

Spark不會自動建立日誌資料夾，因此需要我們自己建立

//首先進入hadoop的bin目錄
cd /usr/local/hadoop/bin
//建立資料夾命令
./hadoop fs -mkdir /var
./hadoop fs -mkdir /var/log
./hadoop fs -mkdir /var/log/spark

2.5 啟動spark歷史日誌web端

//進入spark的bin目錄
cd /usr/local/spark/sbin
//如果spark叢集正在啟動，首先停止叢集
./stop-all.sh
//重新啟動叢集
./start-all.sh
//啟動job歷史埠 

./start-history-server.sh

2.6 瀏覽器檢視是否啟動成功

這裡寫圖片描述

（8）Spark 2.0.0 檢視job 歷史日誌

1.引言在使用Spark的時候，有時候我們會關注job的歷史日誌，但是在Spark中預設情況下，歷史日誌是關閉的，在本篇部落格中主要介紹一下如何啟動spark的歷史日誌。

Spark入門到精通（入門）——第二節 Spark 2.0.0 檢視job 歷史日誌

本文十分的重要，希望對大家的spark學習有一些幫助： 1 引言：在使用Spark的時候，有時候我們會關注job的歷史日誌，但是在Spark中預設情況下，歷史日誌是關閉的，在本篇部落格中主要介紹一下如何啟動spark的歷史日誌。 2 開啟歷史日誌伺服器 2.

Spark Streaming實時流處理筆記（1）——Spark-2.2.0原始碼編譯

1 下載原始碼 https://spark.apache.org/downloads.html 解壓 2 編譯原始碼參考 https://www.imooc.com/article/18419 https://spark.apache.org/docs/2.2.2/bu

Hive總結（一）Hive 2.1.0本地模式搭建教程

零．前言 Apache Hive是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張資料庫表，並提供簡單的SQL查詢功能，可以將SQL語句轉換為MapReduce任務進行執行。其優點是學習成本低，可以通過類SQL語句快速實現簡單的MapRe

初識vue 2.0（8）：vuex進階

rom 註冊簡單實例 imp module aps cti 函數 maps 主要講三部分內容： vuex模塊化 vuex命名空間 mutations和actions 模塊化由於使用單一狀態樹，應用的所有狀態會集中到一個比較大的對象，當應用變得非常復雜時

Spark RDD的預設分割槽數：（spark 2.1.0）

本文基於Spark 2.1.0版本新手首先要明白幾個配置： spark.default.parallelism：（預設的併發數）如果配置檔案spark-default.conf中沒有顯示的配置，則按照如下規則取值：

spark學習1——配置hadoop 單機模式並執行WordCount例項（ubuntu14.04 & hadoop 2.6.0）

1. 安裝SSH hadoop是採用SSH進行通訊的，此時要設定密碼為空，即不需要密碼登陸，免去每次登陸時都要輸入密碼，當叢集較大時該步驟顯得尤為重要。 $ sudo apt-get install ssh 安裝完成後啟動服務： $ /etc/init.

webpack4.0各個擊破（8）—— tapable篇

重寫方法名自動化工具 plugin event 接受 tex 出發 module webpack作為前端最火的構建工具，是前端自動化工具鏈最重要的部分，使用門檻較高。本系列是筆者自己的學習記錄，比較基礎，希望通過問題 + 解決方式的模式，以前端構建中遇到的具體需求為出發

AFNetWorking(3.0)原始碼分析（四）——AFHTTPSessionManager(2)

在上一篇部落格中，我們分析了AFHTTPSessionManager，以及它是如何實現GET/HEAD/PATCH/DELETE相關介面的。我們還剩下POST相關介面沒有分析，在這篇部落格裡面，我們就來分析一下POST相關介面是如何實現的。 multipart/form-data請

3.0 類的內建方法 3.1 類的繼承（1） 3.2 類的繼承（2）

3.0 類的內建方法所謂內部類，就是在類的內部定義的類，主要目的是為了更好的抽象現實世界。比如，汽車是一個類，汽車的地盤，輪胎也可以抽象為類，將其定義到汽車的類中，則形成內部類，更好的描述汽車類，因為底盤、輪胎是汽車的一部分建立內部類的方法和建立類的方法很相似內部類的例項化方法方法1：直接使用外部類

3.0 類的內建方法 3.1 類的繼承（1） 3.2 類的繼承（2）

3.0 類的內建方法所謂內部類，就是在類的內部定義的類，主要目的是為了更好的抽象現實世界。比如，汽車是一個類，汽車的地盤，輪胎也可以抽象為類，將其定義到汽車的類中，則形成內部類，更好的描述汽車類，因為底盤、輪胎是汽車的一部分建立內部類的方法和建立類的方法很相似內部類的例項化方

Android studio3.0對於百度地圖api開發（8）——百度地圖開發思考

隨著對於百度地圖SDK的不斷深入，對於百度地圖的基本操作以及實現，每一塊功能就像是一個個工具，他們功能不同，又能相互組合，這就為我們開發者提供了一個很好的平臺，在這個平臺，開發人員可以進行根據自己的需求進行組裝。為了更好的交流，相互學了，我也賺點積分吧！O(∩_

玩轉人工智慧（8）Python機器學習基礎庫、autoML、Apollo2.0介紹

本文前半部分介紹numpy、scipy、matplotlib、pandas、pyTorch等機器學習的基本函式庫。後半部分介紹cloud autoML和autoML Version、以及X度的Apollo 2.0/auto技術。 numpy庫是python中用來處理資料的函

IntelliJ IDEA 15線上啟用碼（破解）--License server 15.0.2本人親測

http://blog.csdn.net/liyanlei5858/article/details/54289264 上面的這種方式更簡單快捷！下面的方式不能用了，後來發現了上面的方式，而且一直在用，首推上面的方式，簡單快捷！　　最近釋出的idea 15帶來了很多的新

從0開始寫一個基於Flutter的開源中國客戶端（8）——外掛的使用

上一篇中我記錄了基於Flutter的開源中國客戶端裡網路請求和資料儲存的部分，本篇記錄的是app中外掛的使用，由於很多功能並沒有內建到Flutter中，所以我們需要引入一些外掛來幫助我們完成某些功能，比如app內網頁的載入，相簿選擇照片等。搜尋外掛包

【Python+OpenCV】Windows+Python3.6.0（Anaconda3）+OpenCV3.2.0安裝配置

注：本次安裝因為我要配的這個筆記本是win7（32bit）的，所以安裝中軟體版本的選擇就是按32位走的，我之前在win10（64bit）也裝過，實際中這個教程的方法對於win7還是win10,32位又或是64位系統是通用的，軟體版本按需選擇就行了。 1.安裝Python

【無私分享：從入門到精通ASP.NET MVC】從0開始，一起搭框架、做專案（8）許可權管理，自定義許可權，擴充套件許可權

索引簡述今天我們來做許可權的管理，這篇比較多希望新手朋友慢慢消化專案準備我們用的工具是：VS 2013 + SqlServer 2012 + IIS7.5 希望大家對ASP.NET MVC有一個初步的理解，理論性的東西我們不做過多解釋，有些地方不理解也沒關係，會用就行了，用的多了，用的

專案實訓（一）Rxjava 2.0 學習筆記

我感覺Rxjava像是一條流水線，一塊原料到來經過層層加工最後交給訂閱者，當然不處理直接交給訂閱者也可以。從基本設計（Rx1.0）來看，Observable有一個內部類例項OnSubscribe，當Observable呼叫subscribe時會呼叫這個OnS

hadoop學習（九）Hadoop2.2.0+HA+zookeeper3.4.5詳細配置過程+錯誤處理(2)

Hadoop2.2.0+HA+zookeeper3.4.5詳細配置過程+體系結構+錯誤處理(2) 這篇文章，主要是針對zookeeper和hadoop叢集的整體測試，以及自己在實際過程遇到的問題和解決思路。如有轉載，

Windows+Python3.6.0（Anaconda3）+OpenCV3.2.0安裝配置

，推薦使用Anaconda，下載地址 2. 雙擊Anaconda3-4.3.1-Windows-x64.exe一路安裝到底，中途根據自己需求改安裝位置。 3.檢查Anaconda的安裝路徑是否新增到PATH變數中，正常情況安裝時會自己新增好，可以按下面步驟新增。單擊

（8）Spark 2.0.0 檢視job 歷史日誌

1.引言

2. 啟動Spark歷史日誌

2.1 安裝Spark

2.2 修改配置檔案spark-defaults.conf

2.3 修改配置檔案spark-env.sh

2.4 建立日誌目錄

2.5 啟動spark歷史日誌web端

2.6 瀏覽器檢視是否啟動成功

相關推薦

2.2 修改配置檔案`spark-defaults.conf`