淺談spark yarn模式的問題除錯

阿新 • • 發佈：2019-01-26

spark執行的時候，有可能發生崩潰，而在spark console裡面看到的堆疊，很可能不是發生問題的實際堆疊，這個時候需要看yarn日誌來定位問題。

我在除錯spark程式的時候，採用如下命令啟動spark驅動程式：

/usr/local/spark-1.3.1-bin-hadoop2.6/bin/spark-submit --supervise --class spark_security.Sockpuppet --name "testperf" --executor-memory 4096M --num-executors 8 --driver-memory 8096M --master yarn-client /home/www/spark_Security-1.0-SNAPSHOT.jar

這個時候報如下錯誤：

15/07/03 14:35:01 INFO scheduler.DAGScheduler: Stopping DAGScheduler
15/07/03 14:35:01 INFO scheduler.DAGScheduler: Job 10 failed: foreachRDD at Sockpuppet.scala:80, took 2.226514 s
15/07/03 14:35:01 INFO scheduler.DAGScheduler: Stage 20 (map at Sockpuppet.scala:57) failed in 2.192 s
15/07/03 14:35:01 INFO cluster.YarnClientSchedulerBackend: Shutting down all executors
15/07/03 14:35:01 INFO cluster.YarnClientSchedulerBackend: Asking each executor to shut down
15/07/03 14:35:01 ERROR scheduler.JobScheduler: Error running job streaming job 1435905299000 ms.0
org.apache.spark.SparkException: Job cancelled because SparkContext was shut down
        at org.apache.spark.scheduler.DAGScheduler$$anonfun$cleanUpAfterSchedulerStop$1.apply(DAGScheduler.scala:699)
        at org.apache.spark.scheduler.DAGScheduler$$anonfun$cleanUpAfterSchedulerStop$1.apply(DAGScheduler.scala:698)
        at scala.collection.mutable.HashSet.foreach(HashSet.scala:79)
        at org.apache.spark.scheduler.DAGScheduler.cleanUpAfterSchedulerStop(DAGScheduler.scala:698)
        at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onStop(DAGScheduler.scala:1411)
        at org.apache.spark.util.EventLoop.stop(EventLoop.scala:84)
        at org.apache.spark.scheduler.DAGScheduler.stop(DAGScheduler.scala:1346)
        at org.apache.spark.SparkContext.stop(SparkContext.scala:1380)
        at org.apache.spark.scheduler.cluster.YarnClientSchedulerBackend$$anon$1.run(YarnClientSchedulerBackend.scala:143)
Exception in thread "main" org.apache.spark.SparkException: Job cancelled because SparkContext was shut down
        at org.apache.spark.scheduler.DAGScheduler$$anonfun$cleanUpAfterSchedulerStop$1.apply(DAGScheduler.scala:699)
        at org.apache.spark.scheduler.DAGScheduler$$anonfun$cleanUpAfterSchedulerStop$1.apply(DAGScheduler.scala:698)
        at scala.collection.mutable.HashSet.foreach(HashSet.scala:79)
        at org.apache.spark.scheduler.DAGScheduler.cleanUpAfterSchedulerStop(DAGScheduler.scala:698)
        at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onStop(DAGScheduler.scala:1411)
        at org.apache.spark.util.EventLoop.stop(EventLoop.scala:84)
        at org.apache.spark.scheduler.DAGScheduler.stop(DAGScheduler.scala:1346)
        at org.apache.spark.SparkContext.stop(SparkContext.scala:1380)
        at org.apache.spark.scheduler.cluster.YarnClientSchedulerBackend$$anon$1.run(YarnClientSchedulerBackend.scala:143)
15/07/03 14:35:01 INFO cluster.YarnClientSchedulerBackend: Stopped
15/07/03 14:35:01 INFO scheduler.OutputCommitCoordinator$OutputCommitCoordinatorActor: OutputCommitCoordinator stopped!
15/07/03 14:35:01 INFO spark.MapOutputTrackerMasterActor: MapOutputTrackerActor stopped!
15/07/03 14:35:01 INFO storage.MemoryStore: MemoryStore cleared
15/07/03 14:35:01 INFO storage.BlockManager: BlockManager stopped

可是在我的驅動程式中，實在是沒有出錯導致異常的地方。這個時候我採用如下命令

yarn logs -applicationId application_1436175803684_0004 >execption

看了一下yarn日誌。

yarn中出錯資訊有2個，第一個是如下堆疊資訊：

 at org.apache.hadoop.util.Shell.runCommand(Shell.java:538)
        at org.apache.hadoop.util.Shell.run(Shell.java:455)
        at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:715)
        at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:211)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)
        at java.util.concurrent.FutureTask.run(FutureTask.java:262)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
        at java.lang.Thread.run(Thread.java:745)

第二個是如下錯誤：

15/07/06 10:49:54 ERROR executor.CoarseGrainedExecutorBackend: RECEIVED SIGNAL 15: SIGTERM

我最先根據

ERROR executor.CoarseGrainedExecutorBackend: RECEIVED SIGNAL 15: SIGTERM

這條出錯資訊查詢解決方案，嘗試了各種解決方案，花費了很長的時間，問題還是沒有解決。

然後根據yarn裡面的這條堆疊資訊：

at org.apache.hadoop.util.Shell.runCommand(Shell.java:538)
        at org.apache.hadoop.util.Shell.run(Shell.java:455)
        at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:715)
        at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:211)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)
        at java.util.concurrent.FutureTask.run(FutureTask.java:262)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
        at java.lang.Thread.run(Thread.java:745)

找到了解決方案，問題的原因是hdp版本不對，在spark-defaults.conf檔案裡面加上如下兩行：

spark.driver.extraJavaOptions -Dhdp.version=2.2.0.0–2041
spark.yarn.am.extraJavaOptions -Dhdp.version=2.2.0.0–2041

問題解決

總結一下：

1. 當spark console列印的堆疊很可能只是表面現象，導致問題出現的堆疊資訊很可能在yarn的日誌裡面

2. yarn日誌裡面的堆疊錯誤，要優先排查解決

淺談spark yarn模式的問題除錯

spark執行的時候，有可能發生崩潰，而在spark console裡面看到的堆疊，很可能不是發生問題的實際堆疊，這個時候需要看yarn日誌來定位問題。我在除錯spark程式的時候，採用如下命令啟動spark驅動程式： /usr/local/spark-1

spark-yarn 模式 jar包優化

spark 大數據 hadoop yarn在yarn模式下，會上傳jar包到yarn來執行spark程序，如果每次都上傳，很耗時間，而且如果是阿裏雲的機器，上傳很慢，180m的jar要上傳十幾分鐘，所以要提前上傳到hdfs中去。spark支持如下幾個參數spark.yarn.jars：只能指定具體jar包，在

淺談Spark算子

oss qrc com 類型 guide sha spa ng- align RDD的操作類型分為兩類：? Transformation，根據原有的RDD創建一個新的RDD? actions，對RDD操作後把結果返回給driver Transfrmation操作是延遲的，

淺談js設計模式之發布 — 命令模式

刪除常見設計程序體會 span 一個發送正在是什麽命令模式最常見的應用場景是：有時候需要向某些對象發送請求，但是並不知道請求的接收者是誰，也不知道被請求的操作是什麽。此時希望用一種松耦合的方式來設計程序，使得請求發送者和請求接收者能夠消除彼此之間的耦合關系。

淺談js設計模式 — 享元模式

func 參數如何 del 如果性能優化情況 under 核心享元（flyweight）模式是一種用於性能優化的模式，“fly”在這裏是蒼蠅的意思，意為蠅量級。享元模式的核心是運用共享技術來有效支持大量細粒度的對象。假設有個內衣工廠，目前的產品有 50種男式內衣和

淺談資料庫三大模式

1外模式 -2 概念模式 -3內模式 1、外模式對應資料庫的升級、外模式包括（子模式使用者模式）用來描述使用者看到或者使用那部分的資料的邏輯結構，使用者根據外模式使用者資料操作語句或者程式去操作資料庫中的資料，外模式的主要特點用來描述組成使用者檢視各個記錄的組成、相互

淺談Python設計模式 - 代理模式

　　宣告：本系列文章主要參考《精通Python設計模式》一書，並且參考一些資料，結合自己的一些看法來總結而來。　　一、在某些應用中，我們想要在訪問某個物件之前執行一個或者多個重要的操作，例如，訪問敏感資訊 -- 在允許使用者訪問敏感資訊之前，我們希望確保使用者具備足夠的去許可權。同時

Android-淺談沉浸式模式

背景那是一個寒冷的季節，“沉浸式”這個詞悄然對映進我的腦海。看著它那高階大氣的樣式，頓時感覺自己眼前一亮，如此高階大氣的設計怎能不學，怎能不用呢？作用眾所周知，“沉浸式”是google在Android4.4推出的一種新模式，可以使APP最上方的顯示系統訊息的狀態列（Status Ba

淺談裝飾者模式+JAVA I/O中的裝飾者模式

1. 裝飾者模式舉個栗子，假如在一家飲料店中有兩種飲料，分別是奶茶和咖啡，相對的有三種調料，蜂蜜、塊糖和摩卡，這樣消費者就有不同的消費組合，比如加糖摩卡咖啡、蜂蜜摩卡咖啡，加糖奶茶......如果飲料的種類或者調料的種類增多，那麼消費組合就會相應的增多，反映到程式設計程式碼上就會出現“類爆炸”

淺談MVC設計模式

1、MVC設計模式：如圖所示，MVC模式（Model-View-Controller）是軟體工程中的一種軟體架構模式，把軟體系統分為三個基本部分：模型（Model）、檢視（View）和控制器（Controller）。MVC模式最早為Trygve Reensk

淺談程式碼規範&&基礎除錯&&幾道面試題

廢話篇：本文由CSUST的FINAL實驗室的LX創作，用途是給予CSUST的小鮮肉們一些關於C語言程式碼規範的一些基本知識，若本文有什麼錯誤或是表述不清之處，歡迎留言討論指正。程式碼規範：在講程式碼規範之前，我想給大家看一句感人肺腑的註釋名言來告誡各位以後的優秀程

淺談Java設計模式——單例模式

一、概述單例模式主要是為了避免因為建立了多個例項造成資源的浪費，且多個例項由於多次呼叫容易導致結果出現錯誤，而使用單例模式能夠保證整個應用中有且只有一個例項。二、定義定義：只

淺談Java設計模式——簡單工廠模式

一、定義通過專門定義一個類來負責建立其他類的例項，被建立的例項通常都具有共同的父類。二、類圖三、理解 Operation為抽象類，它定義了一個抽象方法getResult；OperationAdd和OperationSubtra

淺談Java設計模式——抽象工廠模式(AbstractFactory)

一、對比簡單工廠模式、工廠方法模式簡單工廠模式只通過一個工廠類，通過給定引數返回相應的例項物件。工廠方法模式只有一個抽象產品類，而抽象工廠模式有多個。工廠方法模式的具體工廠類只能建立一個具體產品類的例項，而抽象工廠模式可以建立多個。普通工廠產出是一個產

淺談Java設計模式——建造者模式(Builder)

一、概述將一個複雜物件的構建與它的表示分離，使得同樣的構建過程可以建立不同的表示。建造者模式將複雜產品的構建過程封裝分解在不同的方法中，使得建立過程非常清晰，能夠讓我們更加精確的控制複雜產品物件的建立過程，同時它隔離了複雜產品物件的建立

淺談Java設計模式——原型模式(Prototype)

一、概述用原型例項指定建立物件的種類，並且通過拷貝這些原型建立新的物件。二、使用場景 1.當一個系統應該獨立於它的產品建立、構成和表示時。 2.當要例項化的類是在執行時刻指定時，例如，通過動態裝載。 3.為了避免建立一個與產品類層次平行的工廠類

淺談Java設計模式——介面卡模式(Adapter)

一、概述將一個類的介面轉換成客戶希望的另外一個介面。Adapter模式使得原本由於介面不相容而不能一起工作的那些類可以一起工作。在我們的應用程式中我們可能需要將兩個不同介面的類來進行通訊，在不修改這兩個的前提下我們可能會需要某個中介軟體來完成這個銜接的過程

淺談Java設計模式——組合模式(Composite)

一、概述將物件組合成樹形結構以表示"部分-整體"的層次結構。"Composite使得使用者對單個物件和組合物件的使用具有一致性。它定義瞭如何將容器物件和葉子物件進行遞迴組合，使得客戶在使用的過程中無須進行區分，可以對他們進行一致的處理。在使用組合模式中需要

淺談Java設計模式——外觀模式(facade)

一、概述為子系統中的一組介面提供一個一致的介面，Facade模式定義了一個高層介面，這個介面使得這一子系統更加容易使用。我們都知道類與類之間的耦合越低，那麼可複用性就越好，如果兩個類不必彼此通訊，那麼就不要讓這兩個類發生直接的相互關係，如果需要呼叫裡面的方

淺談Java設計模式——享元模式(Flyweight)

一、概述運用共享技術有效地支援大量細粒度的物件。在一個系統中物件會使得記憶體佔用過多，特別是那些大量重複的物件，這就是對系統資源的極大浪費。享元模式對物件的重用提供了一種解決方案，它使用共享技術對相同或者相似物件實現重用。享元模式就是執行共享技術有效地支援

淺談spark yarn模式的問題除錯

相關推薦