檢視spark任務日誌的幾種方式
阿新 • • 發佈:2019-02-20
spark執行的任務往往通過web來檢視,但是,當執行的是sparkStreaming任務時,日誌往往會很大,web檢視並不方便,因此需要定位到伺服器上去看。下面將分別介紹兩種檢視driver端和executor端日誌的方式。
一、web端日誌的檢視:
下面是四個yarn排程spark任務的web總介面:
點選第一個任務:application_1509845442132_3866 進入下面介面,右下角記錄的日誌其實就是driver端的日誌,driver端在打了馬賽克的那個節點上。
另外我們還可以檢視executor節點上的日誌。上圖開啟applicationMaster將跳轉到spark的任務排程總介面
點開executor後可以看到四個executor,和一個driver。日誌見右側。stdout是自己定義println的輸出日誌,stderr是spark輸出的規範日誌。
二、伺服器端日誌檢視
sparkStreaming的任務日誌往往很大,web檢視並不方便。因此需要我們定位到伺服器上檢視。前面web可以看到那個節點是driver。driver端的日誌一般在如下目錄:/yarn/container-logs/
萬一不知道具體在哪個目錄,可以直接find下: find / -name "application_1509845442132_3866"
對應的executor日誌同樣用此方式在伺服器上找。