1. 程式人生 > >如何使用yarn介面檢視spark job執行的情況

如何使用yarn介面檢視spark job執行的情況

如下圖所示,是一個spark任務的第一個Job,job0的執行情況。

job1的執行情況如下:


可以看到job0,job1的input不一樣,shuffle read,shuffle write的大小也不一樣,但是每個job的shuffle read是和shuffle write的大小是一樣。

現在我們探討一下job中的Input、 Output 、 shuffle read、shuffle write是代表哪些量的。

另外我發現job1的Input大小是和記憶體中快取的資料量大小是一樣的


有意思。。。