【原創】經驗分享（20）spark job之間會停頓幾分鐘

阿新 • • 發佈：2018-12-27

今天遇到一個問題，spark應用中在一個迴圈裡執行sql，每個sql都會向一張表寫入資料，比如

insert overwrite table test_table partition(dt) select * from test_table_another;

除了執行sql沒有其他邏輯，每個sql都會對應1個job，在spark web ui上看到job和job之間會停頓幾分鐘，並且非常有規律，任何兩個job之間都會停頓，是不是很神奇？

答案揭曉：

spark在執行insert overwrite table partition的時候，分為兩個部分，一個是執行select（讀資料），一個是執行load partition（寫資料），具體詳見執行計劃；

每個sql對應1個job，這個job執行的select部分（讀資料），不包含load partition部分（寫資料），因為spark為了相容hive，直接使用hive的元資料庫，所有ddl操作都是通過反射直接呼叫hive的程式碼（spark2.1依賴的是hive1.2），這個過程並不包含在spark job中，所以看起來job執行完之後停頓了幾分鐘才執行下個job，這裡停頓的幾分鐘其實是在做load partition操作（寫資料）；

這裡還有另外一個問題，hive1.2在loadPartition刪除檔案時是序列操作，非常慢，這個問題在hive2時改為執行緒池解決，具體程式碼及問題解析詳見：

https://www.cnblogs.com/barneywill/p/10154922.html

【原創】經驗分享（20）spark job之間會停頓幾分鐘

【原創】經驗分享（20）spark job之間會停頓幾分鐘

【原創】經驗分享（15）spark sql limit實現原理

【原創】經驗分享（10）Could not transfer artifact org.apache.maven:maven. from/to central. Received fatal alert: protocol_version

【原創】經驗分享（12）如何程式化kill提交到spark thrift上的sql

【原創】經驗分享（22）檢視linux發行版以及核心版本

【原創】演算法分享（4）Cardinality Estimate 基數計數概率演算法

【原創】演算法分享（5）聚類演算法DBSCAN

【原創】案例分享（3）使用者行為分析--見證scala的強大

【原創】案例分享（4）定位分析--見證scala的強大

【原創】演算法分享（7）最小二乘法

【原創】大叔經驗分享（39）spark cache unpersist級聯操作

【原創】MapReduce實戰（一）

【原創】命令列（2）----一些伺服器命令列

【原創】java-NIO（一）阻塞IO與非阻塞IO--轉載請註明出處

【原創】java-NIO（一）阻塞IO與非阻塞IO

【原創】經驗分享：一個Content-Length引發的血案(almost....)

【原創】經驗分享：一個小小emoji盡然牽扯出來這麼多東西？

【原創】大叔經驗分享（23）hive metastore的幾種部署方式

【原創】大叔經驗分享（30）CM開啟kerberos

【原創】大叔經驗分享（38）beeline連接hiveserver2報錯impersonate

【原創】經驗分享（20）spark job之間會停頓幾分鐘

相關推薦