1. 程式人生 > >HIVE 語句執行 中報錯:Java heap space

HIVE 語句執行 中報錯:Java heap space

1、報錯資訊
ask with the most failures(4):
-----
Task ID:
  task_1472873234260_9322_m_000004


URL:
  http://hadoop-namenode1:8088/taskdetails.jsp?jobid=job_1472873234260_9322&tipid=task_1472873234260_9322_m_000004
-----
Diagnostic Messages for this Task:
Error: Java heap space


FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask


2、根據提示加大了 HADOOP_HEAP 設定,但是錯誤依舊;


3、後來測試中,設定 set io.sort.mb=10;  預設值是100,問題輕鬆解決;
     其他幾個引數: set hive.map.aggr=true; //在map端做部分聚合 
                          set hive.groupby.skewindata=true;//解決資料傾斜問題


4、io.sort.mb 的作用
  排序所使用的記憶體數量。
  預設值:100M,需要與mapred.child.java.opts相配 預設:-Xmx200m。
  不能超過mapred.child.java.opt設定,否則會OOM。




參考:
  1、http://www.aboutyun.com/thread-7524-1-1.html
  2、http://blog.csdn.net/sanms/article/details/11575143
  3、http://blog.sina.com.cn/s/blog_6a67b5c50100vop9.html