1. 程式人生 > >Hive資料壓縮

Hive資料壓縮

****幾個配置方式:
>>>MR程式
>>>mapred-site.xml
>>>hive命令列


1.Map端資料輸出壓縮
set hive.exec.compress.intermediate = true;
set mapreduce.map.output.compress = true;
set mapreduce.map.output.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;


2.Reduce端資料輸出壓縮

set hive.exec.compress.output = true;
set mapreduce.output.fileoutputformat.compress = true;
set mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;

 

然後在hive 執行sql語句即可,

可以在yarn的日誌頁面看到該job的執行引數,明顯已經發生了變化: