1. 程式人生 > >3、hive儲存格式

3、hive儲存格式

行式儲存

textFile

SequenceFile

 

列式儲存

優點:1、一列資料一般是同質的,利於壓縮資料,節省空間

           2、掃描時只讀其中部分列,較少io

rcFile

每4m行資料進行切分成一組,再在每個行組內按照列進行儲存

orc

每個塊是256m,優化磁碟線性讀取,通過指定編碼器確定資料型別並優化壓縮

parquet

大資料生態中通用儲存格式,使用範圍廣,適用於巢狀檔案格式