1. 程式人生 > >Hive中的資料模型

Hive中的資料模型

Hive 中主要包括 4 種資料模型:表(Table)外部表(External Table)分割槽(Partition)以及 桶(Bucket)

Hive 的表和資料庫中的表在概念上沒有什麼本質區別,在 Hive 中每個表都有一個對應的儲存目錄。

外部表指向已經在 HDFS 中存在的資料,也可以建立分割槽。

Hive 中的每個分割槽都對應資料庫中相應分割槽列的一個索引,但是其對分割槽的組織方式和傳統關係資料庫不同。

桶在指定列進行 Hash 計算時,會根據雜湊值切分資料,使每個桶對應一個檔案。