1. 程式人生 > >[Hive_8] Hive 設計優化

[Hive_8] Hive 設計優化


0. 說明

  在 Hive 中,資料庫是一個資料夾,表也是資料夾

  partition,是一個欄位,是檔案

  前提:在 Hive 進行 where 子句查詢的時候,會將條件語句和全表進行比對,搜尋出所需的資料,效能極差,partition 就是為了避免全表掃描

 

 


1. 分割槽

  1.1 建立非分割槽表 user_nopar

    create table user_nopar
    (id int, name string, age int, province string, city string)
    row format delimited
    fields terminated 
by '\t';

 

  1.2 載入資料

load data local inpath '/home/centos/files/user_nopar.txt' into table user_nopar;