1. 程式人生 > >hive指定資料切分格式--row format

hive指定資料切分格式--row format

建立表時需要指定資料切分格式,會用到ROW FORMAT關鍵字。

下面是java集合框架圖,存入hive的資料就是集合中的某一種

所以在建立標的時候就可以指定分隔符:

  1. 第一個--<欄位>,由[ , ]分割----------FIELDS TERMINATED BY ','
  2. 第二個是--<Array形式>,元素與元素之間由[ - ]分割----------COLLECTION ITEMS TERMINATED BY '-'
  3. 第三個是--<K-V形式>,每組K-V對內部由[ : ]分割,每組K-V對之間由[ - ]分割----------MAP KEYS TERMINATED BY ':'
  4. 每條資料之間由換行符分割(預設[ \n ]),如果是其它分割方式(比如[ ; ])----------LINES TERMINATED BY ';'

例如:

create table student (
id sno,
name string,
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '-'
MAP KEYS TERMINATED BY ':';