hive 建立/刪除/截斷表(翻譯自Hive wiki)

阿新 • • 發佈：2020-07-15

簡單的建立表

create table table_name (
  id                int,
  dtDontQuery       string,
  name              string
)

建立有分割槽的表

create table table_name (
  id                int,
  dtDontQuery       string,
  name              string
)
partitioned by (date string)

一個表可以擁有一個或者多個分割槽，每個分割槽以資料夾的形式單獨存在表文件夾的目錄下。

分割槽是以欄位的形式在表結構中存在，通過describe table命令可以檢視到欄位存在，但是該欄位不存放實際的資料內容，僅僅是分割槽的表示。

在Hive Select查詢中一般會掃描整個表內容，會消耗很多時間做沒必要的工作。有時候只需要掃描表中關心的一部分資料，因此建表時引入了partition概念。表中的一個Partition對應於表下的一個目錄,Partition就是輔助查詢，縮小查詢範圍，加快資料的檢索速度和對資料按照一定的規格和條件進行管理。

典型的預設建立表

CREATE TABLE page_view(
     viewTime INT, 
     userid BIGINT,
     page_url STRING, 
     referrer_url STRING,
     ip STRING COMMENT 'IP Address of the User')
 COMMENT 'This is the page view table'
 PARTITIONED BY(dt STRING, country STRING)
 ROW FORMAT DELIMITED
   FIELDS TERMINATED BY '\001'
   COLLECTION ITEMS TERMINATED BY '\002'
   MAP KEYS TERMINATED BY '\003'
 STORED AS TEXTFILE;

這裡建立了表page_view,有表的註釋，一個欄位ip的註釋，分割槽有兩列,分別是dt和country。

[ROW FORMAT DELIMITED]關鍵字，是用來設定建立的表在載入資料的時候，支援的列分隔符。不同列之間用一個'\001'分割,集合(例如array,map)的元素之間以'\002'隔開,map中key和value用'\003'分割。

[STORED AS file_format]關鍵字是用來設定載入資料的資料型別,預設是TEXTFILE，如果檔案資料是純文字，就是使用 [STORED AS TEXTFILE]，然後從本地直接拷貝到HDFS上，hive直接可以識別資料。

常用的建立表

CREATE TABLE login(
     userid BIGINT,
     ip STRING, 
     time BIGINT)
 PARTITIONED BY(dt STRING)
 ROW FORMAT DELIMITED
   FIELDS TERMINATED BY '\t'
 STORED AS TEXTFILE;

建立外部表

如果資料已經存在HDFS的'/user/hadoop/warehouse/page_view'上了，如果想建立表，指向這個路徑，就需要建立外部表:

CREATE EXTERNAL TABLE page_view(
     viewTime INT, 
     userid BIGINT,
     page_url STRING, 
     referrer_url STRING,
     ip STRING COMMENT 'IP Address of the User',
     country STRING COMMENT 'country of origination')
 COMMENT 'This is the staging page view table'
 ROW FORMAT DELIMITED FIELDS TERMINATED BY '\054'
 STORED AS TEXTFILE
 LOCATION '/user/hadoop/warehouse/page_view';

建立表，有指定EXTERNAL就是外部表，沒有指定就是內部表，內部表在drop的時候會從HDFS上刪除資料，而外部表不會刪除。

外部表和內部表一樣，都可以有分割槽，如果指定了分割槽，那外部表建了之後，還要修改表新增分割槽。

外部表如果有分割槽，還可以載入資料，覆蓋分割槽資料，但是外部表刪除分割槽，對應分割槽的資料不會從HDFS上刪除，而內部表會刪除分割槽資料。

指定資料庫建立表

如果不指定資料庫，hive會把表建立在default資料庫下，假設有一個hive的資料庫mydb,要建立表到mydb,如下:

CREATE TABLE mydb.pokes(foo INT,bar STRING);

或者是

use mydb; --把當前資料庫指向mydb
CREATE TABLE pokes(foo INT,bar STRING);

複製表結構

CREATE TABLE empty_table_name LIKE table_name;

根據table_name建立一個空表empty_table_name,empty_table_name沒有任何資料。

create-table-as-selectt (CTAS)

CTAS建立的表是原子性的，這意味著，該表直到所有的查詢結果完成後，其他使用者才可以看到完整的查詢結果表。

CTAS唯一的限制是目標表，不能是一個有分割槽的表，也不能是外部表。

簡單的方式

CREATE TABLE new_key_value_store
  AS 
SELECT (key % 1024) new_key, concat(key, value) key_value_pair FROM key_value_store;

複雜的方式

CREATE TABLE new_key_value_store
   ROW FORMAT SERDE "org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe"
   STORED AS RCFile AS
SELECT (key % 1024) new_key, concat(key, value) key_value_pair
FROM key_value_store
SORT BY new_key, key_value_pair;

刪除表

DROP TABLE table_name;
DROP TABLE IF EXISTS table_name;

刪除表會移除表的元資料和資料，而HDFS上的資料，如果配置了Trash，會移到.Trash/Current目錄下。

刪除外部表時，表中的資料不會被刪除。

截斷表

TRUNCATE TABLE table_name;
TRUNCATE TABLE table_name PARTITION (dt='20080808');

從表或者表分割槽刪除所有行，不指定分割槽，將截斷表中的所有分割槽，也可以一次指定多個分割槽，截斷多個分割槽。

hive 建立/刪除/截斷表(翻譯自Hive wiki)

簡單的建立表

建立有分割槽的表

典型的預設建立表

常用的建立表

建立外部表

指定資料庫建立表

複製表結構

create-table-as-selectt (CTAS)

刪除表

截斷表

hive 建立/刪除/截斷表(翻譯自Hive wiki)

用hive建立的臨時表_【悟空雲課堂】第十九期：用不安全的授權建立臨時檔案漏洞（CWE-378）...

mongodb資料庫建立刪除、表（集合）建立刪除、資料增刪改查

Hive操作——刪除表(drop、truncate)

Hive建立表時新增中文註釋後亂碼問題

hive建立表sql

011.hive建立表、新增表註釋、檢視函式用法、載入資料到hive表

電商專案實戰Hive實現-track_info分割槽表的建立

hive建立分割槽表指定分隔符_Hive建表時指定分隔符或使用多字元分隔

mysql建立刪除表的例項詳解

Hive通過Jdbc獲取表的欄位資訊

Hive數倉建表該選用ORC還是Parquet，壓縮選LZO還是Snappy？

Hive基礎（十六）：Hive的元資料表結構詳解

hive幾種建表方式

SQL批量循壞建立和刪除資料表

建立clickhouse 分散式表方式及分散式表資料增加、更新、刪除、查詢

電商專案實戰Hive實現-將ETL資料載入到Hive表中

資料庫操作-建立/刪除/表修改...

MySQL筆記2：資料庫的列型別、欄位屬性、表的建立刪除和修改

navicat刪除oracle表的操作方法

hive 建立/刪除/截斷 表(翻譯自Hive wiki)

簡單的建立表

建立有分割槽的表

典型的預設建立表

常用的建立表

建立外部表

指定資料庫建立表

複製表結構

create-table-as-selectt (CTAS)

刪除表

截斷表

相關推薦

hive 建立/刪除/截斷表(翻譯自Hive wiki)