20180604早課記錄24-Hive
阿新 • • 發佈:2018-06-07
Hive1. hive數據分為哪兩塊?分別存儲在哪?
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month=‘2017-12‘);
查詢:select * from test1.order_created_partition
where event_month=‘2017-12‘;
元數據和數據本身; mysql等關系型數據庫 和 hdfs
2. hive的建表SQL語句你們覺得裏有哪些內容?(不光光是字段的定義)
定義分區,分隔字符,內外表之分
3. 默認的換行符和分割符是什麽?
/t /r
4. 加載數據或本地數據到hive表或者覆蓋hive表,語法是什麽?
LOAD DATA LOCAL INPATH ‘xxx‘ OVERWRITE INTO TABLE xxxx;
5.hive的執行引擎是mr,請問哪種hive SQL是觸發mr job的
帶聚合函數,某些insert,還有create table as select
6. create table a as select * from b; 你們覺得有沒有mr job?
有
7. 談談你們對分區表的理解? 怎樣定義的,怎樣加載數據,怎麽查詢
定義:CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加載數據:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
PARTITION (event_month=‘2017-12‘);
查詢:select * from test1.order_created_partition
where event_month=‘2017-12‘;
8. 靜態分區表和動態分區表是什麽區別?
靜態只能自己手動建立分區表 動態可以設置分區字段然後自動分區
9. 查看函數的是什麽語法?
desc function xxx
10. (拓展題)hive一般我們用來做數據插入和追加,不會去更新刪除數據,那麽hive支持這種操作嗎?該加什麽參數呢?
支持
20180604早課記錄24-Hive