1. 程式人生 > >20180604早課記錄24-Hive

20180604早課記錄24-Hive

Hive

1. hive數據分為哪兩塊?分別存儲在哪?

元數據和數據本身; mysql等關系型數據庫 和 hdfs

2. hive的建表SQL語句你們覺得裏有哪些內容?(不光光是字段的定義)

定義分區,分隔字符,內外表之分

3. 默認的換行符和分割符是什麽?

/t /r

4. 加載數據或本地數據到hive表或者覆蓋hive表,語法是什麽?

LOAD DATA LOCAL INPATH ‘xxx‘ OVERWRITE INTO TABLE xxxx;

5.hive的執行引擎是mr,請問哪種hive SQL是觸發mr job的

帶聚合函數,某些insert,還有create table as select

6. create table a as select * from b; 你們覺得有沒有mr job?

7. 談談你們對分區表的理解? 怎樣定義的,怎樣加載數據,怎麽查詢

定義:CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加載數據:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"

OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month=‘2017-12‘);
查詢:select * from test1.order_created_partition
where event_month=‘2017-12‘;

8. 靜態分區表和動態分區表是什麽區別?

靜態只能自己手動建立分區表 動態可以設置分區字段然後自動分區

9. 查看函數的是什麽語法?

desc function xxx

10. (拓展題)hive一般我們用來做數據插入和追加,不會去更新刪除數據,那麽hive支持這種操作嗎?該加什麽參數呢?

支持

20180604早課記錄24-Hive