hive 中的二級分割槽表和動態分割槽表

阿新 • • 發佈：2018-12-27

二級分割槽表/管理表：

 create  table emp_part1(
 empno int,
 empname string,
 empjob string,
 mgrno int,
 birthday string,
 salary float,
 bonus float,
 deptno   int
 )
 partitioned by (day string,hour string)
row format delimited fields terminated by '\t';

增加分割槽

alter table emp_part1 add partition (day 
='20170306',hour='0');

刪除分割槽

alter table emp_part1 drop partition (day='20170306',hour='0');


load data local inpath '/home/user01/emp.txt' into table emp_part1 partition (day='20170308',hour='9');

load data local inpath '/home/user01/emp.txt' into table emp_part1 partition (day='20170308',hour='10');

load data local 
 inpath '/home/user01/emp.txt' into table emp_part1 partition (day='20170308',hour='14');

load data local inpath '/home/user01/emp.txt' into table emp_part1 partition (day='20170309',hour='10');

查詢分割槽資料

select * from emp_part1 where day='20170308'

select * from emp_part1 where day='20170308' and hour='14';

查詢所有的分割槽資訊

show partitons emp_part1;

分割槽可以理解為分類，通過分類把不同型別，時間，地域的資料放到不同的目錄下。
分類的標準就是分割槽欄位，可以一個，也可以多個。
分割槽表的意義在於優化查詢。查詢時儘量利用分割槽欄位。如果不使用分割槽欄位，就會全表掃描。

動態分割槽表：多維度資料處理及查詢嚴格模式：static partitioned by (county string,states
string) 非嚴格模式：partitioned by (county string,states string)
需要設定以下引數： //是否開啟動態分割槽功能 0.13版本預設開啟

set hive.exec.dynamic.partition=true;
動態分割槽的模式，預設strict，表示必須指定至少一個分割槽為靜態分割槽，nonstrict模式表示允許所有的分割槽欄位都可以使用動態分割槽
set hive.exec.dynamic.partition.mode=nostrict;

create table dypart(
id int,
name string
)
partitioned by (addr string)
row format delimited fields terminated by '\;'; 
//使用特殊字元作為分隔符時需要轉義

//動態分割槽必須使用mapreduce才能完成，所以不能使用load方式載入
insert into table dypart partition (addr) select deptno,deptname,addr as addr from dept;

二級動態分割槽表

create external table dypart2(
empno    int,
empname string,
empjob  string,
mgrno    int,
birthday string,
salary  int,
bonus   float,
deptno  int
)
partitioned by (country string,province string)
row format delimited fields terminated by '\t'
location '/hive/dynamic/dypart2';
//location之後的目錄可以不存在，建立表會自動建立，但作為外部表推薦目錄和資料已經存在

開啟嚴格模式

set hive.exec.dynamic.partition.mode=strict;

嚴格模式中，要求主分割槽必須為靜態分割槽，輔助分割槽可以為動態

insert into table dypart2 partition (country='usa',province) select empno,empname,empjob,mgno,birthday,salary,bonus,depno,depno as province from emp;

通過子查詢方式

insert into table dypart2 partition (country='usa',province) select c.empno,c.empname,c.empjob,c.mgno,c.birthday,c.salary,c.bonus,c.depno,c.deptname as province from  (select * from emp a join dept b on a.depno=b.deptno) c;

覆蓋匯入方式，此時overwrite和into不能連用

insert overwrite  table dypart2 partition (country='china',province) select a.empno,a.empname,a.empjob,a.mgno,a.birthday,a.salary,a.bonus,a.depno,b.deptname as province from emp a join dept b on a.depno=b.deptno;

桶表：將內部表，外部表和分割槽表進一步組織成桶表可以將表的列通過Hash演算法進一步分解成不同的檔案儲存

create table test_bucket_table(
id int,
name string,
addr string
)
clustered by (id) into 4 buckets
row format delimited fields terminated by '\|';
`//強制開啟分桶
set hive.enforce.bucketing=true;
insert overwrite table test_bucket_table select * from dept;
`//若沒有使用hive.enforce.bucketing屬性, 則需要設定和分桶個數相匹配的reducer個數, 同時SELECT後新增CLUSTER BY
set mapred.reduce.tasks=4;
insert into table test_bucket_table select * from dept cluster by deptno;

hive 中的二級分割槽表和動態分割槽表

二級分割槽表/管理表： create table emp_part1( empno int, empname string, empjob string, mgrno int, bi

資料結構之靜態順序表和動態順序表

@Sock對靜態順序表和動態順序表的總結簡單概括他們的異同點相同點:記憶體空間連續, 資料順序儲存不同點:它們所佔記憶體空間的位置不同, 靜態定義一個順序表, 順序表所佔的記憶體空間開闢在記憶體的靜態區, 即所謂的函式棧上, 隨著函式呼叫的結束, 這塊記憶體區域會被系統自動

資料倉庫和hive語句中的分割槽表和分桶表

資料倉庫中從各資料來源獲取資料以及在資料倉庫內的資料轉換和流動都可以認為是ETL（抽取Extra,轉化Transfer,裝載Load）的過程,ETL是資料倉庫的流水線.資料倉庫(data warehouse)與資料庫的區別:資料倉庫(data warehouse)--

hive從查詢中獲取資料插入到表或動態分割槽

轉自：http://www.crazyant.net/1197.html Hive的insert語句能夠從查詢語句中獲取資料，並同時將資料Load到目標表中。現在假定有一個已有資料的表staged_employees（僱員資訊全量表），所屬國家cnty和所屬州st是該表

Hive中靜態分割槽和動態分割槽總結

## 目錄 - 背景 - 第一部分靜態分割槽 - 第二部分動態分割槽 - 第三部分兩者的比較 - 第四部分動態分割槽使用的問題 - 參考文獻及資料 ## 背景在`Hive`中有兩種型別的分割槽：靜態分割槽(Static Partitioning)和動態分割槽(Dynamic Partitio

Hive面試題:Hive分割槽表和分桶表的區別

分割槽在HDFS上的表現形式是一個目錄，分桶是一個單獨的檔案分割槽: 細化資料管理，直接讀對應目錄，縮小mapreduce程式要掃描的資料量分桶： 1、提高join查詢的效率（用分桶欄位做連線欄位）

一起學Hive——建立內部表、外部表、分割槽表和分桶表及匯入資料

Hive本身並不儲存資料，而是將資料儲存在Hadoop的HDFS中，表名對應HDFS中的目錄/檔案。根據資料的不同儲存方式，將Hive表分為外部表、內部表、分割槽表和分桶表四種資料模型。每種資料模型各有優缺點。通過create user命令建立user表時，會在HDFS中生成一個user目錄/檔案。外部表

內表外表區別以及靜態分割槽和動態分割槽

//內表和外表的區分刪外表表下的東西還在內表相反 CREATE EXTERNAL TABLE CITY_ex( province_code int, province_name string, city_code int, city_n

對現有Hive的大表進行動態分割槽

分割槽是在處理大型事實表時常用的方法。分割槽的好處在於縮小查詢掃描範圍，從而提高速度。分割槽分為兩種：靜態分割槽static partition和動態分割槽dynamic partition。靜態分割槽和動態分割槽的區別在於匯入資料時，是手動輸入分割槽名稱，還是通過資料來判斷資料分割槽。對於大資料批量匯入

匯入作業資料集total.csv到Hive中，用日期做為分割槽表的分割槽ID

hive> select * from t_reverse_repurchase where tradedate=='20130723' and securityid='204001' limit 10;OK145651 204001 2.65 104300 2.66 100

hive的靜態分割槽和動態分割槽

文章來自：https://blog.csdn.net/gavin_chun/article/details/78174492一、靜態分割槽 1、建立分割槽表hive (default)> create table order_mulit_partition(

Hive靜態分割槽和動態分割槽

一、靜態分割槽 1、建立分割槽表 hive (default)> create table order_mulit_partition( > order_number string, >

Hive 系列（五）—— Hive 分割槽表和分桶表

一、分割槽表 1.1 概念 Hive 中的表對應為 HDFS 上的指定目錄，在查詢資料時候，預設會對全表進行掃描，這樣時間和效能的消耗都非常大。分割槽為 HDFS 上表目錄的子目錄，資料按照分割槽儲存在子目錄中。如果查詢的 where 字句的中包含分割槽條件，則直接從該分割槽去查詢，而不是掃描整個表目錄，合

Linux中直接掛載硬碟和掛載分割槽有什麼區別？

[[email protected]_storage ~]# fdisk -l Disk /dev/sda: 21.5 GB, 21474836480 bytes 255 heads, 63 sectors/track, 2610 cylinders Units = cylinders of 160

oracle,查詢分割槽表和非分割槽表，索引對應的表空間sql

SELECT TABLESPACE_NAME FROM DBA_INDEXES WHERE INDEX_NAME = 'BUSTB_TESTRESULT_IDX1';--非分割槽表SELECT S

大資料Hive的案例、引數、動態分割槽、分桶、檢視、索引、執行方式、許可權管理、Hive的優化_03_03

一、案例：統計出掉線率最高的前10基站需求：統計出掉線率最高的前10基站資料： record_time：通話時間 imei：基站編號 cell：手機編號 drop_num：掉話的秒數duration：通話持續總秒數 1.建表 create table cell_mon

Hive的靜態分區和動態分區

操作 mage 分區 ive 作者 over rom for top 作者：Syn良子出處：http://www.cnblogs.com/cssdongl/p/6831884.html 轉載請註明出處雖然之前已經用過很多次hive的分區表，但是還是找時間快速回顧總結一下

Java中靜態變量和動態變量

.com pan 1-1 一道 args ict print stat 類的加載這是我面試遇到的一道題，題目如下： 1 public class StaticTest { 2 private static int b = 1; 3 priv

c 鏈表和動態內存分配

malloc 鏈表 all point 類型強制轉換動態內存分配使用優先級數據結構兜兜轉轉又用到了c。c的一些基本卻忘記的差不多了（笑哭）！！動態內存分配當malloc完將返回的指針類型強制轉換成想要的類型後，指針中存有該指針的數據結構，而分配的內存恰好可用於

2.2 在單鏈表和雙鏈表中刪除倒數第K個節點

刪除函數 del 另一個核心鏈表刪除倒數第k個單鏈表 dex 題目：分別實現兩個函數，一個可以刪除單鏈表中倒數第K個節點，另一個可以刪除雙鏈表中倒數第K個節點要求：如果鏈表長度為N，時間復雜度達到O(N)，額外空間復雜度達到O(1) My: 刪除單鏈表或雙鏈表中

hive 中的二級分割槽表和動態分割槽表

相關推薦