Hive靜態分區和動態分區

阿新 • • 發佈：2018-09-27

出了 nat .net load data ide 沒有 -- 靜態 tab

一、靜態分區
1、創建分區表

1 hive (default)> create table order_mulit_partition(
2               > order_number string,
3               > event_time string
4               > )
5               > PARTITIONED BY(event_month string, step string)
6               > row format delimited fields terminated by ‘ 
\t‘;

2、加載數據到分區表

1 load data local inpath ‘/opt/data/order_created.txt‘ overwrite into table order_mulit_partition PARTITION(event_month=‘201405‘, step=‘1‘);

order_created.txt內容如下

1  order_number           event_time 
2 10703007267488  2014-05-01 06:01:12.334+01
3 10101043505096  2014-05-01 07:28:12.342+01
4 10103043509747 
  2014-05-01 07:50:12.33+01
5 10103043501575  2014-05-01 09:27:12.33+01
6 10104043514061  2014-05-01 09:03:12.324+01

3、這種手動指定分區加載數據，就是常說的靜態分區的使用。但是在日常工作中用的比較多的是動態分區。

二、動態分區
需求：按照不同部門作為分區導數據到目標表
以上需求如果用靜態分區的話，數據量大你是不是很懵逼？？所以這個需求一般采用動態分區來實現。
1、創建目標表

 1 hive (default)> create table emp_dynamic_partition(
 2               > empno int 
, 
 3               > ename string, 
 4               > job string, 
 5               > mgr int, 
 6               > hiredate string, 
 7               > sal double, 
 8               > comm double)
 9               > PARTITIONED BY(deptno int)
10               > row format delimited fields terminated by ‘\t‘;

2、采用動態方式加載數據到目標表
加載之前先設置一下下面的參數

1 hive (default)> set hive.exec.dynamic.partition.mode=nonstrict

開始加載

1 insert into table emp_dynamic_partition partition(deptno)
2 select empno , ename , job , mgr , hiredate , sal , comm, deptno from emp;

上面加載數據方式並沒有指定具體的分區，只是指出了分區字段。在select最後一個字段必須跟你的分區字段，這樣就會自行根據deptno的value來分區。

3、驗證一下
有值

 1 hive (default)> select * from emp_dynamic_partition;
 2 OK
 3 emp_dynamic_partition.empno     emp_dynamic_partition.ename     emp_dynamic_partition.job       emp_dynamic_partition.mgr       emp_dynamic_partition.hiredate     emp_dynamic_partition.sal       emp_dynamic_partition.comm      emp_dynamic_partition.deptno
 4 7782    CLARK   MANAGER 7839    1981-6-9        2450.0  NULL    10
 5 7839    KING    PRESIDENT       NULL    1981-11-17      5000.0  NULL    10
 6 7934    MILLER  CLERK   7782    1982-1-23       1300.0  NULL    10
 7 7369    SMITH   CLERK   7902    1980-12-17      800.0   NULL    20
 8 7566    JONES   MANAGER 7839    1981-4-2        2975.0  NULL    20
 9 7788    SCOTT   ANALYST 7566    1987-4-19       3000.0  NULL    20
10 7876    ADAMS   CLERK   7788    1987-5-23       1100.0  NULL    20
11 7902    FORD    ANALYST 7566    1981-12-3       3000.0  NULL    20
12 7499    ALLEN   SALESMAN        7698    1981-2-20       1600.0  300.0   30
13 7521    WARD    SALESMAN        7698    1981-2-22       1250.0  500.0   30
14 7654    MARTIN  SALESMAN        7698    1981-9-28       1250.0  1400.0  30
15 7698    BLAKE   MANAGER 7839    1981-5-1        2850.0  NULL    30
16 7844    TURNER  SALESMAN        7698    1981-9-8        1500.0  0.0     30
17 7900    JAMES   CLERK   7698    1981-12-3       950.0   NULL    30
18 8888    HIVE    PROGRAM 7839    1988-1-23       10300.0 NULL    NULL

有分區（自動分區）

1 hive (default)> show partitions emp_dynamic_partition;
2 OK
3 partition
4 deptno=10
5 deptno=20
6 deptno=30
7 deptno=__HIVE_DEFAULT_PARTITION__
8 Time taken: 0.29 seconds, Fetched: 4 row(s)

4、emp表的具體你內容如下

 1 hive (default)> select * from emp;
 2 OK
 3 emp.empno       emp.ename       emp.job emp.mgr emp.hiredate    emp.sal emp.comm        emp.deptno
 4 7369    SMITH   CLERK   7902    1980-12-17      800.0   NULL    20
 5 7499    ALLEN   SALESMAN        7698    1981-2-20       1600.0  300.0   30
 6 7521    WARD    SALESMAN        7698    1981-2-22       1250.0  500.0   30
 7 7566    JONES   MANAGER 7839    1981-4-2        2975.0  NULL    20
 8 7654    MARTIN  SALESMAN        7698    1981-9-28       1250.0  1400.0  30
 9 7698    BLAKE   MANAGER 7839    1981-5-1        2850.0  NULL    30
10 7782    CLARK   MANAGER 7839    1981-6-9        2450.0  NULL    10
11 7788    SCOTT   ANALYST 7566    1987-4-19       3000.0  NULL    20
12 7839    KING    PRESIDENT       NULL    1981-11-17      5000.0  NULL    10
13 7844    TURNER  SALESMAN        7698    1981-9-8        1500.0  0.0     30
14 7876    ADAMS   CLERK   7788    1987-5-23       1100.0  NULL    20
15 7900    JAMES   CLERK   7698    1981-12-3       950.0   NULL    30
16 7902    FORD    ANALYST 7566    1981-12-3       3000.0  NULL    20
17 7934    MILLER  CLERK   7782    1982-1-23       1300.0  NULL    10
18 8888    HIVE    PROGRAM 7839    1988-1-23       10300.0 NULL    NULL

--------------------- 本文來自 A_ChunUnique 的CSDN 博客，全文地址請點擊：https://blog.csdn.net/Gavin_chun/article/details/78174492

Hive靜態分區和動態分區

Hive的靜態分區和動態分區

操作 mage 分區 ive 作者 over rom for top 作者：Syn良子出處：http://www.cnblogs.com/cssdongl/p/6831884.html 轉載請註明出處雖然之前已經用過很多次hive的分區表，但是還是找時間快速回顧總結一下

Hive靜態分區和動態分區

出了 nat .net load data ide 沒有 -- 靜態 tab 一、靜態分區 1、創建分區表 1 hive (default)> create table order_mulit_partition( 2 >

mysql分表和表分區詳解

sql char 根據 blank 服務端 lpad one urn 聯系為什麽要分表和分區？日常開發中我們經常會遇到大表的情況，所謂的大表是指存儲了百萬級乃至千萬級條記錄的表。這樣的表過於龐大，導致數據庫在查詢和插入的時候耗時太長，性能低下，如果涉及聯合查詢的情況，性

fdisk分區和parted分區增加SWAP空間 CDN分布式緩存的作用

width 設備幫助 and 一次 ted 環境 inux運維邏輯分區作者：歸檔：學習筆記2016/6/27 本章正題：磁盤分區1.1 磁盤分區表1.1.1 MBR主引導記錄（引導系統啟動）位置：位於0磁頭，0磁道，1扇區的前446字節 MBR446字

(轉)linux磁盤分區fdisk分區和parted分區

http tab gpo xtend parted分區 bsp 目錄 pla ssa 原文：http://www.cnblogs.com/jiu0821/p/5503660.html ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

leetcode 53. 最大子序和（分治法和動態規劃）

給定一個整數陣列 nums ，找到一個具有最大和的連續子陣列（子陣列最少包含一個元素），返回其最大和。示例:輸入: [-2,1,-3,4,-1,2,1,-5,4], 輸出: 6 解釋: 連續子陣列 [4,-1,2,1] 的和最大，為 6。進階:如果你已經實現複雜度為 O(n

靜態鏈接和動態鏈接

動態 sta class 實例 -i 操作 tdi -a usr 1.實例代碼 //add.c#include"tmath.h" int tadd(int x,int y) { return x+y; } int tsub(int x,int y) {

Java中靜態變量和動態變量

.com pan 1-1 一道 args ict print stat 類的加載這是我面試遇到的一道題，題目如下： 1 public class StaticTest { 2 private static int b = 1; 3 priv

linux 靜態鏈接和動態鏈接

g++ -o 允許合並動態打包成 font 符號初始鏈接一個可執行目標文件的生成需要經過預編譯（g++ -E）、編譯（g++ -S）、匯編（g++ -c）、鏈接四個步驟。鏈接是將多個可重定位目標文件合並到一個目標文件的過程。鏈接由鏈接器完成，鏈接器重要

靜態綁定和動態綁定

運行期 end bug new sin spa clas clu cout /**************************************************************************** 靜態綁定：對象在聲明時采用

工作區和暫存區

res 文本 reset osi master 更改所有系統解釋 Git和其他版本控制系統如SVN的一個不同之處就是有暫存區的概念。先來看名詞解釋。工作區（Working Directory）就是你在電腦裏能看到的目錄，比如我的learngit文件夾就是一個工作

泊松分布和指數分布：10分鐘教程

一個 poi 函數生活 ebooks 網站最可 note 14. 本文轉載自：http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html 大學時，我一直覺得統計學很難，還差點掛科。工作以後

JSP 靜態導入和動態導入的區別

har 文件傳遞 tle span 文件包含的區別參數名稱名稱　　靜態導入是使用scriptlet語法導入 <%@include file="文件路徑" %> 　　靜態導入是先把文件包含進來然後一起編譯，可能會導致重復定義變量報錯　　動態導

了解Git的工作區和暫存區

mas 新建 osi alt tro 而是 track 指針由於 Git有工作區，暫存區之分。 1.工作區我們電腦上的某個被Git管理的文件夾，就是一個工作區。比如說我的GitWorkText文件夾，如圖： 2.版本庫（Repository）在工作區有一個隱藏目

物理分頁和邏輯分頁

mysql數據庫只需要能夠占用 lis list集合實時性空間集合一、概述 1、物理分頁物理分頁依賴的是某一物理實體，這個物理實體就是數據庫，比如MySQL數據庫提供了limit關鍵字，程序員只需要編寫帶有limit關鍵字的SQL語句，數據庫返回的就是分頁結

jsp裏面include的靜態導入和動態導入的區別

class false lin 目標 target span line head cat 靜態導入就是將被導入頁面完全融入到導入的頁面中；而動態導入只是在servlet裏面插入了include方法，導入的這是被導入頁面的body標簽裏面的內容 1、什麽是靜態導入？靜態導入

MyBatis學習——第五篇（手動分頁和pagehelper分頁實現）

1：專案場景介紹在專案中分頁是十分常見的功能，一般使用外掛實現分頁功能，但是在使用外掛之前我們首先手動寫出分頁程式碼，發然對比外掛實現的分頁，利於我們理解分頁底層實現和更好的實現外掛分頁實用技術，本次使用的外掛是PageHelper（採用都是物理分頁）在開始之前我們建立兩個表，分別是t_

工作區和暫存區（六）

Git和其他版本控制系統如SVN的一個不同之處就是有暫存區的概念。工作目錄（Working Directory）就是你在電腦裡能看到的目錄，比如我的learngit資料夾就是一個工作區，工作區有一個隱藏目錄.git。版本庫（Repository）這個不算工作區，而

用Makefile編譯靜態庫檔案和動態庫檔案

最近要用到的簽名演算法只給了一堆原始碼沒有給庫檔案，api都不好呼叫，於是嘗試著用Makefile給一堆c原始碼編譯靜態連結庫檔案和動態連結庫檔案。 Makefile檔案編輯的相關資料連結： https://www.cnblogs.com/yya

nginx作為靜態資源伺服器和動態代理的用法示例

專案描述 vue專案使用8090埠（提供頁面），java專案使用8080埠（提供ajax介面），nginx監聽80埠。此時，nginx配置如下： #java專案伺服器使用8080埠 upstream server_java { server 127.0.0.1:8080; }

Hive靜態分區和動態分區

相關推薦