Hive學習之路（十）Hive的高級操作

阿新 • • 發佈：2018-04-11

ipc functions nes aof inpu 輸入表格開發 eat

一、負責數據類型

1、array

現有數據如下：

1 huangbo guangzhou,xianggang,shenzhen a1:30,a2:20,a3:100 beijing,112233,13522334455,500
2 xuzheng xianggang b2:50,b3:40 tianjin,223344,13644556677,600
3 wangbaoqiang beijing,zhejinag c1:200 chongqinjg,334455,15622334455,20

建表語句

use class;
 
create table cdt(
id int, 
name string, 
work_location array<string>, 
piaofang map<string,bigint>, 
address struct<location:string,zipcode:int,phone:string,value:int>) 
row format delimited 
fields terminated by "\t" 
collection items terminated by "," 
map keys terminated  
by ":" 
lines terminated by "\n";

技術分享圖片

導入數據

0: jdbc:hive2://hadoop3:10000> load data local inpath "/home/hadoop/cdt.txt" into table cdt;

查詢語句

select * from cdt;

技術分享圖片

select name from cdt;

技術分享圖片

select work_location from cdt;

技術分享圖片

select work_location[0] from cdt;

技術分享圖片

select work_location[1 
] from cdt;

技術分享圖片

2、map

建表語句、導入數據同1

查詢語句

select piaofang from cdt;

技術分享圖片

select piaofang["a1"] from cdt;

技術分享圖片

3、struct

建表語句、導入數據同1

查詢語句

select address from cdt;

技術分享圖片

select address.location from cdt;

技術分享圖片

4、uniontype

很少使用

參考資料：http://yugouai.iteye.com/blog/1849192

二、視圖

1、Hive 的視圖和關系型數據庫的視圖區別

和關系型數據庫一樣，Hive 也提供了視圖的功能，不過請註意，Hive 的視圖和關系型數據庫的數據還是有很大的區別：

　　（1）只有邏輯視圖，沒有物化視圖；

　　（2）視圖只能查詢，不能 Load/Insert/Update/Delete 數據；

　　（3）視圖在創建時候，只是保存了一份元數據，當查詢視圖的時候，才開始執行視圖對應的那些子查詢

2、Hive視圖的創建語句

create view view_cdt as select * from cdt;

技術分享圖片

3、Hive視圖的查看語句

show views;
desc view_cdt;-- 查看某個具體視圖的信息

4、Hive視圖的使用語句

select * from view_cdt;

技術分享圖片

5、Hive視圖的刪除語句

drop view view_cdt;

技術分享圖片

三、函數

1、內置函數

具體可看http://www.cnblogs.com/qingyunzong/p/8744593.html

（1）查看內置函數

show functions;

技術分享圖片

（2）顯示函數的詳細信息

desc function substr;

技術分享圖片

（3）顯示函數的擴展信息

desc function extended substr;

技術分享圖片

2、自定義函數UDF

當 Hive 提供的內置函數無法滿足業務處理需要時，此時就可以考慮使用用戶自定義函數。

UDF（user-defined function）作用於單個數據行，產生一個數據行作為輸出。（數學函數，字符串函數）

UDAF（用戶定義聚集函數 User- Defined Aggregation Funcation）：接收多個輸入數據行，並產生一個輸出數據行。（count，max）

UDTF（表格生成函數 User-Defined Table Functions）：接收一行輸入，輸出多行（explode）

　　(1) 簡單UDF示例

　　(2) JSON數據解析UDF開發

　　(3) Transform實現

四、特殊分隔符處理

1、使用RegexSerDe正則表達式解析

2、通過自定義InputFormat處理特殊分隔符

Hive學習之路（十）Hive的高級操作

ipc functions nes aof inpu 輸入表格開發 eat 一、負責數據類型 1、array 現有數據如下： 1 huangbo guangzhou,xianggang,shenzhen a1:30,a2:20,a3:100 beijing,

Hive學習之路（二）Hive安裝

different 0.10 director lar blog cut cti mysql extend Hive的下載下載地址http://mirrors.hust.edu.cn/apache/ 選擇合適的Hive版本進行下載，進到stable-2文件夾可以看到穩

Hive學習之路（一）Hive初識

完成優化 ble 缺點 ase 適合 table vol 利用 Hive 簡介什麽是Hive 1、Hive 由 Facebook 實現並開源 2、是基於 Hadoop 的一個數據倉庫工具 3、可以將結構化的數據映射為一張數據庫表 4、並提供 HQL(Hive

Hive學習之路（三）Hive元數據信息對應MySQL數據庫表

需要 pri from metastore node rom lazy 測試安裝概述 Hive 的元數據信息通常存儲在關系型數據庫中，常用MySQL數據庫作為元數據庫管理。上一篇hive的安裝也是將元數據信息存放在MySQL數據庫中。 Hive的元數據信息在MySQ

Hive學習之路（六）Hive的DDL操作

存儲位置 BE 輔助 cond 允許 param 就是文件夾 selected 庫操作 1、創建庫語法結構 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name 　　[COMMENT database_

Hive學習之路（七）Hive中文亂碼

min sta keys Coding ava eight img 字符集步驟 Hive註釋中文亂碼創建表的時候，comment說明字段包含中文，表成功創建成功之後，中文說明顯示亂碼 create external table movie( userID in

Hive學習之路（六）Hive SQL之數據類型和存儲格式

OS big api 而且好的存儲 array 文本文件字符串一、數據類型 1、基本數據類型 Hive 支持關系型數據中大多數基本數據類型類型描述示例 boolean true/false TRUE tinyint 1字

MySQL學習之路（五）MySQL高級查詢

code left 功能限定查詢外鏈接 spa size 平均數 asc MySQL統計函數　　count（）：統計數量；　　max（）：統計最大值；　　min（）：統計最小值；　　avg（）：統計平均數；　　sum（）：統計和； Select

Hive學習之路（十五）Hive分析窗口函數(三) CUME_DIST和PERCENT_RANK

select rank com ble class mina src format () 這兩個序列分析函數不是很常用，這裏也練習一下。數據準備數據格式 cookie3.txt d1,user1,1000 d1,user2,2000 d1,user3,

Hive學習之路（十八）Hive的Shell操作

int one 依次也會 not show div ble ive 遞增一、Hive的命令行 1、Hive支持的一些命令 Command Description quit Use quit or exit to leave the interactive sh

Hive學習之路（五）DbVisualizer配置連接hive

ado lan inf files AD sha comm HR 下載地址一、安裝DbVisualizer 下載地址http://www.dbvis.com/ 也可以從網上下載破解版程序，此處使用的版本是DbVisualizer 9.1.1 具體的安裝步驟可以百度，

hadoop生態系統學習之路（六）hive的簡單使用

一、hive的基本概念與原理 Hive是基於Hadoop之上的資料倉庫，可以儲存、查詢和分析儲存在 Hadoop 中的大規模資料。Hive 定義了簡單的類 SQL 查詢語言，稱為 HQL，它允許熟悉 SQL 的使用者查詢資料，允許熟悉 MapReduce 開發

HBase學習之路（十）HBase表的設計原則

建議 ima 是否屬性循環列族將在 serve sch 建表高級屬性　　下面幾個 shell 命令在 hbase 操作中可以起到很大的作用，且主要體現在建表的過程中，看下面幾個 create 屬性 1、 BLOOMFILTER 　　默認是 NONE 是否使

Scala學習之路（十）Scala的Actor

margin 編碼 source remote RR ada rpath 當前時間 mov 一、Scala中的並發編程 1、Java中的並發編程 ①Java中的並發編程基本上滿足了事件之間相互獨立，但是事件能夠同時發生的場景的需要。 ②Java中的並發編程是基於共享

C++學習之路（十）：虛繼承引入的執行效率

存取 ++ 移位繼承模型虛函數必須執行 amp 這篇文章不知道取啥名字了，暫且這樣叫，直接看場景就明白了。節選自《深度探索C++對象模型》 Point3d origin, *pt = &origin; （1）origin.x = 0; （2）pt->

JAVA基礎學習之路（十）this關鍵字

代碼學習之路 ava 老人與海 color 問題 turn urn println class Book { String name; int price; int num;//構造方法之間的互相調用解決了代碼的重復問題，但是一定要留出口

Python小白學習之路（十）—【函式】【函式返回值】【函式引數】

寫在前面：昨天早睡之後，感覺今天已經恢復了百分之八十的樣子又是活力滿滿的小夥郭今日份雞湯：我始終相信，在這個世界上，一定有另一個自己，在做著我不敢做的事，在過著我想過的生活。-------宮崎駿函式一、函數出現的背景在學習函式之前，一直遵循：面向過程程式設計，即：根據業務邏輯從上到

Python小白學習之路（十）—【函數】【函數返回值】【函數參數】

函數返回值列表默認參數 print 關鍵字內部 if條件語句 pre 提取寫在前面：昨天早睡之後，感覺今天已經恢復了百分之八十的樣子又是活力滿滿的小夥郭今日份雞湯：我始終相信，在這個世界上，一定有另一個自己，在做著我不敢做的事，在過著我想過的生活。-----

Linux 學習之路（十）：磁碟及檔案系統管理

磁碟及檔案系統管理檔案系統訪問控制列表 setfacl -b Remove all -m -k 塊點陣圖：bitmap 硬連結：多個檔案的路徑指向同一個inode號軟連結|符號連結：該檔案被硬連結的次數 drwxr-x

Android破解學習之路（十）—— 我們戀愛吧三色繪戀二次破解

前言好久沒有寫破解教程了（我不會告訴你我太懶了），找到一款戀愛遊戲，像我這樣的宅男只能玩玩戀愛遊戲感覺一下戀愛的心動了。。這款遊戲免費試玩，但是後續章節得花6元錢購買，我怎麼會有錢呢，而且身在吾愛的大家庭裡，不破解一波怎麼對得起我破解渣渣的身份呢！喲，還是支付寶購買的，直接9000大法，但是破解的時候沒

Hive學習之路 （十）Hive的高級操作

一、負責數據類型

1、array

2、map

3、struct

4、uniontype

二、視圖

1、Hive 的視圖和關系型數據庫的視圖區別

2、Hive視圖的創建語句

3、Hive視圖的查看語句

4、Hive視圖的使用語句

5、Hive視圖的刪除語句

三、函數

1、內置函數

（1）查看內置函數

（2）顯示函數的詳細信息

（3）顯示函數的擴展信息

2、自定義函數UDF

(1) 簡單UDF示例

(2) JSON數據解析UDF開發

(3) Transform實現

四、特殊分隔符處理

1、使用RegexSerDe正則表達式解析

2、通過自定義InputFormat處理特殊分隔符

相關推薦

Hive學習之路（十）Hive的高級操作

　　(1) 簡單UDF示例

　　(2) JSON數據解析UDF開發

　　(3) Transform實現