Hive 表複雜型別欄位使用

阿新 • • 發佈：2021-06-28

1. Hive中複雜資料型別

　　1>. 複雜型別定義

     1.1 map結構資料定義  map<string,string>
    1.2 array結構資料定義  array<string>
    1.3 struct結構資料定義  struct<id:int,name:string,age:int>
    1.4 struct和array巢狀定義 array<struct<id:int,name:string,age:int>>

　　2>. 複雜型別資料封裝

     2.1 map型別
        map(key1,val1,key2,val2,....)               --使用map函式 

    2.2 struct型別
        struct(val1,val2,val3,..)                   --使用struct構造器函式，對應列名預設是col1,col2,col3,...
        named_struct(name1,val1,name2,val2,..)      --使用帶名稱struct構造器函式，指定對應列名
    2.3 array型別
        array(val1,val2,val3,...)
        collect_list() 函式
         collect_set()  函式

　　3>. 複雜型別資料訪問

    3.1 map
        map[key]                                    --獲取key對應的value
    3.2 struct
        struct.columnName                           --columnName代表列名
    3.3 array
        array[index]                                --index表示索引值

2. 具體使用案例

　　1>. 資料準備: 建立一個複雜型別的表+簡單型別表

CREATE TABLE test.employee(
              name STRING,
              salary FLOAT,
              subordinates ARRAY 
<string>,
              deductions MAP<string,string>,
              address ARRAY<STRUCT<stree:string,city:string,state:string,zip:int>>
            ) ROW FORMAT DELIMITED
                  FIELDS TERMINATED BY '\t'
                  COLLECTION ITEMS TERMINATED BY ','
                  MAP KEYS TERMINATED BY ':'
            STORED AS TEXTFILE;

        CREATE TABLE test.emp(
              name STRING,
              salary FLOAT,
              subord string,
              dedkey string,
              dedval FLOAT,
              stree string,
              city string,
              state string,
              zip int
            ) ROW FORMAT DELIMITED
                  FIELDS TERMINATED BY '\t'
            STORED AS TEXTFILE;
         insert into test.emp (name,salary,subord,dedkey,dedval,stree,city,state,zip) values ('u001',25000,'sub001','ded-k01',10.01,'china','beijing','use','100000');
         insert into test.emp (name,salary,subord,dedkey,dedval,stree,city,state,zip) values ('u001',25000,'sub002','ded-k02',20.02,'china-02','shanghai','use','100001');
         insert into test.emp (name,salary,subord,dedkey,dedval,stree,city,state,zip) values ('u001',25000,'sub003','ded-k03',30.03,'china-03','lanzhou','use','100002');

　　2>. 根據簡單型別表資料組裝複雜型別表中資料

　　　　 1). 使用collect_list()組裝 ARRAY<string>欄位
             select name,collect_list(subord) subordinates  from   test.emp  group by name;
                 name    subordinates
                 u001    ["sub002","sub003","sub001"]
        2). 使用collect_list()組裝 ARRAY<STRUCT<stree:string,city:string,state:string,zip:int>>欄位
            select name,collect_set(named_struct('stree',stree,'city',city,'state',state,'zip',zip)) address from  test.emp group by name;
                name    address
                u001    [{"stree":"china-02","city":"shanghai","state":"use","zip":100001},{"stree":"china-03","city":"lanzhou","state":"use","zip":100002},{"stree":"china","city":"beijing","state":"use","zip":100000}]

        3). 組裝Map型別欄位
            select name,collect_set(named_struct('dedkey',dedkey,'dedval',dedval)) page_stats from  test.emp group by name;
                u001    [{"dedkey":"ded-k02","dedval":20.02},{"dedkey":"ded-k03","dedval":30.03},{"dedkey":"ded-k01","dedval":10.01}]

            select name,collect_set(concat_ws('=',dedkey,cast(dedval as string))) page_stats from  test.emp group by name;
                u001    ["ded-k02=20.02","ded-k03=30.03","ded-k01=10.01"]

            --  第一步： 將key-value欄位組裝成一個字串，藉助於concat_ws
             select name,concat_ws(':',dedkey,cast(dedval as string)) kvs from  test.emp ;
                     name    kvs
                    u001    ded-k03:30.03
                    u001    ded-k01:10.01
                    u001    ded-k02:20.02
            --  第二步: 將所有屬於同一個人的資料組合在一起,，藉助於collect_set
             select name,collect_set(concat_ws(':',dedkey,cast(dedval as string))) kvs from  test.emp group by name;
                    name    kvs
                    u001    ["ded-k02:20.02","ded-k03:30.03","ded-k01:10.01"]

            --  第三步： 將陣列變成一個字串，藉助於concat_ws
             select name,concat_ws(',',collect_set(concat_ws(':',dedkey,cast(dedval as string)))) kvs from  test.emp group by name;
                    name    kvs
                    u001    ded-k02:20.02,ded-k03:30.03,ded-k01:10.01

            --  第四步:將字串轉成map 使用函式str_to_map(text, delimiter1, delimiter2)
                --  text：是字串
                --  delimiter1：多個鍵值對之間的分隔符
                --  delimiter2：key和value之間的分隔符
             select name,str_to_map(concat_ws(',',collect_set(concat_ws(':',dedkey,cast(dedval as string)))),",",":") from test.emp group by name;
                map     deductions
                u001    {"ded-k02":"20.02","ded-k03":"30.03","ded-k01":"10.01"}

　　3>.最終插入複雜表的SQL

with deds as (
             select name,str_to_map(concat_ws(',',collect_set(concat_ws(':',dedkey,cast(dedval as string)))),",",":") deductions from test.emp group by name
            ),
            adds  as(
             select name,collect_set(named_struct('stree',stree,'city',city,'state',state,'zip',zip)) address from  test.emp group by name
            ),
            subs as(
                select name,collect_list(subord) subordinates  from   test.emp  group by name
            )
            insert  into table test.employee
            select
                coalesce(adds.name,deds.name,subs.name) name,
                25000,
                subs.subordinates,
                deds.deductions,
                adds.address
            from deds
            full join adds on deds.name=adds.name
            full join subs on deds.name=subs.name;

　　4>.最終複雜表中資料查詢

SELECT * from  test.employee;
  employee.name    employee.salary        employee.subordinates            employee.deductions
   u001                25000            ["sub002","sub003","sub001"]    {"ded-k02":"20.02","ded-k03":"30.03","ded-k01":"10.01"}
  employee.address
  [{"stree":"china-02","city":"shanghai","state":"use","zip":100001},{"stree":"china-03","city":"lanzhou","state":"use","zip":100002},{"stree":"china","city":"beijing","state":"use","zip":100000}]

Hive 表複雜型別欄位使用

1. Hive中複雜資料型別　　1>. 複雜型別定義 1.1 map結構資料定義map<string,string>1.2 array結構資料定義array<string>1.3 struct結構資料定義struct<id:int,name:string,age:int>1.4 struc

Spark SQL解析查詢parquet格式Hive表獲取分割槽欄位和查詢條件

首先說一下，這裡解決的問題應用場景： sparksql處理Hive表資料時，判斷載入的是否是分割槽表，以及分割槽表的欄位有哪些？再進一步限制查詢分割槽表必須指定分割槽？

Hive基礎（十九）：面試題:如何用sqoop將hive中分割槽表的分割槽欄位匯入到MySQL中

問題分析： hive中分割槽表其底層就是HDFS中的多個目錄下的單個檔案，hive匯出資料本質是將HDFS中的檔案匯出

MySQl 建立表時timestamp型別欄位出錯

CREATE TABLE `sync_test` ( `id` varchar(32) NOT NULL, `int_two` smallint(6) DEFAULT NULL COMMENT \'整型2\',

postgresql獲取表結構，表名、表註釋、欄位名、欄位型別及長度和欄位註釋

場景描述：navicate 將postgresql表結構匯出到Excel。 1、查詢表名和表註釋 select relname as tabname,

SQL Server資料庫中的表名稱、欄位比較

前言專案中一般分測試環境（QAS），生產環境（PRD），當我們的專案經歷了一次週期跨度較長的更新後，當我們釋出到生產環境時，首要的任務是將新增的表，欄位更新到生產資料庫。很多時候，當我們釋出更新的時候，已經

sql在一個表中新增欄位並新增備註的方法

1、加欄位： alter table 表名 ADD 欄位名型別; eg: alter table sys_cwzd ADD SCCLLJ VARCHAR2(50);

MySQL不同表之前的欄位複製

有時候，我們需要複製某個欄位一整列的資料到另外一個新的欄位中，這很簡單，SQL可以這麼寫：

mysql建立儲存過程實現往資料表中新增欄位的方法分析

本文例項講述了mysql建立儲存過程實現往資料表中新增欄位的方法。分享給大家供大家參考，具體如下：

如何使用MySQL一個表中的欄位更新另一個表中欄位

1，修改1列 update student s,city c set s.city_name = c.name where s.city_code = c.code; 2，修改多個列

MySQL Union合併查詢資料及表別名、欄位別名用法分析

本文例項講述了MySQL Union合併查詢資料及表別名、欄位別名用法。分享給大家供大家參考，具體如下：

Mysql 根據一個表資料更新另一個表的某些欄位(sql語句)

下面一段程式碼給大家介紹Mysql 根據一個表資料更新另一個表的某些欄位，具體程式碼如下所示：

SQL提取資料庫表名及欄位名等資訊程式碼示例

本文向大家介紹了使用SQL語句提取資料庫所有表的表名、欄位名的例項程式碼，在SQLserver 中進行了測試，具體內容如下：

資料庫表CRMD_ORDERADM_I裡欄位OBJECT_TYPE的計算邏輯

In order to resolve one issue I need to figure out the logic how field OBJECT_TYPE is populated in table CRMD_ORDERADM_I.

sqlserver奪標替換：兩表有一個欄位相同，想替換一個欄位為另外一表的欄位

UPDATE RP_bankrecp SET RP_bankrecp.iflag = rp_bankrecp_2011.iflag FROM RP_bankrecp LEFT JOIN RP_bankrecp_2011 ON RP_bankrecp.i_id = RP_bankrecp_2011.i_id

Dynamics CRM - 在 C# Plugin 中如何對 PartyList 型別欄位進行取值

C# Plugin - 獲取 <From> 的值在這裡 Mark 一下 C# Plugin 中是如何對 PartyList 型別欄位進行取值的，以 <From> 欄位為例，我們想取得 <From> 欄位裡所有的 AccountId：

關於oracle sql語句查詢時表名和欄位名要加雙引號的問題

關於oracle sql語句查詢時表名和欄位名要加雙引號的問題用navicat視覺化建立了表，可是就是不能查到！

MS-SQLSERVER 批量修改表中某個欄位可為NULL

-- 危險操作，處理前記得先備份資料庫 1 declare @sql varchar(500),@tbname varchar(100) 2 begin

mybatis關聯查詢時兩張表有相同欄位導致對映錯誤

表1 表2 兩張表都存在name欄位 xml中的配置 <?xml version=\"1.0\" encoding=\"UTF-8\" ?> <!DOCTYPE mapper

spring處理資料庫中Date型別欄位轉換成時間戳問題

有兩種方式可以解決日期轉換Json問題： 1、（不推薦）區域性修改，自定義註解進行將日期型別轉換為Date型別。

Hive 表複雜型別欄位使用

1. Hive中複雜資料型別

1>. 複雜型別定義

2>. 複雜型別資料封裝

3>. 複雜型別資料訪問

2. 具體使用案例

1>. 資料準備: 建立一個複雜型別的表+簡單型別表

2>. 根據簡單型別表資料組裝複雜型別表中資料

3>.最終插入複雜表的SQL

4>.最終複雜表中資料查詢

相關推薦

　　1>. 複雜型別定義

　　2>. 複雜型別資料封裝

　　3>. 複雜型別資料訪問

　　1>. 資料準備: 建立一個複雜型別的表+簡單型別表

　　2>. 根據簡單型別表資料組裝複雜型別表中資料

　　3>.最終插入複雜表的SQL

　　4>.最終複雜表中資料查詢