hive新增欄位和修改欄位的影響

阿新 • • 發佈：2020-10-29

DROP TABLE IF EXISTS tmp_dm_test_a.t_aa_orc;
USE tmp_dm_test_a;
CREATE EXTERNAL TABLE IF NOT EXISTS tmp_dm_test_a.t_aa_orc(
 user_id          string COMMENT '使用者id'
,all_addr  string COMMENT '常用地址'
)
PARTITIONED BY (
  inc_day string COMMENT 'inc_day used by partition'
)
STORED AS orc
TBLPROPERTIES( 
'orc.compress'='SNAPPY');



set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.fetch.task.conversion=more;
set hive.exec.parallel=true;
set mapreduce.output.fileoutputformat.compress.codec=org.apache.hadoop.io.compress.SnappyCodec;
set mapreduce.output.fileoutputformat.compress.type= 
BLOCK;

WITH tmp AS
(
SELECT 'sf1111' as user_id, '湖南省' as all_addr, '20180101'
union all
SELECT 'sf2222' as user_id, '江西省' as all_addr, '20180101'
union all
SELECT 'sf3333' as user_id, '上東省' as all_addr, '20180101'
union all
SELECT 'sf1111' as user_id, '湖南省' as all_addr, '20180102'
union all
SELECT 'sf2222' as 
 user_id, '江西省' as all_addr, '20180102'
union all
SELECT 'sf3333' as user_id, '上東省' as all_addr, '20180102'
)


INSERT OVERWRITE TABLE tmp_dm_test_a.t_aa_orc PARTITION (inc_day)
SELECT * from tmp;

SELECT * from tmp_dm_test_a.t_aa_orc;
SELECT user_id,all_addr,original_union_id from tmp_dm_test_a.t_aa_orc;
SELECT user_id,all_addr,original_union_id from tmp_dm_test_a.t_aa_orc where inc_day='20180101';
SELECT user_id,all_addr,original_union_id from tmp_dm_test_a.t_aa_orc where inc_day='20180103';
----
SELECT phone_number,all_addr,original_union_id from tmp_dm_test_a.t_aa_orc;


 alter table tmp_dm_test_a.t_aa_orc add columns(original_union_id string) cascade; 
 
 alter table tmp_dm_test_a.t_aa_orc partition(inc_day='20180101') add columns(original_union_id string); 
 
 
 
 
DROP TABLE IF EXISTS tmp_dm_test_a.t_aa_orc;
USE tmp_dm_test_a;
CREATE EXTERNAL TABLE IF NOT EXISTS tmp_dm_test_a.t_aa_orc(
 user_id          string COMMENT '使用者id'
,all_addr  string COMMENT '常用地址'
,original_union_id string
)
PARTITIONED BY (
  inc_day string COMMENT 'inc_day used by partition'
)
STORED AS orc
TBLPROPERTIES('orc.compress'='SNAPPY');

MSCK REPAIR TABLE tmp_dm_test_a.t_aa_orc;

WITH tmp AS
(
SELECT 'sf1111' as user_id, '湖南省' as all_addr,'sf0x1111' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf2222' as user_id, '江西省' as all_addr,'sf0x2211' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf3333' as user_id, '上東省' as all_addr,'sf0x3311' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf1111' as user_id, '湖南省' as all_addr,'sf0x4411' as original_union_id, '20180104'
union all                                                                       
SELECT 'sf2222' as user_id, '江西省' as all_addr,'sf0x5511' as original_union_id, '20180104'
union all                                                                       
SELECT 'sf3333' as user_id, '上東省' as all_addr,'sf0x6611' as original_union_id, '20180104'
)


INSERT OVERWRITE TABLE tmp_dm_test_a.t_aa_orc PARTITION (inc_day)
SELECT * from tmp;



********************
alter table tmp_dm_test_a.t_aa_orc change column user_id phone_number string;
alter table tmp_dm_test_a.t_aa_orc change column user_id phone_number string cascade;

-------------
show create table tmp_dm_test_a.t_aa_orc;

parquet儲存格式

DROP TABLE IF EXISTS tmp_dm_test_a.t_aa;
USE tmp_dm_test_a;
CREATE EXTERNAL TABLE IF NOT EXISTS tmp_dm_test_a.t_aa(
 user_id          string COMMENT '使用者id'
,all_addr  string COMMENT '常用地址'
)
PARTITIONED BY (
  inc_day string COMMENT 'inc_day used by partition'
)
STORED AS parquet
TBLPROPERTIES('parquet.compression'='SNAPPY');



set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.fetch.task.conversion=more;
set hive.exec.parallel=true;
set mapreduce.output.fileoutputformat.compress.codec=org.apache.hadoop.io.compress.SnappyCodec;
set mapreduce.output.fileoutputformat.compress.type=BLOCK;

WITH tmp AS
(
SELECT 'sf1111' as user_id, '湖南省' as all_addr, '20180101'
union all
SELECT 'sf2222' as user_id, '江西省' as all_addr, '20180101'
union all
SELECT 'sf3333' as user_id, '上東省' as all_addr, '20180101'
union all
SELECT 'sf1111' as user_id, '湖南省' as all_addr, '20180102'
union all
SELECT 'sf2222' as user_id, '江西省' as all_addr, '20180102'
union all
SELECT 'sf3333' as user_id, '上東省' as all_addr, '20180102'
)


INSERT OVERWRITE TABLE tmp_dm_test_a.t_aa PARTITION (inc_day)
SELECT * from tmp;

SELECT * from tmp_dm_test_a.t_aa;
SELECT user_id,all_addr,original_union_id from tmp_dm_test_a.t_aa;
SELECT user_id,all_addr,original_union_id from tmp_dm_test_a.t_aa where inc_day='20180101';
----
SELECT phone_number,all_addr,original_union_id from tmp_dm_test_a.t_aa;


 alter table tmp_dm_test_a.t_aa add columns(original_union_id string); 
 
 alter table tmp_dm_test_a.t_aa partition(inc_day='20180101') add columns(original_union_id string); 
 
 
 
 
DROP TABLE IF EXISTS tmp_dm_test_a.t_aa;
USE tmp_dm_test_a;
CREATE EXTERNAL TABLE IF NOT EXISTS tmp_dm_test_a.t_aa(
 user_id          string COMMENT '使用者id'
,all_addr  string COMMENT '常用地址'
,original_union_id string
)
PARTITIONED BY (
  inc_day string COMMENT 'inc_day used by partition'
)
STORED AS parquet
TBLPROPERTIES('parquet.compression'='SNAPPY');


MSCK REPAIR TABLE tmp_dm_test_a.t_aa;

WITH tmp AS
(
SELECT 'sf1111' as user_id, '湖南省' as all_addr,'sf0x1111' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf2222' as user_id, '江西省' as all_addr,'sf0x2211' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf3333' as user_id, '上東省' as all_addr,'sf0x3311' as original_union_id, '20180103'
union all                                                                       
SELECT 'sf1111' as user_id, '湖南省' as all_addr,'sf0x4411' as original_union_id, '20180104'
union all                                                                       
SELECT 'sf2222' as user_id, '江西省' as all_addr,'sf0x5511' as original_union_id, '20180104'
union all                                                                       
SELECT 'sf3333' as user_id, '上東省' as all_addr,'sf0x6611' as original_union_id, '20180104'
)


INSERT OVERWRITE TABLE tmp_dm_test_a.t_aa PARTITION (inc_day)
SELECT * from tmp;


********************
alter table tmp_dm_test_a.t_aa change column user_id phone_number string;
alter table tmp_dm_test_a.t_aa change column user_id phone_number string cascade;

*********************************************

結論：

1、parquet和orc格式，舊分割槽中資料檔案內容不可變。

2、parquet和orc格式：欄位增加後，舊資料檔案中無新欄位內容；新產生的分割槽中資料檔案才會有新欄位內容。

3、parquet和orc格式：通過add語句新增欄位後，舊分割槽和新分割槽都可以查，舊資料為null而已。

4、parquet格式：修改欄位名後，無法從舊資料解析原欄位內容，相當於新舊欄位名沒有印射關係，select不能解析新欄位名，因為舊資料中只有舊欄位名沒有新欄位名，而且新欄位名無法印射舊欄位名。

5、orc格式：修改欄位名後，可以從舊資料解析原欄位內容，相當於新舊欄位名有印射關係，select可以解析新欄位名，因為雖然舊資料中只有舊欄位名沒有新欄位名，但是新欄位名印射了舊欄位名，相當於一個別名。

hive新增欄位和修改欄位的影響

DROP TABLE IF EXISTS tmp_dm_test_a.t_aa_orc; USE tmp_dm_test_a; CREATE EXTERNAL TABLE IF NOT EXISTS tmp_dm_test_a.t_aa_orc(

Sql Server 增加欄位、修改欄位、修改型別、修改預設值

1、修改欄位名：　　alter table 表名 rename column A to B 2、修改欄位型別：　　alter table 表名 alter column 欄位名 type not null

解決實體類屬性欄位和資料庫欄位不一致的問題

一、別名操作sql語句時給欄位起別名，別名和實體類屬性欄位一致 <select id=\"getUserList\" resultType=\"User\">

關於Int自增欄位和GUID欄位的效能測試。只有測試，沒有分析，呵呵

最近有兩篇關於GUID和Int自增的文章，我是一直使用Int自增的，不習慣使用GUID，感覺GUID很麻煩，用著不方便，效能也比不上Int自增。但是同時我也知道，二者在效能上孰優孰劣，只是感覺和猜測，並沒有做測

Qt 用程式碼實現選單欄(MenuBar)和工具欄(ToolBar)

新建Qt專案，選擇Qt Widgets Application，填入專案名稱“ImageView”，點選完成。在Qt Designer裡會生成如圖所示的幾個檔案：

移位運算——獲取unsigned short的高八位和低八位數值

示例程式碼： #include \"pch.h\" #include <iostream> #include <string> typedefunsigned charBYTE;

C#中獲取byte第四位和高四位方法和獲取設定byte每一位的值

C#低四位 public static int GetLow4(byte data) {//獲取低四位 return data & 0x0f; } C#高四位 public static int getHeight4(byte data)

MySQL資料表新增欄位、修改和刪除示例詳情

MySQL資料表新增欄位　　MySQL資料表是由行和列構成的，通常把表的\"列\"稱為欄位(Field)，把表的“行”校標為記錄(Record)。在實際的業務中，可能已存在的表中新增新的欄位值，MySQL允許在表的開頭、中間和結尾新增

Spark SQL解析查詢parquet格式Hive表獲取分割槽欄位和查詢條件

首先說一下，這裡解決的問題應用場景： sparksql處理Hive表資料時，判斷載入的是否是分割槽表，以及分割槽表的欄位有哪些？再進一步限制查詢分割槽表必須指定分割槽？

mybatis-plus如何自動填充欄位建立時間和修改時間

技術標籤：面試程式設計師JAVA資料庫javamysqlmybatis後端前言根據阿里巴巴開發手冊，表必備三個欄位：id,create_time, update_time，針對建立時間和修改時間我們有兩種方式可以去生成——資料庫層面和程式碼層

mysql教程（六）對欄位的操作--新增、刪除、修改

1、新增欄位　　alter table 表名 add column 列名型別；//column 可省略　　示例：alter table t_student add contact_tel varchar(40);

hive 修改欄位型別_Hive常用命令你會哪些？

技術標籤：hive 修改欄位型別hive 刪除分割槽hive刪除分割槽資料啟動hive報錯啟動hive報錯exceptionininitializererror

SQL server 為表和欄位新增表描述和欄位描述

檢視當前資料庫中已存在描述的表與欄位： SELECT表名 = -- CASEwhena.colorder=1then d.name

eggjs sequelize操作多個數據，表名不加s，不預設加建立和修改時間欄位

操作多個數據庫： // 多個數據庫操作，model名稱不同 // model目前專案的庫，model2是之前的招聘庫，model3是cd公共庫

mongodb新增欄位和建立自增主鍵

sql型別 --新增欄位db.library_category.update({},{$set:{code:\"\"}},{multi:1})--新增自增序列集合

C# 建立表ACCESS表，新增修改欄位

最開始以為access 修改欄位資訊，用ALTER TABLE 語句就可以了，開啟access 檔案執行了

sql儲存過程修改新增欄位前判斷欄位是否存在

-- 判斷欄位不存在則增加該欄位 DROP PROCEDURE if EXISTS proc_add_column; delimiter $$ CREATE PROCEDURE `proc_add_column`(in var_table_name varchar(64),in var_column_name varchar(64),in var_sqlstr varc

MySQL筆記2：資料庫的列型別、欄位屬性、表的建立刪除和修改

2. 操作資料庫 sqlyog操作命令：選中命令列，點選執行圖示操作資料庫 > 操作資料庫中的表 > 操作表中的資料

MySQL group by對單字分組序和多欄位分組的方法講解

我這裡建立了一個 goods 表，先看下里面的資料： mysql> select * from goods; +----+------+------+------------+-------------+------------+

mysql匯出表的欄位和相關屬性的步驟方法

需要匯出資料庫中表的欄位及屬性,製成表格儲存到word中首先找到要導的庫,在查詢頁面輸入sql

hive新增欄位和修改欄位的影響

相關推薦