[Hive]Hive執行指令碼的方式以及轉義字元

阿新 • • 發佈：2019-01-06

1. hive指令碼的執行方式

hive指令碼的執行方式大致有三種：
1. hive控制檯執行；
2. hive -e "SQL"執行；
3. hive -f SQL檔案執行；

參考hive的用法

usage: hive
 -d,--define <key=value>          Variable subsitution to apply to hive
                                  commands. e.g. -d A=B or --define A=B
    --database <databasename>     Specify the database to use
 -e 
 <quoted-query-string>         SQL from command line
 -f <filename>                    SQL from files
 -H,--help                        Print help information
 -h <hostname>                    connecting to Hive Server on remote host
    --hiveconf <property=value>   Use value for 
 given property
    --hivevar <key=value>         Variable subsitution to apply to hive
                                  commands. e.g. --hivevar A=B
 -i <filename>                    Initialization SQL file
 -p <port>                        connecting to Hive Server on port number
 -S,--silent                      Silent mode in 
 interactive shell
 -v,--verbose                     Verbose mode (echo executed SQL to the
                                  console)

1.1. `hive控制檯`執行

顧名思義，是進入hive控制檯以後，執行sql指令碼，例如：

hive> set mapred.job.queue.name=pms;
hive> select page_name, tpa_name from pms.pms_exps_prepro limit 2;
Total MapReduce jobs = 1
Launching Job 1 out of 1
...
Job running in-process (local Hadoop)
2015-10-23 10:06:47,756 null map = 100%,  reduce = 0%
2015-10-23 10:06:48,863 null map = 23%,  reduce = 0%
2015-10-23 10:06:49,946 null map = 38%,  reduce = 0%
2015-10-23 10:06:51,051 null map = 72%,  reduce = 0%
2015-10-23 10:06:52,129 null map = 100%,  reduce = 0%
Ended Job = job_local1109193547_0001
Execution completed successfully
Mapred Local Task Succeeded . Convert the Join into MapJoin
OK
APP首頁   APP首頁_價格比京東低
APP首頁   APP首頁_價格比京東低
Time taken: 14.279 seconds
hive>

1.2. `hive -e "SQL"`方式執行

利用hive -e "SQL"的方式進入hive控制檯並直接執行sql指令碼，例如：

hive -e "
set mapred.job.queue.name=pms;
set mapred.job.name=[HQL]exps_prepro_query;

select page_name, tpa_name 
from pms.pms_exps_prepro 
limit 2;"

1.3. `hive -f SQL檔案`方式執行

執行sql檔案中的sql指令碼，例如：

pms_exps_prepro.sql檔案內容如下：

set mapred.job.queue.name=pms;
set hive.exec.reducers.max=48;
set mapred.reduce.tasks=48;
set mapred.job.name=[HQL]pms_exps_prepro;

drop table if exists pms.pms_exps_prepro; 
create table pms.pms_exps_prepro as 
select 
  a.provinceid,
  a.cityid,
  a.ieversion,
  a.platform,
  '${date}' as ds
from track_exps a;

上述檔案中的sql指令碼接收一個日期，接收引數寫法類似${date}，執行時如下執行：

date=2015-10-22
hive -f pms_exps_prepro.sql --hivevar date=$date

2. hive轉義字元的問題

下面以一個業務場景闡述關於hive轉義字元的問題

track_exps記錄曝光資料，現在小A希望獲取2015-10-20有效的曝光資料
其中有效的曝光記錄是指，
* relatedinfo欄位滿足數字.數字.數字.數字.數字的格式，
例如4.4.5.1080100.1

extfield1欄位滿足request-字串,section-數字的格式，
例如request-b470805b620900ac492bb892ad7e955e,section-4

對於這個問題，小A寫出瞭如下sql指令碼：

select 
    *
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '^4.\d+.\d+.\d+.\d+$' 
  and extfield1 rlike '^request.+section-\d+$';

但是由於正則表示式是被包含在sql裡面，所以裡面的特殊字元需要轉義

2.1. `hive -e "SQL"`的方式執行

改動如下：

hive -e "
set mapred.job.queue.name=pms;

explain select 
    cityid
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '\\^4\\.\\\d\\+\\.\\\d\\+\\.\\\d\\+\\.\\\d\\+\\$' 
  and extfield1 rlike '\\^request\\.\\+section\\-\\\d\\+\\$';"

檢視執行計劃，可以確定正則表示式解析正確了：

...
predicate:
  expr: ((relatedinfo rlike '^4.\d+.\d+.\d+.\d+$') and (extfield1 rlike '^request.+section-\d+$'))
  type: boolean
...

分析如下：

在hive -e "SQL"的執行方式中，"'正則表示式'"，正則表示式先被一個單引號括起來，再被一個雙引號括起來的，所以正則表示式裡面，\\^的第一個\用來解析第二個\，第二個\才真正起到了轉義的作用

2.2. `hive -f SQL檔案`的方式執行

改動如下：

pms_exps_prepro.sql檔案內容如下：

select 
    *
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '\^4\.\\d\+\.\\d\+\.\\d\+\.\\d\+\$' 
  and extfield1 rlike '\^request\.\+section\-\\d\+\$';

分析如下：

不同於hive -e "SQL"的執行方式，因為是sql檔案，所以正則表示式只被一個單引號括起來而已，一個\就起到了轉義的作用了

[Hive]Hive執行指令碼的方式以及轉義字元

1. hive指令碼的執行方式 hive指令碼的執行方式大致有三種： 1. hive控制檯執行； 2. hive -e "SQL"執行； 3. hive -f SQL檔案執行；參考hive的用法 usage: hive -d,--define

Properties配置檔案常見錯誤寫法以及轉義字元說明

對轉義字元的使用，常見錯誤示例： jdbc.url=jdbc\:mysql\://192.168.0.1\:3306/test?useUnicode\=true&characterEncoding\=UTF-8 在Properties檔案中，分隔符有兩種存在方式：“=”（等於號

回車換行的不同以及轉義字元和ASCII碼值—（附ASCII碼錶）

問題來源： “回車”（carriage return）VS “換行”（line feed）在計算機還沒有出現之前，有一種叫做電傳打字機（Teletype Model 33）的玩意，每秒鐘可以

getchar， EOF 以及轉義字元

1.在用getchar 和putchar實現檔案複製時：例如： int c; c=getchar(); while(c!=EOF) { putchar(c); c=getchar(

【PHP轉義字元】單引號雙引號以及轉義字元【原創】

今天在寫一個指令碼，統計一個純英文的文字文件txt，裡面的單詞出現的數量的時候呢，程式碼如下： <?php /** * 任一個英文的純文字檔案，統計其中的單詞出現的個數。 * Created b

在Oozie 中排程執行shell、hive 指令碼，以及通過shell指令碼執行hive/sqoop/shell指令碼的方法

最近專案需要用到OOzie工具，可是找了好久，也沒有找到一個完整的、統一的解決和部署方案。經過努力，終於打通了其中的所有環節，解決了各種坑爹的問題。首先，就專案需求做一個簡單的介紹：專案需要從mysql中匯入資料到hive進行離線計算後，再導回到mys

hive筆記：轉義字元的使用

hive中的轉義符 Hadoop和Hive都是用UTF-8編碼的，所以, 所有中文必須是UTF-8編碼, 才能正常使用備註：中文資料load到表裡面, 如果字符集不同，很有可能全是亂碼需要做轉碼的, 但是hive本身沒有函式來做這個一、轉義字元的特殊情況：自身的轉義，比如java有時候需要兩個轉

hive學習之指令碼化執行

第一種方式:使用hive -e "sql" hive -e "select count(1) from default.hive_test" 第二種方式:使用shell指令碼 #建立test.sh檔案 vi test.sh #編寫指令碼 #!/bin/bash hive -e "

Hive執行指令碼時傳參

使用-hiveconf傳參測試指令碼 -- test.sql select 'Start Testing ...'; select ${hiveconf:day}, '${hiveconf:url}'; select 'Test End!';

hive-shell批量命令執行指令碼

#!/usr/bin/bash HADOOP_HOME="/opt/module/cdh-5.3.6-ha/hadoop-2.5.0-cdh5.3.6" HIVE_HOME='/opt/module/c

hive中執行python指令碼

hive中可以載入python指令碼，然後在hive中執行。好處：可以解決模型離線上線問題和一些基於行的運算。 python指令碼： import sys #本程式碼實現47中變換中的求均值 #執行前先處理掉空值 ''' 表結構： uid,c1,c2,c3 123,11,22,33

Hive之Java操作jdbc以及指令碼實現

原部落格地址：http://blog.csdn.net/evankaka 摘要：本文主要講了如何通過java來連線Hive,以及如何執行hive指令碼一、Hive連線 1.1、通過shell 1、Hive 命令列模式，直接輸入#/hive

Hive表中四種不同資料匯出方式以及如何自定義匯出列分隔符

問題導讀： 1、Hive表資料四種匯出方式是？ 2、匯出命令中LOCAL的作用及有無的區別？ 3、匯出命令中是否可以嚮導入命令一樣使用INTO？ 4、如何自定義匯出檔案的列分隔符？ 5、hive的-e和-f引數的作用及如何使用其來匯出資料？ 6、hive shell環境中

Hive中建立表的各種方式以及區別詳解

3.新表中會將原表的分割槽當做欄位出現在新表中。> describe formatted mytest_tmp1 ; OK col_name data_type comment # col_name

Hive中LIKE查詢使用萬用字元'%'的一個BUG--當轉義符'\'遇到萬用字元'%'或'_'

在Hive開發過程中遇到這樣一個問題：例如表T001的欄位col1裡面存有’ABC\DEF’這樣的資料，在Oracle中，我可以通過下面這樣的SQL將其查出： SELECT * FROM T001 WHERE COL1 LIKE ‘ABC\%’; ‘\’不會將’%’進行轉

hive執行指令碼格式錯誤解決方案

在Xshell中鍵入命令：sh friendpage.sh系統提示錯誤：'riendpage.sh: line 4: synt ax error near unexpected token `{'riendpage.sh: line 4: `function main(){解

hive sql執行的job在map時報java.lang.OutOfMemoryError的錯誤

reduce -xmx apr 執行 mapred ive yar 參數調整成功較為詳細且重要的一段報錯信息是org.apache.hadoop.mapred.YarnChild: Error running child : java.lang.OutOfMemoryE

大資料元件之----HIVE，win10下安裝以及配置hadoop詳細步驟

HIVE其本質是以Hadoop作為基礎的資料倉庫基礎設施。其中hadoop為資料的儲存和執行在商業機器上提供了可擴充套件以及容錯性的可能，其中容錯性可通過副本來進行理解。目標： HIVE是讓資料彙總更加簡單和針對大容量資料的查詢和分析，提供了SWL來使得使用者可以更簡單查詢，彙總和資料分析

Core中使用Hangfire 在Asp.Net Core中使用DI的方式使用Hangfire構建後臺執行指令碼解決 ASP.NET Core Hangfire 未授權（401 Unauthorized）

　　之前使用Quartz.Net，後來發現hangfire對Core的繼承更加的好，而且自帶管理後臺，這就比前者好用太多了。安裝註冊安裝 PM> Install-Package Hangfire Startup.cs，在ConfigureServices方法中添加註冊：

Hive之執行計劃分析(explain)

Hive是通過把sql轉換成對應mapreduce程式，然後提交到Hadoop上執行，檢視具體的執行計劃可以通過執行explain sql知曉一條sql會被轉化成由多個階段組成的步驟，每個步驟有執行順序和依賴關係，可以稱之為有向無環圖（DAG:Directed Acyclic Graph）這

[Hive]Hive執行指令碼的方式以及轉義字元

1. hive指令碼的執行方式

1.1. hive控制檯執行

1.2. hive -e "SQL"方式執行

1.3. hive -f SQL檔案方式執行

2. hive轉義字元的問題

2.1. hive -e "SQL"的方式執行

2.2. hive -f SQL檔案的方式執行

相關推薦

1.1. `hive控制檯`執行

1.2. `hive -e "SQL"`方式執行

1.3. `hive -f SQL檔案`方式執行

2.1. `hive -e "SQL"`的方式執行

2.2. `hive -f SQL檔案`的方式執行