hive指令碼執行方式

阿新 • • 發佈：2018-12-21

hive指令碼的執行方式

hive指令碼的執行方式大致有三種：

hive控制檯執行；
hive -e "SQL"執行；
hive -f SQL檔案執行；
參考hive用法：

usage: hive
 -d,--define <key=value>          Variable subsitution to apply to hive
                                  commands. e.g. -d A=B or --define A=B
    --database <databasename>     Specify the database to use
 -e <quoted-query-string>         SQL from command line
 -f <filename>                    SQL from files
 -H,--help                        Print help information
 -h <hostname>                    connecting to Hive Server on remote host
    --hiveconf <property=value>   Use value for given property
    --hivevar <key=value>         Variable subsitution to apply to hive
                                  commands. e.g. --hivevar A=B
 -i <filename>                    Initialization SQL file
 -p <port>                        connecting to Hive Server on port number
 -S,--silent                      Silent mode in interactive shell
 -v,--verbose                     Verbose mode (echo executed SQL to the
                                  console)

1.1. hive控制檯執行

顧名思義，是進入hive控制檯以後，執行sql指令碼，例如：

hive> set mapred.job.queue.name=pms;
hive> select page_name, tpa_name from pms.pms_exps_prepro limit 2;
Total MapReduce jobs = 1
Launching Job 1 out of 1
...
Job running in-process (local Hadoop)
2015-10-23 10:06:47,756 null map = 100%,  reduce = 0%
2015-10-23 10:06:48,863 null map = 23%,  reduce = 0%
2015-10-23 10:06:49,946 null map = 38%,  reduce = 0%
2015-10-23 10:06:51,051 null map = 72%,  reduce = 0%
2015-10-23 10:06:52,129 null map = 100%,  reduce = 0%
Ended Job = job_local1109193547_0001
Execution completed successfully
Mapred Local Task Succeeded . Convert the Join into MapJoin
OK
APP首頁   APP首頁_價格比京東低
APP首頁   APP首頁_價格比京東低
Time taken: 14.279 seconds
hive>

1.2. hive -e "SQL"方式執行

利用hive -e "SQL"的方式進入hive控制檯並直接執行sql指令碼，例如：

hive -e "
set mapred.job.queue.name=pms;
set mapred.job.name=[HQL]exps_prepro_query;

select page_name, tpa_name 
from pms.pms_exps_prepro 
limit 2;"

1.3. hive -f SQL檔案方式執行

執行sql檔案中的sql指令碼，例如：

pms_exps_prepro.sql檔案內容如下：

set mapred.job.queue.name=pms;
set hive.exec.reducers.max=48;
set mapred.reduce.tasks=48;
set mapred.job.name=[HQL]pms_exps_prepro;

drop table if exists pms.pms_exps_prepro; 
create table pms.pms_exps_prepro as 
select 
  a.provinceid,
  a.cityid,
  a.ieversion,
  a.platform,
  '${date}' as ds
from track_exps a;

上述檔案中的sql指令碼接收一個日期，接收引數寫法類似${date}，執行時如下執行：

date=2015-10-22
hive -f pms_exps_prepro.sql --hivevar date=$date

2. hive轉義字元的問題

下面以一個業務場景闡述關於hive轉義字元的問題

track_exps記錄曝光資料，現在小A希望獲取2015-10-20有效的曝光資料
其中有效的曝光記錄是指，

relatedinfo欄位滿足數字.數字.數字.數字.數字的格式，
例如4.4.5.1080100.1

extfield1欄位滿足request-字串,section-數字的格式，
例如request-b470805b620900ac492bb892ad7e955e,section-4
對於這個問題，小A寫出瞭如下sql指令碼：

select 
    *
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '^4.\d+.\d+.\d+.\d+$' 
  and extfield1 rlike '^request.+section-\d+$';

但是由於正則表示式是被包含在sql裡面，所以裡面的特殊字元需要轉義

2.1. hive -e "SQL"的方式執行

改動如下：

hive -e "
set mapred.job.queue.name=pms;

explain select 
    cityid
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '\\^4\\.\\\d\\+\\.\\\d\\+\\.\\\d\\+\\.\\\d\\+\\$' 
  and extfield1 rlike '\\^request\\.\\+section\\-\\\d\\+\\$';"

檢視執行計劃，可以確定正則表示式解析正確了：

...
predicate:
  expr: ((relatedinfo rlike '^4.\d+.\d+.\d+.\d+$') and (extfield1 rlike '^request.+section-\d+$'))
  type: boolean
...

分析如下：

在hive -e “SQL"的執行方式中，”‘正則表示式’"，正則表示式先被一個單引號括起來，再被一個雙引號括起來的，所以正則表示式裡面，\^的第一個\用來解析第二個\，第二個\才真正起到了轉義的作用

2.2. hive -f SQL檔案的方式執行

改動如下：

pms_exps_prepro.sql檔案內容如下：

select 
    *
from track_exps
where ds = '2015-10-20'
  and relatedinfo rlike '\^4\.\\d\+\.\\d\+\.\\d\+\.\\d\+\$' 
  and extfield1 rlike '\^request\.\+section\-\\d\+\$';

分析如下：

不同於hive -e "SQL"的執行方式，因為是sql檔案，所以正則表示式只被一個單引號括起來而已，一個\就起到了轉義的作用了

hive指令碼執行方式

hive指令碼的執行方式 hive指令碼的執行方式大致有三種： hive控制檯執行； hive -e "SQL"執行； hive -f SQL檔案執行；參考hive用法： usage: hive -d,--define <key=value>

hive指令碼執行檢視錯誤日誌方式

當指令碼在執行時報錯資訊如下： Examining task ID: task_201201061122_0007_m_000002 (and more) from job job_201201061122_0007 Exception in thread "Thread-23" java.lang.R

shell基礎:指令碼執行方式

假設shell指令碼在/tmp/test.sh下並且有執行許可權方式一：以相對路徑的方式執行指令碼 [root@rgl tmp]# cd /tmp/ [root@rgl tmp]# ./test.sh hello shell [root@rgl tmp]# ../

Linux shell指令碼執行方式：source、sh、bash、./執行指令碼的區別

1、source命令用法：　　source FileName 　　作用:在當前bash環境下讀取並執行FileName中的命令。該filename檔案可以無"執行許可權" 注：該命令通常用命令“.”來替代。如：source .bash_prof

IIS6 啟用 gzip 壓縮功能，指令碼執行方式來設定

1. 啟用指令碼詳見：http://www.yongfa365.com/item/IIS6-Enable-Web-GZIP.html (啟用IIS6的GZIP功能，提高網站開啟速度，減少頻寬佔用) 這個指令碼，打開了 asp, js 等檔案的 gzip

[Hive]Hive執行指令碼的方式以及轉義字元

1. hive指令碼的執行方式 hive指令碼的執行方式大致有三種： 1. hive控制檯執行； 2. hive -e "SQL"執行； 3. hive -f SQL檔案執行；參考hive的用法 usage: hive -d,--define

Python 指令碼的三種執行方式

1.互動模式下執行 Python，這種模式下，無需建立指令碼檔案，直接在 Python直譯器的互動模式下編寫對應的 Python 語句即可。 1）開啟互動模式的方式： Windows下：在開始選單找到“命令提示符”，開啟，就進入到命令列模式：在命令列模式輸入： python 即可進入

Linux Shell基礎 Shell指令碼格式及執行方式

概述在 Linux 的指令碼中，只要是基於 Bash語法寫的Shell指令碼第一行必須是"#!/bin/bash"，用來宣告此檔案是一個指令碼。執行方式 Shell 指令碼的執行主要有以下兩種方法：賦予執行許可權，直接執行這種方法是最常用的 Shell 指令碼執行方法，也最為直接簡單。就是賦

shell指令碼不同執行方式的差異

說明：以下是個人的見解，不一定都正確，如有錯誤，歡迎指正! 一，shell指令碼的執行方式，最常見的有以下幾種： 1 ) . xxx.sh,注意，前面是一個點'.' 2 ) source xxx.sh,這種方式和第一種的方式效果是一樣的 3）./xxx.sh 4) sh xx

執行shell指令碼的方式

書寫完shell指令碼（文字）並儲存後，以下列三種方式執行 1，切換到指令碼所在目錄： $ bash<指令碼名 2，切換到指令碼所在目錄： $ bash 指令碼名 [引數1] [引數2] 3，給sh

Shell基礎--執行Bash指令碼的方式

使用shell來執行 $ sh hello.sh 使用bash來執行 $ bash hello.sh 使用.來執行 $ . ./hello.sh 使用source來執行 $ source h

Shell指令碼執行Hive語句

#!/bin/bash #give the params: name value tablename if [ $# -eq 3 ] then name=$1 value=$2 tablename=$3 echo name=${name} echo value=${value} echo

Shell指令碼執行hive語句 | hive以日期建立分割槽表 | linux schedule程式 | sed替換檔案字串 | shell判斷hdfs檔案目錄是否存在

#!/bin/bash source /etc/profile; ################################################## # Author: ouyangyewei # #

使用shell指令碼執行hive、sqoop命令

1、test.sh指令碼內容如下： #!/bin/bash #CURR_DATE=`date +"%Y-%m-%d %H:%M:%S"`------>不能使用v_sql="insert into

在Oozie 中排程執行shell、hive 指令碼，以及通過shell指令碼執行hive/sqoop/shell指令碼的方法

最近專案需要用到OOzie工具，可是找了好久，也沒有找到一個完整的、統一的解決和部署方案。經過努力，終於打通了其中的所有環節，解決了各種坑爹的問題。首先，就專案需求做一個簡單的介紹：專案需要從mysql中匯入資料到hive進行離線計算後，再導回到mys

shell 指令碼執行python指令碼，連線hive提交資料寫入表

使用說明 1.cd /opt/zy 在這個目錄下以root使用者許可權執行命令 2. 在SAP查詢的時候 Tcode:ZMMR0005 Purchase Org * PO Creating：2017/3/1 (開始日期） 2017/

shell命令執行hive指令碼（hive互動，hive的shell程式設計）

Hive執行方式 Hive的hql命令執行方式有三種： 1、CLI 方式直接執行 2、作為字串通過shell呼叫hive –e執行（-S開啟靜默，去掉”OK”，”Time taken”） 3、作

shell指令碼執行hive命令傳值給sql檔案、shell傳參

使用場景，大資料平臺azkaban任務中通過shell指令碼呼叫sql檔案（尤其是呼叫多個sql時），希望可以傳參到sql檔案中方法：本例以sh呼叫hive命令執行sql為例，道理相同 1、sh 檔案中執行hive -f 命令將inputdate傳給sql檔案使用

Linux學習基礎——之shell基礎——指令碼的執行方式

所有的Linux命令都可以在shell中執行 1、echo 輸出命令【[email protected] ~】#echo 【選項】【輸出內容】選項： -e :支援反斜線控制的字元轉換那什麼樣的字元加反斜線才能被識別呢？

Shell指令碼程式設計之（三）執行方式差異(source, sh script, ./script)

利用直接方式或bash執行該指令碼都會使用一個新的 bash 環境來執行指令碼內的指令！也就是說，使用這種執行方式時，其實 script 是在子程式的 bash 內執行的知識點當子程式完成後，在子程式內的各項變數或動作將會結束而不會傳回到父程式中

hive指令碼執行方式

hive指令碼的執行方式

1.1. hive控制檯執行

1.2. hive -e "SQL"方式執行

1.3. hive -f SQL檔案方式執行

2. hive轉義字元的問題

2.1. hive -e "SQL"的方式執行

2.2. hive -f SQL檔案的方式執行

相關推薦