Hive-常用操作

阿新 • • 發佈：2018-11-29

前提條件：

安裝好hadoop2.7.3（LInux系統下）

安裝好hive2.3.3（Linux系統下）

安裝好Xampp（Windows系統下），併成功用Navicat連線Xampp Mysql。參考：Navicat連線Xampp資料庫

準備源資料：

1. 開啟終端，新建emp.csv檔案

$ nano emp.csv

輸入內容如下，儲存退出。

7369,SMITH,CLERK,7902,1980/12/17,800,,20
7499,ALLEN,SALESMAN,7698,1981/2/20,1600,300,30
7521,WARD,SALESMAN,7698,1981/2/22,1250,500,30
7566,JONES,MANAGER,7839,1981/4/2,2975,,20
7654,MARTIN,SALESMAN,7698,1981/9/28,1250,1400,30
7698,BLAKE,MANAGER,7839,1981/5/1,2850,,30
7782,CLARK,MANAGER,7839,1981/6/9,2450,,10
7788,SCOTT,ANALYST,7566,1987/4/19,3000,,20
7839,KING,PRESIDENT,,1981/11/17,5000,,10
7844,TURNER,SALESMAN,7698,1981/9/8,1500,0,30
7876,ADAMS,CLERK,7788,1987/5/23,1100,,20
7900,JAMES,CLERK,7698,1981/12/3,950,,30
7902,FORD,ANALYST,7566,1981/12/3,3000,,20
7934,MILLER,CLERK,7782,1982/1/23,1300,,10

2. 新建dept.csv檔案

$ nano dept.csv

輸入以下內容，儲存退出

10,ACCOUNTING,NEW YORK
20,RESEARCH,DALLAS
30,SALES,CHICAGO
40,OPERATIONS,BOSTON

實驗操作：

（1）把上面兩張表上傳到hdfs某個目錄下，如/001/hive

在linux終端下輸入命令：

hdfs dfs -mkdir -p /001/hive
hdfs dfs -put dept.csv /001/hive
hdfs dfs -put emp.csv /001/hive

（2）建立員工表（emp+學號，如：emp001）注意：在hive命令列下輸入：

進入hive命令列：

$ hive

新建hive表，表名為emp001

create table emp001(empno int,ename string,job string,mgr int,hiredate string,sal int,comm int,deptno int) row format delimited fields terminated by ',';

（3）建立部門表（dept+學號，如：dept001）

create table dept001(deptno int,dname string,loc string) row format delimited fields terminated by ',';

（4）匯入資料

load data inpath '/001/hive/emp.csv' into table emp001;  
load data inpath '/001/hive/dept.csv' into table dept001;

（5）根據員工的部門號建立分割槽，表名emp_part+學號，如:emp_part001

create table emp_part001(empno int,ename string,job string,mgr int,hiredate string,sal int,comm int)partitioned by (deptno int)row format delimited fields terminated by ',';

往分割槽表中插入資料：指明匯入的資料的分割槽（通過子查詢匯入資料）。

insert into table emp_part001 partition(deptno=10) select empno,ename,job,mgr,hiredate,sal,comm from emp001 where deptno=10;
insert into table emp_part001 partition(deptno=20) select empno,ename,job,mgr,hiredate,sal,comm from emp001 where deptno=20;
insert into table emp_part001 partition(deptno=30) select empno,ename,job,mgr,hiredate,sal,comm from emp001 where deptno=30;

（6）建立一個桶表，表名emp_bucket+學號，如:emp_bucket001，根據員工的職位（job）進行分桶

create table emp_bucket001(empno int,ename string,job string,mgr int,hiredate string,sal int,comm int,deptno int)clustered by (job) into 4 buckets row format delimited fields terminated by ',';

通過子查詢插入資料：

insert into emp_bucket001 select * from emp001;

（7）查詢所有的員工資訊

select * from emp001;

（8）查詢員工資訊：員工號姓名薪水

select empno,ename,sal from emp001;

（9）多表查詢

select dept001.dname,emp001.ename from emp001,dept001 where emp001.deptno=dept001.deptno;

（10）做報表，根據職位給員工漲工資,把漲前、漲後的薪水顯示出來

按如下規則漲薪，PRESIDENT漲1000元，MANAGER漲800元，其他人員漲400元

select empno,ename,job,sal,
case job when 'PRESIDENT' then sal+1000
 when 'MANAGER' then sal+800
 else sal+400
end 
from emp001;

完成！

Hive-常用操作

前提條件：安裝好hadoop2.7.3（LInux系統下）安裝好hive2.3.3（Linux系統下）安裝好Xampp（Windows系統下），併成功用Navicat連線Xampp Mysql。參考：Navicat連線Xampp資料庫準備源資料： 1.

hive-常用操作及函式

select '我們' from file_cto_user_info limit 1 select 1 from file_cto_user_info where 'football' like 'foot____' limit 1 --注意：否定比較時候用NOT A L

Hive 常用操作

hive> SELECT age,grade FROM student1;OK22 大三23 大二22大三24大四23大三Time taken: 0.072 seconds, Fetched: 5 row(s)hive> SELECT DISTINCT age,grade FROM student

hive的常用操作

文件夾 char external list 正常 ted format ont light 1、hive的數據類型 tinyint/smallint/int/bigint tinyint:從 0 到 255 的整型數據 smallint:從 0 到 65535 的整型數

Hive 修改表結構常用操作

新增列 add columns 　　　　alter table table_name add columns (id int comment '主鍵ID' ) ; 　　　　預設在表所有欄位之後，分割槽欄位之前。替換列 replace columns ,會替換所有列

Hive命令列常用操作（資料庫操作，表操作）

資料庫操作檢視所有的資料庫 hive> show databases ; 使用資料庫default hive> use default; 檢視資料庫資訊 hive > describe data

hive (二) ----- hive的常用操作

並且 class cluster clu spa task group by partition mapr 一、hive操作 1.創建表 CREATE TABLE t3(id int,name string,age int) PARTITIONED BY (Year IN

hive中常用操作

本篇文章主要介紹一下hive的常用sql 操作新增分割槽一次新增一個分割槽 ALTER TABLE table_name ADD PARTITION (partCol = 'value1') location 'loc1'; //示例 ALTER T

Hive常用分割槽操作命令20180805

環境：hadoop-2.7 , hive 2.1 操作hive資料倉庫中的表有個前提，就是被操作的表必須是有分割槽的。需要在建表的時候指定分割槽，具體如何建立有分割槽的表，請看我的另一篇文章《在hive中建立分割槽表,再關聯到hdfs有關位置,而不需匯入資料到

HIVE分割槽常用操作

分割槽常用操作 1.檢視分割槽表中有哪些分割槽 show partitions table_name; SHOW PARTITIONS tomcat_log PARTITION(year='2019'); 2.查詢某個分割槽下的資料根據分割槽查詢資料 select tabl

Hive常用命令（三）--DML操作

Data Manipulation Language：資料操縱語言資料匯入 1、load模式 LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PA

HIVE的常用操作-建庫和表-插入資料

hive的安裝（遠端模式）點選開啟連結使用hive ----------------------- 啟動hadoop 啟動hive 建立資料庫： create database myhive; 檢視資料庫： hive (default)> s

Hive常用的SQL命令操作

1、表相關SQL操作 1.1、建立內部表 CREATE TABLE table_name (name string); select * from table_name LOAD DATA LOCAL INPATH '/litong/data/20170507' ove

hadoop中hive常用的交互式操作

-i ken cif init mas variable rom sil ati hive的幫助命令： [[email protected] tmp]$ hive -help usage: hive -d,--define <key=value&

Hive 系列（四）—— Hive 常用 DDL 操作

一、Database 1.1 檢視資料列表 show databases; 1.2 使用資料庫 USE database_name; 1.3 新建資料庫語法： CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name --DATABASE|SC

Hive 系列（七）—— Hive 常用 DML 操作

一、載入檔案資料到表 1.1 語法 LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] LOCAL 關鍵字代表

byte 常用操作

exceptio cat 移動 ror 位置 all const 長度 ear /** * 低位在前，高位在後 * * @param data * @return */ private byte[] intToBytes(int value) {

Rancher常用操作及名詞概念解析

開發隔離用戶登錄項目組做什麽前言：關於Rancher安裝請參考Rancher-Server部署，此文操作過程是基於以上部署環境進行演示。關於Rancher是做什麽，能完成哪些功能，有哪些優據點請自行了解。本文主要介紹以下幾點什麽是環境如何添加環境什麽是應用棧如何添

Rancher常用操作及名詞解析

用戶登錄項目組做什麽開發隔離前言：關於Rancher安裝請參考Rancher-Server部署，此文操作過程是基於以上部署環境進行演示。關於Rancher是做什麽，能完成哪些功能，有哪些優據點請自行了解。本文主要介紹以下幾點什麽是環境如何添加環境什麽是應用棧如何添

VPS常用操作（自用）

stat art ado ssserver exe 常用 gin lsp sse 1.screen 用來開啟進程，關閉ssh或命令行後扔可以繼續運行 screen screen -list screen -r xx screen -S PID -X quit 2.

Hive-常用操作

前提條件：

準備源資料：

實驗操作：

相關推薦