Hive中查詢語句

阿新 • • 發佈：2018-12-02

查詢語句

常用函式

求總行數（count）

hive (default)> select count(*) cnt from emp;

求工資的最大值（max）

hive (default)> select max(sal) max_sal from emp;

求工資的最小值（min）

hive (default)> select min(sal) min_sal from emp;

求工資的總和（sum）

hive (default)> select sum(sal) sum_sal from emp;

求工資的平均值（avg）

hive (default)> select avg(sal) avg_sal from emp;

Limit語句典型的查詢會返回多行資料。LIMIT子句用於限制返回的行數。

hive (default)> select * from emp limit 5;

分組

group by語句通常會和聚合函式一起使用,按照一個或者多個列隊結果進行分組,然後對每個組執行聚合操作

計算emp表每個部門的平均工資

hive (hive)> select avg(sal) avg_sal, deptno from emp group by deptno;

計算emp表每個部分中每個崗位的最高薪水

select deptno,job,max(sal) max_sal from emp group by deptno, job;

having:

having和where不同點

1.where針對表中列發揮作用,查詢資料,Having針對查詢結果中的列發揮作用,篩選資料
2. where後面不能寫分組函式,而having後面可以使用分組函式
3. having只用於group by分組統計語句

求每個部門的平均薪水大於2000的部門

select deptno,avg(sal) avg_sal from emp group by deptno having avg_sal > 2000;

jion語句

等值join

Hive只支援等值連線,不支援非等值連線

根據員工表和部門表中的部門編號相等,查詢員工編號,員工名稱,部門編號

hive (hive)> select e.empno, e.ename, d.deptno from emp e join dept d on e.deptno = d.deptno;

e.empno	e.ename	d.deptno
7369	SMITH	20
499	ALLEN	30
7521	WARD	30
7566	JONES	20

表的別名

好處

使用別名可以簡化查詢,表名字首,提高執行效率

內連線

只進行連線的兩個表中都存在於連線條件相匹配的資料才會被保留下來

案例如等值join

左外連線

jion操作符左邊表中符合where子句的所有記錄將會被返回

select e.empno, e.ename, d.deptno from emp e left join dept d on e.deptno = d.deptno;

右外連線

jion 操作符右邊表中符合where子句的所有記錄將會被返回

select e.empno, e.ename, d.deptno from emp e right join dept d on e.deptno = d.deptno;

滿外連線

將所有表中符合where語句條件的所有記錄,

如果任一表中的指定欄位沒有符合條件的值的話,用null替代

select e.empno, e.ename, d.deptno from emp e full join dept d on e.deptno = d.deptno;

多表連線

連線n個表,至少需要n-1個條件,例如,連線三個表,至少需要兩個連線條件

資料來源

1700 Beijing
1800 London
1900 Tokyo

建立位置表

hive (hive)> create table location(loc int,loc_name string) row format delimited fields terminated by '\t

載入資料

hive (hive)> load data local inpath '/opt/datas/location.txt' into table location;

多表連線查詢

hive (hive)> select e.ename,d.deptno,l.loc_name from emp e join dept d on d.deptno = e.deptno join location l on l.loc = d.loc;

結果

e.ename d.deptno l.loc_name
SMITH 20 London
ALLEN 30 Tokyo
WARD 30 Tokyo
JONES 20 London
MARTIN 30 Tokyo
BLAKE 30 Tokyo
CLARK 10 Beijing
SCOTT 20 London
KING 10 Beijing
TURNER 30 Tokyo
ADAMS 20 London
JAMES 30 Tokyo
FORD 20 London
MILLER 10 Beijing

大多數情況下，Hive會對每對JOIN連線物件啟動一個MapReduce任務。本例中會首先啟動一個MapReduce job對錶e和表d進行連線操作，然後會再啟動一個MapReduce job將第一個MapReduce job的輸出和表l;進行連線操作。
注意：為什麼不是表d和表l先進行連線操作呢？這是因為Hive總是按照從左到右的順序執行的。

笛卡爾積

出現場景

1.省略連線條件
2.連線條件無效
3.所有表中的所有行互相連線

Hive中查詢語句

查詢語句常用函式求總行數（count） hive (default)> select count(*) cnt from emp; 求工資的最大值（max） hive (default)> select max(sal) max_sal from e

Hive通過查詢語句向表中插入資料過程中發現的坑

前言最近在學習使用Hive（版本0.13.1）的過程中，發現了一些坑，它們或許是Hive提倡的比關係資料庫更加自由的體現（同時引來一些問題），或許是一些bug。總而言之，這些都需要使用Hive的開發人員額外注意。本文旨在列舉我發現的3個通過查詢語句向表中插入資料過程中的問題，

ORACLE中查詢語句的執行順及where部分條件執行順序測試 Oracle中的一些查詢語句及其執行順序 Select 語句執行順序以及如何提高Oracle 基本查詢效率

Oracle中的一些查詢語句及其執行順序原文地址：https://www.cnblogs.com/likeju/p/5039115.html 查詢條件：1)LIKE：模糊查詢，需要藉助兩個萬用字元，%：表示0到多個字元；_：標識單個字元。2)IN(list)：用來取出符合列表範圍中的資料。3)NOT I

關於JdbcTemplate中查詢語句的

JDBCTemplate中關於查詢語句的api：（1）如果查詢返回的是單行單列的形式的話，就用queryForObject(),它類似於這樣的sql語句：select count(*) from 資料庫名；（2）如果查詢返回的是單行多列的形式的話，就用qu

Hive中查詢語

查詢語句常用函式求總行數（count） hive (default)> select count(*) cnt from emp; 求工資的最大值（max） hive (default)&g

Hibernate5中的3中查詢語句（HQL、SQL、QBC）

User為類名，id userName，password為屬性; t_user為表名，t_id，t_username，t_password為表字段名1、HQL語句：Hibernate的語句 String

關於MySQL中查詢語句行轉列分組的問題

今天遇到一個SQL的小問題，首先需要按天查詢資料，並且需要統計每一個不同位置的資料條數，處理的時候卡住了，特此記錄一下： #首先，第一次寫的SQL如下，先按天分組，後按指定條件分組： SELECT id, DATE_FORMAT(crea

hive select查詢語句

hive select查詢語句現在不想整理了！！！！！！！！！有空再整理了！！！ SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condit

hive ---- hive常見查詢語句練習（有一定難度的）

有一定難度的sql語句 -- 1、查詢"01"課程比"02"課程成績高的學生的資訊及課程分數思路：關鍵步驟：select * from score l join score r on (l

sqlserver中查詢語句case when判斷的用法

今天幫同事統計表格，給我了個sql語句，又給我了份excel模板，但是sql語句查詢出來的結果和模板對不上，這導致還得人工一條一條的找這些資料，然後手動填寫結果...這太tm麻煩了... excel模板如下（簡化版）：機構\日期 5月13日 5月15日某某機構1 是否

[一起學Hive]之九-Hive的查詢語句SELECT

八、Hive的查詢語句SELECT 在所有的資料庫系統中，SELECT語句是使用最多，也最複雜的一塊，Hive中的查詢語句SELECT支援的語法當然也比較複雜，本文只能盡力去介紹。 8.1 基礎查詢語法 Hive中的SELECT基礎語法和標準SQL語法基本一致，支援

HUE-hive常用查詢語句整理

hue count 你好連接查詢 reg 數據 -h bsp select 通過hue進行數據導入： 1，create table demo_id(`id` string) row format serde ‘org.apache.hadoop.hive.serde

Hive 不支援 where 子句中的子查詢， SQL 常用的 exist in 子句需要改寫。這一改寫相對簡單。考慮以下 SQL 查詢語句：

歡迎使用Markdown編輯器你好！這是你第一次使用 Markdown編輯器所展示的歡迎頁。如果你想學習如何使用Markdown編輯器, 可以仔細閱讀這篇文章，瞭解一下Markdown的基本語法知識。新的改變我們對Markdown編輯器進行了一些功能

sqlit中使用到的查詢語句

join article pid 記錄 ack 時間排序 ont 連表 -1 近期使用sqlite查詢比較多，包含連表查詢等。記錄一下。以免忘記！ 1.先依據時間排序後選擇前十條： select * from MyBill order by createTime

Mysql 數據查詢語句中between and 是包含邊界值的

數據查詢 repl use ref net bsp 使用一個數 not MySQL的sql語句中可以使用between來限定一個數據的範圍，例如： select * from user where userId between 5 and 7; 查詢userId為5、6，

如何查找MySQL中查詢慢的SQL語句

for 分析 warnings 主鍵每一個毫秒通知 const 每天如何在mysql查找效率慢的SQL語句呢？這可能是困然很多人的一個問題，MySQL通過慢查詢日誌定位那些執行效率較低的SQL 語句，用--log-slow-queries[=file_name]選項

數據庫基礎查詢語句中的幾個細節

語句 nvl 備註 nav 數據庫數據庫基礎細節字符串 rom 運算　　select 姓名列，工資列，工資列*12 from 表名　　計算年薪字符串拼接　　irst_name||‘是‘||start_date||‘入職的,工資是‘||salary||‘,職位是

關於sql查詢語句中的別名

sql查詢 img col exceptio pan 語句 sel select ava sql語句中給子查詢或其他查詢類型加別名的時候可能會報錯 java.sql.SQLException: 無法轉換為內部表示原因是select返回類型的實體類中沒有寫該別名原來

MySQL 查詢語句中自己定義的中文內容在Java Web 中顯示為問號

variable select 關閉程序自己 bsp from sel 技術　　Java Web 端做查詢時，性別字段存的是數字，1代表男，2代表女，取數據時將性別轉為漢字顯示在頁面，sql語句如下，結果發生了問題 select a.emp_id,a.emp_n

SQL中的SELECT 簡單查詢語句總結

clas 識別結果集 -i ear get int 一個 lec --scott用戶不能使用，使用system登錄--修改用戶scott賬戶解鎖ALTER USER SCOTT ACCOUNT UNLOCK;--重新設置密碼identified被識別的alter user

Hive中查詢語句

查詢語句

常用函式

分組

jion語句

等值join

表的別名

內連線

左外連線

右外連線

滿外連線

多表連線

笛卡爾積

相關推薦