hive詳解（二）

阿新 • • 發佈：2018-12-12

hive操作

建立表的本質：在hdfs的/user/hive/warehouse下的對應的庫目錄下建立表目錄刪除表的本質：刪除表資料對應的目錄

載入資料：（1）values（不建議使用，耗時太長）

insert into t_2 values('1','zhangsan');

我們可以看到，這個時間（雖然與我的叢集執行速度有關），但實在是太慢了。（2）put操作（即上傳檔案）

hdfs dfs -put /xxx /user/hive/warehouse/brz.db/t_3

這裡我上傳stu檔案

[[email protected] test]# hdfs dfs -put ./stu /user/hive/warehouse/brz.db/t_2
[ 
[email protected] test]# hdfs dfs -cat /user/hive/warehouse/brz.db/t_2/stu
1liming
2daming

可以看到，上傳成功。hive中檢視：注意：hive的分隔符預設為：(ctrl+v ctrl+A)，hive是嚴格的讀時模式，如果格式不正確，就會用MULL代替（3）load方式

load data [local] inpath '/usr/local/hive/xxxx' into table tableName;

**注意：**加local則為linux下的目錄

小技巧：在hive的客戶端中執行hdfs和linux的shell命令，需要在命令之前加上!

！hdfs dfs -ls /

載入資料的本質：將資料檔案copy（不完全是copy）到對應表目錄下。如果資料是從本機中載入的，則copy資料到表目錄下；如果資料是從hdfs中載入，則移動(剪下)資料到表目錄下。

（4）insert into載入資料

insert into t_4
select * from t_2
where uid < 7
;

克隆表，不帶資料：like

create table if not exists t_5 like t_4;

克隆錶帶資料：

create table if not exists t_6 like t_2 location '/user/hive/warehouse/brz.db/t_2';

注意： location後指定的一定是hdfs的目錄，而不是檔案

克隆錶帶資料：

更靈活的方式跟建立表的方式一樣，元資料和目錄都會建立

create table if not exists t_7
as
select * from t_2
where uid < 3;

設定hive執行的本機模式：

set hive.exec.mode.local.auto=true;

create table if not exists t_8
as
select uname from t_2
where 1=0
;

速度明顯快了很多。

檢視庫描述：

desc database [extended] brz;
describe database [extended] brz;

查看錶：

desc [extended] t_8;
describe [extended] t_2;
//加extended顯示較為詳細	
show create table t_2;//顯示的結果較全

案例：

CREATE TABLE log(
id string COMMENT 'this is id column',
phonenumber bigint,
mac string,
ip string,
url string,
stat01 string,
stat02 string,
upflow int,
downflow int,
status string,
dt string
)
COMMENT 'this is log table'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '	'
LINES TERMINATED BY '\n'
stored as textfile;

載入資料：

load data local inpath '/usr/local/hive/test/data.log.txt' into table log;

需求： 1、統計每個使用者的上下行流量以及總流量（用人眼可識別的流量單位表示，保留2位小數）

select
l.phonenumber,
sum(l.upflow) as upflow,
sum(l.downflow) as downflow,
sum(l.upflow + l.downflow) as sumflow
from log l
group by l.phonenumber
;

2、求訪問排名前三的url：

select
l.url,
count(l.url) as urlcount 
from log l
group by l.url
order by urlcount desc 
limit 3
;

3、模擬收費(總流量*價格)

表的修改： 1、修改表名 rename to

alter table t_2 rename to t_user_info;

2、修改列名：change column

alter table t_9 change column uname name string;

3、修改列的位置：

alter table t_9 change column name name string after uage;
alter table t_9 change column uage uage string after uname;

alter table t_9 change column uage uage string first;

4、修改欄位型別

alter table t_9 change column uid uid string;

5、增加欄位 add columns

alter table t_9 add columns (
usex int,
addr string
)
;

6、刪除欄位：replace columns(本質：先刪除表，再建立表)

alter table t_9 replace columns(
uid string,
uname string,
addr string
)
;

7、內部表和外部表的轉換：

alter table t_9 set tblproperties("EXTERNAL"="TRUE");   ##true一定要大寫
alter table t_9 set tblproperties("EXTERNAL"="false");  ##false大小寫都沒關係

顯示當前庫：

set hive.cli.print.current.db=true;

刪除庫：

drop database if exists gp;  ##刪除空庫
drop database if exists test cascade; ##cascade強制刪除

hive詳解（二）

hive操作建立表的本質：在hdfs的/user/hive/warehouse下的對應的庫目錄下建立表目錄刪除表的本質：刪除表資料對應的目錄載入資料：（1）values（不建議使用，耗時太長） insert into t_2 values('1'

java.util包詳解（二）——Connection接口

操作相同元素叠代 cat roo soft true nbsp Connection接口介紹　　Connection接口是java集合的root接口，沒有實現類，只有子接口和實現子接口的各種容器。主要用來表示java集合這一大的抽象概念。　　Connection接

C++ 模板詳解（二）（轉）

創建規則 error ++ 例如 public err iostream () 四、類模板的默認模板類型形參　　1、可以為類模板的類型形參提供默認值，但不能為函數模板的類型形參提供默認值。函數模板和類模板都可以為模板的非類型形參提供默認值。　　2、類模板的類型形

mybatis 詳解（二）------入門實例（基於XML）

ssi 開發模式文件中 Coding import 拼接 upd baidu actor 　　通過上一小節，mybatis 和 jdbc 的區別：http://www.cnblogs.com/ysocean/p/7271600.html，我們對 mybatis有了一個大致

Spring詳解（二）------IOC控制反轉

tsp name 調試的人好的 turn 同時 eth 時機　　我相信提到 Spring，很多人會脫口而出IOC（控制反轉）、DI（依賴註入）、AOP等等概念，這些概念也是面試官經常問到的知識點。那麽這篇博客我們就來詳細的講解 IOC控制反轉。　　ps:本篇博客源

.Net AppDomain詳解（二）

onf urn attach msdn 允許 cut isolation cal pst AppDomain 類表示應用程序域，它是一個應用程序在其中執行的獨立環境。此類不能被繼承。命名空間: System程序集: mscorlib（位於 mscorlib.

Ansible詳解（二）

latest load 遠程即使 centos fine oct syn srv Ansible系列命令 Ansible系列命令有如下： ansible:這個命令是日常工作中使用率非常高的命令之一，主要用於臨時一次性操作； ansible-doc:是Ansible模塊文

Zookeeper詳解（二）：Zookeeper安裝

zookeeper安裝安裝環境：CentOS 7 內存1GBJDK版本：1.8.0_112為JDK配置如下環境變量：編輯/etc/profile.d/jdk.sh#!/bin/bash JAVA_HOME=/usr/local/jdk1.8.0_112 export PATH=$JAVA_HOME/bi

dns詳解（二）

dns 子域授權主從架構 bind 轉發區域 bind view dns的另外一種實現方式：dnsmasq較為簡單請自行理解一.主從架構二.子域授權三.轉發區域四.bind中的安全相關配置五.bind view視圖一.主從架構從s擁有和主s一樣的解析庫註意：從服務器是

Linux防火墻詳解（二）

iptables netfilter linux防火墻詳解 nat dnat 一、iptables命令基本語法二、iptables語法進階三、iptables顯示擴展四、iptables簡單案例五、iptables之forward 六、iptables之NAT一、iptables命

Redis詳解（二）

redis sentinal redis集群 redis主從 redis事務一、redis認證二、redis事務三、Connection&server相關命令四、Redis的發布與訂閱//充當mq的功能五、Redis持久化六、redis復制七、master-slave實現八、se

05-Linux中DNS詳解（二）

相關 proc gen lin 四種方法 .... rate 我的網站四種接“04-Linux中DNS詳解（一）” 六、在Linux上測試域名解析1、先檢查DNS是否設置正確 cat /etc/resolv.conf [resolv.conf] # Generate

LAMP詳解（二）

cgi www perl gre tar.gz emd init.d .html product 編譯安裝LAMP一、安裝mariadb二、安裝httpd三、php編譯四、apache的代理指令五、其他LAMP結合的方式 c---httpd[modules]

RGB格式詳解（二）--索引格式

存儲簡介以及關於需要色彩顏色針對表現本節針對RGB索引格式做簡單介紹，這些格式是比較老的格式，比較節省空間，在計算機發展的初期存儲的成本還是很高的，但是表現的色彩很有限，而隨著存儲成本的不斷降低，以及用戶越來越高的視覺體驗需求，這些格式也就基本被拋棄，不再

編碼原理詳解（二）---變換編碼

mar 關於詳解 tex 描述原理學習編碼原理 watermark 本篇介紹編碼原理中的變換編碼。一、變換的目的和作用：變換編碼的作用是將空間域描述的圖像信號變換到頻率域，然後對變換後的系數進行編碼處理。一般來說，圖像在空間上具有較強的相關性，變換到頻率

Nginx詳解（二）操作

ive nal set gen local pcr 大小寫 cpu 目錄結構一、前言二、Nginx安裝三、Nginx的配置文件詳解四、nginx配置之http段五、其他模塊六、實驗一、前言http://www.nginx.cn/doc/ nginx安裝等各個操作界面介紹

Android進階筆記：AIDL內部實現詳解（二）

ucc == 筆記 null stack 直接 android 最好 public 接著上一篇分析的aidl的流程解析。知道了aidl主要就是利用Ibinder來實現跨進程通信的。既然是通過對Binder各種方法的封裝，那也可以不使用aidl自己通過Binder來實現跨進

CentOS 7.4 Tengine安裝配置詳解（二）

tengine、虛擬主機、IP、訪問控制三、配置虛擬主機：1、配置基於端口的虛擬主機：（1）在http{}配置段中新增如下server：server {listen 8000;server_name localhost;access_log /usr/local/tengine/logs/localhost8

Redis詳解（二）------ redis的配置文件介紹

sha 變化模塊 arr bin 詳細特性 disable 是個　　上一篇博客我們介紹了如何安裝Redis，在Redis的解壓目錄下有個很重要的配置文件 redis.conf （/opt/redis-4.0.9目錄下），關於Redis的很多功能的配置都在此文件中完成的

HAProxy詳解（二）

配置文件詳解 ins gif .tar.gz mil 應用完成 get 版本一.HAProxy基礎配置與應用實例： 1.快速安裝HAProxy集群軟件： HAProxy的官網： https://www.haproxy.org/#down下載H

hive詳解（二）

hive操作

相關推薦