HIVE數倉的安裝與使用

阿新 • • 發佈：2018-12-24

hive的安裝與簡單入門

1 HIVE簡單介紹

1.1什麼是 Hive
Hive：由 Facebook 開源用於解決海量結構化日誌的資料統計。
Hive 是基於 Hadoop 的一個數據倉庫工具，可以將結構化的資料檔案對映為一張表，並提供類 SQL 查詢功能。
本質是：將HQL 轉化成 MapReduce 程式
1.2Hive 架構原理
hive架構
1.3Hive 在載入資料的過程中不會對資料進行任何處理，甚至不會對資料進行掃描，因此也沒有對資料中的某些 Key 建立索引。

2 HIVE安裝

2.1 下載地址
http://archive.apache.org/dist/hive/
github:

https://github.com/apache/hive
2.2 hive 安裝部署

[[email protected] ~]$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C ~/install

[[email protected] ~]$ cd install

[[email protected] install]$ mv apache-hive-1.2.1-bin.tar.gz hive

[[email protected] install]$ cd hive/conf

[[email protected] 
 conf]$  mv hive-env.sh.template hive-env.sh

配置hive-env.sh 檔案

(a)配置 HADOOP_HOME 路徑
export HADOOP_HOME=/home/hadoop/install/hadoop-2.7.2
(b)配置HIVE_CONF_DIR 路徑
exportHIVE_CONF_DIR=/home/hadoop/install/hive/conf

3.啟動HIVE

3.1啟動hadoop

[[email protected] ~]$ start-dfs.sh

[[email protected] 
 ~]$ start-yarn.sh

3.2在hdfs上新建/tmp目錄和/user/hive/warehouse

[[email protected] ~]$ hdfs dfs -mkdir /tmp

[[email protected] ~]$ hdfs dfs -mkdir -p /user/hive/warehouse

3.3啟動hive

[[email protected] ~]$ /home/hadoop/hive/bin/hive

4.HIVE基本操作

檢視資料庫

hive > show database;

使用預設資料庫

hive > use default;

建立表

hive > create table student(id int, name string) ;

查看錶的結構

hive > desc student;

向表中插入資料

hive > insert into student values(1000,"ss");

HQL語句是類SQL語句

5.HIVE的基本資料型別

Hive資料型別	Java資料型別	長度	例子
TINYINT	byte	1byte 有符號整數	20
SMALINT	short	2byte 有符號整數	20
INT	int	4byte 有符號整數	20
BIGINT	long	8byte 有符號整數	20
BOOLEAN	boolean	布林型別，true 或者false	TRUE FALSE
FLOAT	float	單精度浮點數	3.14159
DOUBLE	double	雙精度浮點數	3.14159
STRING	string	字元系列。可以指定字符集。可以使用單引號或者雙引號	‘now is the time’ “for all good men”
TIMESTAMP		時間型別
BINARY		位元組陣列

對於Hive 的 String 型別相當於資料庫的 varchar 型別，該型別是一個可變的字串，不過它不能宣告其中最多能儲存多少個字元，理論上它可以儲存 2GB 的字元數。

5.2集合型別

資料型別	描述	語法示例
STRUCT	和 c 語言中的 struct 類似，都可以通過“點” 符號訪問元素內容。例如，如果某個列的資料型別是 STRUCT{first STRING, lastSTRING}, 那麼第 1 個元素可以通過欄位.first 來引用。	struct()
MAP	MAP 是一組鍵-值對元組集合，使用陣列表示法可以訪問資料。例如，如果某個列的資料型別是 MAP ，其中鍵-> 值對是’first’->’John’和’last’->’Doe’，那麼可以通過欄位名[‘last’]獲取最後一個元素	map()
ARRAY	陣列是一組具有相同型別和名稱的變數的集合。這些變數稱為陣列的元素，每個陣列元素都有一個編號，編號從零開始。例如，陣列值為[‘John’, ‘Doe’]，那麼第 2 個元素可以通過陣列名[1]進行引用	Array()

基於上述資料結構，我們在 Hive 裡建立對應的表，並匯入資料
建立本地檔案test.txt

songsong,bingbing_lili,xiao song:18_xiaoxiao song:19,hui long guan_beijing

yangyang,caicai_susu,xiao yang:18_xiaoxiao yang:19,chao yang_beijing

Hive 上建立測試表 test

hive> create table test( name string,
    > friends array<string>, children map<string, int>,
    > address struct<street:string, city:string>)
    > row format delimited fields terminated by ',' collection items terminated by '_'
    > map keys terminated by ':'
    > lines terminated by '\n';
OK
Time taken: 35.772 seconds
hive>

讀取資料到表中

hive> load data local inpath '/home/hadoop/test/test.txt' into table test;

訪問三種集合列裡的資料，以下分別是 ARRAY，MAP，STRUCT 的訪問方式

hive> select friends[1],children['xiao song'],address.city 
    > from test where name="songsong";
OK
lili	18	beijing
Time taken: 4.662 seconds, Fetched: 1 row(s)

HIVE數倉的安裝與使用

hive的安裝與簡單入門 1 HIVE簡單介紹 1.1什麼是 Hive Hive：由 Facebook 開源用於解決海量結構化日誌的資料統計。 Hive 是基於 Hadoop 的一個數據倉庫工具，可以將結構化的資料檔案對映為一張表，並提供類 SQL 查詢功能。本質是：將HQL

大資料（十七）：Hive簡介、安裝與基本操作

一、簡介 Hive由Facebook開源用於解決海量結構化日誌的資料統計。Hive是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張表，並提供類Sql查詢的功能。 hive本質是將HQL轉化為MapRedu

hive數倉的優化

（1）資源分配 Mapredue的最小資源單元為container，container包括memory及vcores，所以直接與mapreduce掛鉤的資源在yarn上是container，下面是具體的container及mapreduce資源佔用設定

HIVE數倉資料血緣分析工具-SQL解析

一、數倉經常會碰到的幾類問題： 1、兩個資料報表進行對比，結果差異很大，需要人工核對分析指標的維度資訊，比如從頭分析資料指標從哪裡來，處理條件是什麼，最後才能分析出問題原因。 2、基礎資料表因某種原因需要修改欄位，需要評估其對數倉的影響，費時費力，然後在做方

HIVE數倉ETL之MongoDB

前狀：平臺目前還沒有完善的mongodb資料同步方式，在拉取公司埋點系統countly資料時，起初通過編寫MapReduce讀取mongodb資料轉化成BSONObject寫入到HDFS，在hive中建立對映表，使得BSON格式資料可以通過hive sql方式進行查詢通

hive數倉客戶端介面工具

1.Hive的官網上介紹了三個可以在Windows中通過JDBC連線HiveServer2的圖形介面工具，包括：SQuirrel SQL Client、Oracle SQL Developer以及DbVisualizer。 2.SQuirrel SQL Client 從http://squirrel-sql.

MySQL5.6 數據庫主從（Master/Slave）同步安裝與配置詳解

inux bind 主從配置希望 master 強調數據庫主從 ria 配置文件目錄(?)[+] 安裝環境操作系統：CentOS 6.5 數據庫版本：MySQL 5.6.27 主機A：192.168.1.1 （Master）主機B：192.168.

CentOS6.4下Mysql數據庫的安裝與配置

商業 storage 不同的 pool use 速度 man aries ora 原文連接：http://www.cnblogs.com/xiaoluo501395377/archive/2013/04/07/3003278.html 說到數據庫，我們大多想到的是關系型數據

Mysql數據庫一:安裝與創建windows服務

clear 程序啟動 hang spa -- pan mysql數據庫 top Mysql數據庫安裝與創建windows服務 1.先下載壓縮包(mysql-5.7.18-winx64.zip)移動到對應目錄(如D:\software)後解壓. 2.安裝服務端: m

Hive數據類型與文件存儲格式

文件格式 alt dfs apple union pos tro map 內部 Hive數據類型基礎數據類型： TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIM

數據庫與數據倉庫的比較Hbase——Hive

歷史數據發展歷程數據庫設計分析管理 hive eve volatile subject 數據倉庫（Data Warehouse）是一個面向主題的（Subject Oriented）、集成的（Integrate）、相對穩定的（Non-Volatile）、反映歷史

[js高手之路]深入淺出webpack系列1-安裝與基本打包用法和命令參數

查看 2-2 gre colors 令行一起切換 json round webpack，我想大家應該都知道或者聽過，Webpack是前端一個工具,可以讓各個模塊進行加載,預處理,再進行打包。現代的前端開發很多環境都依賴webpack構建，比如vue官方就推薦使用webp

二.Hive數據庫的安裝

hive======一.Hive數據庫的安裝======<code>1.首先需要安裝以上hadoop環境。2.安裝mysql環境存儲Hive的元數據，因為默認的元數據是存放在derby（只支持一個鏈接，用於測試）實際環境用mysql。3.安裝環境使用centos 6.5 IP為：192.168.

Mysql-day1數據庫的安裝與介紹

圖片找到環境變量版本安裝步驟系統 com 安裝位置 image 一、mysql的安裝步驟以5.7.20版本為例：第1步：第2步：第3步：第4步：第5步：第6步：第7步：第8步：第9步：

Hadoop 之 Hive 安裝與配置

file 接下來重新軟件 driver name arc /etc ted Hive 作為基於Hadoop的一個數據倉庫工具，可將sql語句轉換為MapReduce任務進行運行。通過類SQL語句快速實現簡單的MapReduce統計，不用開發專門的MapReduce應用

Hive安裝與配置詳解

column logs javax utf-8 頁面 connect 公司 http 根據既然是詳解，那麽我們就不能只知道怎麽安裝hive了，下面從hive的基本說起，如果你了解了，那麽請直接移步安裝與配置 hive是什麽 hive安裝和配置 hive的測試 hive

Sqoop數據分析引擎安裝與使用

ase 數據庫表 hive list pass font table imp 任務 Sqoop數據分析引擎安裝與使用 ==>什麽是Sqoop ? Sqoop 是一個開源的數據處理引擎，主要是通過 JDBC 為媒介，在Hadoop（Hive）與傳統的關系

SQL server數據庫安裝與表的基本使用

col 技術 gem -o x64 log sql shadow png **** SQL server 安裝與基礎使用**** 一．安裝SQL Server 2008 R2企業版（64位）x64前的準備二、安裝S

mysql數據庫安裝與配置

fig creat rest restart mysql常用命令 mysql 需要數據庫安裝 upd 1.（訪問賬號權限控制）dql-查詢（select） dml-（insert update delete） ddl-（create table create view）

oracle數據庫的安裝與連接關鍵點

navi clas bubuko mage 遠程連接 http height 連接成了一、window xp系統上安裝Oracle Database 10G 解鎖Scott、Hr賬號並重置口令遠程連接數oracle數據庫地址二、在Mac系統上使用Na

HIVE數倉的安裝與使用

hive的安裝與簡單入門

1 HIVE簡單介紹

2 HIVE安裝

3.啟動HIVE

4.HIVE基本操作

5.HIVE的基本資料型別

相關推薦