大資料--Hive的安裝以及三種互動方式

阿新 • • 發佈：2022-06-06

1.3 Hive的安裝(前提是：mysql和hadoop必須已經成功啟動了)

在之前部落格中我有記錄安裝JDK和Hadoop和Mysql的過程，如果還沒有安裝，請先進行安裝配置好，對應的隨筆我也提供了百度雲下載連線。

安裝JDK: https://www.cnblogs.com/wyh-study/p/12014368.html

安裝Hadoop https://www.cnblogs.com/wyh-study/p/12043948.html

安裝Mysql https://www.cnblogs.com/wyh-study/p/12044652.html

（注意：安裝mysql的時候一定要確保已經執行：

1.3.1 上傳壓縮包並解壓

tar -zxvf apache-hive-1.2.1-bin.tar.gz

1.3.2 修改目錄名稱

mv apache-hive-1.2.1-bin hive-1.2.1

1.3.3 備份配置檔案

cp hive-env.sh.template hive-env.sh

cp hive-default.xml.template hive-site.xml

1.3.4 修改配置hive的配置檔案（在conf目錄下）

修改hive-env,sh

加入三行內容（大家根據自己的情況來新增,每個人安裝路徑可能有所不同）

<! -- 先進入目錄下  cd /usr/local/soft/hive-1.2.1/conf
HADOOP_HOME=/usr/local/soft/hadoop-2.7.6
JAVA_HOME=/usr/local/soft/jdk1.8.0_171
HIVE_HOME=/usr/local/soft/hive-1.2.1

修改hive-site.xml (找到對應的鍵對值進行修改，注意！！！是修改，而不是全部直接複製貼上)

<！--資料儲存位置就是我們在HDFS上看的目錄-->
<property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>
</property>

(注意：修改自己安裝mysql的主機地址）
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://192.168.40.110:3306/hive?createDatabaseIfNotExist=true&amp;useUnicode=true&amp;characterEncoding=utf8&amp;useSSL=false</value>
</property>

(固定寫法，mysql驅動類的位置)
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>

（mysql的使用者名稱）
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>


（mysql的使用者密碼）
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
</property>

 
（你的hive安裝目錄的tmp目錄）
<property>
<name>hive.querylog.location</name>
<value>/usr/local/soft/hive-1.2.1/tmp</value>
</property>

 
（同上）
<property>
<name>hive.exec.local.scratchdir</name>
<value>/usr/local/soft/hive-1.2.1/tmp</value>
</property>


（同上）
<property>
<name>hive.downloaded.resources.dir</name>
<value>/usr/local/soft/hive-1.2.1/tmp</value>
</property>

<!--指定這個的時候，為了啟動metastore服務的時候不用指定埠-->
<!--hive --service metastore -p 9083 & | hive --service metastore-->
<property>
    <name>hive.metastore.uris</name>
    <value/>
    <description>thrift://master:9083</description>
</property>

修改core-site.xml 直接改，改完重啟就行，為後面beeline連線做準備

注意：三個節點上的都要改。

<!--該引數表示可以通過httpfs介面hdfs的ip地址限制-->
<property>
 <name>hadoop.proxyuser.hadoop.hosts</name>
 <value>*</value>
</property>
<!--通過httpfs介面訪問的使用者獲得的群組身份-->
<property>
 <name>hadoop.proxyuser.hadoop.groups</name>
 <value>*</value>
</property>

1.3.5 拷貝mysql驅動到$HIVE_HOME/lib目錄下

cp /usr/local/soft/mysql-connector-java-5.1.49.jar ../lib/

1.3.6 將hadoop的jline-0.9.94.jar的jar替換成hive的版本。

cp /usr/local/soft/hive-1.2.1/lib/jline-2.12.jar /usr/local/soft/hadoop-2.7.6/share/hadoop/yarn/lib/

1.3.7 將hive的bin目錄配置到環境變數中去

export HIVE_HOME=/usr/local/soft/hive-1.2.1
export PATH=.:$HIVE_HOME/bin

1.3.8 source命令讓環境變數生效

1.3.9 拷貝到其他兩個節點中去，因為可能我們會在其他的節點上當作客戶端訪問hive，注意，也需要配置環境變數，增加驅動jar包，將hadoop的jline-0.9.94.jar的jar替換成hive的版本

<! -- 先進入目錄下  cd /usr/local/soft/
scp -r hive-1.2.1/ node1:`pwd`
  scp -r hive-1.2.1/ node2:`pwd`
<! -- 先進入目錄下  cd /usr/local/soft/ hadoop-2.7.6/etc/hadoop/
   scp core-site.xml node1:`pwd`
<! -- 環境變數也需要配置，這裡就直接遠端複製，配置完成後source一下  
scp /etc/profile node1:/etc/profile
scp /etc/profile node2:/etc/profile

1.3.10 啟動

啟動hadoop

start-all.sh

啟動hive

hive --service metastore

nohup hive --service metastore >/dev/null &

hive

啟動HiveServer2

hiveserver2

nohup hiveserver2 >/dev/null &

beeline -u jdbc:hive2://master:10000 -n root

1.4 Hive的三種互動方式

1）第一種互動方式

shell互動Hive，用命令hive啟動一個hive的shell命令列，在命令列中輸入sql或者命令來和Hive互動。

服務端啟動metastore服務（後臺啟動）：nohup hive --service metastore > /usr/local/soft/mylogs 2>&1 &
進入命令:hive
退出命令列：quit;

2）第二種互動方式

Hive啟動為一個伺服器，對外提供服務，其他機器可以通過客戶端通過協議連線到伺服器，來完成訪問操作，這是生產環境用法最多的

服務端啟動hiveserver2服務：
nohup hive --service metastore >/dev/null &
nohup hiveserver2 >/dev/null &

需要稍等一下，啟動服務需要時間：
進入命令:1)先執行： beeline ，再執行： !connect jdbc:hive2://master:10000 
        2)或者直接執行：  beeline -u jdbc:hive2://master:10000 -n root
退出命令列：！exit

第三方連線工具 DBeaver (熊logo)。

3）第三種互動方式

使用 –e 引數來直接執行hql的語句

bin/hive -e "show databases;"

使用 –f 引數通過指定文字檔案來執行hql的語句

特點：執行完sql後，回到linux命令列。

vim hive.sql

use myhive;
select * from test;

hive -f hive.sql

4）hive cli和beeline cli的區別

大資料--Hive的安裝以及三種互動方式

1.3 Hive的安裝(前提是：mysql和hadoop必須已經成功啟動了) 在之前部落格中我有記錄安裝JDK和Hadoop和Mysql的過程，如果還沒有安裝，請先進行安裝配置好，對應的隨筆我也提供了百度雲下載連線。

Redis（二）redis釋出與訂閱以及三種新資料型別

1 配置檔案 Utis單位部分 redis支援位元組但不支援其他型別 Includes部分設定包含的其他檔案的目錄

w10資料夾選項在哪_win10開啟資料夾選項的三種方法

win10系統的資料夾選項在哪裡？很多使用win1032位旗艦版系統的使用者都會碰到需要對資料夾進行一些設定的情況,這時往往需要用到資料夾選項，可能有網友不知道資料夾選項在哪。沒關係，下面小編就來為大家介紹win10開

004-大資料-4Linux安裝與更新

系統與軟體、安裝、更新編譯安裝編譯安裝配置檔案 Makefile 編譯，安裝命令：make

入門大資料---Hive計算引擎Tez簡介和使用

一、前言 Hive預設計算引擎時MR，為了提高計算速度，我們可以改為Tez引擎。至於為什麼提高了計算速度，可以參考下圖：

axios POST提交資料的三種請求方式寫法

1、Content-Type: application/json import axios from \'axios\' let data = {\"code\":\"1234\",\"name\":\"yyyy\"};

大資料--hive的基礎認識（學習筆記）

一.什麼是hive Hive是基於Hadoop的資料倉庫解決方案。由於Hadoop本身在資料儲存（hdfs）和計算(Map-reduce)方面有很好的可擴充套件性和高容錯性，因此使用Hive構建的資料倉庫也秉承了這些特性。

資料分析必備的三種思考模型

新人學習資料分析有個誤區，認為Excel很Low，SQL做久了又是表哥表姐，學習python又陷入無盡的工具包中不能自拔，迷茫到找專案學習，結果是分析又不得要領，說多了都是淚，這是為什麼呢？其實，這是因為忽略

Ubuntu - 解除安裝軟體的三種最佳方式

三種方式分別為： 1、通過軟體中心刪除 2、通過Synaptic Package Manager刪除 3、通過命令列刪除

大白話詳解大資料hive知識點，老劉真的很用心(1)

前言：老劉不敢說寫的有多好，但敢保證儘量用大白話把自己複習的知識點詳細解釋出來，拒絕資料上的生搬硬套，做到有自己的瞭解！

大白話詳解大資料hive知識點，老劉真的很用心(2)

前言：老劉不敢說寫的有多好，但敢保證儘量用大白話把自己複習的內容詳細解釋出來，拒絕資料上的生搬硬套，做到有自己的瞭解！

大資料視覺化（三）時間資料視覺化

技術標籤：大資料視覺化筆記資料視覺化時間分為連續型時間和離散型時間連續型時間資料視覺化

大白話詳解大資料hive知識點，老劉真的很用心(3)

前言：老劉不敢說寫的有多好，但敢保證儘量用大白話把自己複習的內容詳細解釋出來，拒絕資料上的生搬硬套，做到有自己的瞭解！

java陣列的三種擴容方式以及程式實現詳解

因為陣列是在記憶體中連續的一段儲存空間，所以陣列一旦被建立，空間就固定了，長度是不能擴增的。

Protobuf安裝與三種序列化反序列化方式

技術標籤：nettyprotobuf 首先，我們進入官網下載 https://github.com/protocolbuffers/protobuf/releases/

hive中匯入csv_[大資料]Hive:Spark,我發現你有小祕密啊~

技術標籤：hive中匯入csv 01 請問，你的夢想是什麼？在大資料公司中，任何一家公司都不會只使用一個框架吧？！

大資料-hive-記錄一次不用sqoop將mysql庫的資料匯入到hive庫中

技術標籤：大資料大資料hivemysql 一、場景描述公司需要的一些資料是自己收集的，收集的時候儲存在mysql中，現在需要將mysql中的儲存的資料匯入到hive庫中。

Docker與資料：三種掛載方式

作業系統與儲存作業系統中將儲存定義為 Volume（卷），這是對物理儲存的邏輯抽象，以達到對物理儲存提供有彈性的分割方式。另外，將外部儲存關聯到作業系統的動作定義為 Mount（掛載）。

HDP 大資料環境安裝

HDP: Hortomworks Data Platform CH: Cloudera Distribuion Hadoop 安裝主要分為3部分 1.準備環境,配置機器，準備離線包，本地倉庫，資料庫等

Linux（CentOS）下安裝JDK三種方式

安裝前切記先檢查伺服器上是否存在jdk環境方式一：tar.gz壓縮包安裝下載jdk 下載地址（本人選擇8u221版本）：https://www.oracle.com/java/technologies/downloads/archive/　　

大資料--Hive的安裝以及三種互動方式

1.3 Hive的安裝(前提是：mysql和hadoop必須已經成功啟動了)

1.3.1 上傳壓縮包並解壓

1.3.2 修改目錄名稱

1.3.3 備份配置檔案

1.3.4 修改配置hive的配置檔案（在conf目錄下）

1.3.5 拷貝mysql驅動到$HIVE_HOME/lib目錄下

1.3.6 將hadoop的jline-0.9.94.jar的jar替換成hive的版本。

1.3.7 將hive的bin目錄配置到環境變數中去

1.3.8 source命令讓環境變數生效

1.3.10 啟動

1.4 Hive的三種互動方式

相關推薦