1. 程式人生 > >流式大資料計算實踐(7)----Hive安裝

流式大資料計算實踐(7)----Hive安裝

一、前言

1、這一文學習使用Hive

二、Hive介紹與安裝

Hive介紹:Hive是基於Hadoop的一個數據倉庫工具,可以通過HQL語句(類似SQL)來操作HDFS上面的資料,其原理就是將使用者寫的HQL語句轉換成MapReduce任務去執行,這樣不用開發者去寫繁瑣的MapReduce程式,直接編寫簡單的HQL語句,降低了很多學習成本。由於Hive實際上是執行MapReduce,所以Hive的查詢速度較慢,不適合用於實時的計算任務

1、下載Hive的tar包,並解壓

tar zxvf /work/soft/installer/apache-hive-2.3.4-bin.tar.gz

2、配置環境變數

vim /etc/profile

#set hive env
export HIVE_HOME=/work/soft/apache-hive-2.3.4-bin
export PATH=$PATH:$HIVE_HOME/bin

source /etc/profile

3、修改配置檔案(進入Hive的config目錄)

(1)先把模板配置檔案複製一份,並編輯(配置一些目錄,以及將資料庫引擎換成MySQL,這裡需要有MySQL環境)

cp hive-default.xml.template hive-site.xml

(2)配置的hdfs目錄手動建立

hadoop fs -mkdir -p /user/hive/warehouse
hadoop fs -mkdir -p /user/hive/tmp
hadoop fs -mkdir -p /user/hive/log

(3)將配置檔案中的${system:java.io.tmpdir}全部替換成/work/tmp(要記得建立目錄)

(4)將配置檔案中的${system:user.name}全部替換成${user.name}

(5)下面配置中,配置MySQL驅動的包名,如果像我一樣使用高版本的驅動,包名注意是(com.mysql.cj.jdbc.Driver)

cp hive-default.xml.template hive-site.xml

  
<property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> <description>location of default database for the warehouse</description> </property> <property> <name>hive.exec.scratchdir</name> <value>/user/hive/tmp</value> <description>HDFS root scratch dir for Hive jobs which gets created with write all (733) permission. For each connecting user, an HDFS scratch dir: ${hive.exec.scratchdir}/&lt;username&gt; is created, with ${hive.scratch.dir.permission}.</description> </property> <property> <name>hive.querylog.location</name> <value>/user/hive/log/hadoop</value> <description>Location of Hive run time structured log file</description> </property> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://192.168.3.123:3306/myhive?createDatabaseIfNotExist=true&amp;serverTimezone=UTC</value> <description> JDBC connect string for a JDBC metastore. To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL. For example, jdbc:postgresql://myhost/db?ssl=true for postgres database. </description> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.cj.jdbc.Driver</value> <description>Driver class name for a JDBC metastore</description> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> <description>Username to use against metastore database</description> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> <description>password to use against metastore database</description> </property>

(5)下載好MySQL的驅動包(mysql-connector-java-8.0.13.jar),並放到lib目錄下

(6)接下來修改指令碼檔案,同樣將模板複製一份並編輯

cp hive-env.sh.template hive-env.sh

HADOOP_HOME=/work/soft/hadoop-2.6.4

export HIVE_CONF_DIR=/work/soft/apache-hive-2.3.4-bin/conf

三、Hive啟動

1、首先初始化MySQL,進入到bin目錄下,執行初始化命令

bash schematool -initSchema -dbType mysql

2、看到如下列印,說明初始化ok

3、啟動之前先設定一下HDFS的目錄許可權,改成777(可讀可寫可執行)

hadoop fs -chmod -R 777 /

4、執行命令啟動Hive,見到如下列印,說明啟動ok

hive

show databases;