大資料BigData之如何安裝配置hive？

阿新 • • 發佈：2018-12-19

在安裝hive之前，希望你已經裝好：

Java
hadoop

文章目錄

1. 配置環境變數
2. 配置 hive-env.sh 檔案
3. 配置 hive-site.xml
4. /hive/conf/下，找到hive-site.xml配置檔案

4.1 需要修改臨時資料夾的路徑，改為正確的路徑
4.2 如果沒有此路徑，則自己建立

5. 修改 hive-config.sh

1. 配置環境變數

執行以下命令

$ sudo vi /etc/profile

增加如下配置：

export HIVE_HOME=/usr/local/hive
export PATH=$PATH:$HIVE_HOME/bin
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:/usr/local/hive/lib

2. 配置 hive-env.sh 檔案

所有Hive的配置是在 /usr/local/hive/conf 目錄下，進入這個目錄，我們需要先基於模板新建 hive-env.sh 檔案：

$ cp hive-env.sh.template hive-env.sh
$ vi hive-env.sh

指定Hadoop的路徑，增加以下行：

HADOOP_HOME=/usr/local/hadoop

3. 配置 hive-site.xml

預設配置下是沒有 hive-site.xml 檔案的，我們要先從模板檔案中 copy 一份 hive-site.xml 出來。

$ cp hive-default.xml.template hive-site.xml
$ vi hive-site.xml

**記得要先清空原有的預設資料！！！**否則會報錯，比如說找不到tmpdir目錄！

增加自己需要連線的資料庫 。比如mysql，比如Amazon s3
我這裡的例子是 Amazon s3的

<property 
>
    <name>fs.s3a.access.key</name>
    <value>your access key</value>
</property>
<property>
    <name>fs.s3a.secret.key</name>
    <value>your secret key</value>
</property>

想要使用 hive 進行操作的話，必須要讓 hive 有元資料庫。
例子1：我想用 hive 進行管理操作 mysql，那麼就在 hive 中配置好並連線 mysql 。
例子2：我想用 hive 建立外部表操作 Amazon s3，那麼就在 hive 中配置一個元資料庫（可以是mysql、SQlite等），元資料庫是必須要有的，否則無法操作 Amazon s3。

4. /hive/conf/下，找到hive-site.xml配置檔案

4.1 需要修改臨時資料夾的路徑，改為正確的路徑

hive-site.xml查詢或新增

<property> 
 <name>hive.exec.local.scratchdir</name>
 <value>[your iotmp dir]</value>
 <description>Local scratch space for Hive jobs</description>
 </property>
 <property>
 <name>hive.downloaded.resources.dir</name>
 <value>[your iotmp dir]</value>
 <description>Temporary local directory for added resources in the remote file system.</description>
 </property>

4.2 如果沒有此路徑，則自己建立

這裡因為我當前使用者是user，所以我在hduser的目錄下建立一個iotmp資料夾，並授權：

$ mkdir -p /home/user/iotmp 
$ chmod -R 775 /home/user/iotmp

5. 修改 hive-config.sh

進入目錄/usr/local/hive/bin

$ vi hive-config.sh

在該檔案的最前面加入以下配置：

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 
export HADOOP_HOME=/usr/local/hadoop 
export HIVE_HOME=/usr/local/hive

大資料BigData之如何配置hive連線mysql，把mysql作為元資料庫？

如何配置hive連線mysql，把mysql作為元資料庫？文章目錄 1.增加mysql資料庫的連線配置 2.修改臨時資料夾的路徑 3.修改 hive-config.sh 4.下載MySQL JDBC驅動 5.在HDFS中建立目錄和設定許可權

大資料BigData之如何安裝配置hive？

在安裝hive之前，希望你已經裝好： Java hadoop 文章目錄 1. 配置環境變數 2. 配置 hive-env.sh 檔案 3. 配置 hive-site.xml 4. /hive/conf/下，找到hive-

大資料BigData之hive的執行過程是怎麼樣的？（概括）

hive的執行過程，大體上是這樣的： hive 客戶端（一般是hive cli，入口類為CliDriver）把HQL翻譯成MR執行計劃(Operator樹)並序列化到 plan.xml plan.xml 上傳到hdfs上 hive 客戶端新起一程序，提交MapRe

大資料BigData之 hive command line 如何 debug？

大資料BigData之 hive command line 如何 debug？或是說如何修改日誌的輸出級別？（設定成 Debug 級別）文章目錄 1. 執行 hive cli 的時候加上日誌引數 2. 在xml配置檔案設定日誌輸出級別

大資料BigData之hadoop連線Amazon s3時，core-site.xml檔案該怎麼配置？

hadoop連線Amazon s3時，core-site.xml檔案該怎麼配置？文章目錄 1. 注意 2. s3的配置模板 3. s3n的配置模板 4. s3a的配置模板 5. 必須要新增的配置 5.1 配置 endpo

大資料元件之----HIVE，win10下安裝以及配置hadoop詳細步驟

HIVE其本質是以Hadoop作為基礎的資料倉庫基礎設施。其中hadoop為資料的儲存和執行在商業機器上提供了可擴充套件以及容錯性的可能，其中容錯性可通過副本來進行理解。目標： HIVE是讓資料彙總更加簡單和針對大容量資料的查詢和分析，提供了SWL來使得使用者可以更簡單查詢，彙總和資料分析

大資料基礎之Kafka（1）簡介、安裝及使用

http://kafka.apache.org 一簡介 Kafka® is used for building real-time data pipelines and streaming apps. It is horizontally scalable,&nb

大資料學習之路94-kafka叢集安裝

解壓 Kafka 安裝包修改配置檔案 config/server.properties vi server.properties broker.id=0 //為依次增長的：0、1、2、3、4，叢集中唯一id log.dirs=/kafkaData/logs // Kafka

大資料學習之路92-sparkSQL整合hive

我們知道sparkSQL跟hive是相容的，他支援hive的元資料庫，sql語法，多種型別的UDF，而且還支援hive的序列化和反序列化方式，意思就是hive寫的自定義函式，spark拿過來就能用。最重要的就是MetaStore元資料庫，以後一旦我們使用hive的Meta

大資料入門（15）hive簡介和配置

1、上傳檔案，解壓到app 下 tar -zxvf 檔案 -C app 2、不配置檔案的情況下啟動：./hive (目錄：/home/admin/app/hive

大資料開發之Hadoop篇----hdfs垃圾回收機制配置

其實要啟動hdfs上的垃圾回收機制只需要配置兩個引數就可以了，也是在core-site.xml上配置就好了，我們先去官網看下這個兩引數的解釋。官網的解釋是：Number of minutes after which the checkpoint gets deleted. If zero

大資料開發之Hive篇----初始hive及hadoop簡單回顧

我們先簡單回顧一下hadoop： a，Hadoop是什麼：海量資料分散式的儲存和計算框架。其中資料的儲存是hdfs(Hadoop Distributed File System)，而計算是yarn/mapreduce。 b，Hadoop的訪問方式：shell，Java API，Web UI(

大資料學習之路-Centos6安裝python3.5

Centos 6.8安裝python3.5.2 因為學習所需，需要用到python3.x的環境，目前Linux系統預設的版本都是python2.x的，還有一些自帶的工具需要用到python2.6版本，所以要求的是python3 和 python2 共存，pip2 和** pip3共存，如何安裝

1.大資料元件之ELK過程之安裝logstash-jdbc-input外掛

1.安裝logstash-jdbc-input外掛安裝logstash的'jdbc連線檔案，首先需要安裝ruby，也是為了更好的使用ruby中的gem安裝外掛，下載地址如下： https://rubyinstaller.org/downloads/ （1）下面先寫一下ruby的安裝教程

大資料晉級之路（7）Storm安裝及使用

一、Apache Storm簡介 Apache Storm簡介 Storm是一個分散式的，可靠的，容錯的資料流處理系統。Storm叢集的輸入流由一個被稱作spout的元件管理，spout把資料傳遞給bolt， bolt要麼把資料儲存到某種儲存器，要麼把資料傳遞

大資料培訓之核心知識點Hbase、Hive、Spark和MapReduce的概念理解、特點及機制等

今天，上海尚學堂大資料培訓班畢業的一位學生去參加易普軟體公司面試，應聘的職位是大資料開發。面試官問了他10個問題，主要集中在Hbase、Spark、Hive和MapReduce上，基礎概念、特點、應用場景等問得多。看來，還是非常注重基礎的牢固。整個大資料開發技術，這幾個技術知識點佔了很大一部分。那本

大資料系列之——hive（七、hive詳解及應用）

目錄 2.HQL 一、HIVE概述 1.Hadoop分散式計算遇到的問題 MapReduce只能用java開發(也支援其他語言，但是不是主流)需要對Hadoop的底層原理 api比較瞭解才能順暢的開發出分散式的處

大資料開發之Hadoop篇----配置yarn和mapreduce

上一篇部落格中我們已經完成了hdfs的部署，現在我們開始部署yarn了。我們先使用jps命令來檢視下現在與java相關的程序：這裡NameNode以後簡稱為NN，DataNode簡稱為DN，而SecondaryNameNodel簡稱為SNN。我們先切換到had

大資料系列之hive（八、hive內建函式全解）

1.內建運算子1.1關係運算符運算子型別說明 A = B 所有原始型別如果A

記錄我的大資料學習之旅 ---01.使用VMware安裝CentOs7

前言從2017年初開始接觸大資料，從一無所知，到慢慢探索，到最後能夠獨立開發大資料專案。為此，趁著專案空閒的時間，分享與記錄一下我的大資料學習之旅。一.準備資料，下載CentOs 二.新建虛擬機器

大資料BigData之如何安裝配置hive？

文章目錄

1. 配置環境變數

2. 配置 hive-env.sh 檔案

3. 配置 hive-site.xml

4. /hive/conf/下，找到hive-site.xml配置檔案

4.1 需要修改臨時資料夾的路徑，改為正確的路徑

4.2 如果沒有此路徑，則自己建立

5. 修改 hive-config.sh

相關推薦