10大資料-hive 環境搭建

阿新 • • 發佈：2019-01-12

1、將apache-hive-1.2.1-bin.tar.gz上傳到以下目錄

（這個目錄可以自定義，我慣用這個）
/opt/modules/app

2、解壓到當前目錄，並且重新命名為hive

tar -xzvf apache-hive-1.2.1-bin.tar.gz

3、配置環境變數

進入環境變數配置檔案：

vi /etc/profile

追加以下內容：

export HIVE_HOME=/opt/modules/app/hive
export PATH=$PATH:$HIVE_HOME/bin

修改完環境變數，使用以下語句，使該環境變數生效：

resource /etc/profile

測試環境變數看是否配置成功：

echo $HIVE_HOME

image.png

執行結果

4、配置hive引數

所需配置檔案所在目錄：/opt/modules/app/hive/conf

1、拷貝 hive-default.xml ，hive-env.sh 模板

cp hive-default.xml.template  hive-default.xml  

cp hive-env.sh.template   hive-env.sh

2、建立hive-site.xml

touch hive-site.xml

3、配置hive-env.sh

在hive-env.sh文件中追加以下內容：

export JAVA_HOME=/opt/modules/jdk1.8
export HIVE_HOME=/opt/modules/app/hive
export HADOOP_HOME=/opt/modules/app/hadoop

4、配置hive-site.xml

配置該檔案，需要首先在hive 下建立tmp目錄
然後將以下內容填寫到hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration> 
<property>
   <name>javax.jdo.option.ConnectionURL</name>
   <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
   <description>JDBC connect string for a JDBC metastore </description>
</property> 
<property>
   <name>javax.jdo.option.ConnectionDriverName</name>
   <value>com.mysql.jdbc.Driver</value>
</property>

<property>
   <name>javax.jdo.option.ConnectionUserName</name>
   <value>root</value>
</property>

<property>
   <name>javax.jdo.option.ConnectionPassword</name>
   <value>root</value>
</property>

<property>      
        <name>hive.querylog.location</name>     
        <value>/opt/modules/hive/tmp</value>   
</property>    

<property>      
        <name>hive.exec.local.scratchdir</name>     
        <value>/opt/modules/hive/tmp</value>   
</property>   

<property>   
        <name>hive.downloaded.resources.dir</name>     
        <value>/opt/modules/hive/tmp</value>   
</property>

<property>
        <name>datanucleus.schema.autoCreateAll</name>
        <value>true</value>
</property>
### beeline連線hive的thrift服務，使用者名稱密碼設定
<property>
    <name>hive.server2.thrift.client.user</name>
    <value>root</value>
    <description>Username to use against thrift client</description>
  </property>
  <property>
    <name>hive.server2.thrift.client.password</name>
    <value>root</value>
    <description>Password to use against thrift client</description>
  </property>
</configuration>

5、上傳mysql驅動jar

下載mysql驅動檔案mysql-connector-java-5.1.7-bin.jar，並上傳到到/opt/modules/app/hive/lib目錄下。

6、初始化hive

命令：schematool -initSchema -dbType mysql
最後顯示schemaTool completed，沒有報錯就成功了。

7、啟動hive

輸入命令：hive

注意：在啟動hive之前確保hadoop是啟動的

常見問題

1.Permission denied: user=dr.who, access=READ_EXECUTE, inode="/tmp":root:supergroup:drwx------

修改一下許可權

[[email protected] bin]# ./hdfs dfs -chmod -R 777 /tmp

2.hive啟動beeline連線報錯： User: xxx is not allowed to impersonate anonymous (state=08S01,code=0)

解決方式：在hadoop的配置檔案core-site.xml增加如下配置，重啟hdfs，其中“xxx”是連線beeline的使用者，將“xxx”替換成自己的使用者名稱即可

<property>
    <name>hadoop.proxyuser.xxx.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.xxx.groups</name>
    <value>*</value>
</property>

“*”表示可通過超級代理“xxx”操作hadoop的使用者、使用者組和主機

如果在hive之前安裝了spark，可能出現以下錯誤：

初次啟動hive,解決 ls: cannot access /home/hadoop/spark-2.2.0-bin-hadoop2.6/lib/spark-assembly-.jar: No such file or directory問題
spark升級到spark2以後，原有lib目錄下的大JAR包被分散成多個小JAR包，原來的spark-assembly-.jar已經不存在，所以hive沒有辦法找到這個JAR包。

解決方法

開啟hive的安裝目錄下的bin目錄，找到hive檔案

cd $HIVE_HOME/bin
vi hive

找到下圖中的位置

將滑鼠定位的位置，更改成下圖

10大資料-hive 環境搭建

1、將apache-hive-1.2.1-bin.tar.gz上傳到以下目錄（這個目錄可以自定義，我慣用這個） /opt/modules/app 2、解壓到當前目錄，並且重新命名為hive tar -xzvf apache-hive-1.2.1-bin.tar.gz 3、配置環境

大資料入門環境搭建整理、大資料入門系列教程合集、大資料生態圈技術整理彙總、大資料常見錯誤合集、大資料的離線和實時資料處理流程分析

本篇文章主要整理了筆者學習大資料時整理的一些文章，文章是從環境搭建到整個大資料生態圈的常用技術整理，環境希望可以幫助到剛學習大資料到童鞋，大家在學習過程中有問題可以隨時評論回覆！大資料生態圈涉及技術： Hadoop、MapReduce、HDFS、Hive、Hbase、Spark、Scala

大資料學習環境搭建(CentOS6.9+Hadoop2.7.3+Hive1.2.1+Hbase1.3.1+Spark2.1.1)

node1192.168.1.11node2192.168.1.12node3192.168.1.13備註NameNodeHadoopYY高可用DateNode YYYResourceManager YY高可用NodeManagerYYYJournalNodes YYY奇數個,至少3個節點ZKFC（DFSZK

高效的大資料開發環境搭建及實戰

內容大綱：一、開發環境準備1.IDE開發工具選擇及安裝2.Java SDK版本選擇及安裝3.Spark開發語言版本選擇及安裝4.下載Spark的安裝程式5.安裝Maven6.安裝sbt7.IDE的外掛選擇、安裝及配置二、從零開始創建第一個Spark程式－ HelloSpa

大資料CDH5環境搭建

一、基礎環境準備(所有伺服器都要做) 1.修改主機名和hosts # vi /etc/sysconfig/network --修改主機名 NETWORKING=yes HOSTNAME=bigdata01.nebuinfo.com # vi /e

hadoop spark 大資料叢集環境搭建（一）

大資料雲端計算現在比較熱門，未來的一個發展方向，在此分享下技術,有不對的地方歡迎指出 1、軟體環境(會分享到網盤) centos6.5 jdk1.7 hadoop2.4.1(這裡只用到hdfs,namenode不走ha) zookeeper3.4.5 spark1.3.0

Win10不需要Cygwin搭建大資料測試環境（4）---Hive

系列文章前言這篇文章是系列文章中的第四篇，主要描述了win10系安裝Hive。準備工作 1：完成第一篇教程，確保Hadoop正常執行。 2：下載Hive，我安裝的版本是apache-hive-2.1.1-bin。安裝路徑是D:\apach

在阿里雲中搭建大資料實驗環境

第2步：使用MobaXterm工具遠端連線雲伺服器 MobaXterm遠端登入工具提供了大量為程式設計師，網站管理員，IT管理員以及幾乎所有需要以更簡單的方式處理遠端作業的使用者量身打造的功能。它不僅支援各種連線和Unix命令，還可以像PuTTY一樣通過SSH連線Raspberry Pi等

D001.5 Docker搭建大資料叢集環境（基礎篇）

0x00 教程內容 0x01 Docker的安裝 1. 2. 3. 0x02 Docker的簡單操作 1. 2. 3. 0x03 Docker資料卷 Docker的資料卷與Centos的

大資料初學者福利：一片文章教你搭建Hadoop大資料處理環境

由於Hadoop需要執行在Linux環境中，而且是分散式的，因此個人學習只能裝虛擬機器，本文都以VMware Workstation為準，安裝CentOS7，具體的安裝此處不作過多介紹，只作需要用到的知識介紹。 VMware的安裝，裝好一個虛擬機器後利用複製虛擬機器的方式建立後面幾個虛擬機器，省

使用python fabric搭建RHEL 7.2大資料基礎環境以及部分優化

大資料系統基本架構： 1.使用python fabric進行Linux基礎配置使用python，可以讓任何事情高效起來，包括運維工作，fabric正式這樣一套基於python2的類庫，它執行本地或遠端shell命令提供了操作的基本套件（正常或通過sud

資料倉庫元件：Hive環境搭建和基礎用法

本文原始碼：[GitHub](https://github.com/cicadasmile/big-data-parent) || [GitEE](https://gitee.com/cicadasmile/big-data-parent) # 一、Hive基礎簡介 **1、基礎描述** Hive是基

Spark環境搭建（四）-----------數據倉庫Hive環境搭建

apr 程序版本擴展 arch 表名數據集 .tar.gz 自定義 Hive產生背景 1）MapReduce的編程不便，需通過Java語言等編寫程序 2） HDFS上的文缺失Schema(在數據庫中的表名列名等)，方便開發者通過SQL的方式處理結構化的數據，而不需

hive環境搭建

客戶環境 logs java-5 var apache 9.1 ddp body 機器規劃：主機 ip 進程 master1 10.112.29.9 hive server master2 10.112.29.10 hive client mys

Hive環境搭建及簡單使用

Hive前言：上篇文章我們介紹了Hive源碼編譯的相關內容，本篇文章將主要介紹Hive環境的搭建步驟及簡單使用。 1.下載安裝包並解壓 # 下載地址http://archive.cloudera.com/cdh5/cdh/5/ 選擇hive-1.1.0-cdh5.7.0.tar.gz包，也可用我們上篇文

[大資料]hadoop 環境配置(1)

1 基礎環境搭建 Centos 6.4 環境 hadoop 環境搭建 1 使用者新增 sodo adduser kfk 2 hostname 更改 sudo vi /etc/sysconfig/network 3 hosts 更改 sudo vi /etc/h

大資料Hive系列之Hive MapReduce

1. JOIN 1.1 join操作 INSERT OVERWRITE TABLE pv_users SELECT pv.pageid, u.age FROM page_view pv JOIN user u ON (pv.userid = u.userid);

大資料Hive系列之Hive常用SQL

1. hive匯出資料到hdfs 語法：export table 表名 to '輸出路徑'; 例子：export table cloud.customer to '/tmp/hive/customer'; 2. beeline連線 $ beeline 語法：beeline> !

大資料Hive系列之Hive使用者許可權管理

1. 角色 * 建立角色 create role role_name; * 顯示角色 show roles; * 刪除角色 drop role role_name; 2. 使用者 * 使用者進入admin角色許可權 set hive.users.in.admin.role;

大資料Hive系列之Hive API

Maven依賴配置 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://ma

10大資料-hive 環境搭建

常見問題

如果在hive之前安裝了spark，可能出現以下錯誤：

相關推薦