大資料入門教程系列之Hive的Java API 操作

阿新 • • 發佈：2018-11-19

Java 想要訪問Hive，需要通過beeline的方式連線Hive，hiveserver2提供了一個新的命令列工具beeline，hiveserver2 對之前的hive做了升級，功能更加強大，它增加了許可權控制，要使用beeline需要先啟動hiverserver2，再使用beeline連線

操作步驟：

①、修改hadoop的core-site.xml配置檔案

②、啟動hadoop

③、啟動hiverserver2

④、開啟一個新視窗使用beeline連線(注意這裡的javaapidb需要提前建立好)

⑤、新建java專案(maven)

詳細步驟：

一、修改hadoop的core-site.xml配置檔案

<property>
    <name>hadoop.proxyuser.hadoop.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hadoop.groups</name>
    <value>*</value>
</property>

否則使用beeline連線時會報如下錯

hadoop is not allowed to impersonate hadoop (state=08S01,code=0)

原因：hiveserver2增加了許可權控制，需要在hadoop的配置檔案中配置

解決方法：在hadoop的core-site.xml中新增如下內容，然後重啟hadoop，再使用beeline連線即可

參考官網：

https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/Superusers.html

二、啟動hadoop

start-sll.sh

三、啟動hiverserver2

hiveserver2

jps看到這個程序說明啟動成功了

四、開啟一個新視窗使用beeline連線(注意這裡的javaapidb需要提前建立好)

beeline -u jdbc:hive2://node1:10000/javaapidb -n hadoop -p

引數解釋：

-u：連線url，可以使用IP，也可以使用主機名，埠預設為10000

-n：連線的使用者名稱（注：不是登入hive的使用者名稱，是hive所在伺服器登入使用者名稱）

-p：密碼，可以不用輸入

啟動中密碼處可以直接回車，啟動後我們查詢一下資料庫即可看到是否啟動成功

五、新建java專案(maven)

1、修改pom


<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.demo</groupId>
    <artifactId>java-api-hive</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>2.3.0</version>
        </dependency>

        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.9</version>
        </dependency>
    </dependencies>

    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.5.1</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
        </plugins>
    </build>

</project>

2、建立測試類HiveJDBC，程式碼如下

官網參考：https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients

演示了一個查詢

完整程式碼：

package hiveapi;

/**
 * Created by zhoujh on 2018/8/15.
 */


import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.sql.*;

/**
 * JDBC 操作 Hive（注：JDBC 訪問 Hive 前需要先啟動HiveServer2）
 */
public class HiveJDBC {

    private static String driverName = "org.apache.hive.jdbc.HiveDriver";
    private static String url = "jdbc:hive2://node1:10000/javaapidb";
    private static String user = "hadoop";
    private static String password = "";

    private static Connection conn = null;
    private static Statement stmt = null;
    private static ResultSet rs = null;

    // 載入驅動、建立連線
    @Before
    public void init() throws Exception {
        Class.forName(driverName);
        conn = DriverManager.getConnection(url, user, password);
        stmt = conn.createStatement();
    }

    // 建立資料庫
    @Test
    public void createDatabase() throws Exception {
        String sql = "create testdb";
        System.out.println("Running: " + sql);
        stmt.execute(sql);
    }

    // 查詢所有資料庫
    @Test
    public void showDatabases() throws Exception {
        String sql = "show databases";
        System.out.println("Running: " + sql);
        rs = stmt.executeQuery(sql);
        while (rs.next()) {
            System.out.println(rs.getString(1));
        }
    }

    // 建立表
    @Test
    public void createTable() throws Exception {
        String sql = "create table emp(\n" +
                "empno int,\n" +
                "ename string,\n" +
                "job string,\n" +
                "mgr int,\n" +
                "hiredate string,\n" +
                "sal double,\n" +
                "comm double,\n" +
                "deptno int\n" +
                ")\n" +
                "row format delimited fields terminated by '\\t'";
        System.out.println("Running: " + sql);
        stmt.execute(sql);
    }

    // 查詢所有表
    @Test
    public void showTables() throws Exception {
        String sql = "show tables";
        System.out.println("Running: " + sql);
        rs = stmt.executeQuery(sql);
        while (rs.next()) {
            System.out.println(rs.getString(1));
        }
    }

    // 查看錶結構
    @Test
    public void descTable() throws Exception {
        String sql = "desc emp";
        System.out.println("Running: " + sql);
        rs = stmt.executeQuery(sql);
        while (rs.next()) {
            System.out.println(rs.getString(1) + "\t" + rs.getString(2));
        }
    }

    // 載入資料
    @Test
    public void loadData() throws Exception {
        String filePath = "/home/hadoop/data/emp.txt";
        String sql = "load data local inpath '" + filePath + "' overwrite into table emp";
        System.out.println("Running: " + sql);
        stmt.execute(sql);
    }

    // 查詢資料
    @Test
    public void selectData() throws Exception {
        String sql = "select * from emp";
        System.out.println("Running: " + sql);
        rs = stmt.executeQuery(sql);
        System.out.println("員工編號" + "\t" + "員工姓名" + "\t" + "工作崗位");
        while (rs.next()) {
            System.out.println(rs.getString("empno") + "\t\t" + rs.getString("ename") + "\t\t" + rs.getString("job"));
        }
    }

    // 統計查詢（會執行mapreduce作業）
    @Test
    public void countData() throws Exception {
        String sql = "select count(1) from emp";
        System.out.println("Running: " + sql);
        rs = stmt.executeQuery(sql);
        while (rs.next()) {
            System.out.println(rs.getInt(1));
        }
    }

    // 刪除資料庫
    @Test
    public void dropDatabase() throws Exception {
        String sql = "drop database if exists hive_jdbc_test";
        System.out.println("Running: " + sql);
        stmt.execute(sql);
    }

    // 刪除資料庫表
    @Test
    public void deopTable() throws Exception {
        String sql = "drop table if exists emp";
        System.out.println("Running: " + sql);
        stmt.execute(sql);
    }

    // 釋放資源
    @After
    public void destory() throws Exception {
        if (rs != null) {
            rs.close();
        }
        if (stmt != null) {
            stmt.close();
        }
        if (conn != null) {
            conn.close();
        }
    }
}

大資料入門教程系列之Hive的Java API 操作

大資料入門教程系列之Hive篇彙總

大資料入門教程系列之Hive篇彙總 1、Hive概述、體系架構、分割槽、桶與傾斜 2、大資料入門教程系列之Hive環境搭建--Linux(Centons7)下配置安裝Hive 3、Hive DDL DML及SQL操作 4、Hadoop2.7.4 編譯支援5種壓縮（Hive壓縮）

大資料入門教程系列之Hive內建函式及自定義函式

本篇文章主要介紹Hive內建函式以及自定義UDF函式和UDFT函式，自定義UDF函式通過一個國際轉換中文的例子說明。操作步驟： ①、準備資料和環境 ②、演示Hive內建函式 ③、自定義UDF函式編寫、演示詳細步驟：一、準備資料和

大資料入門教程系列之Hbase安裝(偽分散式)

本篇文章主要介紹在windows下使用vmware虛擬機器中的Linux(Centons7)下配置安裝Hbase。簡要步驟： ①、下載Hbase解壓包 ②、安裝zookeeper ③、解壓Hbase，配置環境環境 ④、修改Hbase指令碼檔案hbase-env.sh ⑤、修

大資料入門教程系列之Hadoop環境搭建、軟體準備

本篇文章主要介紹大資料入門教程環境搭建所需要的軟體、環境配置等，為後面的學習做準備。完成目標： 1、安裝VMware及新建虛擬機器安裝VMware及新建虛擬機器 2、VMware中安裝centons7 虛擬機器VMware中安裝linux系統CentOS

大資料入門基礎系列之初步認識大資料生態系統圈（博主推薦）

　　不多說，直接上乾貨！　　之前在微信公眾平臺裡寫過大資料入門基礎系列之初步認識hadoop生態系統圈 http://mp.weixin.qq.com/s/KE09U5AbFnEdwht44FGrOA 大資料入門基礎系列之初步認識大資料生態系統圈 1.概述

大資料入門基礎系列之Hadoop1.X、Hadoop2.X和Hadoop3.X的多維度區別詳解（博主推薦）

　　不多說，直接上乾貨！在前面的博文裡，我已經介紹了　　見下面我寫的微信公眾號博文歡迎大家，加入我的微信公眾號：大資料躺過的坑免費給分享同時，大家可以關注我的個人部

大資料Hadoop學習系列之Hadoop、Spark學習路線

1 Java基礎：視訊方面：推薦畢老師《畢向東JAVA基礎視訊教程》。學習hadoop不需要過度的深入，java學習到javase，在多執行緒和並行化多多理解實踐即可。書籍方面：推薦李興華的《java開發實戰經典》 2 Linux基礎：視訊方面：（1）馬哥的高薪Linux

大資料調錯系列之hadoop在開發工具控制檯上打印不出日誌的解決方法

（1）在windows環境上配置HADOOP_HOME環境變數（2）在eclipse上執行程式（3）注意：如果eclipse打印不出日誌，在控制檯上只顯示 1.log4j:WARN No appenders could be found

大資料調錯系列之：自己總結的myeclipse連線hadoop會出現的問題

在我們學習或者工作中開始hadoop程式的時候，往往會遇到一個問題，我們寫好的程式需要打成包放在叢集中執行，這無形中在浪費我們的時間，因為程式可以需要不斷的除錯，然後把最終程式放在叢集中即可。為了解決這個問題，現在我們配置遠端連線hadoop，遠端除錯的方法。一段程式如下：獲取更多大資料視訊資料請加QQ群

python 大資料入門教程

Python在大資料行業非常火爆近兩年，as a pythonic，所以也得涉足下大資料分析，下面就聊聊它們。 Python資料分析與挖掘技術概述所謂資料分析，即對已知的資料進行分析，然後提取出一些有價值的資訊，比如統計平均數，標準差等資訊，資料分析的資料量可能不會太大，而資料探勘，是指對

大資料與Hadoop系列之壓縮(一)

Hadoop壓縮簡介Hadoop作為一個較通用的海量數椐處理平臺，在使用壓縮方式方面，主要考慮壓縮速度和壓縮檔案的可分割性.所有的壓縮演算法都會考慮時間和空間的權衡，更快的壓縮和解壓縮速度通常會耗費更多的交間（壓縮比較低）例如：通過gzip命令壓縮資料時，使用者可以設定不同的

小多的Android入門教程系列---之1---貪吃蛇改進版

Android_Tutorial-Advanced_Snake 小多的Android入門教程系列之1 貪吃蛇改進版背景 android 2.3.3 SDK 10 Eclipse 3.5.1 反饋時間

大資料開發實戰系列之電信客服(1)

大資料實戰開發系列，以實戰為主，輔以一些基礎知識，關於電信客服，在網上也有很多的資料，這裡我自然會去參考網上的資料，程式的整體設計是在今天開始的，老夫儘量在本週末錢結束這個電信客服的程式編寫。因為我也是一個學習者，所以在程式編寫過程中難免會存在問題，有問題還請大家指出，有則改之，無則加勉。大家共同進步。本教程

大資料Hive系列之Hive API

Maven依賴配置 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://ma

大資料入門環境搭建整理、大資料入門系列教程合集、大資料生態圈技術整理彙總、大資料常見錯誤合集、大資料的離線和實時資料處理流程分析

本篇文章主要整理了筆者學習大資料時整理的一些文章，文章是從環境搭建到整個大資料生態圈的常用技術整理，環境希望可以幫助到剛學習大資料到童鞋，大家在學習過程中有問題可以隨時評論回覆！大資料生態圈涉及技術： Hadoop、MapReduce、HDFS、Hive、Hbase、Spark、Scala

大資料Hive系列之Hive API(jdbc增刪改查 &)

Maven依賴配置 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schema

WPF入門教程系列十——布局之Border與ViewBox（五）

last () put prev 裝飾 wpf 背景 .text 部分九. Border Border 是一個裝飾的控件，此控件繪制邊框及背景，在 Border 中只能有一個子控件，若要顯示多個子控件，需要將一個附加的 Panel 控件放置在父 Border 中。然後可以

WPF入門教程系列八——布局之Grid與UniformGrid（三）

input 接下來 toolbar wid ids 全部 ica tar 生成五. Grid Grid顧名思義就是“網格”，它的子控件被放在一個一個實現定義好的小格子裏面，整齊配列。 Grid和其他各個Panel比較起來，功能最多也最為復雜。要使用Grid，首先要向Row

大資料入門之hadoop相關概念知識點整理

Hadoop是一個開源框架，允許使用簡單的程式設計模型在跨計算機叢集的分散式環境中儲存和處理大資料。它的設計是從單個伺服器擴充套件到數千個機器，每個都提供本地計算和儲存。今天整理了一些關於hadoop相關概念的知識點，覺得文章有用的小夥伴可以直接收藏~ 我還是要推薦下我自己建立的大資料資料分享群14

大資料入門教程系列之Hive的Java API 操作

操作步驟：

詳細步驟：

一、修改hadoop的core-site.xml配置檔案

二、啟動hadoop

三、啟動hiverserver2

四、開啟一個新視窗使用beeline連線(注意這裡的javaapidb需要提前建立好)

五、新建java專案(maven)

相關推薦