java本地使用JDBC連線Spark SQL（HiveServer2）

阿新 • • 發佈：2019-02-13

根據Spark官網所述，Spark SQL實現了Thrift JDBC/ODBC server：

The Thrift JDBC/ODBC server implemented here corresponds to the HiveServer2 in Hive 1.2.1 You can test the JDBC server with the beeline script that comes with either Spark or Hive 1.2.1.

這就意味著我們可以像HIVE那樣通過JDBC遠端連線Spark SQL傳送SQL語句並執行。

1、準備工作

在這之前需要先將${HIVE_HOME}/conf/hive-site.xml 拷貝到${SPARK_HOME}/conf目錄下，由於我的hive配置了元資料資訊存

儲在MySQL中，所以Spark在訪問這些元資料資訊時需要mysql連線驅動的支援。新增驅動的方式有三種：

第一種是在${SPARK_HOME}/conf目錄下的spark-defaults.conf中新增：spark.jars /opt/lib/mysql-connector-java-5.1.26-bin.jar

第二種是通過新增：spark.driver.extraClassPath /opt/lib2/mysql-connector-java-5.1.26-bin.jar 這種方式也可以實現新增多個依賴jar，比較方便

第三種是在執行時新增 --jars /opt/lib2/mysql-connector-java-5.1.26-bin.jar

做完上面的準備工作後，spark sql和Hive就繼承在一起了，spark sql可以讀取hive中的資料

2、啟動thrift

在spark根目錄下執行：./sbin/start-thriftserver.sh 開啟thrift伺服器

start-thriftserver.sh 和spark-submit的用法類似，可以接受所有spark-submit的引數，並且還可以接受--hiveconf 引數。

不新增任何引數表示以local方式執行。

預設的監聽埠為10000

3、用beeline測試

在spark根目錄下執行：

./bin/beeline

連線 JDBC/ODBC server

beeline> !connect jdbc:hive2://localhost:10000

連線後會提示輸入使用者名稱和密碼，使用者名稱可以填當前登陸的linux使用者名稱，密碼為空即可，連線成功如下圖所示：

執行show tables;

可以看到之前我在hive中使用的三張表

看一下doc1的表結構：

執行查詢操作：

4、在java程式碼中用jdbc連線

接下來開啟eclipse用jdbc連線hiveserver2，連線hive的步驟同樣如此。
新建一個maven專案：
在pom.xml新增以下依賴：

（注意！！hive-jdbc的版本一定要和伺服器上的hive版本對應，jdk版本和本地機器的對應這邊以1.8為例，不然會報錯！！！）

（注意！！hive沒有提供-version的版本檢視命令，檢視hive版本請移步：

http://blog.csdn.net/zyzzxycj/article/details/79268754）

<dependencies>
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>1.1.0</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.4.1</version>
        </dependency>

        <dependency>
            <groupId>jdk.tools</groupId>
            <artifactId>jdk.tools</artifactId>
            <version>1.8</version>
        </dependency>
    </dependencies>

然後將jdk中的${JAVA_HOME}/lib/tools.jar拷貝到當前工程目錄下，在執行以下程式碼手動安裝：

（注意！！-Dversion=1.* 這邊的版本對應）

mvn install:install-file -DgroupId=jdk.tools -DartifactId=jdk.tools -Dpackaging=jar -Dversion=1.8 -Dfile=tools.jar -DgeneratePom=true

等待maven載入完成後，進入下一步：

在編寫jdbc連線程式碼之前要了解連線hiveserver2的相關引數：

驅動：org.apache.hive.jdbc.HiveDriver

url：jdbc:hive2://你的hive地址:埠號/資料庫名

使用者名稱：root (啟動thriftserver的linux使用者名稱)

密碼：“”（預設密碼為空）

import java.sql.*;

public class test_Spark_JDBC {
    public static void main(String[] args) throws SQLException {
        String url = "jdbc:hive2://你的hive地址:埠號/資料庫名";
        try {
            Class.forName("org.apache.hive.jdbc.HiveDriver");
        } catch (ClassNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        Connection conn = DriverManager.getConnection(url, "root", "");
        Statement stmt = conn.createStatement();
        String sql = "SELECT name,price FROM instancedetail_test limit 10";
        String sql2 = "desc instancedetail_test";
        String sql3 = "SELECT count(*) FROM instancedetail_test";
        ResultSet res = stmt.executeQuery(sql);
        while (res.next()) {
            System.out.println(res.getString(1) + "\t" + res.getDouble(2));
    }
        res = stmt.executeQuery(sql2);
        res = stmt.executeQuery(sql3);
//        while (res.next()) {
//            System.out.println("id: " + res.getInt(1) + "\ttype: " + res.getString(2) + "\tauthors: " + res.getString(3) + "\ttitle: " + res.getString(4) + "\tyear:" + res.getInt(5));
//        }
    }
}

至此連線成功！有錯誤或疑問歡迎評論~

java本地使用JDBC連線Spark SQL（HiveServer2）

根據Spark官網所述，Spark SQL實現了Thrift JDBC/ODBC server： The Thrift JDBC/ODBC server implemented here corresponds to the HiveServer2 in Hive 1.

JAVA學習：JDBC連線DB2資料庫（1）

在CSDN潛了這麼久，今天終於決定開始寫一點東西了，慵懶的腳算是邁出第一步了，希望自己堅持。 JAVA專案做了這麼長時間，資料庫的連線一直沒有仔細研究過。專案中因為這部分都是封在包裡的，自己並沒有機會去寫，甚至連看都看不到。趁著最近比較閒，自己好好的練習一下。以下這一段藍字部

JAVA使用JDBC連線資料庫SQL Server2012

要在JAVA中使用JDBC連線SQL Server2012資料庫需要如下三個大的步驟：一、設定SQL Server2012的身份驗證方式為混合模式如果不知道如何設定，請見博文：二、啟動telnet服務如果不知道如何啟動該服務，請見博文三、在java中使

Spark SQL 筆記(5)—— Hive 到 Spark SQL（1）

1 SQLContext 1.1 Spark1.x 中Spark SQL 的入口點：SQLContext 參考連結 https://spark.apache.org/docs/1.6.1/sql-programming-guide.html#starting-point-sqlc

JAVA通過JDBC操作MySQL資料庫（三）：PreparedStatement介面操作資料庫

JAVA通過JDBC操作MySQL資料庫（三）：PreparedStatement介面操作資料庫 Statement介面的問題 PreparedStatement介面操作資料庫 Statement介面的問題在文章JAVA通過JDBC操作

JDBC連線資料庫程式碼（一） -- 一個簡單的獲取資料庫表單

package com.nenu.www; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql

spark SQL （二）聚合

聚合內建功能DataFrames提供共同聚合，例如count()，countDistinct()，avg()，max()，min()，等。雖然這些功能是專為DataFrames，spark SQL還擁有型別安全的版本，在其中的一些 scala 和 Java使用

JDBC批量執行sql（轉）

JDBC的批量處理語句包括下面兩個方法：addBatch(String)：新增需要批量處理的SQL語句或是引數；executeBatch（）；執行批量處理語句；通常我們會遇到兩種批量執行SQL語句的情況

spark SQL（六）效能調整

spark SQL 效能調整對於某些工作負載，可以通過在記憶體中快取資料或開啟一些實驗選項來提高效能。 1，在記憶體中快取資料 Spark SQL可以通過呼叫spark.catal

spark SQL（三）資料來源 Data Source----通用的資料載入/儲存功能

Spark SQL 的資料來源------通用的資料載入/儲存功能 Spark SQL支援通過DataFrame介面在各種資料來源上進行操作。DataFrame可以使用關係變

java基礎類庫學習 java.sql（7）使用資料庫連線池來管理資料庫連線物件

前言：在實際開發中，如果我們不斷地建立資料庫連線物件，一個數據庫連線物件均對應一個物理資料庫連線，每次操作都開啟一個物理連線，使用完後就立即關閉連線，頻繁的開啟關閉連線會造成系統性能下降因此實際開發中不推薦頻繁的建立資料庫連線物件，頻繁的開啟物理資料庫連線，頻繁的關閉

intelij idea下使用java和JDBC連線oracle資料庫及簡單的SQL操作

（1）閱讀參考資料，理解 JDBC 的呼叫機制；（2）學會在 tomcat 中部署 JDBC 介面驅動；首先修改 D:\SoftwareSetups\Tomcat\webapps\manager\META-INF\context.xml，在其中新增以下程式碼： &l

Java使用JDBC連線Hive（新版本）API封裝

網上找了很多封裝的API,發現都是過時了的，執行報各種錯誤，經過了幾天的調錯，終於可以使用java程式碼操作hive了首先看看所需的包所有的分析都在程式碼裡面注意：網上很多程式碼對於DDL都執行 res = stmt.executeQuery(

java用jdbc連線mysql資料庫和sql server資料庫

public static void cre_mysql(String lst,String term,String kind) { try { Class.f

java採用jdbc連線SQL資料庫例項

<p>import java.sql.*; </p><p>public class test { public static void main(String[] args) { String JDriver="com.micros

JAVA WEB JDBC連線資料庫

桂林理工大學實驗報告班級軟體16-1班學號 3162052051116 姓名張識虔同組實驗者 &

第一篇隨記:學習WAMP中最基礎的JDBC連線操作記錄（ Statement、PreparedStatement和CallableStatement）

用Statement實現資料庫連線： <%@ page contentType="text/html" pageEncoding="UTF-8" %> <%@ page import="java.sql.*" %> <html> <

jdbc連線mysql資料庫（或oracle）驗證通過，並操作資料庫

1.連線資料庫其實很簡單，直接粘程式碼，首先我們先複製mysql的jar包 2.再建立資料庫連線資訊檔案，寫入檔案，DRIVER可以照抄，URL是本地的資料庫資訊，如果是伺服器的資料庫可以將localhsot改成伺服器Ip，使用者名稱和密碼是資料庫的。 3.建立一個db類，第一個

Spark學習（柒）- Spark SQL擴充套件和總結

文章目錄 Spark SQL使用場景 Spark SQL載入資料 1) RDD DataFrame/Dataset 2) Local Cloud(HDFS/S3) DataFrame與SQL的對比

Spark學習（肆）- 從Hive平滑過渡到Spark SQL

文章目錄 SQLContext的使用 HiveContext的使用 SparkSession的使用 spark-shell&spark-sql的使用 spark-shell spark-sql thri

java本地使用JDBC連線Spark SQL（HiveServer2）

相關推薦