spark sql整合hive步驟

阿新 • • 發佈：2019-02-20

SPARK ON HIVE：讓spark sql通過sql的方式去讀取hive當中的資料

HIVE ON SPARK：讓hive的計算引擎由MapReduce改為SPARK

1、先按官網的參考程式碼，構建

val conf = new SparkConf().setMaster("local[*]").setAppName("hotCount")

val sc = new SparkContext(conf)

//建立hive的例項

val hiveContext = new HiveContext(sc)

hiveContext.sql("CREATE TABLE IF NOT EXISTS src (key INT, value STRING)")

hiveContext.sql("LOAD DATA LOCAL INPATH 'E:/hive.txt' INTO TABLE src")

// Queries are expressed in HiveQL

hiveContext.sql("FROM src SELECT key, value").collect().foreach(println)

出現：

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)V

我們之後在windows當中配置的hadoop版本是從apache下載，但是我們現在所使用的hadoop版本是cdh的。所以出現的版本不一致的問題。

1、需要去下載一個cdh版本的hadoop

配置HADOOP_HOME的環境變數

將外掛中的

中的hadoop.dll檔案複製到C:/windows/system32目錄下

在外掛中的其它檔案，複製到hadoop目錄的/bin目錄下。

注意：有可能是外掛問題

現在可以保證，HiveContext可以操作相應的SQL。

但是該SQL操作的內容是來自於windows本地，沒有與hive表進行連線。

2、讓HiveContext與hive進行連線，出現下面樣式，表示配置已經成功

將hive-site.xml、hdfs-site.xml、core-site.xml檔案加入resource目錄

需要在cdh的版本下，去找到hive的配置檔案

2.1：find / -name ‘hive-site.xml’發現有多個配置檔案，建議使用/etc/目錄下的檔案

2.2：在Idea專案去建立一個resource目錄

2.3將配置檔案複製到resource目錄下

注意：在sparksql去連線是通過主機名去訪問的，要讓本地的hosts的ip與主機名對應。

連線成功了。但是看不到相應的資料

在hive當中去建立了一個很簡單的表，通過spark sql去測試，發現是可以正常讀取出來的。

查詢不到結果與表結構有關。

flume到hive的表需要要求：分桶與orc格式。

在spark 1.6以及之前不支援。

在spark 2.*當中是可以通過spark sql來操作的。

將原始表中的資料，轉換成我們計算的單元【根據需求來確定】

spark sql整合hive步驟

SPARK ON HIVE：讓spark sql通過sql的方式去讀取hive當中的資料HIVE ON SPARK：讓hive的計算引擎由MapReduce改為SPARK1、先按官網的參考程式碼，構建val conf = new SparkConf().setMaste

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive

type with hql lac 命令 val driver spark集群 string 1.安裝Hive 如果想創建一個數據庫用戶，並且為數據庫賦值權限，可以參考：http://blog.csdn.net/tototuzuoquan/article/details/5

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Spark SQL 整合Hive的使用

Spark SQL官方釋義 Spark SQL is Apache Spark's module for working with structured data. 一、使用Spark SQL訪問Hive需要將$HIVE_HOME/conf下的hive

Spark SQL與hive hbase mysql整合

虛擬機器環境：centos7 一、Spark SQL 與Hive整合（spark-shell） 1.需要配置的專案 1）將hive的配置檔案hive-site.xml拷貝到spark conf目錄，同時新增metastore的url配置。執行

spark sql 查詢hive表並寫入到PG中

clas sel append nec pro 增加 word postgres erro import java.sql.DriverManager import java.util.Properties import com.zhaopin.tools.{DateU

Spark SQL 訪問hive 出現異常：org.datanucleus.exceptions.NucleusDataStoreException

異常： org.datanucleus.exceptions.NucleusDataStoreException: Exception thrown obtaining schema column information from datastore 出現問題原因： 1、hi

第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

第四天 – Accumulator累加器 – Spark SQL – DataFrame – Hive on Spark 文章目錄第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

Spark sql操作Hive

這裡說的是最簡便的方法，通過Spark sql直接操作hive。前提是hive-site.xml等配置檔案已經在Spark叢集配置好。 val logger = LoggerFactory.getLogger(SevsSpark4.getClass) def main(args:

Spark SQL：Hive資料來源複雜綜合案例實戰

一、Hive資料來源實戰 Spark SQL支援對Hive中儲存的資料進行讀寫。操作Hive中的資料時，必須建立HiveContext，而不是SQLContext。HiveContext繼承自SQLContext，但是增加了在Hive元資料庫中查詢表，以及用Hi

Spark SQL 與 Hive 的第一場會師

“你好，一杯熱美式，加 2 份shot, 1 份焦糖，謝謝” L 跨進匯智國際中心大廈的 Starbucks, 拿著 iPhone 對著點餐機輕輕一掃，對黑帶服務員小妹丟擲一個笑臉。 “ L 先生，您的熱美式” “謝謝” 最近 1 禮拜，無論雙休還是工作日，L 每天基本都是同一時間，在早上 Starbucks

spark sql: 操作hive表

目標：實現類似於navicat的功能=> 寫hql語句，在idea下使用spark sql 一鍵執行，而不用到shell視窗下執行命令步驟：寫sql檔案 (resources目錄)—> 讀取內容 --> 以 ‘;’ 解析每條命令 --

第69課：Spark SQL通過Hive資料來源實戰

內容： 1.Spark SQL操作Hive解析 2.SparkSQL操作Hive實戰一、Spark SQL操作Hive解析 1.在目前企業級大資料Spark開發的時候，

spark sql 訪問Hive資料表

測試環境 hadoop版本：2.6.5 spark版本：2.3.0 hive版本：1.2.2 master主機：192.168.11.170 slave1主機：192.168.11.171 程式碼實現針對Hive表的sql語句會轉化為MR程式，一般執行起來會比較耗時，spar

通過spark sql建立HIVE的分割槽表

今天需要通過匯入文字中的資料到HIVE資料庫，而且因為預設該表的資料會比較大，所以採用分割槽表的設計方案。將表按地區和日期分割槽。在這個過程出現過一些BUG，記錄以便後期檢視。 spark.sql("use oracledb") spark.sql("CREATE TABL

Spark SQL相容Hive及擴充套件

前言相比於Shark對Hive的過渡依賴，Spark SQL在Hive相容層面僅依賴HQL Parser、Hive Metastore和Hive SerDes。也就是說，從HQL被解析成抽象語法樹(AST)起，就全部由Spark SQL接管了，執行計劃生成和優

Spark-sql與hive的結合環境配置

轉：zx老師 ######################################## alter database hive character set latin1; ALTER TABLE hive.* DEFAULT CHARACTER SET latin1

spark從入門到放棄三十三:Spark Sql(6)hive sql 案例查詢分數大於80分的同學

DROP TABLE IF EXISTS student_info"); sqlContext.sql("CREATE TABLE IF NOT EXISTS student_info (name STRING ,age INT)"); System.out.println(

spark從入門到放棄三十二:Spark Sql(5)hive sql 簡述

1 簡述 Spark Sql 支援對Hive 中儲存的資料進行讀寫。操作Hive中的資料時，可以建立HiveContext,而不是SqlContext.HiveContext 繼承自SqlContext,但是增加了在Hive元資料庫中查詢表，以及用Hi

spark-sql 集合hive查詢資料執行日誌

[[email protected] spark]# spark-sql --master spark://hadoop1:7077,hadoop2:7077 --executor-memory 1g --total-executor-cores 2 --driv

spark sql整合hive步驟

相關推薦