Spark sql操作Hive

阿新 • • 發佈：2018-12-11

這裡說的是最簡便的方法，通過Spark sql直接操作hive。前提是hive-site.xml等配置檔案已經在Spark叢集配置好。

val logger = LoggerFactory.getLogger(SevsSpark4.getClass)

def main(args: Array[String]): Unit = {
val sparkconf = new SparkConf().setAppName("sevs_spark4")
.set("HADOOP_USER_NAME", getProp("hbase.hadoop.username"))
.set("HADOOP_GROUP_NAME", getProp("hbase.hadoop.groupname"))
// .setMaster("local")

val spark = SparkSession
.builder()
.appName("sevs spark sql")
.config(sparkconf)
.enableHiveSupport()
.getOrCreate()

// For implicit conversions like converting RDDs to DataFrames
import spark.implicits._

//讀Hive示例

val df = spark.sql("select field1,field2 from table1")
df.show(1)
val count = df.count
logger.error(s"資料量={} ################",count)

//寫hive示例

val wf = spark.sql("insert into table1 values ('1','201812')")
logger.error("ending sql hive#################")
}

maven依賴如下：

<dependency>
           <groupId>org.apache.spark</groupId>
           <artifactId>spark-sql_2.11</artifactId>
           <version>2.1.0</version>
           <scope>provided</scope>
       </dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-hive_2.11</artifactId>

<version>2.1.0</version>

<scope>provided</scope>

</dependency>

Spark sql操作Hive

這裡說的是最簡便的方法，通過Spark sql直接操作hive。前提是hive-site.xml等配置檔案已經在Spark叢集配置好。 val logger = LoggerFactory.getLogger(SevsSpark4.getClass) def main(args:

spark sql: 操作hive表

目標：實現類似於navicat的功能=> 寫hql語句，在idea下使用spark sql 一鍵執行，而不用到shell視窗下執行命令步驟：寫sql檔案 (resources目錄)—> 讀取內容 --> 以 ‘;’ 解析每條命令 --

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive

type with hql lac 命令 val driver spark集群 string 1.安裝Hive 如果想創建一個數據庫用戶，並且為數據庫賦值權限，可以參考：http://blog.csdn.net/tototuzuoquan/article/details/5

spark sql 查詢hive表並寫入到PG中

clas sel append nec pro 增加 word postgres erro import java.sql.DriverManager import java.util.Properties import com.zhaopin.tools.{DateU

Spark SQL 訪問hive 出現異常：org.datanucleus.exceptions.NucleusDataStoreException

異常： org.datanucleus.exceptions.NucleusDataStoreException: Exception thrown obtaining schema column information from datastore 出現問題原因： 1、hi

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

第四天 – Accumulator累加器 – Spark SQL – DataFrame – Hive on Spark 文章目錄第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

大資料利用hive on spark程式操作hive

hive on spark 作者：小濤 Hive是資料倉庫，他是處理有結構化的資料，當資料沒有結構化時hive就無法匯入資料，而它也是遠行在mr程式之上

Spark SQL：Hive資料來源複雜綜合案例實戰

一、Hive資料來源實戰 Spark SQL支援對Hive中儲存的資料進行讀寫。操作Hive中的資料時，必須建立HiveContext，而不是SQLContext。HiveContext繼承自SQLContext，但是增加了在Hive元資料庫中查詢表，以及用Hi

Spark SQL 與 Hive 的第一場會師

“你好，一杯熱美式，加 2 份shot, 1 份焦糖，謝謝” L 跨進匯智國際中心大廈的 Starbucks, 拿著 iPhone 對著點餐機輕輕一掃，對黑帶服務員小妹丟擲一個笑臉。 “ L 先生，您的熱美式” “謝謝” 最近 1 禮拜，無論雙休還是工作日，L 每天基本都是同一時間，在早上 Starbucks

Spark SQL與hive hbase mysql整合

虛擬機器環境：centos7 一、Spark SQL 與Hive整合（spark-shell） 1.需要配置的專案 1）將hive的配置檔案hive-site.xml拷貝到spark conf目錄，同時新增metastore的url配置。執行

第69課：Spark SQL通過Hive資料來源實戰

內容： 1.Spark SQL操作Hive解析 2.SparkSQL操作Hive實戰一、Spark SQL操作Hive解析 1.在目前企業級大資料Spark開發的時候，

spark sql 訪問Hive資料表

測試環境 hadoop版本：2.6.5 spark版本：2.3.0 hive版本：1.2.2 master主機：192.168.11.170 slave1主機：192.168.11.171 程式碼實現針對Hive表的sql語句會轉化為MR程式，一般執行起來會比較耗時，spar

通過spark sql建立HIVE的分割槽表

今天需要通過匯入文字中的資料到HIVE資料庫，而且因為預設該表的資料會比較大，所以採用分割槽表的設計方案。將表按地區和日期分割槽。在這個過程出現過一些BUG，記錄以便後期檢視。 spark.sql("use oracledb") spark.sql("CREATE TABL

Spark SQL相容Hive及擴充套件

前言相比於Shark對Hive的過渡依賴，Spark SQL在Hive相容層面僅依賴HQL Parser、Hive Metastore和Hive SerDes。也就是說，從HQL被解析成抽象語法樹(AST)起，就全部由Spark SQL接管了，執行計劃生成和優

Spark-sql與hive的結合環境配置

轉：zx老師 ######################################## alter database hive character set latin1; ALTER TABLE hive.* DEFAULT CHARACTER SET latin1

spark+hcatalog操作hive表及其資料

package iie.hadoop.hcatalog.spark; import iie.udps.common.hcatalog.SerHCatInputFormat; import iie.udps.common.hcatalog.SerHCatOutputFo

Kakfka-Spark Streaming-Spark SQL操作筆記

（kafka版本與Spark版本在maven專案中有提到） linux下測試kafka 1.偽分散式下開啟kafka服務（啟動有先後順序）： nohup zookeeper-server-start.sh config/zookeeper.propert

spark從入門到放棄三十三:Spark Sql(6)hive sql 案例查詢分數大於80分的同學

DROP TABLE IF EXISTS student_info"); sqlContext.sql("CREATE TABLE IF NOT EXISTS student_info (name STRING ,age INT)"); System.out.println(

[2.6]Spark SQL 操作各種資料來源筆記

參考 spark sql操作各種資料來源的資料流轉 : 各種資料來源的輸入 => RDD(lines) =>RDD(Rows) => DataFrame(註冊臨時表) => 分析與過濾（各種sql操作、機器學習等）=