spark本地除錯hive

阿新 • • 發佈：2019-01-20

本地環境資訊 spark2.1.0 hadoop:2.6.0 hive:2.1.1 scala:2.11.8 java:1.8.0_141 mysql

1 保證hive可用，配置hive-site.xml如下，下面的配置使用的是mysql作為元資料儲存工具，所以還需要將mysql驅動包複製到hive安裝路徑的lib目錄下，需要配置hive使用mysql座位底層儲存工具schematool -initSchema -dbType mysql。

<configuration>  
   <property>  
        <name>javax.jdo.option.ConnectionURL</name>  
        <value>jdbc:mysql://10.118.58.27:3306/hive?createDatabaseIfNotExist=true</value>  
    </property>  
    <property>  
        <name>javax.jdo.option.ConnectionDriverName</name>  
        <value>com.mysql.jdbc.Driver</value>  
    </property>  
    <property>  
        <name>javax.jdo.option.ConnectionUserName</name>  
        <value>××××</value>  
    </property>  
    <property>  
        <name>javax.jdo.option.ConnectionPassword</name>  
        <value>××××</value>  
    </property>  
    <property>    
   <name>hive.metastore.schema.verification</name>    
   <value>false</value>    
    <description>    
    Enforce metastore schema version consistency.    
    True: Verify that version information stored in metastore matches with one from Hive jars.  Also disable automatic    
          schema migration attempt. Users are required to manully migrate schema after Hive upgrade which ensures    
          proper metastore schema migration. (Default)    
    False: Warn if the version information stored in metastore doesn't match with one from in Hive jars.    
    </description>    
 </property> 
 <property>
	<name>hive.server2.thrift.bind.host</name>
	<value>bigData</value>
 </property>
 <property>
        <name>hive.server2.thrift.port</name>
        <value>10000</value>
 </property>
</configuration>

2 保證本地spark-sql可以正常呼叫（通常需要將hive-site拷貝到spark的conf目錄下，如果hive底層使用的是mysql，則需要將mysql的驅動包也複製到spark的lib路徑）

3 spark程式設計，我使用的是idea，通過maven建立scala工程，如果要通過本地除錯，需要將hive-site.xml複製到工程的resources目錄下，同時將mysql/spark_hive的jar包也新增到專案路徑下，由於spark2.1.0使用sparkSession，支援hive，所以在初始化sparkSession時只需啟用hive即可，如下：

objectTestWork {
  def  
main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf()
    args.map(_.split("=")).filter(_.size==2).map(x=>sparkConf.set(x(0),x(1)))
    val spark = SparkSession.builder()
      .config(sparkConf)
      .appName("test").enableHiveSupport()
//      .master("spark://10.118.58.27:7077")
.getOrCreate()
    spark.sql("select * from selfwork.srczkw" 
).show()
  }
}

web預設埠：

namenode的webUI埠：50070
yarn的web埠：8088
spark叢集的web埠：8080
spark-job監控埠：4040

spark本地除錯hive

spark本地除錯hive

Spark本地除錯和程式重啟checkpoint恢復碰到的問題

Hive本地除錯

spark學習14之使用maven快速切換本地除錯的spark版本

Spark本地開發與遠端除錯環境搭建

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive

spark sql 查詢hive表並寫入到PG中

大數據學習系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集

微信開發公眾號本地除錯

Spark SQL 訪問hive 出現異常：org.datanucleus.exceptions.NucleusDataStoreException

本地用tomcat和eclipse如何除錯vue、springboot：第一種eclipse本地除錯

微信小程式Push場景本地除錯方法

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

Windows下本地除錯 hadoop 的 mapreduce

第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

微信公眾號開發本地除錯方法

spark本地環境的搭建到執行第一個spark程式

Hadoop系列 - 本地除錯程式碼（不使用jar包）

Spark本地開發環境搭建與遠端debug設定

Spark本地安裝及Linux下偽分散式搭建

spark本地除錯hive

相關推薦