hive on spark安裝

阿新 • • 發佈：2019-02-01

Hive on spark安裝

1. 下載apache-hive-2.0.0-bin.tar.gz，安裝。（儘量安裝和hive相對應的版本spark和hadoop）

2. 編譯spark（不帶hive的）

./make-distribution.sh--name "hadoop2-without-hive"--tgz "-Pyarn,hadoop-provided,hadoop-2.4,parquet-provided"

將編譯後的spark下的lib下的spark-assembly jar 拷貝到hive的lib下。

3. hive-env.sh配置：

exportHIVE_AUX_JARS_PATH=/home/hadoop/app/apache-hive-2.0.0-bin/lib

exportHADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.6.0

export HIVE_CONF_DIR=/home/hadoop/app/apache-hive-2.0.0-bin/conf

exportHIVE_HOME=/home/hadoop/app/apache-hive-2.0.0-bin

export JAVA_HOME=/usr/java/jdk1.7.0_79

4. hive-site配置：

<name>hive.metastore.schema.verification</name>

<value>false</value>

</property>

<!--預設 metastore 在本地，新增配置改為非本地

<name>hive.metastore.local</name>

<value>false</value>

</property>-->

<name>hive.metastore.uris</name>

<value>thrift://bihdp01:9083</value>

<description>Thrift uri for the remote metastore. Used by metastore client to connect to remote metastore.</description>

</property>

<name>hive.metastore.warehouse.dir</name>

<value>/hive/warehouse</value>

</property>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://bihdp01:3306/hiveto?createDatabaseIfNotExist=true</value>

<description>JDBC connect string for a JDBC metastore</description>

</property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

<description>Driver class name for a JDBC metastore</description>

</property>

<name>javax.jdo.option.ConnectionUserName</name>

<description>username to use against metastore database</description>

</property>

<name>javax.jdo.option.ConnectionPassword</name>

<description>password to use against metastore database</description>

</property>

<name>hive.server2.enable.doAs</name>

</property>

<name>hive.server2.thrift.bind.host</name>

<value>bihdp01</value>

</property>

<name>hive.server2.thrift.port</name>

</property>

<name>hive.exec.parallel</name>

</property>

<name>hive.exec.dynamic.partition.mode</name>

<value>strict</value>

</property>

<name>hive.exec.compress.intermediate</name>

</property>

<name>hive.hwi.listen.host</name>

<value>bihdp01</value>

</property>

<name>hive.hwi.listen.port</name>

</property>

</property>

<name>spark.eventLog.enabled</name>

</property>

<!—hdfs目錄存在-->

<name>spark.eventLog.dir</name>

<value>hdfs:///hive_on_sparklogs</value>

</property>

<name>spark.executor.memory</name>

</property>

<name>spark.serializer</name>

<value>org.apache.spark.serializer.KryoSerializer</value>

</property>

</configuration>

5. 啟動hive

sethive.execution.engine=spark;

set spark.master=yarn-cluster;(目前只有這個測試有效)

（也可以配置在hive-site.xml中）

遇到問題：http://91r.net/ask/31228420.html

Hive On Spark 安裝成功之後的總結

Hive On Spark官方文件：https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started 首先，之前憑藉自己的錯覺以為使用官網提供好的安裝包之後就可以，後來各種實

Hive on Spark安裝配置詳解（都是坑啊）

簡介本文主要記錄如何安裝配置Hive on Spark，在執行以下步驟之前，請先確保已經安裝Hadoop叢集，Hive，MySQL，JDK，Scala，具體安裝步驟不再贅述。背景 Hive預設使用MapReduce作為執行引擎，即Hive on mr。實際上，H

hive on spark安裝

Hive on spark安裝 1. 下載apache-hive-2.0.0-bin.tar.gz，安裝。（儘量安裝和hive相對應的版本spark和hadoop） 2. 編譯spark（不帶hive的） ./make-distribution.sh--

hive on spark的安裝及問題

配置hive hive-site <property> <name>hive.metastore.uris</name> <value>thrift://database:9083</value>

spark 2.0.0集群安裝與hive on spark配置

3.6 temp format info port urn mysql5.7 del cnblogs 1. 環境準備: JDK1.8 hive 2.3.4 hadoop 2.7.3 hbase 1.3.3 scala 2.11.12 mysql5.7

SparkSQL與Hive on Spark的比較

.cn local 順序沒有針對 ast custom spark manager 簡要介紹了SparkSQL與Hive on Spark的區別與聯系一、關於Spark簡介在Hadoop的整個生態系統中，Spark和MapReduce在同一個層級，即主要解決分布式計算框

hive on spark VS SparkSQL VS hive on tez

dir csdn cluster 並且 http 緩沖快速 bsp pos http://blog.csdn.net/wtq1993/article/details/52435563 http://blog.csdn.net/yeruby/article/details

hive on spark

技術分享 engine sele park cut bsp 配置 spark lec hive on spark 的配置及設置CDH都已配置好，直接使用就行，但是我在用的時候報錯，如下：　　具體操作如下時報的錯：在hive 裏執行以下命令： set

sparksql\hive on spark\hive on mr

Hive on Mapreduce Hive的原理大家可以參考這篇大資料時代的技術hive：hive介紹，實際的一些操作可以看這篇筆記：新手的Hive指南，至於還有興趣看Hive優化方法可以看看我總結的這篇Hive效能優化上的一些總結 Hive on Mapreduce執行流程

hive on spark 效能引數調優

select * from stg_bankcard_auth_apply where length(idcardno) >= 1 and length(idcardno) <> 32; --該表儲存檔案格式為txt格式，是原始檔直接load進來的，mapreduce執行不管任何s

Hive on Spark調優

之前在Hive on Spark跑TPCx-BB測試時，100g的資料量要跑十幾個小時，一看CPU和記憶體的監控，發現 POWER_TEST階段（依次執行30個查詢）CPU只用了百分之十幾，也就是沒有把整個叢集的效能利用起來，導致跑得很慢。因此，如何調整引數，使整個叢集發揮最大效能顯得尤為

第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

第四天 – Accumulator累加器 – Spark SQL – DataFrame – Hive on Spark 文章目錄第四天 -- Accumulator累加器 -- Spark SQL -- DataFrame -- Hive on Spark

SparkSQL和hive on Spark

SparkSQL簡介 SparkSQL的前身是Shark，給熟悉RDBMS但又不理解MapReduce的技術人員提供快速上手的工具，hive應運而生，它是當時唯一執行在Hadoop上的SQL-on-hadoop工具。但是MapReduce計算過程中大量的中間磁碟落地過程消耗了大量的I/O，降低的執行效率，為

Hive on spark 報錯FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.spark

cp /opt/cloudera/parcels/CDH-5.13.3-1.cdh5.13.3.p0.2/lib/spark/lib/spark-assembly.jar /opt/cloudera/parcels/CDH-5.13.3-1.cdh5.13.3.p0.2/lib/hive/lib

大資料利用hive on spark程式操作hive

hive on spark 作者：小濤 Hive是資料倉庫，他是處理有結構化的資料，當資料沒有結構化時hive就無法匯入資料，而它也是遠行在mr程式之上

Hive on Spark 偽分散式環境搭建過程記錄

進入hive cli是，會有如下提示： Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. s

hive on spark開發demo

public class SparkHiveTest { public static void main(String[] args) { String warehous

hive on spark通過YARN-client提交任務不成功

在Hive on spark中設定spark.master 為 yarn-client ，提交HiveQL任務到yarn上執行，發現任務無法執行輸出一下錯誤：可以看到 Hive on S

基於Spark2.0搭建Hive on Spark環境(Mysql本地和遠端兩種情況)

Hive的出現可以讓那些精通SQL技能、但是不熟悉MapReduce 、程式設計能力較弱與不擅長Java語言的使用者能夠在HDFS大規模資料集上很方便地利用SQL 語言查詢、彙總、分析資料，畢竟精通SQL語言的人要比精通Java語言的多得多。Hive適合處理離線非實時資料。h

第74課：Hive on Spark大揭祕完整版

內容： 1.Hive On Spark內幕 2.Hive on Spark實戰一、Hive On Spark內幕 1.Hive on spark 是hive 的一個子

hive on spark安裝

相關推薦