自行編譯spark適配CDH 6.3.2的spark-sql

阿新 • • 發佈：2022-04-04

一開始覺得簡單，參考某些文章用apache編譯後的2.4.0的包直接替換就行，發現搞了好久spark-sql都不成功。

於是下決心參考網上的自己編譯了。

軟體版本：jdk-1.8、maven-3.6.3、scala-2.11.12 、spark-3.1.2

1.下載軟體

wget  http://distfiles.macports.org/scala2.11/scala-2.11.12.tgz
wget  https://archive.apache.org/dist/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.tar.gz
wget  https://archive.apache.org/dist/spark/spark-3.1.2/spark-3.1.2.tgz

把壓縮包放在/opt目錄，全部解壓，設定jdk、scala、maven 的環境變數

#####java#####
export JAVA_HOME=/usr/java/jdk1.8.0_181-cloudera
export JRE_HOME=$JAVA_HOME/jre
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

######maven#######
export PATH=/opt/apache-maven-3.6.3/bin:$PATH

####scala#####
export SCALA_HOME 
=/opt/scala-2.11.12
export PATH=${SCALA_HOME}/bin:$PATH

2.編譯spark3

修改spark3的pom配置 /opt/spark-3.1.2/pom.xml，增加cloudera maven倉庫

<repositories>
  <repository>
     <id>central</id>
      <!-- This should be at top, it makes maven try the central repo first and then others and hence faster dep resolution -->
      <name>Maven Repository</name>
      <url>https:// 
repo1.maven.org/maven2</url>
      <releases>
        <enabled>true</enabled>
      </releases>
      <snapshots>
        <enabled>false</enabled>
      </snapshots>
    </repository>
    <repository>
          <id>cloudera</id>
          <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
     </repository>
</repositories>

修改pom檔案中的hadoop版本

預設是帶的hadoop 3.2 ，需要將 hadoop.version 屬性改為 3.0.0-cdh6.3.2

注意2：maven環境記憶體要符合條件。如果用maven進行編譯需要先設定maven記憶體，如果用make-distribution.sh ，則在這個/opt/spark-3.1.2/dev/make-distribution.sh指令碼中進行修改：

編譯的時候，Xmx設定的4G，CacheSize設定的2G，否則編譯總是失敗

export MAVEN_OPTS="-Xmx4g -XX:ReservedCodeCacheSize=2g"

注意3：如果scala 版本為2.10.x ,需要進行

# cd  /opt/spark-3.1.2
# ./dev/change-scala-version.sh 2.10

如果為2.11.x，需要進行

# cd  /opt/spark-3.1.2
#./dev/change-scala-version.sh 2.11

注意4：

推薦使用一下命令編譯：

./dev/make-distribution.sh \
--name 3.0.0-cdh6.3.2 --tgz  -Pyarn -Phadoop-3.0 \
-Phive -Phive-thriftserver -Dhadoop.version=3.0.0-cdh6.3.2 -X

用的是spark的make-distribution.sh指令碼進行編譯，這個指令碼其實也是用maven編譯的，

–tgz 指定以tgz結尾
–name後面跟的是我們Hadoop的版本，在後面生成的tar包我們會發現名字後面的版本號也是這個（這個可以看make-distribution.sh原始碼瞭解）
-Pyarn 是基於yarn
-Dhadoop.version=3.0.0-cdh6.3.2 指定Hadoop的版本。

編譯報錯報錯資訊：

/root/spark-3.1.2/build/mvn: 行 212:  6877 已殺死               "${MVN_BIN}" -DzincPort=${ZINC_PORT} "$@"

解決方法：

修改./dev/make-distribution.sh檔案，將原來的maven地址指定為自己系統裡裝的maven環境：

# cat make-distribution.sh
# Figure out where the Spark framework is installed
SPARK_HOME="$(cd "`dirname "$0"`/.."; pwd)"
DISTDIR="$SPARK_HOME/dist"

MAKE_TGZ=false
MAKE_PIP=false
MAKE_R=false
NAME=none
#MVN="$SPARK_HOME/build/mvn"
MVN="/opt/apache-maven-3.6.3/bin/mvn"

編譯過程很漫長：

編譯成功後的目錄：

編譯完後的spark檔案就是：

spark-3.1.2-bin-3.0.0-cdh6.3.2.tgz

3.部署

tar zxvf   spark-3.1.2-bin-3.0.0-cdh6.3.2.tgz  /opt/cloudera/parcels/CDH/lib/spark3

將CDH叢集的spark-env.sh 複製到/opt/cloudera/parcels/CDH/lib/spark3/conf 下:

cp /etc/spark/conf/spark-env.sh  /opt/cloudera/parcels/CDH/lib/spark3/conf

然後將spark-home 修改一下：

[root@master1 conf]# cat spark-env.sh
#!/usr/bin/env bash
##
# Generated by Cloudera Manager and should not be modified directly
##

SELF="$(cd $(dirname $BASH_SOURCE) && pwd)"
if [ -z "$SPARK_CONF_DIR" ]; then
  export SPARK_CONF_DIR="$SELF"
fi

#export SPARK_HOME=/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/spark
export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark3

將gateway節點的hive-site.xml複製到spark2/conf目錄下，不需要做變動:

cp /etc/hive/conf/hive-site.xml /opt/cloudera/parcels/CDH/lib/spark3/conf/

配置yarn.resourcemanager，檢視你CDH的yarn配置裡是否有如下配置，需要開啟：

正常情況下，resourcemanager應該會預設啟用以上配置的，

建立spark-sql

cat /opt/cloudera/parcels/CDH/bin/spark-sql 
#!/bin/bash  
# Reference: http://stackoverflow.com/questions/59895/can-a-bash-script-tell-what-directory-its-stored-in  
export HADOOP_CONF_DIR=/etc/hadoop/conf
export YARN_CONF_DIR=/etc/hadoop/conf
SOURCE="${BASH_SOURCE[0]}"  
BIN_DIR="$( dirname "$SOURCE" )"  
while [ -h "$SOURCE" ]  
do  
 SOURCE="$(readlink "$SOURCE")"  
 [[ $SOURCE != /* ]] && SOURCE="$BIN_DIR/$SOURCE"  
 BIN_DIR="$( cd -P "$( dirname "$SOURCE" )" && pwd )"  
done  
BIN_DIR="$( cd -P "$( dirname "$SOURCE" )" && pwd )"  
LIB_DIR=$BIN_DIR/../lib  
export HADOOP_HOME=$LIB_DIR/hadoop  
  
# Autodetect JAVA_HOME if not defined  
. $LIB_DIR/bigtop-utils/bigtop-detect-javahome  
  
exec $LIB_DIR/spark3/bin/spark-submit --class org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver "$@"

配置快捷方式

alternatives --install /usr/bin/spark-sql spark-sql  /opt/cloudera/parcels/CDH/lib/spark3/bin/spark-sql   1

測試:

參考：

https://its401.com/article/qq_26502245/120355741

https://blog.csdn.net/Mrheiiow/article/details/123007848

自行編譯spark適配CDH 6.3.2的spark-sql

一開始覺得簡單，參考某些文章用apache編譯後的2.4.0的包直接替換就行，發現搞了好久spark-sql都不成功。

真我 GT 大師探索版適配 realme UI 3.0 嚐鮮版（基於安卓 12）第二批招募開啟

11 月 15 日訊息，感謝網友 @倫流掛科的線索投遞，今日，realme UI 官方宣佈，真我 GT 大師探索版適配 realme UI 3.0 嚐鮮版的報名通道在今日 15:00 開放。不過，本次 realme UI 3.0 嚐鮮版的名額只有 1000 名，GT

真我 GT 大師探索版適配 realme UI 3.0 嚐鮮版（基於安卓 12）第三批招募開啟

感謝網友倫流掛科的線索投遞！

真我 GT 大師探索版適配 realme UI 3.0 公測版

感謝網友 sq chaos 的線索投遞！

微信 macOS 版 3.1.6 Beta 已適配蘋果 M1 晶片

7 月 9 日訊息據網友反饋，微信團隊最新發布了微信 macOS 版 3.1.6 Beta，已經成為通用程式，適配了最新的 M1 晶片 (Apple Silicon)。

釘釘 iOS 版 6.3.35 更新：適配蘋果 Apple Watch，可檢視、收、發訊息

感謝網友帥科、榆吢、數碼少年V 的線索投遞！

vue-cli 2.x和3.x配置移動端適配px自動轉為rem

移動端適配一直都是個大問題，現在也出現了各種各樣的解決方案，比如 rem, vw 百分比等，但是比較成熟的切比較容易編寫的還是 rem，他是相對於根元素的 font-size 進行等比例計算的。

10分鐘 Castle.Windsor 適配 Asp.Net Core 3.0

Asp.Net Core 3.0以上，不再能通過修改Starup.ConfigureServices返回值（IServiceProvider），所以只能呼叫IHostBuilder.UseServiceProviderFactory修改最外層的IServiceProviderFactory，達到替換DI容器的目的。

redhat 6.3下編譯淘寶tfs

為什麼80%的碼農都做不了架構師？>>> 淘寶的tfs在帽子5（rhel 5.* && centos 5.*）下面編譯不會出題，但是在6.*下面，就會有很多報錯，原因在於5.*與6.*二個版本的gcc不一樣，帽子5系

加快Android Studio 3.6.3的編譯速度

1. 加大給Android Studio 3.6.3分配的記憶體開啟Android Studio的安裝目錄，找到虛擬機器的配置檔案，進行修改，如下：

移動端的3種適配方法

做移動端頁面以來，經常會聽說移動端的適配這個問題，但是並沒有認真分析過是如何適配各種機型的。目前公司用的是手淘的flexible.js進行頁面適配的。適配的根本原理其實就是將設計稿按一定的比例在不同的手機上實現。

android 8.0 調系統拍照_Android 系統拍照及開啟系統相簿完美適配 Android 10、9、8、7、6、5、4...

技術標籤：android 8.0 調系統拍照android 從手機獲取相簿android 圖片拼接android 開啟系統相簿android 相簿許可權android 獲取版本號

kmem 反編譯linux核心_Linux核心適配的一則小記

技術標籤：kmem 反編譯linux核心我們的產品包含多個核心驅動模組，隨著Linux核心的不斷演進，既有的驅動程式碼可能因為使用了一些被新版本核心所廢棄的函式或者資料結構，導致不能編譯通過，或者執行時出錯

qt 5.6.3版本編譯方法

現在是2021年2月，我們的客戶還有大約不到40%的機器還在使用windows xp系統，QT最後支援windows xp系統的版本是5.6.3，但是想要將編譯出來的程式在windows xp裡面成功跑起來還是要費一番功夫的。

《原神攻略》1.3版本武器評級與適配角色一覽

《原神》中有眾多的武器可供玩家選擇和使用，每把武器都有其不同的屬性，可適配的角色也不同，那麼現在為大家帶來“風過晚舟”分享的《原神》1.3版本武器評級與適配角色一覽，希望對大家有所幫助。

OPPO ColorOS 系統 3 月升級適配計劃公佈：OPPO A91/Reno2/K5 等機型在列

2月28日訊息ColorOS 11 系統於去年 9 月正式釋出，支援無限息屏、閃達視窗等功能。今日，OPPO 官方公佈了 ColorOS 11 3 月升級適配計劃。2021 年 3 月 2 日：A912021 年 3 月 10 日：Reno2、K52021 年 3 月 17 日：R

一加手機升級 ColorOS 嚐鮮適配計劃：一加 8 系列 6 月底發出，驍龍 845 機型無緣

3 月 28 日訊息此前一加 9 系列手機正式釋出，並且宣佈了 ColorOSfor OnePlus，官方表示，你能在一加 9 系列的ColorOSfor OnePlus 上體會到熟悉的「輕快流暢」，在此基礎上有了更多自由定製的空間以及功能。同時公佈

小米 11 青春版支援 Micro SD 卡，MIUI 12.5 6 月適配上線

3 月 30 日訊息小米春季新品釋出會於 3 月 29 日召開，小米 11 Pro/Ultra 以及青春版釋出。小米 11 青春版擁有 6.81mm 的厚度，重量僅為 159g，為目前市面上最輕薄的 5G 手機之一。此款手機首發驍龍 780G 晶片，內建

爆料：榮耀 20、30 系列等機型將從 6 月開始逐步適配華為鴻蒙系統

5 月 8 日訊息華為在 2019 年開發者大會上正式推出了鴻蒙 OS 系統，並首先應用在智慧屏等產品上，並於 2020 年開發者大會上宣佈為智慧手機升級支援鴻蒙 HarmonyOS 2.0。

《原神攻略》1.6版千巖牢固套效果及適配角色解析

《原神》的千巖牢固聖遺物偏向於輔助，會增加角色的生命值上限，4件套更是能提升護盾效果。下面請看由“vdbvbd”帶來的《原神》1.6版千巖牢固套效果及適配角色解析，一起來看看吧。

自行編譯spark適配CDH 6.3.2的spark-sql

1.下載軟體

2.編譯spark3

3.部署

相關推薦