spark-submit&spark-class腳本解析

阿新 • • 發佈：2018-09-29

options mman 程序空字符結果 ast 數據存儲 zed 大小

################################################

#從spark-shell調用之後，傳進來--class org.apache.spark.repl.Main --name "Spark shell" --master spark://ip:7077
#先檢測spark_home,然後去調用spark_home/bin/spark-class 會將org.apache.spark.deploy.SparkSubmit作為第一個參數，
#----- 會執行腳本spark-class org.apache.spark.deploy.SparkSubmit --class org.apache.spark.repl.Main --name"Spark shell" --master spark://ip:7077

#####################################
##spark- 
submit 邏輯

#!/usr/bin/envbash

if [-z "${SPARK_HOME}" ]; then

  export SPARK_HOME="$(cd "`dirname"$0"`"/..; pwd)"

fi

 

#disable randomized hash for string in Python 3.3+

exportPYTHONHASHSEED=0

#exec 執行完面的命令，exec 命令，是創建一個新的進程，只不過這個進程與前一個進程的ID是一樣的。

#這樣，原來的腳本剩余的部分代碼就不能執行了，因為相當於換了一個進程。



exec "${SPARK_HOME} 
"/bin/spark-class org.apache.spark.deploy.SparkSubmit " $@"



#以下是spark-class邏輯
###########################################################################

#--如果是spark-shell從spark-submit腳本傳進來如下參數：

org.apache.spark.deploy.SparkSubmit --classorg.apache.spark.repl.Main --name "Spark shell" --master spark://ip:7077
#如果自己的application則直接執行spark-submit 腳本傳入自己的-- 
class等參數信息就可以

###########################################################################

#!/usr/bin/envbash

#還是判斷了一下SPARK_HOME環境變量是否存在

if [-z "${SPARK_HOME}" ]; then

  export SPARK_HOME="$(cd "`dirname"$0"`"/..; pwd)"

fi

#---執行shell，不加“. 和空格”也能執行：配置一些環境變量,它會將conf/spark-env.sh中的環境變量加載進來:

. "${SPARK_HOME}"/bin/load-spark-env.sh

 

# ---Find the java binary 如果有java_home環境變量會將java_home/bin/java給RUNNER

#if [ -n str ] 表示當串的長度大於0時為真

if [-n "${JAVA_HOME}" ]; then

  RUNNER="${JAVA_HOME}/bin/java"

else

  #---command -v 和which的功能一樣

  if [ `command -v java` ]; then

    RUNNER="java"

  else

    echo "JAVA_HOME is not set">&2

    exit 1

  fi

fi

 

#--- Find assembly jar ： 會先找spark_home/RELESE文本是否存在，如果存在將spark_home/lib目錄給變量ASSEMBLY_DIR

SPARK_ASSEMBLY_JAR=

if [-f "${SPARK_HOME}/RELEASE" ]; then

  ASSEMBLY_DIR="${SPARK_HOME}/lib"

else

 ASSEMBLY_DIR="${SPARK_HOME}/assembly/target/scala-$SPARK_SCALA_VERSION"

fi

 

#---ls -1與ls -l的區別在於ls -1只會返回文件名，沒有文件類型，大小，日期等信息。num_jars返回spark-assembly的jar有多少個

GREP_OPTIONS=

num_jars="$(ls-1 "$ASSEMBLY_DIR" | grep "^spark-assembly.*hadoop.*\.jar$"| wc -l)"

 

#---如果$num_jars為0，會報錯並退出

if ["$num_jars" -eq "0" -a -z "$SPARK_ASSEMBLY_JAR"-a "$SPARK_PREPEND_CLASSES" != "1" ]; then

  echo "Failed to find Spark assembly in$ASSEMBLY_DIR." 1>&2

  echo "You need to build Spark beforerunning this program." 1>&2

  exit 1

fi

 

if [-d "$ASSEMBLY_DIR" ]; then

  #---ls 後面加 || true和不加效果一樣，還是會返回這個串的：spark-assembly-1.6.0-hadoop2.6.0.jar

  ASSEMBLY_JARS="$(ls -1"$ASSEMBLY_DIR" | grep "^spark-assembly.*hadoop.*\.jar$" ||true)"

  #---這個$num_jars不能大於1，否則會退出

  if [ "$num_jars" -gt "1"]; then

    echo "Found multiple Spark assemblyjars in $ASSEMBLY_DIR:" 1>&2

    echo "$ASSEMBLY_JARS" 1>&2

    echo "Please remove all but onejar." 1>&2

    exit 1

  fi

fi

#---將spark_home/lib/spark-assembly-1.6.0-hadoop2.6.0.jar給變量SPARK_ASSEMBLY_JAR

SPARK_ASSEMBLY_JAR="${ASSEMBLY_DIR}/${ASSEMBLY_JARS}"

#---還是將spark_home/lib/spark-assembly-1.6.0-hadoop2.6.0.jar賦給別一個變量LAUNCH_CLASSPATH

LAUNCH_CLASSPATH="$SPARK_ASSEMBLY_JAR"

 

#Add the launcher build dir to the classpath if requested.

#---if [ -n str ] 表示當串的長度大於0時為真

if [-n "$SPARK_PREPEND_CLASSES" ]; then

 LAUNCH_CLASSPATH="${SPARK_HOME}/launcher/target/scala-$SPARK_SCALA_VERSION/classes:$LAUNCH_CLASSPATH"

fi

#--- 將spark_home/lib/spark-assembly-1.6.0-hadoop2.6.0.jar值給全局變量_SPARK_ASSEMBLY

export_SPARK_ASSEMBLY="$SPARK_ASSEMBLY_JAR"

 

#For tests

if[[ -n "$SPARK_TESTING" ]]; then

  unset YARN_CONF_DIR

  unset HADOOP_CONF_DIR

fi

 

#The launcher library will print arguments separated by a NULL character, toallow arguments with

#characters that would be otherwise interpreted by the shell. Read that in awhile loop, populating

# anarray that will be used to exec the final command.

#######################################################

#啟動程序庫將打印由空字符分隔的參數，以允許帶有由shell解釋的字符的參數。 在while循環中讀取它，填充將用於執行最終命令的數組。

 #如果要調試輸入如下$JAVA_OPTS環境變量即可

#export JAVA_OPTS="$JAVA_OPTS -Xdebug-Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=5005"

#如果想調試org.apache.spark.launcher.Main，需要將$JAVA_OPTS放在$RUNNER後面就可以了,

#如果想直接調用SparkSubmit.scala可以將$JAVA_OPTS放在 launcher.Main的後面

 

#-----spark-class先執行org.apache.spark.launcher.Main，由launcher.Main來解析腳本參數，然後由Main方法將打印的結果給while語句，
#再次執行SparkSubmit類中的main方法；

#小括號有，數組或執行的命令的意思

#java -cp spark_home/lib/spark-assembly-1.6.0-hadoop2.6.0.jarorg.apache.spark.launcher.Main org.apache.spark.deploy.SparkSubmit --class org.apache.spark.repl.Main--name "Spark shell" --master  spark://ip:7077

#######################################################

 

CMD=()

whileIFS= read -d ‘‘ -r ARG; do

  echo "===========>"$ARG

  CMD+=("$ARG")

done< <("$RUNNER" -cp "$LAUNCH_CLASSPATH"org.apache.spark.launcher.Main "$@")

exec"${CMD[@]}"

 

#launcher.Main返回的數據存儲到CMD數組中，可以通過打印查看$ARG裏面的內容，實際上就是laucher.Main裏面的main打印的參數

 ./spark-shell --master  spark://ip:7077 --verbose /tool/jarDir/maven_scala-1.0-SNAPSHOT.jar

#ARG打印的內容如下，這樣看來${CMD[@]}就是讓 “java -cp 執行第三行包中類即SparkSubmit, 使用jvm參數(即第四，五，六，七行)，然後執行SparkSubmit 後面的是SparkSubmit參數是 --class 等內容

轉自：https://blog.csdn.net/luyllyl/article/details/79553979

options mman 程序空字符結果 ast 數據存儲 zed 大小 ################################################ #從spark-shell調用之後，傳進來--class org.apache.spark.r

android init進程分析 init腳本解析和處理

還要 ret process ram ces ken option restart launch (懶人近期想起我還有csdn好久沒打理了。這個android init躺在我的草稿箱中快5年了。略微改改發出來吧) RC文件格式 rc文件是linu

ubuntu10.04 默認腳本解析器更改(./sdk.unpack: 2: source: not found)

figure 功能 found fig 找不到解析出現解析器 ls -l ubuntu10.04 系統默認的SH（腳本解析器）為dash，可以使用 ls -l /bin/sh 命令查看。 dash解析器的解析效率很高，但是功能不如bash那麽強大，因此，在解析

windows PAC腳本解析的軟件 pac syntax檢查

windows pac腳本解析的軟件 pac 語法檢查 pac syntax檢查參考文檔:https://zhuanlan.zhihu.com/p/22166179?refer=barretleehttps://github.com/pacparser/pacparserhttps://community.m

鏈接腳本解析

連接腳本1. 概述鏈接器的作用主要是對符號的解析以及將符號與地址進行綁定。要實現這個功能需要依賴鏈接腳本，鏈接腳本大多數情況下用來鏈接輸入文件，並生成目標文件。編譯器的“-T”參數就是用來指定鏈接腳本的。2. 鏈接腳本需要解析的鏈接腳本代碼如程序清單 2.1所示。程序清單 2.1 鏈接腳本源碼OUTPUT_

大資料基礎之Spark（1）Spark Submit即Spark任務提交過程

Spark版本2.1.1 一 Spark Submit本地解析 1.1 現象提交命令： spark-submit --master local[10] --driver-memory 30g --class app.package.AppClass app-1

shell腳本傳參執行spark-submit

遍歷 shell腳本傳參 bin 執行 soup spark exe oot 讀取多個目錄下的本地文件，多個目錄通過循環遍歷的方式，以參數傳遞： #!/bin/bash i=0while [ $i -lt 10000 ] do echo "i=$i" spark-

Spark學習之路（十五）SparkCore的源碼解讀（一）啟動腳本

-o 啟動服務 binary dirname ppi std 參數 exp 情況一、啟動腳本分析獨立部署模式下，主要由master和slaves組成，master可以利用zk實現高可用性，其driver，work，app等信息可以持久化到zk上；slaves由一臺至多

【原創 Hadoop&Spark 動手實踐 3】Hadoop2.7.3 MapReduce理論與動手實踐

pack license 讀取 rgs 理論程序員開發 -s 接口 pri 開始聊MapReduce，MapReduce是Hadoop的計算框架，我學Hadoop是從Hive開始入手，再到hdfs，當我學習hdfs時候，就感覺到hdfs和mapreduce關系的緊密。這個

【原創 Hadoop&Spark 動手實踐 5】Spark 基礎入門，集群搭建以及Spark Shell

min util man 操作 because tro txt library all Spark 基礎入門，集群搭建以及Spark Shell 主要借助Spark基礎的PPT，再加上實際的動手操作來加強概念的理解和實踐。

word.xml加變量賦值後格式損壞（類似發表評論，腳本符號<>&）

for ret lac 錯亂 urn pla pos word 變量如果傳入的變量值包含腳本符號，會使格式錯亂 //格式化名稱，防止xml出錯 private String formatName(String name) { name = n

[Windows] 【油猴腳本】慕課網視頻下載鏈接解析工具

nbsp 解析 baidu tar wid 轉載 forum uid 安裝教程 http://www.52pojie.cn/forum.php?mod=viewthread&tid=592829&fromguid=hot 好久沒出來發帖了點進來的都

3DMax腳本插件--改動材質&amp;貼圖名稱

... string 圖文素材 jsb -a cit 跳過 fontsize 從網上淘到了一套人物的模型，當時的心情是激動無比，掏出用的不熟練的3DMax折騰了半天。突然發現了一個蛋疼的事兒，所有的模型文件，材質名稱，子材質，以及貼圖所實用的是中文命名！！！盡管說

shell腳本中的$# $0 class="__cf_email__" data-cfemail="f8dcb8">[email protected] $* $$ $! $?的意義

腳本 $* width 上一個 pre shell int .cn height 轉載自：http://www.cnblogs.com/davygeek/p/5670212.html 今天學寫腳本遇到一些變量不認識，在此做下記錄。變量含義 $0 當前腳本的文件

spark-submit&spark-class腳本解析

spark-submit&spark-class腳本解析

android init進程分析 init腳本解析和處理

ubuntu10.04 默認腳本解析器更改(./sdk.unpack: 2: source: not found)

windows PAC腳本解析的軟件 pac syntax檢查

鏈接腳本解析

大資料基礎之Spark（1）Spark Submit即Spark任務提交過程

shell腳本傳參執行spark-submit

Spark學習之路（十五）SparkCore的源碼解讀（一）啟動腳本

【原創 Hadoop&Spark 動手實踐 3】Hadoop2.7.3 MapReduce理論與動手實踐

【原創 Hadoop&Spark 動手實踐 5】Spark 基礎入門，集群搭建以及Spark Shell

word.xml加變量賦值後格式損壞（類似發表評論，腳本符號<>&）

[Windows] 【油猴腳本】慕課網視頻下載鏈接解析工具

3DMax腳本插件--改動材質&amp;貼圖名稱

shell腳本中的$# $0 class="__cf_email__" data-cfemail="f8dcb8">[email protected] $* $$ $! $?的意義

linux的shell腳本中if，for，while的解析與應用

scala & spark實戰

Spark記錄-spark-submit學習

C#利用TCP傳送各種文件的腳本 listener&&client

百度統計的JS腳本原理解析

LR函數筆記一腳本關聯&參數化

spark-submit&spark-class腳本解析

相關推薦

shell腳本中的$# $0 class="__cf_email__" data-cfemail="f8dcb8">[email protected] $* $$ $! $?的意義