1. 程式人生 > 程式設計 >Azkaban3.81.x部署過程及遇到的坑

Azkaban3.81.x部署過程及遇到的坑

Azkaban是什麼?

Azkaban是由Linkedin公司推出的一個批量工作流任務排程器,主要用於在一個工作流內以一個特定的順序執行一組工作和流程,它的配置是通過簡單的key:value對的方式,通過配置中的dependencies 來設定依賴關係,這個依賴關係必須是無環的,否則會被視為無效的工作流。Azkaban使用job配置檔案建立任務之間的依賴關係,並提供一個易於使用的web使用者介面維護和跟蹤你的工作流。

一、前提安裝

1.1 Java1.8環境搭建

  1) 下載jdk1.8並解壓:

# tar -zxvf jdk-8u201-linux-i586.tar.gz -C /usr/local

2) 新增Java環境變數,在/etc/profile中新增:

export JAVA_HOME=/usr/local/jdk1.8.0_201 
export PATH=$PATH:$JAVA_HOME/bin
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib

  3) 儲存後重新整理環境變數:

# source /etc/profile

  4) 檢查Java是否配置成功,成功配置會有如下圖所示。

# java -version

Azkaban3.81.x部署過程及遇到的坑

1.2 MySQL安裝

  Ubuntu可以參考我的MySQL安裝博文。

1.3 git安裝

# sudo apt-get install git

1.4 下載azkaban

  從github選取版本下載azkaban:

https://github.com/azkaban/azkaban/releases

  在這裡我選取了azkaban-3.18.4版本:

# wget https://github.com/azkaban/azkaban/archive/3.84.4.tar.gz

  解壓:

# tar -zxvf azkaban-3.84.4.tar.gz -C /mnt/addDisk1/BigData/
# cd /mnt/addDisk1/BigData/azkaban-3.84.4

1.5 編譯

  執行gradlew編譯命令,跳過測試:

# ./gradlew distTar -x test

  它會一下編譯,直到編譯成功,執行之後會生成5個壓縮包,分別放在在azkaban-*/build/distributions/目錄下:

azkaban-db-3.47.0-10-gdd67b02.tar.gz
azkaban-exec-server-3.47.0-10-gdd67b02.tar.gz
azkaban-hadoop-security-plugin-3.47.0-10-gdd67b02.tar.gz
azkaban-solo-server-3.47.0-10-gdd67b02.tar.gz
azkaban-web-server-3.47.0-10-gdd67b02.tar.gz 

Azkaban3.81.x部署過程及遇到的坑

  接著把五個包分別解壓在另外的目錄下(/mnt/addDisk1/BigData/azkaban),並重命名:

cd /mnt/addDisk1/BigData
tar -zxvf ./azkaban-3.81.4/azkaban-db/build/distributions/azkaban-db-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/
tar -zxvf ./azkaban-3.81.4/azkaban-exec-server/build/distributions/azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/
tar -zxvf ./azkaban-3.81.4/azkaban-hadoop-security-plugin/build/distributions/azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/
tar -zxvf ./azkaban-3.81.4/azkaban-solo-server/build/distributions/azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/
tar -zxvf ./azkaaban-3.81.4/azkaban-web-server/build/distributions/azkaban-web-server-0.1.0-SNAPSHOT.tar.gz -C ./azkaban/
mv azkaban-solo-server-0.1.0-SNAPSHOT/ azkaban-solo-server
mv azkaban-exec-server-0.1.0-SNAPSHOT/ azkaban-exec-server
mv azkaban-web-server-0.1.0-SNAPSHOT/ azkaban-web-server
mv azkaban-db-0.1.0-SNAPSHOT/ azkaban-db
mv azkaban-hadoop-security-plugin-0.1.0-SNAPSHOT/ azkaban-hadoop-security-plugin

Azkaban3.81.x部署過程及遇到的坑

二、azkaban部署

2.1在MySQL中建立azkaban資料庫:

create database azkaban;
grant all privileges on azkaban.* to azkaban@'%' identified by 'azkaban';
flush privileges;
use azkaban;
# 將azkaban sql表結構匯入mysql
source /mnt/addDisk1/BigData/azkaban/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql

2.2 建立SSL配置:

# keytool -keystore keystore -alias jetty -genkey -keyalg RSA
執行此命令後,會提示輸入當前生成 keystor的密碼及相應資訊,輸入的密碼請勞記,資訊如下:

輸入keystore密碼: 
再次輸入新密碼:
您的名字與姓氏是什麼?
 [Unknown]: 
您的組織單位名稱是什麼?
 [Unknown]: 
您的組織名稱是什麼?
 [Unknown]: 
您所在的城市或區域名稱是什麼?
 [Unknown]: 
您所在的州或省份名稱是什麼?
 [Unknown]: 
該單位的兩字母國家程式碼是什麼
 [Unknown]: CN
CN=Unknown,OU=Unknown,O=Unknown,L=Unknown,ST=Unknown,C=CN 正確嗎?
 [否]: y
密碼在此我輸入的是hadoop
輸入<jetty>的主密碼
 (如果和 keystore 密碼相同,按回車): 
再次輸入新密碼:

  完成上述工作後,將在當前目錄生成 keystore 證書檔案,將keystore 考貝到 azkaban web伺服器根目:

# sudo mv keystore azkaban/azkaban-web-server

2.3部署 azkaban-web-server

# cd ./azkaban
# sudo cp -r ./azkaban-solo-server/conf/ ./azkaban-web-server/
# cd ./azkaban-web-server/conf

  配置azkaban.properties:

# 預設時區,已改為亞洲/上海 預設為美國
default.timezone.id=Asia/Shanghai
database.type=mysql #資料庫型別
# h2.path=./h2
# h2.create.tables=true
mysql.port=3306 #埠號
mysql.host=localhost #資料庫連線IP
mysql.database=azkaban #資料庫例項名
mysql.user=root #資料庫使用者名稱
mysql.password=root #資料庫密碼

jetty.use.ssl=true
jetty.maxThreads=25 #最大執行緒數
jetty.ssl.port=8443 #Jetty SSL埠
jetty.port=8081 #Jetty埠
jetty.keystore=keystore #SSL檔名
jetty.password=hadoop #SSL檔案密碼
jetty.keypassword=hadoop #Jetty主密碼 與 keystore檔案相同
jetty.truststore=keystore #SSL檔名
jetty.trustpassword=hadoop # SSL檔案密碼

# 執行伺服器屬性
executor.port=12321 #執行伺服器埠

# 郵件設定 可不設計
[email protected] #傳送郵箱
mail.host=smtp.163.com #傳送郵箱smtp地址
mail.user=xxxxxxxx #傳送郵件時顯示的名稱
mail.password=********** #郵箱密碼
[email protected] #任務失敗時傳送郵件的地址
[email protected] #任務成功時傳送郵件的地址
lockdown.create.projects=false #
cache.directory=cache #快取目錄

  配置log4j.properties(預設就可以了,如有其他需求可修改):

log4j.rootLogger=INFO,Console
log4j.logger.azkaban=INFO,server
log4j.appender.server=org.apache.log4j.RollingFileAppender
log4j.appender.server.layout=org.apache.log4j.PatternLayout
log4j.appender.server.File=logs/azkaban-webserver.log
log4j.appender.server.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n
log4j.appender.server.MaxFileSize=102400MB
log4j.appender.server.MaxBackupIndex=2
log4j.appender.Console=org.apache.log4j.ConsoleAppender
log4j.appender.Console.layout=org.apache.log4j.PatternLayout
log4j.appender.Console.layout.ConversionPattern=%d{yyyy/MM/dd HH:mm:ss.SSS Z} %p [%c{1}] [Azkaban] %m%n

  新增管理員使用者:

# sudo vim azkaban-users.xml

<azkaban-users>
 <user groups="azkaban" password="azkaban" roles="admin" username="azkaban"/>
 <user password="metrics" roles="metrics" username="metrics"/>
 <user username="admin" password="admin" roles="admin,metrics" />
 <role name="admin" permissions="ADMIN"/>
 <role name="metrics" permissions="METRICS"/>
</azkaban-users>

2.4部署 azkaban-exec-server

# cd /mnt/addDisk1/BigData/azkaban
# sudo cp -r ./azkaban-solo-server/conf/ ./azkaban-exec-server/
# cd ./azkaban-exec-server/conf

  配置azkaban.properties:

# sudo vim azkaban.properties

#Azkaban
default.timezone.id=Asia/Shanghai #時區

# Azkaban JobTypes 外掛配置
azkaban.jobtype.plugin.dir=plugins/jobtypes #jobtype 外掛所在位置

#Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects

#資料庫設定
database.type=mysql #資料庫型別(目前只支援mysql)
mysql.port=3306 #資料庫埠號
mysql.host=localhost #資料庫IP地址
mysql.database=azkaban #資料庫例項名
mysql.user=azkaba #資料庫使用者名稱
mysql.password=azkaba #資料庫密碼
mysql.numconnections=100 #最大連線數

# 執行伺服器配置
executor.maxThreads=50 #最大執行緒數
executor.port=12321 #埠號(如修改,請與web服務中一致)
executor.flow.threads=30 #執行緒數

  在azkaban-exec-server和azkaban-web-server安裝目錄下建立extlib目錄,將lib目錄下的mysql-connector-java-5.1.28.jar包拷備這extlib目錄:

# cd /mnt/addDisk1/BigData/azkaban
# sudo cp ./azkaban-web-server/lib/mysql-connector-java-5.1.28.jar ./azkaban-web-server/extlib/
# sudo cp ./azkaban-exec-server/lib/mysql-connector-java-5.1.28.jar ./azkaban-exec-server/extlib/

2.5啟動web-server和exec-server

# ./azkaban-exec-server/bin/start-exec.sh
# ./azkaban-web-server/bin/start-web.sh

2.6訪問https://ip:8443開啟azkaban的web頁面

Azkaban3.81.x部署過程及遇到的坑

2.7 測試

三、遇到的問題

3.1、 找到guava-*.jar包版本過低,但在/lib/下的是0.21版本,不低了,根據排除可知找到系統中版本過低的而使用。

2019/12/20 14:25:34.573 +0800 ERROR [StdOutErrRedirect] [Azkaban] Exception in thread "main"
2019/12/20 14:25:34.574 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.NoSuchMethodError: com.google.common.collect.ImmutableMap.toImmutableMap(Ljava/util/function/Function;Ljava/util/function/Function;)Ljava/util/stream/Collector;
2019/12/20 14:25:34.574 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.Status.<clinit>(Status.java:40)
2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.FetchActiveFlowDao$FetchActiveExecutableFlows.<clinit>(FetchActiveFlowDao.java:177)
2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.FetchActiveFlowDao.fetchActiveFlows(FetchActiveFlowDao.java:148)
2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.JdbcExecutorLoader.fetchActiveFlows(JdbcExecutorLoader.java:102)
2019/12/20 14:25:34.575 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.loadRunningExecutions(ExecutorManager.java:384)
2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.initialize(ExecutorManager.java:136)
2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.start(ExecutorManager.java:149)
2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.launch(AzkabanWebServer.java:231)
2019/12/20 14:25:34.576 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.main(AzkabanWebServer.java:224)

解決方案:https://www.jb51.net/article/185901.htm

# vim /mnt/addDisk1/BigData/azkaban/azkaban-web-server/bin/internal/internal-start-web.sh

將如下:
for file in $azkaban_dir/lib/*.jar;
do
 CLASSPATH=$CLASSPATH:$file
done

改為:
for file in $azkaban_dir/lib/*.jar;
do
 CLASSPATH=$file:$CLASSPATH
done

# vim /mnt/addDisk1/BigData/azkaban/azkaban-exec-server/bin/internal/internal-start-executor.sh

將如下:
for file in $azkaban_dir/lib/*.jar;
do
 CLASSPATH=$CLASSPATH:$file
done

改為:
for file in $azkaban_dir/lib/*.jar;
do
 CLASSPATH=$file:$CLASSPATH
done

3.2解決executor非active的問題

解決方案:

1)

# cd ./azkaban/azkaban-exec-server/
# curl -G "localhost:$(<./executor.port)/executor?action=activate" && echo

Azkaban3.81.x部署過程及遇到的坑

2)也可以通過在MySQL中修改:https://www.jb51.net/article/185900.htm

到此這篇關於Azkaban3.81.x部署過程及遇到的坑的文章就介紹到這了,更多相關Azkaban3.81.x部署內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!