Kettle學習筆記001之執行環境配置
強調:針對Kettle的配置操作都是重啟後才能生效。
1. JDK
a. Kettle 8.1 要求jdk版本1.8以上。
注意:可以單獨為kettle工具設定JDK環境,也可以使用安裝在作業系統中的JDK環境。
案例一:為Kettle工具單獨設定JDK環境。
(1) Kettle安裝目錄:data-integration
(2)用文字編輯器(不要用記事本)開啟Spoon.bat檔案:
在 ' cd /D %~dp0 ] 行下
新增: set JAVA_HOME=C:\Program Files\Java\jdk1.8.0_131
提示:可以使用相對路徑指示Java的安裝路徑。
2. 針對Kettle的JVM引數優化
a. Kettle的預設使用最大JVM堆記憶體為2G,而複雜的作業可能會出現堆記憶體溢位錯誤(OutOfMemoryError)
在data-integration目錄下的Spoon.bat檔案,找到
if "%PENTAHO_DI_JAVA_OPTIONS%
b. 如果出現棧溢位錯誤(StackOverFlowError),則需要增加一個引數 "-Xss", 數值根據本機記憶體配置適當填寫
3. KETTLE_HOME
Kettle執行時會使用一個名叫“.kettle”的資料夾,裡面放置一些配置檔案,預設會會安裝在C盤的個人目錄下。
a. 當一臺主機安裝多個Kettle時就需要,對每個Kettle單獨配置KETTLE_HOME,以便 .kettle目錄自動建立在配置的KETTLE_HOME目錄下。
修改spoon.bat檔案:
效果:使用了相對路徑,啟動Kettle後會在Spoon.bat所在目錄的上一層目錄下建立一個.kettle資料夾(當然也可以使用絕對路徑):
4. 依賴包匯入
Kettle沒有內建資料庫jdbc連線的驅動,所以包括Kettle的JAVA元件使用的java依賴包在內所有依賴包要自己裝。
a. 依賴包安裝目錄: data-integration/lib/
注意:不能把一個數據庫的多個版本的jdbc驅動同時匯入,會造成依賴衝突。