ETL工具Kettle簡介
什麼是Kettle
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上執行,綠色無需安裝,資料抽取高效穩定。
Kettle 中文名稱叫水壺,該專案的主程式設計師MATT 希望把各種資料放到一個壺裡,然後以一種指定的格式流出。
Kettle這個ETL工具集,它允許你管理來自不同資料庫的資料,通過提供一個圖形化的使用者環境來描述你想做什麼,而不是你想怎麼做。
Kettle中有兩種指令碼檔案,transformation和job,transformation完成針對資料的基礎轉換,job則完成整個工作流的控制。
作為Pentaho的一個重要組成部分,現在在國內專案應用上逐漸增多。
Kettle :Kettle is an acronym for “Kettle E.T.T.L. Environment”. This means it has been designed to help you with your ETTL needs: the Extraction, Transformation, Transportation and Loading of data
Kettle 是”Kettle E.T.T.L. Envirnonment”只取首字母的縮寫,這意味著它被設計用來幫助你實現你的ETTL 需要:抽取、轉換、裝入和載入資料;翻譯成中文名稱應該叫水壺,名字的起源正如該專案的主程式設計師MATT 在一個論壇裡說的哪樣:希望把各種資料放到一個壺裡然後以一種指定的格式流出。
kettle的相關知識
Kettle工程儲存方式有兩種:一種是以XML形式儲存,一種是以資源庫方式儲存。
Kettle中有兩類設計分別是:Transformation(轉換)與Job(作業),Transformation完成針對資料的基礎轉換,Job則完成整個工作流的控制。
Kettle常用三大家族:Spoon、Pan、Kitchen。
Spoon:通過圖形介面方式設計、執行、除錯Job與Transformation。
Pan: 通過指令碼命令方式來執行Transformation。
Kitchen: 通過指令碼命令方式來執行Job,一般就是通過呼叫Kitchen指令碼來完成定時任務。
目前Kettle有兩種版本:一種是社群版(免費),一種是企業版(收費)。
相關網站
kettle官網
https://community.hds.com/docs/DOC-1009855
開源中文社群
Kettle的一些元件的使用方法
http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+Steps
Spoon User Guide文件
http://wiki.pentaho.com/display/EAI/Spoon+User+Guide
JAVASCRIPT元件的使用
https://developer.mozilla.org/en/JavaScript
Kettle社群版下載
http://community.pentaho.com/
Kettle企業版下載
http://www.pentaho.com/
Kettle排程使用方法
http://wiki.pentaho.com/display/EAI/Kitchen+User+Documentation