1. 程式人生 > >Kettle 入門筆記1

Kettle 入門筆記1

family 對話框 RR unity ... tran 自己 ext 1.7

一,KETTLE介紹 Kettle是 Extract, Transform and Load抽取、轉換、加載)一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。其中,Spoon是Kettle中的一個組件,其他組件有PAN,CHEF,Encr和KITCHEN等。 Spoon通過圖形化的頁面,方便直觀的讓你完成數據轉換的操作。 二、Kettle下載 可到開源官網(https://community.hds.com)下載; Data Integration(or Kettle) 8版本下載: pdi-ce-8.0.0.0-28 三、java JDK 安裝與部署
1)首先到官網下載對應JDK包,JDK1.8或以上版本就行; 2)安裝JDK; 3)配置環境變量。 具體步驟請百度 四:Kettle環境配置 1)因Kettle是開源工具,下載的壓縮包直接解壓到本地路徑即可。 2)打開環境變量的設置窗口。右擊“我的電腦”,在彈出的快捷菜單中選擇“屬性”選項,進入“系統屬性”對話框。選擇“高級”標簽,進入“高級”選項卡,再單擊“環境變量”按鈕,進入“環境變量”對話框。 3)在“系統變量”欄“新建”系統變量,變量名輸入:KETTLE_HOME;變量值輸入Kettle解壓路徑(...\data-integtation)。點擊“確定”完成環境變量設置。
技術分享圖片 五:Kettle運行 進入到Kettle目錄,雙擊運行spoon.bat文件,出現如下界面及說明kettle成功部署。 技術分享圖片 六:出現問題 1)若kettle啟動spoon提示 A Java Exception has occurred,則說明jdk與當前kettle版本不匹配。(註:jdk1.8版本可支持Kettle7.0以後版本,1.7版本不支持 技術分享圖片

技術分享圖片

7、建立轉換   在文件->新建裝換。   新建轉換後在左邊的主對象樹中建立DB連接用以連接數據庫。如圖所示: 技術分享圖片

技術分享圖片

建立數據庫連接的過程與其他數據庫管理軟件連接數據庫類似。   註意:在數據庫鏈接的過程中,可能會報某個數據庫連接找不到的異常。那是因為你沒有對應的數據庫鏈接驅動,請下載對應驅動後,別忘記在鏈接數據庫時先將數據庫驅動包放入Spoon的lib文件夾下。
技術分享圖片 8 簡單的數據表插入\更新   (1)新建表插入   在左邊的面板中選擇“核心對象”,在核心對象裏面選擇“輸入->表輸入”,用鼠標拖動到右邊面板。如圖所示: 技術分享圖片 雙擊拖過來的表,可以編輯表輸入。   選擇數據庫連接和編輯sql語句,在這一步可以點擊預覽,查看自己是否連接正確。 技術分享圖片 (2)通過插入\更新輸出到表。   在左邊面板中選擇核心對象、選擇“輸出->插入\更新”如圖所示: 技術分享圖片 編輯插入更新:   首先:表輸入連接插入更新。     選中表輸入,按住shift鍵,拖向插入更新 技術分享圖片

然後:雙擊插入更新,編輯它。

技術分享圖片

到這裏基本上,這個轉換就要做完了,可以點擊運行查看效果,看是否有誤,這個要先保存了才能運行,可以隨意保存到任何一個地方。

技術分享圖片

檢查數據庫表test1是否已有數據:

技術分享圖片

無數據的原因是:

技術分享圖片

再次執行轉換:

技術分享圖片

技術分享圖片

9, 使用作業控制上面裝換執行。   使用作業可以定時或周期性的執行轉換,新建一個作業。並從左邊面板拖入start 和轉換。 技術分享圖片

雙擊start可以編輯,可以設置執行時間等等

技術分享圖片 點開轉換,可以設置需要執行的轉換任務,比如可以執行上面我們做的轉換,XXX.ktr 技術分享圖片 開始 連接 轉換 選中START ,按住shift鍵,拖向轉換。 技術分享圖片

由於之前單獨執行測試公轉換是否設置正確,先刪除表test1的數據:

技術分享圖片

執行作業:

技術分享圖片

技術分享圖片

執行成功。查看數據庫表test1是否有數據: 技術分享圖片

Kettle 入門筆記1