Kettle 入門筆記1
阿新 • • 發佈:2018-04-09
family 對話框 RR unity ... tran 自己 ext 1.7
一,KETTLE介紹
Kettle是 (Extract, Transform and Load抽取、轉換、加載)一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。其中,Spoon是Kettle中的一個組件,其他組件有PAN,CHEF,Encr和KITCHEN等。
Spoon通過圖形化的頁面,方便直觀的讓你完成數據轉換的操作。
二、Kettle下載
可到開源官網(https://community.hds.com)下載;
Data Integration(or Kettle) 8版本下載: pdi-ce-8.0.0.0-28
三、java JDK 安裝與部署
1)首先到官網下載對應JDK包,JDK1.8或以上版本就行;
2)安裝JDK;
3)配置環境變量。
具體步驟請百度
四:Kettle環境配置
1)因Kettle是開源工具,下載的壓縮包直接解壓到本地路徑即可。
2)打開環境變量的設置窗口。右擊“我的電腦”,在彈出的快捷菜單中選擇“屬性”選項,進入“系統屬性”對話框。選擇“高級”標簽,進入“高級”選項卡,再單擊“環境變量”按鈕,進入“環境變量”對話框。
3)在“系統變量”欄“新建”系統變量,變量名輸入:KETTLE_HOME;變量值輸入Kettle解壓路徑(...\data-integtation)。點擊“確定”完成環境變量設置。
五:Kettle運行
進入到Kettle目錄,雙擊運行spoon.bat文件,出現如下界面及說明kettle成功部署。
六:出現問題
1)若kettle啟動spoon提示 A Java Exception has occurred,則說明jdk與當前kettle版本不匹配。(註:jdk1.8版本可支持Kettle7.0以後版本,1.7版本不支持)
7、建立轉換
在文件->新建裝換。
新建轉換後在左邊的主對象樹中建立DB連接用以連接數據庫。如圖所示:
建立數據庫連接的過程與其他數據庫管理軟件連接數據庫類似。
註意:在數據庫鏈接的過程中,可能會報某個數據庫連接找不到的異常。那是因為你沒有對應的數據庫鏈接驅動,請下載對應驅動後,別忘記在鏈接數據庫時先將數據庫驅動包放入Spoon的lib文件夾下。
8 簡單的數據表插入\更新
(1)新建表插入
在左邊的面板中選擇“核心對象”,在核心對象裏面選擇“輸入->表輸入”,用鼠標拖動到右邊面板。如圖所示:
雙擊拖過來的表,可以編輯表輸入。
選擇數據庫連接和編輯sql語句,在這一步可以點擊預覽,查看自己是否連接正確。
(2)通過插入\更新輸出到表。
在左邊面板中選擇核心對象、選擇“輸出->插入\更新”如圖所示:
編輯插入更新:
首先:表輸入連接插入更新。
選中表輸入,按住shift鍵,拖向插入更新
然後:雙擊插入更新,編輯它。
到這裏基本上,這個轉換就要做完了,可以點擊運行查看效果,看是否有誤,這個要先保存了才能運行,可以隨意保存到任何一個地方。
檢查數據庫表test1是否已有數據:
無數據的原因是:
再次執行轉換:
9, 使用作業控制上面裝換執行。 使用作業可以定時或周期性的執行轉換,新建一個作業。並從左邊面板拖入start 和轉換。
雙擊start可以編輯,可以設置執行時間等等
點開轉換,可以設置需要執行的轉換任務,比如可以執行上面我們做的轉換,XXX.ktr 開始 連接 轉換 選中START ,按住shift鍵,拖向轉換。由於之前單獨執行測試公轉換是否設置正確,先刪除表test1的數據:
執行作業:
執行成功。查看數據庫表test1是否有數據:
Kettle 入門筆記1