1. 程式人生 > >spoon新手入門教程

spoon新手入門教程

Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上執行,資料抽取高效穩定。Kettle 中文名稱叫水壺,該專案的主程式設計師MATT 希望把各種資料放到一個壺裡,然後以一種指定的格式流出。Kettle這個ETL工具集,它允許你管理來自不同資料庫的資料,通過提供一個圖形化的使用者環境來描述你想做什麼,而不是你想怎麼做。Kettle中有兩種指令碼檔案,transformation和job,transformation完成針對資料的基礎轉換,job則完成整個工作流的控制。

  1. 此軟體執行需要JDK環境,所以電腦沒裝JDK的話,先下載安裝。
  2. Kettle解壓到英文路徑的資料夾中就可以了,不需要安裝。
  3. 點選data-integration資料夾中的Spoon.bat就能打開了。

下面是圖文教程:

進入解壓的目錄,找到Spoon.bat,先彆著急雙擊開啟,如果你本機的資料庫是oracle,就先把oracle的驅動放進spoon解壓目錄的lib目錄下;如果本機裝的是mysql資料庫,同理把mysql的驅動放到lib目錄下,然後再啟動spoon。否則當你啟動的時候會報如下錯誤

Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed.
oracle.jdbc.driver.OracleDriver

這裡寫圖片描述

這裡寫圖片描述

開啟spoon後點擊左上角的主物件樹,右鍵DB連線新建。

這裡寫圖片描述

輸入資料庫連線資訊

這裡寫圖片描述

輸入完成後先點選測試一下,看看連線是否正常。

這裡寫圖片描述

下面開始新建轉換。

這裡寫圖片描述

點開左側欄的輸入,找到表輸入,並用滑鼠把表輸入拖向右邊空白區域。

這裡寫圖片描述

這裡寫圖片描述

雙擊拖進來的表輸入,編輯表輸入裡面的資訊。

這裡寫圖片描述

點開左側欄的輸出,找到插入/更新,並用滑鼠把插入/更新拖向右邊空白區域。
這裡寫圖片描述

摁住shift鍵不放,滑鼠點選表輸入,然後拖向旁邊的插入/更新,這樣就把兩個動作連線起來了。

這裡寫圖片描述

雙擊插入/更新,編輯插入/更新裡面的資訊。最後把該轉換儲存,這裡儲存成test.ktr。

這裡寫圖片描述

接下來開始建立作業

這裡寫圖片描述

建立作業

和建立轉換操作都差不多。

這裡寫圖片描述

雙擊START,對START進行編輯,可以讓作業按每天、每週、每月定時呼叫。

這裡寫圖片描述

雙擊裝換進行編輯,找到前面儲存的test.ktr 轉換檔案。

這裡寫圖片描述

到這一步就可以開始點選運行了

這裡寫圖片描述

下圖是執行結果

這裡寫圖片描述

tb_user是源表

這裡寫圖片描述

tb_user2是目標表,沒執行作業前它是沒有資料的。

這裡寫圖片描述

執行作業後,資料成功匯入到tb_user2表裡。
這裡寫圖片描述

根據上面的教程,可以嘗試著把oracle資料庫中的表的資料插入到mysql等其它資料庫中的表裡面去。