1. 程式人生 > >KETTLE——(二)資料抽取

KETTLE——(二)資料抽取

過了個春節,好長時間沒有更新了,今天接著寫第二部分——資料抽取。

進入介面以後會發現左側選單有兩個東西:轉換和作業;簡單說一下,轉換是單次的轉換,不可重複,但可重複利用;作業是匯聚了其他操作和多次(可單次)轉換,可定時觸發,可定時迴圈。集體情況後面方便再說。


KETTLE支援很多的種形式的資料輸入,總體上分三種方式:第一種資料庫資料輸入(支援多種資料庫關係和非關係型資料庫);第二種文字資料輸入(常見的多種文字,txt,xml等),第三種,有系統自動生成的的資料(包括人工在轉換的時候新增的資料)。以資料庫資料為例,操作如下。

左側輸入——>表輸入


步驟名稱(填寫步驟名稱),資料庫連線(選擇輸入資料的資料庫),就和連線資源庫時的步驟差不多了(資料庫連線),獲取SQL查詢語句,選擇要輸入的資料所在的表。


得到查詢表裡面的所有欄位的SQL語句,根據自己需求,自己調整。


如果有條件查詢裡面存在變數,可勾選【允許……】和【替換……】但注意在前一步需要有變數的確定和輸入,這裡先做一個簡單的輸入,【預覽】可看,點選【確定】即可。

一個簡單的表輸入就完成了,其他的輸入基本步驟也是如此,不同的是,如果是文字資料,需要告訴KETTLE怎麼區分欄位,是用什麼分割的。

一般只有資料輸入是沒有用的,我們還需要輸出,更重要的是中間的轉換過程,想要使用一個工具就想好好了解其功能,多試試各種勾選框和按鈕的功能。

最基本的資料輸入完成。