1. 程式人生 > >Pentaho 插入/更新資料表操作例項

Pentaho 插入/更新資料表操作例項

ETL是EXTRACT(抽取)、TRANSFORM(轉換)、LOAD(載入)的簡稱,實現資料從多個異構資料來源載入到資料庫或其他目標地址,是資料倉庫建設和維護中的重要一環也是工作量較大的一塊。當前知道的ETL工具有informatica, datastage,kettle,ETL Automation,sqoop,SSIS等等。這裡我們聊聊kettle的學習吧(如果你有一定的kettle使用,推薦看看Pentaho Kettle解決方案,這裡用kettle實踐kimball的資料倉庫理論);

需求描述:

假設有一張A表,我們需要將A表更新去結構相同的B表中,但是B表中的資料是之前A的舊資料,現在由於表A中資料更新了,那麼現在的需求就是我們需要將表A中的已更新的資料更新至表B中,表A中新增的資料插入到表B中。

表例

表A(已更新):

id name gender age
1 buranden 0 13
2 james 0 23
3 jim 1 22
4 john 0 17
5 kobe 0 24
6 lily 1 25
7 sam 0 23
8 snow 0 17
9 stack 0 17

表B(舊錶A資料未更新):

id name gender age
1 jim 1 999
2 john 1 18
3 kobe 1 789
4 snow 0 17

#Pentaho流程圖:
在這裡插入圖片描述

在這裡插入圖片描述

在這裡插入圖片描述

表B結果圖:

在這裡插入圖片描述