Pentaho 插入/更新資料表操作例項
阿新 • • 發佈:2019-02-03
ETL是EXTRACT(抽取)、TRANSFORM(轉換)、LOAD(載入)的簡稱,實現資料從多個異構資料來源載入到資料庫或其他目標地址,是資料倉庫建設和維護中的重要一環也是工作量較大的一塊。當前知道的ETL工具有informatica, datastage,kettle,ETL Automation,sqoop,SSIS等等。這裡我們聊聊kettle的學習吧(如果你有一定的kettle使用,推薦看看Pentaho Kettle解決方案,這裡用kettle實踐kimball的資料倉庫理論);
需求描述:
假設有一張A表,我們需要將A表更新去結構相同的B表中,但是B表中的資料是之前A的舊資料,現在由於表A中資料更新了,那麼現在的需求就是我們需要將表A中的已更新的資料更新至表B中,表A中新增的資料插入到表B中。
表例
表A(已更新):
id | name | gender | age |
---|---|---|---|
1 | buranden | 0 | 13 |
2 | james | 0 | 23 |
3 | jim | 1 | 22 |
4 | john | 0 | 17 |
5 | kobe | 0 | 24 |
6 | lily | 1 | 25 |
7 | sam | 0 | 23 |
8 | snow | 0 | 17 |
9 | stack | 0 | 17 |
表B(舊錶A資料未更新):
id | name | gender | age |
---|---|---|---|
1 | jim | 1 | 999 |
2 | john | 1 | 18 |
3 | kobe | 1 | 789 |
4 | snow | 0 | 17 |
#Pentaho流程圖: