1. 程式人生 > >ETL工具—Kettle數據的導入導出—Excel表到數據庫

ETL工具—Kettle數據的導入導出—Excel表到數據庫

data ttl 文件 啟動 連接 alt block 9.png etl

案例目的:當Excel中有幾萬條記錄或者更多數據時,使用Kettle導入到數據庫中。速度就能感到比復制粘貼快很多。

  • 這裏我會演示將"data.xlsx"表中數據有15萬多條記錄,使用Kettle導入到oracle數據庫的testuser用戶下。

準備工作:1.data.xlsx表;

     2.testuser用戶下要有一個與data.xlsx表結構(列數與字段類型)相同的表。

開始!!!

1.新建一個"轉換",將"Excel輸入"、"表輸出"拖拽到新建的轉換工作空間裏

 "文件">"新建">"轉換"打開下圖,並展開左側面板中的"輸入"與"輸出",將"Excel輸入"與"表輸出"拖拽到"轉換1"工作區中。如圖1所示:

技術分享

圖1:工作區拖拽了"Excel輸入"與"表輸出"效果圖

2.設置"Excel輸入"相關參數

1)、雙擊"轉換1"工作區中的"Excel輸入"的圖標,打開設置窗口。

技術分享

圖2:填寫"表類型"與"文件或目錄"兩行的內容

技術分享

圖3:點擊增加後,目錄就會在"選中的文件"中出現了

技術分享

圖4:我的數據在sheet1中,那就把sheet1選進列表中

技術分享

圖5:打開"字段"選項卡,點擊"獲取來自頭部數據的字段",註意時間字段格式的正確性

3.設置"表輸出"相關參數

1)、雙擊"a"工作區(我將"轉換1"保存命名了a)中的"表輸出"的圖標,打開設置窗口。

技術分享

圖6:設置"數據庫連接"的內容

技術分享

圖7:設置"目標模式"

技術分享

圖8:設置"目標表"

技術分享

圖9:設置本地表與數據庫表的映射(也就是字段是否對應正確)

設置完成後點擊"確定"完成設置。

4.運行,將表導入到數據庫中。

技術分享

圖10:運行和啟動

技術分享

圖11:檢測運城結果

註:如果"步驟度量"中出現紅色底紋,表示導入失敗。查看日誌中的提示。個人經驗,最常出現的報錯是,在"Excel輸入"設置中,字段類型裏日期型字段,被設置成了字符型。

結束!!!

ETL工具—Kettle數據的導入導出—Excel表到數據庫