kettle系列之二工具使用

阿新 • • 發佈：2018-12-14

初始化

設定語言

第一步，可選，把工具設定顯示英文。

工具-選項-觀感

介面簡介

只做簡單解釋，後續做專案會慢慢用到一些其中的外掛

簡單的資料庫交換例子

需求：每天定時從A庫的X表獲取資料，搬到B庫的X表，表結構一致

grid_code欄位要求去掉短橫線

新建作業

快捷鍵CTRL+ALT+N

模型：

步驟：

開始和結束外掛是必須的

獲取當前系統日期，儲存結果到記錄集

取出記錄集，替換佔位符(SQL查詢)，獲取資料，搬遷到目標表

新建轉換

獲取日期

快捷鍵CTRL+N

獲取系統當前日期

格式化日期格式

複製資料

從結果獲取記錄

表輸入

格式化字串，去掉grid_code的短橫線

輸出到目標表，注意選目標表

執行

就可以檢視執行結果

可以檢視效能監控圖

一些問題

結果集和變數的區別?

結果集主要用於替換佔位符

變數主要用於替換某些不能使用佔位符的情況，特別注意的是，如果在A轉換裡面設定了變數，是不能在A轉換中使用，必須在下一個轉換或者作業環節才能使用，而且，變數是有作用域範圍的，需要根據實際需要指定好

參考：多表複製的例子

表輸出的時候，表名無法使用佔位符實現

每個結果集執行一次Job

應用場景，當需要用到同步多個表資料的時候，可以採用單個作業，多次迴圈的方式，但是需要設定子作業或者轉換為每個輸入結果執行一次。

分批執行，分頁採集資料

在資料庫輸入和輸出的過程中，可以設定每次提交的數量，因為表輸入一般都是直接把整個資料庫表的資料load進記憶體，再處理輸出到目標資料庫，在資料量較大的情況下，需要分批提交

作業示例

設定變數

設定分頁數

獲取分頁總數之後，設定步進序列

子作業，開始複製表資料

設定開始變數

開始複製資料

為什麼分批執行使用變數，而不使用JS迴圈

在第一次搜尋資料的時候，使用的就是JS迴圈，但是在大資料量的時候，kettle每次都記憶體溢位

而且很明顯這是一個固有的問題，PDI不使用JS迴圈

在資料量小的時候，還是可以使用的，但是不建議

主作業：

設定變數

判斷

判斷成立，進入資料複製步驟

計數加1

支援事務嗎？

開源的社群版本只有轉換支援事務，作業不支援事務

配置方法，每隔50000條作為一次事務，如果在15w的時候失敗，那麼前面10w資料是成功提交的。

優化？

十六、使用kettle時必須要注意並且做到的幾個要點

支援遠端執行？

放在叢集的單元說

怎麼記錄執行日誌？

在下一章節，資料庫資源庫裡面解釋

kettle系列之二工具使用

初始化設定語言第一步，可選，把工具設定顯示英文。工具-選項-觀感介面簡介只做簡單解釋，後續做專案會慢慢用到一些其中的外掛簡單的資料庫交換例子需求：每天定時從A庫的X表獲取資料，搬到B庫的X表，表結構一致 grid_code欄位要求去掉短橫

Profile 工具系列之二： gperftools

簡介 gperftools 原名 Google Performance Tools，是一套可以做 profile 的工具，由 google 提供。目前看來在 Linux 上特別的好使，Windows 基本不能用（官網說 Windows 正在開發，不知道會不

開源ETL工具kettle系列之常見問題

摘要：本文主要討論如何在你自己的Java應用程式中整合Kettle 如果你需要在自己的Java應用程式中整合Kettle , 一般來說有兩種應用需求，一種是通過純設計器來設計ETL轉換任務，然後儲存成某種格式，比如xml或者在資料庫中都可以，然後自己呼叫程式解析這個格式，執行這種轉換，是比較抽象的一種執行方

【只怕沒有幾個人能說清楚】系列之二：Unity中的特殊文件夾

物體 avi ebp time 編輯模式 tro hive 預覽打包參考：http://www.manew.com/thread-99292-1-1.html 1. 隱藏文件夾以.開頭的文件夾會被忽略。在這種文件夾中的資源不會被導入，腳本不會被編譯。也不會出現

【Unity Shaders】ShadowGun系列之二——霧和體積光

依靠 action 圖形學取值線性數學 viewer https 是否寫在前面體積光，這個名稱是God Rays的中文翻譯，感覺不是非常形象。God Rays事實上是Crepuscular rays在圖形學中的說法，而Crepuscular rays的意思是雲隙光

【iOS與EV3混合機器人編程系列之二】工欲善其事，必先利其器（準備篇）

style 混合版權相同開發 code 操作系統圖形 ipa 在上一篇文章中，我們論述了iOS與EV3結合後機器人開發的無限可能。那麽，大家要不要一起來Hacking一把呢？為了能夠完整地完畢我接下來我講的項目。我們須要做下面準備：1、一臺Mac執行MAC OS

C++語言筆記系列之二十——模版

輸出類模板 pos 有一個 class 初始個數創建對象 example 1.隨意輸入兩個數x和y，輸出最大值max。 int max(int x, int y) {return x>y?x:y;} 2.函數模版（1）用一種或者多

Python零基礎學習系列之二--Python介紹及環境搭建

url 軟件包三方庫簡單的 lin 文件的 span 高級程序設計擴展 1-1、Python簡介：　Python是一種解釋型、面向對象、動態數據類型的高級程序設計語言。Python由Guido van Rossum於1989年底發明，第一個公開發行版發行於1991年

緩存系列之二：CDN與其他層面緩存

級別 spl pecl apache 分布式緩存 -o 真實ip har 分享緩存系列之二：CDN與其他層面緩存一：內容分發網絡（Content Delivery Network），通過將服務內容分發至全網加速節點，利用全球調度系統使用戶能夠就近獲取，有效降低訪問延遲，

數據庫面試系列之二：視圖

名稱獨立建立數據庫有用圖的定義適合場景多個視圖的定義：視圖是一個或者多個基本表（或者視圖）導出的表。視圖是一張虛表，視圖的數據並不實際存儲視圖的優點： 1.視圖可以簡化用戶的操作 2.視圖可以讓用戶從多個角度來看待同一數據 3.視圖提供一定的數據邏輯獨

.Neter玩轉Linux系列之二：Linux下的文件目錄及文件目錄的權限

pac linux 在那用戶目錄結構重要 bsp 樹狀 hub 一、Linux下的文件目錄簡介：linux的文件系統是采用級層式的樹狀目錄結構，在此結構中的最上層是根目錄“/”，然後在此目錄下再創建其他的目錄。深刻理解linux文件目錄是

Java並發編程系列之二十八：CompletionService

xtend cts edate strong ext [] com 喚醒 render CompletionService簡介 CompletionService與ExecutorService類似都可以用來執行線程池的任務，ExecutorService繼承了Execut

Web API系列之二WebApi基礎框架搭建

相關框架搭建導入沒有 pos 創建 div 程序傻瓜式本文主要介紹如何搭建一個WebApi的項目.關於如何搭建WebApi的方式一共有兩種: 一、通過vs直接新建一個WebApi的項目,步驟如下: 第一步: 新建一個空的Web應用程序,可以理解為作為WebApi的

CAN總線學習系列之二——CAN總線與RS485的比較

smb 可靠性 bus targe 接口 blog 情況並不是 control CAN總線學習系列之二——CAN總線與RS485的比較上一節介紹了一下CAN總線的基本知識，那麽有人會問，現在的總線格式很多，CAN相對於其他的總線有什麽特點啊？這個問題

從產品展示頁面談談Hybris系列之二: DTO, Converter和Populator

ext 存儲 resource tar adl 裏的 resolve 個數 lis 文章作者：張健(Zhang Jonathan) 上一篇文章從產品展示頁面談談Hybris的特有概念和設計結構我們講解了Hybris一些特有的概念以及大體架構，並且介紹了Facade層裏是

Https系列之二：https的SSL證書在服務器端的部署，基於tomcat,spring boot

onf 基於分享 height 轉化自簽名 size class ont 一：本文的主要內容介紹 CA證書的下載及相應文件的介紹 CA證書在tomcat的部署 CA證書在spring boot的部署自簽名證書的部署二：一些內容的回顧在Https系列之一中已介

Exchange 2013系列之二：AD部署

Windows Exchange Microsoft 打開網絡和共享中心，右鍵網卡選擇屬性；選擇IPV4，點擊屬性；輸入IP地址、子網掩碼、網關及DNS，點擊確定；打開服務器管理器，點擊計算機名；點擊更改；輸入計算機名後點擊確定；重啟電腦；重啟完畢後，打開服務器管理器，在管理菜單中選擇添加角色和功

Unity插件系列之二維碼

rate debug div play 格式轉換 -s 離線 interval private 1.二維碼常見的生成與識別途徑 1.草料二維碼 https://cli.im/text 2.在軟件中實現生成和掃描二維碼使用zxing實現 zxing是一個用java寫的開源

手把手教你跑Larave框架實戰筆記系列之二

Laravel PHP框架系列之一為童鞋們搭好了舞臺，今天正式登臺跑框架了…… 從“路由”開始，玩一把“Hellow world!” Route::get(‘/’, function () { //return view(‘welcome’); return ‘Hellow world!’; });

PowerShell從零開始系列之二

PowerShell好了，之前我們講過學習PowerShell的必要性，那麽今天開始實際操作下PowerShell。PowerShell預裝在Windows 7以上的系統中，無需額外下載，即可使用你可以在開始菜單中找到 Windows PowerShell或者通過 Win+R 運行 PowerShell以打開

kettle系列之二 工具使用

初始化

設定語言

介面簡介

簡單的資料庫交換例子

新建作業

新建轉換

執行

一些問題

相關推薦

kettle系列之二工具使用