1. 程式人生 > >kettle 含參hadoop資料匯入,過濾

kettle 含參hadoop資料匯入,過濾

kettle如果資料量過大在job的迴圈時,可能會出現程式崩潰問題,因此不採用變數傳遞方法去sql裡不斷查詢資料

不過kettle自帶的過濾資料無法傳入動態引數,因此這兒提供一種方法,將過濾資料匯出方法

將所有資料先查詢出來,放到hadoop裡,再通過

hadoop裡的過濾操作,傳入引數

將符合的資料拿出來,最後的結果是經過過濾的資料