資料對接-ETL之StreamSet學習之旅二
阿新 • • 發佈:2018-12-07
目錄
1、測試Ftp取檔案
利用搭建好的StreamSet平臺,配置Ftp客戶端連線,並拉取某個Excel檔案。
利用StreamSet提供的Ftp客戶端元件,進行ftp連線。
配置 如下:
Resource URL: ftp://192.168.1.100/abc/2018/0103/ File Name Pattern: 447965a864094208aa6d6d3c90bf71ef.xls Authentication: password Username :webmote Password:xxx Data Format:Excel Excel Header Option:with Header Line
2、解析Excel
第一節的資料格式,已經標明瞭怎樣解析檔案。支援的檔案列表如下:
解析的資料進行扁平化操作。
該元件可以使巢狀資料,扁平化,變化方式如下:
{
"contact": {
"name": "Jane Smith",
"id": "557",
"address": {
"home": {
"street": "101 3rd St",
"city": "Huntsville",
"state": "NC",
"zipcode": "27023"
} ,
"work": {
"street": "15 Main St",
"city": "Jonestown",
"state": "NC",
"zipcode": "27011"
}
}
}
}
扁平化以後:
{
"contact": {
"name": "Jane Smith",
"id": "10342",
"address": {
"home.street": "34 2nd St",
"home.city" : "Wilma",
"home.state": "OH",
"home.zipcode": "33333",
"work.street": "15 Main St",
"work.city": "Jonestown",
"work.state": "OH",
"work.zipcode": "55555"
}
}
}
3、修改對映列
利用該元件修改對映關係。
例如配置如下替換:
結果如下:
4、處理後的資料執行
5、結語
StreamSet提供了一個靈活的輸入輸出處理,為我們處理具體問題提供了很多可能。