1. 程式人生 > >資料對接-ETL之StreamSet學習之旅二

資料對接-ETL之StreamSet學習之旅二

目錄

1、測試Ftp取檔案

利用搭建好的StreamSet平臺,配置Ftp客戶端連線,並拉取某個Excel檔案。
利用StreamSet提供的Ftp客戶端元件,進行ftp連線。
在這裡插入圖片描述
配置 如下:

Resource URL: ftp://192.168.1.100/abc/2018/0103/
File Name Pattern: 447965a864094208aa6d6d3c90bf71ef.xls
Authentication: password
Username :webmote
Password:xxx
Data Format:Excel
Excel Header Option:with Header Line

2、解析Excel

第一節的資料格式,已經標明瞭怎樣解析檔案。支援的檔案列表如下:
在這裡插入圖片描述
解析的資料進行扁平化操作。
在這裡插入圖片描述
該元件可以使巢狀資料,扁平化,變化方式如下:

{
  "contact": {
     "name": "Jane Smith",
     "id": "557",
     "address": {
       "home": {
         "street": "101 3rd St",
         "city": "Huntsville",
         "state": "NC",
         "zipcode": "27023"
          }
, "work": { "street": "15 Main St", "city": "Jonestown", "state": "NC", "zipcode": "27011" } } } }

扁平化以後:

{
  "contact": {
     "name": "Jane Smith",
     "id": "10342",
     "address": {
         "home.street": "34 2nd St",
         "home.city"
: "Wilma", "home.state": "OH", "home.zipcode": "33333", "work.street": "15 Main St", "work.city": "Jonestown", "work.state": "OH", "work.zipcode": "55555" } } }

3、修改對映列

在這裡插入圖片描述
利用該元件修改對映關係。
例如配置如下替換:
在這裡插入圖片描述
結果如下:
在這裡插入圖片描述

4、處理後的資料執行

在這裡插入圖片描述

5、結語

StreamSet提供了一個靈活的輸入輸出處理,為我們處理具體問題提供了很多可能。

引用連結

  1. 口袋程式碼倉庫
  2. 線上計算器
  3. 本節原始碼:github