Informatica支援 MySQL Community 版本的解決方案
Informatica Power Center 是一個 ETL 工具,提供強大的資料整合軟體和服務,一般用於大資料的抽取、轉換、載入,常應用於資料倉庫、BI 等領域,並支援各種主流的資料來源,如 Oracle、SQL Server、SaleForce、MySQL 等。本文主要分享 Informatica 在處理MySQL資料來源過程中遇到的一些問題,以及對應的解決方案(基於Windows)。
一、MySQL 社群版不支援的問題
雖然 Informatica 支援多種主流資料來源,但官方明確說明不支援 MySQL 社群版,不過通過其他途徑也能實現對 MySQL 社群版的支援,步驟如下:
1) 安裝 ODBC 驅動
首先,從MySQL官網下載社群版 ODBC Connector 驅動,32位和64位的都要下載,32位安裝在 Informatica Client,64位安裝在Informatica Sever。
2) Designer 配置 Data Source
Informatica Designer 用以匯入資料來源表、資料目標表、開發Mapping。現在要配置一個 MySQL 的資料來源,點選 Sources -> Import From DataBase,按如下圖所示:
結果 Informatica 報錯,還需要在Client端配置下 MySQL ODBC 驅動的支援。
3) Client 修改配置檔案
找到Informatica Client的安裝目錄,按如下圖所示的位置找到 powrmart.ini 檔案,新增內容如紅圈所示。
4) Informatica Workflow 配置 Connector
開發好的 Mapping,需要執行在 Workflow,這時候需要對 Mapping 對應的資料來源配置 Connector,以便支援 Workflow 的執行。開啟 Workflow 工具,配置 MySQL Connector,步驟如下所示:
上圖 Connect String 指的是 Server 要配置的系統DSN名稱。
5) Server 配置 DSN
在 Server 配置一個系統 DSN ODBC源(window server作業系統ODBC資料來源(32位)對應的是“ODBC資料來源”程式,
二、中文亂碼的問題
Informatica 在對 MySQL 進行資料抽取時,比如從 SQL Server 抽取到 My SQL,或從 MySQL 抽取到 SQL Server。如果抽取資料時有中文亂碼問題,多半是字符集型別和資料表字段型別造成的,可以嘗試以下方法:
1) 字符集設定檢查
在 Informatica Workflow 的 Connector 對資料來源配置相應的字符集型別,一般 MySQL 是UTF8,在 Connector 配置視窗的 Code Page 就選UTF8,如下所示:
2) 表字段型別
MySQL 如果是 Varchar,SQL Server 對應的欄位需要定義為 Nvarchar,Varchar 是以 UTF8 儲存資料的,Nvarchar 是以 GBK 儲存的。