ETL 幾種工具的比較(Kettle,Talend,Informatica )
成本:
軟體成本包括多方面,主要包括軟體產品, 售前培訓, 售後諮詢, 技術支援等。
開源產品本身是免費的,成本主要是培訓和諮詢,所以成本會一直維持在一個較低水平。
商業產品本身價格很高,但是一般會提供幾次免費的諮詢或支援,所以採用商用軟體最初成本很高,但是逐漸下降。
手工編碼最初成本不高,主要是人力成本,但後期維護的工作量會越來越大。
風險:
專案都是有風險的尤其是大專案。
專案的風險主要包括:超出預算,專案延期,沒有達到使用者的滿意和期望
開源產品由於價格上的優勢,可以在很大程度上降低專案的風險。
易用性:
Talend:有 GUI 圖形介面但是以 Eclipse 的外掛方式提供。
Kettle:有非常容易使用的 GUI,出現問題可以到社群諮詢。
Informatica:有非常容易使用的 GUI,但是要專門的訓練。
Inaplex Inaport:沒有GUI
技術支援:
Talend:主要在美國
Kettle:在美國,歐洲(比利時,德國,法國,英國),亞洲(中國,日本,韓國)都可以找到相關技術支援人員。
Informatica:遍佈全世界
Inaplex Inaport:主要在英國
部署:
Talend:建立 java 或perl 檔案,並通過作業系統排程工具來執行
Kettle:可以使用 job 作業方式或作業系統排程,來執行一個轉換檔案或作業檔案,也可以通過叢集的方式在多臺機器上部署。
Informatica:需要有 Server
Inaplex Inaport:需要 .net 2.0
速度:
Talend:需要手工調整,對特定資料來源有優化知識。
Kettle:比 Talend 快,不過也需要手工調整,對 Oracle 和 PostGre 等資料來源做了優化,同時也取決於轉換任務的設計。
Informatica:是最快的
Inaplex Inaport:沒有使用什麼優化技術。
資料質量:
Talend:在 GUI 裡有資料質量特性,可以手工寫 SQL 語句。
Kettle:在 GUI 裡有資料質量特性,可以手工寫 SQL 語句、java指令碼、正則表示式來完成資料清洗。
Informatica:專門有一個產品 Informatica Data Quality 來保證資料質量
Inaplex Inaport:因為只處理特定資料,所以比較容易進行資料清洗。
監控:
Talend:有監控和日誌工具
Kettle:有監控和日誌工具
Informatica:有非常詳細的監控和日誌工具
Inaplex Inaport:有監控和日誌工具
連線性:
Talend:各種常用資料庫,檔案,web service。
Kettle:非常廣泛的資料庫,檔案,另外可以通過外掛擴充套件。
Informatica:各種資料來源
Inaplex Inaport:ODBC 連線