幾種 ETL 工具的比較(Kettle,Talend,Informatica 等)
成本:
軟件 成本包括多方面,主要包括軟件產品, 售前培訓, 售後咨詢,
技術 支持等。
開源 產品本身是免費的,成本主要是培訓和咨詢,所以成本會一直維持在一個較低水平。
商業產品本身價格很高,但是一般會提供幾次免費的咨詢或支持,所以采用商用軟件最初成本很高,但是逐漸下降。
手工編碼最初成本不高,主要是人力成本,但後期維護的工作量會越來越大。
風險:
項目都是有風險的尤其是大項目。
項目的風險主要包括:超出預算,項目延期,沒有達到用戶的滿意和期望
開源產品由於價格上的優勢,可以在很大程度上降低項目的風險。
易用性:
Talend:有 GUI 圖形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出現問題可以到社區咨詢。
Informatica:有非常容易使用的 GUI,但是要專門的訓練。
Inaplex Inaport:沒有GUI
技術支持:
Talend:主要在美國
Kettle:在美國,歐洲(比利時,德國,法國,英國),亞洲( 中國 ,日本,韓國)都可以找到相關技術支持人員。
Informatica:遍布全世界
Inaplex Inaport:主要在英國
部署:
Talend:創建
java
或perl 文件,並通過操作系統調度工具來運行
Kettle:可以使用 job 作業方式或操作系統調度,來執行一個轉換文件或作業文件,也可以通過集群的方式在多臺機器上部署。
Informatica:需要有
Server
Inaplex Inaport:需要 .net 2.0
速度:
Talend:需要手工調整,對特定數據源有優化知識。
Kettle:比 Talend 快,不過也需要手工調整,對 Oracle 和 PostGre 等數據源做了優化,同時也取決於轉換任務的設計。
Informatica:是最快的
Inaplex Inaport:沒有使用什麽優化技術。
數據質量:
Talend:在 GUI 裏有數據質量特性,可以手工寫
SQL
語句。
Kettle:在 GUI 裏有數據質量特性,可以手工寫 SQL 語句、java腳本、正則表達式來完成數據清洗。
Informatica:專門有一個產品 Informatica Data Quality 來保證數據質量
Inaplex Inaport:因為只處理特定數據,所以比較容易進行數據清洗。
監控:
Talend:有監控和日誌工具
Kettle:有監控和日誌工具
Informatica:有非常詳細的監控和日誌工具
Inaplex Inaport:有監控和日誌工具
連接性:
Talend:各種常用 數據庫 ,文件, web
service。
Kettle:非常廣泛的數據庫,文件,另外可以通過插件擴展。
Informatica:各種數據源
Inaplex Inaport:ODBC 連接
幾種 ETL 工具的比較(Kettle,Talend,Informatica 等)