hive、impala、prestoDB 優缺點對比
阿新 • • 發佈:2018-12-25
- hive
優點 | 缺點 |
---|---|
被廣泛應用,經受時間的考驗 | 既然是基於Mapreduce,也擁有MapReduce所有缺點,包含昂貴的Shuffle操作和磁碟IO操作 |
執行在Mapreduce框架之上 | hive仍然不支援多個reduce操作group by和order by查詢 |
非常好的支援使用者自定義函式 | 和其他競品相比,查詢速度很慢 |
很友好的和hbase等系統結合 |
- cloudera impala
優點 | 缺點 |
---|---|
輕量快速,支援近乎實時的查詢 | 零容忍執行查詢任務,如果一個節點上查詢失敗,整個查詢都會失敗 |
計算都在記憶體中完成,減少延遲和磁碟IO開銷 | 使用者自定義函式不是很好的支援 |
- PrestoDB
優點 | 缺點 |
---|---|
輕量快速,支援近乎實時的查詢 | 13年的new born,需要待驗證 |
facebook內部廣泛使用,擴充套件性和穩定性毋庸置疑 | 現在支援hive管理的表,儘管官方稱支援hbase查詢,但是仍然是開發狀態 |
自從開源依賴有強勁的發展勢頭 | 不支援UDF操作 |
和impala同樣使用分散式查詢引擎,和傳統的Mapreduce相比,消除了延遲和磁碟IO開銷 | |
文件完善 |