1. 程式人生 > >Apache Impala 3.1.0 釋出,高效能的分散式 SQL 引擎

Apache Impala 3.1.0 釋出,高效能的分散式 SQL 引擎

  

Apache Impala 3.1.0 已釋出,暫未發現更新內容的介紹,點此保持關注


下載地址:

Apache Impala 是一個高效能分散式 SQL 引擎,是用於處理儲存在 Hadoop 叢集中的大量資料的 MPP(大規模並行處理)SQL 查詢引擎。用 C++ 和 Java 編寫而成,與其他 Hadoop 的 SQL 引擎相比,它提供了高效能和低延遲。

Impala 通過使用標準組件(如 HDFS,HBase,Metastore,YARN 和 Sentry)將傳統分析資料庫的 SQL 支援和多使用者效能與 Apache Hadoop 的可擴充套件性和靈活性相結合。

  • 使用 Impala,與其他 SQL 引擎(如 Hive)相比,使用者可以使用 SQL 查詢以更快的方式與 HDFS 或 HBase 進行通訊。

  • Impala 可以讀取 Hadoop 使用的幾乎所有檔案格式,如 Parquet,Avro,RCFile。

Impala 將相同的元資料,SQL 語法(Hive SQL),ODBC 驅動程式和使用者介面(Hue Beeswax)用作 Apache Hive,為面向批量或實時查詢提供熟悉且統一的平臺。

與 Apache Hive 不同,Impala 不基於 MapReduce 演算法。 它實現了一個基於守護程序的分散式架構,它負責在同一臺機器上執行的查詢執行的所有方面。

因此,它減少了使用 MapReduce 的延遲,這使得 Impala 比 Apache Hive 快。