1. 程式人生 > >Drill 學習筆記之 入門體驗

Drill 學習筆記之 入門體驗

nbsp 分析 sch logs rri googl base 體驗 數據模型

簡介:

  • Apache Drill是一個低延遲的分布式海量數據(涵蓋結構化、半結構化以及嵌套數據)交互式查詢引擎。分布式、無模式(schema-free)
  • 是Google Dremel的開源實現,本質是一個分布式的mpp(大規模並行處理)查詢層,支持SQL及一些用於NoSQL和Hadoop數據存儲系統上的語言
  • 更快查詢海量數據,通過對PB字節(2的50次方字節)數據的快速掃描完成相關分析
  • Drill 提供即插即用,在現有的 Hive,Mongo,HBase中可以隨時整合部署。
  • 是MR交互式查詢能力不足的補充
  • 數據模型,嵌套
  • 列式存儲
  • 結合了web搜索和並行DBMS技術

技術分享

當安裝好Drill,在drill-override.conf配置clusterid和zookeeper集群,然後啟動集群:

技術分享

配置Storage:

技術分享

通過頁面查詢:

技術分享

通過console查詢:

技術分享

技術分享

JDBC查詢:技術分享

Drill 學習筆記之 入門體驗