1. 程式人生 > >Apache Zeppelin是什麽?

Apache Zeppelin是什麽?

ron 動態表 frame apache2 sql 到你 cal notebook r語

Apache Zeppelin提供了web版的類似ipython的notebook,用於做數據分析和可視化。背後可以接入不同的數據處理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整體展現和使用形式和Databricks Cloud是一樣的,就是來自於當時的demo。

Zeppelin是一個Apache的孵化項目.
一個基於web的筆記本,支持交互式數據分析。你可以用SQL、Scala等做出數據驅動的、交互、協作的文檔。(類似於ipython notebook,可以直接在瀏覽器中寫代碼、筆記並共享)

多用途筆記本

可實現你所需要的:
- 數據采集
- 數據發現
- 數據分析
- 數據可視化和協作

支持多種語言,默認是scala(背後是Spark shell),SparkSQL, Markdown 和 Shell。
技術分享圖片
甚至可以添加自己的語言支持。

Apache Spark 集成

Zeppelin 提供了內置的 Apache Spark 集成。你不需要單獨構建一個模塊、插件或者庫。
Zeppelin的Spark集成提供了:
- 自動引入SparkContext 和 SQLContext
- 從本地文件系統或maven庫載入運行時依賴的jar包。
- 可取消job 和 展示job進度

數據可視化

一些基本的圖表已經包含在Zeppelin中。可視化並不只限於SparkSQL查詢,後端的任何語言的輸出都可以被識別並可視化。
技術分享圖片

動態表格

Zeppelin 可以在你的筆記本中動態地創建一些輸入格式。
技術分享圖片
更多關於動態表格

協作

Notebook 的 URL 可以在協作者間分享。 Zeppelin 然後可以實時廣播任何變化,就像在 Google docs 中一樣。
技術分享圖片

發布

Zeppelin 提供了一個 URL 用來僅僅展示結果,那個頁面不包括 Zeppelin 的菜單和按鈕。這樣,你可以輕易地將其作為一個iframe集成到你的網站。
技術分享圖片

100% 開源

Apache Zeppelin (孵化中) 是 Apache2 許可軟件。 請查看源碼庫 和 如何貢獻。

Zeppelin 有著非常活躍的開發社區。加入郵件列表和在我們的問題跟蹤上報告問題has a very active development community. Join the Mailing list and report issues on our Issue tracker.

以上翻譯自Apache Zeppelin (incubating)官網。
由於目前並不提供binary安裝包,需要自己編譯。

如果有一個工具,可以讓你在同一個Web頁面上寫Shell代碼,Python代碼,Scala代碼,你想要麽?
如果還可以執行PySpark代碼和Spark代碼呢?心動了嗎?
如果還可以寫Hive-SQL,Spark-SQL呢?
如果還可以把這些代碼保存起來,並形成文檔,支持Markdown語法,如何?
如果還可以將SQL的結果在Web界面上可視化出來呢?
如果還支持R語言,還支持Kylin呢?還支持Angular呢?還支持PostgreSQL呢?不信你不心動。

Apache Zeppelin是什麽?