Apache Zeppelin使用入門指南:程式設計
編譯和啟動完相關的程序之後,我們就可以來使用了。我們進入到http://www.iteblog.com:8080
頁面,我們可以在頁面上直接操作Zeppelin,依次選擇Notebook->Create
new note
,然後會彈出一個對話方塊,我們在Note Name裡面隨便輸入一個名字,這裡我輸入iteblog,然後點選Create
Note
就可以建立一個新的Notebook了。我們可以在新建的Notebook裡面輸入相關的程式碼進行測試:
1 |
sc.version |
2 |
sqlc |
3 |
4 |
res 26 :
String =
1.5 . 2 |
5 |
res 27 :
org.apache.spark.sql.SQLContext =
org.apache.spark.sql.SQLContext @ 48806 d 6 c |
和Spark Shell一樣,Zeppelin會初始化好SparkContext
和SQLContext
物件,分別命名為sc
和sqlc
,我們可以直接在裡面使用到它。接下來我們來在Zeppelin裡面載入HDFS上面的資料,如下:
2 |
3 |
res 29 :
Long =
200 |
4 |
Took 0
seconds (outdated) |
我們再來使用sqlc物件讀取上面的json檔案來建立一個DataFrame:
02 |
val
profileDF = profilesJsonRdd.toDF() |
03 |
val
iteblog =
profileDF.selectExpr(
|