1. 程式人生 > >Spark RDD(DataFrame) 寫入到HIVE的程式碼實現

Spark RDD(DataFrame) 寫入到HIVE的程式碼實現

在實際工作中,經常會遇到這樣的場景,想將計算得到的結果儲存起來,而在Spark中,正常計算結果就是RDD。

而將RDD要實現注入到Hive表中,是需要進行轉化的。

關鍵的步驟,是將RDD轉化為一個SchemaRDD,正常實現方式是定義一個case class.

然後,關鍵轉化程式碼就兩行。

data.toDF().registerTempTable("table1")  

sql("create table XXX as select * from table1")

而這裡面,SQL語句是可以修改的,如寫到某個分割槽,新建個表,選取其中幾列等。

實現效果如圖所示:


執行完成之後,可以進入HIVE檢視效果,如表的欄位,表的記錄個數等。完勝。