1. 程式人生 > >Spark rdd 轉 dataset

Spark rdd 轉 dataset

工作中需要,將rdd轉為dataset,記錄一下轉換方式以便以後用到。

val rdd: org.apache.spark.rdd.RDD[Row] = null
val schema = StructType(Seq(
    StructField("textField", StringType, nullable = false))
)
val dataset = SparkSession.builder().getOrCreate().createDataFrame(rdd, schema)