1. 程式人生 > >Spark DataFrame批量修改資料型別

Spark DataFrame批量修改資料型別

rdd的運算元分成Transformation和action運算元,其中Transformation運算元的操作每次都會生成一個新的rdd,所以在進行資料轉換的時候如果單個列進行轉換的話效能消耗比較嚴重,所以批量的操作進行都要減少執行次數。

	val colNames = df.schema.fieldNames
    val cols = colNames.map(f => df(f).cast(DoubleType))
    val test: DataFrame = testDf.select(cols: _*)