1. 程式人生 > >Spark 修改整列資料型別+寫入資料到HDFS

Spark 修改整列資料型別+寫入資料到HDFS

Spark 修改dataset整列資料型別

import org.apache.spark.sql.types.IntegerType

geoans.select(geoans.col("pointNum").cast(IntegerType).as("lat"))

寫入資料到HDFS

a.repartition(3).write.parquet("hdfs://master:9000"+"/data/30sa0")