1. 程式人生 > >Spark核心RDD:Sort排序詳解

Spark核心RDD:Sort排序詳解

val conf = new SparkConf()
val sc = new SparkContext(conf)
val array = Array((1, 6, 3), (2, 3, 3), (1, 1, 2), (1, 3, 5), (2, 1, 2))
val rdd1 = sc.parallelize(array)
//設定元素(e1,e3)為key,value為原來的整體
val rdd2 = rdd1.map(f => ((f._1, f._3), f))
//利用sortByKey排序的對key的特性
val rdd3 = rdd2.sortByKey()
val rdd4 = rdd3.values.collect