spark aggregateByKey使用java版

阿新 • • 發佈：2019-02-11

RDDaggregateByKey操作官方api：

aggregateByKey(U zeroValue, Function2<U,V,U> seqFunc, Function2<U,U,U> combFunc)

U zeroValue為定義初始資料；

Function2<U,V,U> seqFunc中第一個U是初始資料的U，v是傳入資料，第二個U是返回資料；

Function2<U,U,U> combFunc，第一個U是累計資料，第二個U是傳入資料，第三個U是返回資料。

（個人理解，不對請指正。）

同時計算sum和count的樣例程式碼如下：

JavaPairRDD<String, String> allMsg= 。。。

JavaPairRDD<String,Tuple2<Double,Integer>> result = allMsg.aggregateByKey(new Tuple2<Double,Integer>(0.0d,0),new Function2<Tuple2<Double,Integer>, String, Tuple2<Double,Integer>>(){@Overridepublic Tuple2 call(Tuple2<Double,Integer> v1, String v2) {return new

Tuple2<>(v1._1() + Double.parseDouble(v2) , v1._2() + 1); } }, new Function2<Tuple2<Double,Integer>, Tuple2<Double,Integer>, Tuple2<Double,Integer>>(){@Overridepublic Tuple2<Double,Integer> call(Tuple2<Double,Integer> v1, Tuple2<Double,Integer>

v2) {return new Tuple2<>( v1._1() + v2._1() , v1._2() + v2._2()); } });

spark aggregateByKey使用java版

在windows 7中安裝部署spark(python版)

Spark (Python版) 零基礎學習筆記（一）—— 快速入門

在windows中搭建spark單機版

Spark Java版 windows本地開發環境

Spark (Python版) 零基礎學習筆記（五）—— Spark RDDs程式設計

Centos系統安裝spark單機版

Spark (Python版) 零基礎學習筆記（四）—— Spark概覽

spark單機版計算測試

Centos下Spark單機版（python）安裝配置

Spark (Python版) 零基礎學習筆記（二）—— Spark Transformations總結及舉例

spark HelloWorld程序（scala版）

【Spark MLlib速成寶典】模型篇04樸素貝葉斯【Naive Bayes】（Python版）

【Spark MLlib速成寶典】模型篇05決策樹【Decision Tree】（Python版）

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記三之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記五之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記九之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記十之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記十五之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記十六之銘文升級版

【慕課網實戰】Spark Streaming實時流處理項目實戰筆記十七之銘文升級版

spark aggregateByKey使用java版

相關推薦