spark中flatMap函數用法--spark學習（基礎）

阿新 • • 發佈：2017-12-12

比較一次 ica 例子 tail details word fix spark

spark中flatMap函數用法--spark學習（基礎）

在spark中map函數和flatMap函數是兩個比較常用的函數。其中
map：對集合中每個元素進行操作。
flatMap：對集合中每個元素進行操作然後再扁平化。
理解扁平化可以舉個簡單例子

val arr=sc.parallelize(Array(("A",1),("B",2),("C",3)))
arr.flatmap(x=>(x._1+x._2)).foreach(println)

輸出結果為

A
1
B
2
C
3

如果用map

val arr=sc.parallelize(Array(("A",1),("B",2),("C",3)))
arr.map(x=>(x._1+x._2)).foreach(println)

輸出結果

A1
B2
C3

所以flatMap扁平話意思大概就是先用了一次map之後對全部數據再一次map。

實際使用場景

這個場景是我曾經在寫代碼過程中遇到的難題，在字符串中如何統計相鄰字符對出現的次數。意思就是如果有A;B;C;D;B;C字符串，則（A,B）,(C,D),(D,B)相鄰字符對出現一次，(B,C)出現兩次。
如有數據

A;B;C;D;B;D;C
B;D;A;E;D;C
A;B

統計相鄰字符對出現次數代碼如下

data.map(_.split(";")).flatMap(x=>{
      for(i<-0 until x.length-1) yield (x(i)+","+x(i+1),1)
    }).reduceByKey(_+_).foreach(println)

輸出結果為

(A,E,1)
(E,D,1)
(D,A,1)
(C,D,1)
(B,C,1)
(B,D,2)
(D,C,2)
(D,B,1)
(A,B,2)

此例子就是充分運用了flatMap的扁平化功能。

spark中flatMap函數用法--spark學習（基礎）

比較一次 ica 例子 tail details word fix spark spark中flatMap函數用法--spark學習（基礎）在spark中map函數和flatMap函數是兩個比較常用的函數。其中 map：對集合中每個元素進行操作。 fl

delphi 中OutputDebugString 函數的妙用（轉載）

ins dbgview rect blank read con fine eve bsp 原文地址 https://www.peganza.com/delphi-and-outputdebugstring.html Ever wanted to monitor your

spark中flatMap函式用法--spark學習（基礎）

說明在spark中map函式和flatMap函式是兩個比較常用的函式。其中 map：對集合中每個元素進行操作。 flatMap：對集合中每個元素進行操作然後再扁平化。理解扁平化可以舉個簡單例子 val arr=sc.parallelize(Ar

matlab中size函數用法

matlab 元素 size(A)函數是用來求矩陣的大小的。比如說一個A是一個3×4的二維矩陣：1、size（A） %直接顯示出A大小輸出：ans=3 42、s=size（A）%返回一個行向量s，s的第一個元素是矩陣的行數，第二個元素是矩陣的列數輸出：s=3 43、[r,c]=size（A）%將矩陣A

python中的函數用法

pre 表示代碼創建如果 class 普通 div mil 1.函數的創建 def fun():　　　　　　　 #定義 print(‘hellow‘) #函數的執行代碼 retrun 1 #返回值 fun()

Oracle 中 decode 函數用法

個數依次 elsif 根據 sql nbsp htm 開發 ret 含義解釋： decode(條件,值1,返回值1,值2,返回值2,...值n,返回值n,缺省值) 該函數的含義如下：IF 條件=值1 THEN　　　　RETURN(翻譯值1)ELSIF 條件=值2 THEN

Java8函數式編程（二）：類比Spark RDD算子的Stream流操作

編程方式 min 也有 ffffff 種類 spa 封裝方法都是 1 Stream流對集合進行叠代時，可調用其iterator方法，返回一個iterator對象，之後便可以通過該iterator對象遍歷集合中的元素，這被稱為外部叠代（for循環本身正是封裝了其的語法糖

機器學習中的範數規則化之（一）L0、L1與L2範數

[0 證明基本上復雜度所有 img 方法風險機器學習機器學習中的範數規則化之（一）L0、L1與L2範數 [email protected]/* */ http://blog.csdn.net/zouxy09 轉自：http://blog.csdn.n

Python學習筆記五函數式編程（二）

lis 運行 ast 計數 med tro append 避免如果參考教程：廖雪峰官網https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 一、返回函數高

轉：機器學習中的範數規則化之（一）L0、L1與L2範數

今天我們聊聊機器學習中出現的非常頻繁的問題：過擬合與規則化。我們先簡單的來理解下常用的L0、L1、L2和核範數規則化。最後聊下規則化項引數的選擇問題。這裡因為篇幅比較龐大，為了不嚇到大家，我將這個五個部分分成兩篇博文。知識有限，以下都是我一些淺顯的看法，如果理解存在錯誤

轉載：機器學習中的範數規則化之（一）L0、L1與L2範數

監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型過分擬合我們的訓練資料。多麼

機器學習中的範數規則化之（一）L0、L1與L2範數、核範數與規則項引數選擇

今天我們聊聊機器學習中出現的非常頻繁的問題：過擬合與規則化。我們先簡單的來理解下常用的L0、L1、L2和核範數規則化。最後聊下規則化項引數的選擇問題。這裡因為篇幅比較龐大，為了不嚇到大家，我將這個五個部分分成兩篇博文。知識有限，以下都是我一些淺顯的看法，如果理解存在錯誤，希

c++中的幾種函數調用約定（轉）

standard amp 可見代碼 return ext 只有一個 highlight 定義 C++中的函數調用約定主要針對三個問題： 1、參數傳遞的方式（是否采用寄存器傳遞參數、采用哪個寄存器傳遞參數、參數壓桟的順序等）； 2、函數調用結束後的棧指針由誰恢復（被調用

JS函數和對象（一）

inf ack bsp 用法 .cn 求和封裝 obj [0 在本文章中，將對JS中的函數和對象進行一些講解，不對之處還請之處一.JS中的函數 1.1無參函數其形式如下代碼所示 function box(){ alert("我是一個函數，只有被調用才會執行

python函數式編程（轉）

square 定義每次相加匿名函數是把 div spa 邏輯函數式編程是使用一系列函數去解決問題，按照一般編程思維，面對問題時我們的思考方式是“怎麽幹”，而函數函數式編程的思考方式是我要“幹什麽”。至於函數式編程的特點暫不總結，我們直接拿例子來體會什麽是函數式編

Vue2.0 探索之路——生命周期和鉤子函數的一些理解（轉）

head chrom 路由技術分享 defined 修改疑問 reat 有時前言在使用vue一個多禮拜後，感覺現在還停留在初級階段，雖然知道怎麽和後端做數據交互，但是對於mounted這個掛載還不是很清楚的。放大之，對vue的生命周期不甚了解。只知道簡單的使用，而不

.NET中使用Redis之ServiceStack.Redis學習（一）安裝與簡單的運行

arraylist write client cli ring blog 控制臺創建 spa 1.下載ServiceStack.Redis PM> Install-Package ServiceStack.Redis 2.vs中創建一個控制臺程序 class Pro

數據分析學習（一）

nbsp ont 概率學習 ron size 做到由於診斷貝葉斯統計能夠幫助你利用基礎概率和波動數據做到明察秋毫。問題：醫生給你一份蜥蜴流感診斷書。好消息：蜥蜴流感並不致命。壞消息：蜥蜴流感很麻煩。診斷報告：陽性醫生確信你已經染病。不過由於你對數據分析得

自執行函數前面的分號（；）

合並壓縮錯誤。。腳本 span 合並 bsp cnblogs spa 在看有些源碼時，很多人寫腳本都在自執行函數前加個分號，例如： ;(function(){ //具體功能代碼。。。 })(); 主要是應對代碼合並壓縮時，由於缺少分號；帶來的錯誤。 (funct

Appium python自動化測試系列之等待函數如何進行實戰（九）

可能 res path 定位 __file__ poll 9.1 慢慢定義 ?9.1 等待函數的使用 9.1.1 為什麽要使用等待函數我們在做自動化的時候很多時候都不是很順利，不是因為app的問題，我們的腳本也沒問題，但是很多時候都會報錯，比如一個頁面本來就有id為1的

spark中flatMap函數用法--spark學習（基礎）

spark中flatMap函數用法--spark學習（基礎）

實際使用場景

相關推薦