s27賽季限定返場突變，留1w戰令幣巨賺，諸葛亮笑了，5折商店上線

阿新 • • 發佈：2022-04-05

二、掌握spark RDD的概念、運算元的作用和使用（包括建立和各種轉換運算，具體到程式碼的編寫使用），不同共享變數的作用和使用、對於RDD的依賴關係要理解，知道持久化的方法以及型別；

1、Spark RDD的概念

RDD是可擴充套件的彈性分散式資料集（一種容錯的並行資料結構）；

是隻讀、分割槽且不變的資料集合；

是Spark的基石，也是Spark的靈魂；

是一種分散式的記憶體抽象，不具備Schema的資料結構（可以基於任何資料結構建立，如tuple（元組）、dict（字典）和list（列表））

RDD的五個主要屬性：

（1）分割槽資訊（Partition)（2）自定義分片計算（3）RDD之間相互依賴（4）控制分片數量（5）使用列表方式進行塊儲存

4、共享變數

（1）累加器（Accumulator）

累加器是一個全域性的共享變數，累加器可以很好地解決上述程式的閉包問題。使用累加器完成相同的功能，程式碼如下：

sum = sc.accumulator(0)  # 建立一個累加器，初值為0
def fn1(x):
    global sum
    sum += x  # 注意這裡不能是 sum=sum+x，因為+=是原地操作，+是需要兩個變數型別一致。
a_rdd = sc.parallelize([1, 2, 3, 4, 5])
a_rdd.foreach(fn1)
print(sum.value)  # sum.value可以獲取累加器的值，此時列印輸出的是15

累加器是一個write-only的變數，工作節點worker中的task無法讀取這個值，只能在驅動程式中使用value方法來讀取累加器的值。

（2）廣播變數（Broadcast）

廣播變數和累加器類似，也是一個共享變數，廣播變數能夠以一種更有效率的方式將一個大資料量輸入集合的副本分配給每個節點。

SparkContext物件的broadcast方法可以建立廣播變數，廣播變數的value屬性可以獲取該廣播變數的值，unpersist方法可以在執行程式上刪除此廣播的快取副本。destroy方法可以銷燬廣播變數，一旦廣播變數被銷燬，就不能再使用了。

>>> b = sc.broadcast(10)  # 建立一個廣播物件
>>> b.value  # 獲取廣播物件的值
10
>>> sc.parallelize([1, 2, 3, 4, 5]).map(lambda x: x * b.value).collect()
[10, 20, 30, 40, 50] 
>>> b.destroy()  # 銷燬廣播變數，銷燬後就不能訪問它的value了
>>> b.value  #  但是pyspark中還是能訪問到這個值，這是pyspark的問題，如果是scala確實是無法訪問它的值了
10
>>> sc.parallelize([1, 2, 3, 4, 5]).map(lambda x: x * b.value).collect()  # task中確實無法訪問該廣播變數的值了

5、依賴問題

（1）RDD只能基於在穩定物理儲存中的資料集和其他已有的RDD上執行確定性操作來建立。

（2）RDD在血統依賴方面，分為窄依賴和寬依賴。他們用來解決資料容錯的高效性。

窄依賴：
一個父RDD的分割槽partition最多被子RDD的一個分割槽使用（獨生子女）。
在一個叢集節點上管道式執行。
比如map、filter、union等；

寬依賴：
多個子RDD的Partition會依賴同一個父RDD的Partition，會引起shuffle（超生）。
比如groupByKey、reduceByKey、 sortBy、partitionBy等；

注意：一個RDD對不同的父節點可能有不同的依賴方式，可能對父節點1是寬依賴，對父節點2是窄依賴。

shuffle：Spark 裡的某些操作會觸發 shuffle，shuffle 是spark 重新分配資料的一種機制，使得這些資料可以跨不同的區域進行分組。

DAG：Spark裡的每一個轉換操作都會生成一個新的RDD，RDD之間連一條邊，最後這些RDD和他們之間的邊組成一個有向無環圖DAG(Directed Acyclic Graph)。

一個Stage的開始就是從外部儲存或者shuffle結果中讀取資料；一個Stage的結束就是發生shuffle或者生成結果時。

spark劃分stage的整體思路是：從後往前推，遇到寬依賴就斷開，劃分為一個stage；遇到窄依賴就將這個RDD加入該stage中。

6、RDD的持久化

可以使用persist方法和cache方法，cache方法只能快取在記憶體中， persist方法可以快取在磁碟上或者記憶體中。

is_cached屬性可以檢視當前RDD的持久化狀態，或者使用getStorageLevel方法獲取當前RDD的持久化狀態，unpersist方法可以解除RDD的持久化

StorageLevel型別	型別描述	對應的useDisk, useMemory, deserialized, off_heap, replication
MEMORY_ONLY	（預設級別）將RDD以JAVA物件的形式儲存到JVM記憶體。如果分片太大，記憶體快取不下，就不快取	StorageLevel(False, True, False, False, 1)
MEMORY_ONLY_2	（預設級別）將RDD以JAVA物件的形式儲存到JVM記憶體。如果分片太大，記憶體快取不下，就不快取，將分割槽複製到兩個叢集節點上	StorageLevel(False, True, False, False, 2)
MEMORY_ONLY_SER	將RDD以序列化的JAVA物件形式儲存到記憶體	StorageLevel(False, True, False, False, 1)
MEMORY_ONLY_SER_2	將RDD以序列化的JAVA物件形式儲存到記憶體，將分割槽複製到兩個叢集節點上	StorageLevel(False, True, False, False, 2)
DISK_ONLY	將RDD持久化到硬碟	StorageLevel(True, False, False, False, 1)
DISK_ONLY_2	將RDD持久化到硬碟，將分割槽複製到兩個叢集節點上	StorageLevel(True, False, False, False, 2)
MEMORY_AND_DISK	將RDD資料集以JAVA物件的形式儲存到JVM記憶體中，如果分片太大不能儲存到記憶體中，則儲存到磁碟上，下次用時重新從磁碟讀取	StorageLevel(True, True, False, False, 1)
MEMORY_AND_DISK_2	將RDD資料集以JAVA物件的形式儲存到JVM記憶體中，如果分片太大不能儲存到記憶體中，則儲存到磁碟上，下次用時重新從磁碟讀取，並將分割槽複製到兩個叢集節點上	StorageLevel(True, True, False, False, 2)
MEMORY_AND_DISK_SER	與MEMORY_ONLY_SER類似，但當分片太大，不能儲存到記憶體中，會將其儲存到磁碟中	StorageLevel(True, True, False, False, 1)
MEMORY_AND_DISK_SER_2	與MEMORY_ONLY_SER類似，但當分片太大，不能儲存到記憶體中，會將其儲存到磁碟中，將分割槽複製到兩個叢集節點上	StorageLevel(True, True, False, False, 2)
OFF_HEAP	是否利用java unsafe API實現的記憶體管理，RDD實際被儲存到Tachyon	StorageLevel(True, True, True, False, 1)

檢查點 checkpoint

通過cache或者persist將RDD持久化到記憶體或者磁碟中，這樣做並不能保證資料完全不會丟失，當資料丟失的時候，Spark會根據RDD的計算流程DGA重新計算一遍，這樣子就很費效能，

checkpoint的作用就是將DAG中比較重要的中間資料做一個檢查點將結果儲存到一個高可用的地方(通常這個地方就是HDFS裡面，當然也可以是本地檔案系統)。

s27賽季限定返場突變，留1w戰令幣巨賺，諸葛亮笑了，5折商店上線

王者榮耀新賽季s27賽季將會在4月中旬正式開啟，也就是在14號左右開啟正式服版本更新，此次版本更新後也是有非常多的新機制上線到正式服當中，當然還有非常多的新面板上線正式服當中，比如蘭陵王的賽季面板，還有此次

新版宮本首次加強，大喬新面板預熱，猴哥限定返場，星傳說降價

文│可兒遊戲說原創宮本武藏在體驗服再次迎來了重做，並且已經上線測試了。而這個英雄在體驗服還才上線沒多久，官方就對這個英雄再次進行了加強，增加的42呃呃啊4了大招的擊飛時間，增強了二技能的護盾。從體驗服的

31號碎片商店鉅變，情人節限定返場，聖鬥士面板預熱，王昭君笑了

文│可兒遊戲說原創距離王者榮耀前一次碎片商城更新，已經過去了兩個月的時間，所以也到了更新碎片商城的時候了。這次碎片商城會在31號進行更新，上架的面板有電玩小子、水果甜心等。除了碎片商城更新之外，還有一

孫悟空4限定返場，雷霆低至45積分，雙充值突襲，榮耀水晶降價

大家好，我是阿呆。孫悟空的限定面板返場活動終於確定了，看來這並不是官方的愚人節玩笑，言歸正傳，王者榮耀已經更新了4月份的首輪活動，這次更新的亮點主要就是孫悟空的限定面板返場活動，除此之外還有兩大專屬特效

伽羅雙喜臨門，限定返場美哭，妲己魔仙面板突襲，瀾史詩特效升級

文│可兒遊戲說原創王者榮耀近期推出的活動還有面板種類都是比較多的，其中有很多在傳言的面板就包括了妲己、瀾、伽羅等英雄，這些英雄都被大v爆料會有新面板。

1號伽羅絕版限定返場，孫悟空冰雪傳說巨帥，沒有獅心王的笑了

王者榮耀在3月31日將會進行更新，到時候會有新的活動上線，而在4月1日，伽羅的絕版限定也會返場。除此以外，孫悟空的零號赤焰和零號雷霆面板即將進行返場，而且還會有新的冰雪限定傳說面板，亞瑟——獅心王面板也有望

伽羅絕版限定返場，備好4788點券巨賺，西施遇見青鸞美哭，瀾笑了

王者榮耀31號即將進行正式服更新，此次更新也是會有不少新活動上線到正式服當中，比如鑽石消耗活動，消耗鑽石就可以抽取面板或者獲取面板碎片等道具，還有每日充值，魔法球打折等活動上線。

s27賽季戰令寶箱首選鬼劍武藏，雲纓傳說突襲，貂蟬玩家笑了

王者榮耀S27賽季即將在4月14日正式開啟，新賽季開啟以後又將迎來新的戰令面板，分別是白起的夜都怪俠、明世隱的吟遊魔法、呂布的湛藍機甲等等。除此以外，雲纓也將迎來新的傳說面板了，貂蟬也有好訊息。

s27賽季兩款免費面板曝光，孫尚香笑了，馬超冰魄槍傳說突襲

新賽季s27賽季賽季戰令面板正式曝光，此次新賽季的賽季戰令面板也是品質非常不錯的戰令面板，首先就是一級勇者戰令面板，是給到了白起——夜都怪俠，是一款黑暗風格的面板，面板建模是非常帥氣的風格，相信會有不少玩

笑了，面試官問我知不知道非同步程式設計的Future。

荒腔走板大家好，我是 why，歡迎來到我連續周更優質原創文章的第 60 篇。老規矩，先來一個簡短的荒腔走板，給冰冷的技術文注入一絲色彩。

重磅！速看，百度網盤終於還是對這些人下手了，將回收免費永久網盤空間！

百度網盤，相信我們每個人都不陌生吧?一款又愛又恨儲存軟體，愛她：可以給我們日常提供超級大的免費2T空間；恨她：就是下載速度了，充了會員下載速度也是像個蝸牛一樣，還得必須充超級會員才行！也難怪，網

mysql忘記密碼，但是在Navicat中已經用root使用者打開了，這樣可以修改密碼

之前用Navicat登陸的mysql資料庫，而且是root使用者，由於長時間為登陸，忘記了root密碼，現在專案需要修改登陸密碼，

spring data(暫時寫下jpa的部分，後續繼續更新，jpa的多對多之類的就不再玩了，可以回看之前的jpa部分)

技術標籤：spring data 文章目錄 springdataspringdata(這玩意是spring家族成員)簡介springdata的主要模組spring data jpa搭建環境

賓士寶馬奧迪組隊秀電動豪車，純電邁巴赫電動大 G 都來了，這誰頂得住

疫情後海外首場頂級車展開幕，一上來就端出一份電動豪車盛宴，讓人眼花繚亂。

盧偉冰用上小米 12 Pro，晒出微博小尾巴：新年快來了，新機還遠嗎？

12 月 20 日訊息，小米 12 系列此前已經入網，資訊也得到多次曝光，有望在 12 月 28 日釋出。今日晚間，小米集團合夥人，中國區、國際部總裁，Redmi 品牌總經理盧偉冰釋出微博：“新年快來了，小米 12 還遠嗎？”值

米其林三星產品，致信花果茶 30 袋新春禮盒 29.9 元（1.5 折）

米其林三星產品，致信花果茶 30 袋新春禮盒報價 99.9 元，限時限量 70 元券，實付 29.9 元包郵，領券併購買。吊牌價 199 元，相當於 1.5 折優惠。使用最會買 App 下單，預計還能再返 3.29 元，返後 26.61 元包郵，點

冰氧酷冷感面料，傑克瓊斯 7 色新品 T 恤 49 元（5 折）

【JackJones 官方旗艦店】冰氧酷冷感面料，傑克瓊斯男士清新馬卡龍短袖 T 恤報價 89 元，限時限量 40 元券，實付 49 元包郵，領券併購買。吊牌價 99 元，相當於 5 折優惠。7 色可選，預售款此價、3 月 24 日前發貨，

31號鑽石消耗活動來襲，有3000鑽石的笑了，孫悟空雙喜臨門

王者榮耀31號商城迎來了重大更新，此次版本更新當中上線了不少新活動，比如每日充值活動和累積充值活動，還有積分奪寶折扣活動以及魔法球折扣抽取等活動會上線到正式服當中。

5號商城更新，花木蘭典藏突襲，青白蛇優化美哭，諸葛亮笑了

王者榮耀剛剛上線了瀾——賞金獵手面板，而在4月5日又將迎來一次更新了，到時候還會有不少新活動上線，另外，花木蘭的榮耀典藏面板即將來襲，大喬——白蛇和小喬——青蛇面板優化美哭，諸葛亮有好訊息。

王者榮耀：6元機甲風新面板官宣！又一款限定面板突然返場！S27賽季面板鎖定他?

前幾天體驗服裡孫悟空進行了一波史詩級增強，天美的慣例來說這波加強必然意味著有新面板或者什麼其他操作。果不其然，阿離頭七還沒過，就爆出來孫悟空真有一款傳說限定面板即將返場，目前也是進行了官宣

s27賽季限定返場突變，留1w戰令幣巨賺，諸葛亮笑了，5折商店上線

二、掌握spark RDD的概念、運算元的作用和使用（包括建立和各種轉換運算，具體到程式碼的編寫使用），不同共享變數的作用和使用、對於RDD的依賴關係要理解，知道持久化的方法以及型別；

1、Spark RDD的概念

RDD的五個主要屬性：

4、共享變數

（1）累加器（Accumulator）

（2）廣播變數（Broadcast）

5、依賴問題

（1）RDD只能基於在穩定物理儲存中的資料集和其他已有的RDD上執行確定性操作來建立。

（2）RDD在血統依賴方面，分為窄依賴和寬依賴。他們用來解決資料容錯的高效性。

6、RDD的持久化

檢查點 checkpoint

相關推薦