1. 程式人生 > >學習參考《深度實踐Spark機器學習》PDF+吳茂貴

學習參考《深度實踐Spark機器學習》PDF+吳茂貴

開發 9.png 文字 tar 領域 ref size 之前 ont

研究大數據和數據挖掘的都知道,並行化算法研究是大數據領域一個較為重要的研究熱點。近年來國內外開始關註在 Spark 平臺上如何實現各種機器學習和數據挖掘並行化算法設計。
Spark 提供了大量的庫,包括SQL、DataFrames、MLlib、GraphX、Spark Streaming。 開發者可以在同一個應用程序中無縫組合使用這些庫。

《深度實踐Spark機器學習》系統講解了Spark機器學習的技術、原理、組件、算法,以及構建Spark機器學習系統的方法、流程、標準和規範。此外,還介紹了Spark的深度學習框架TensorFlowOnSpark,以及如何借助它實現卷積神經網絡和循環神經網絡。

學習參考:

《深度實踐Spark機器學習》PDF,247頁,帶書簽目錄,文字可以復制;
作者 吳茂貴等。
下載:https://pan.baidu.com/s/15l70-TlT0zomyxUroNjJCA
提取碼: aab6

技術分享圖片


全書共14章,分為四個部分:
第一部分(1~7章)
主要講解了Spark機器學習的技術、原理和核心組件,包括Spark ML、Spark ML Pipeline、Spark MLlib,以及如何構建一個Spark 機器學習系統。

技術分享圖片
第二部分(8~12章)
主要以實例為主,講解了Spark ML的各種機器學習算法,包括推薦模型、分類模型、聚類模型、回歸模型,以及PySpark決策

樹模型和Spark R樸素貝葉斯模型。

技術分享圖片
第三部分(第13章)
與之前的批量處理不同,本章以在線數據或流式數據為主,講解了Spark的流式計算框架Spark Streaming。
第四部分(第14章)
介紹了Spark深度學習,主要包括TensorFlow的基礎知識及它與Spark的整合框架TensorFlowOnSpark。

技術分享圖片

學習參考《深度實踐Spark機器學習》PDF+吳茂貴