Spark MLlib 機器學習演算法與原始碼解析(網路課程—第一期)
《Spark MLlib 機器學習演算法與原始碼解析》
spark是一個開源叢集運算框架,最初是由加州大學柏克利分校AMPLab所開發。Spark使用了記憶體內運算技術,在記憶體上的運算速度比Hadoop MapReduce的運算速度快上100倍,即便是在磁碟上執行也能快10倍。Spark允許將資料載入至叢集記憶體,並多次對其進行查詢,非常適合用於機器學習演算法。
目前,Spark成為了現在大資料領域最火的開源軟體,Spark也被許多企業尤其是網際網路企業廣泛應用到商業專案中,在國內包括阿里、百度、騰訊、網易、搜狐等。
本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴充套件的分散式計算框架;實現了常用的機器學習,如:聚類、分類、迴歸等演算法。本課拒絕枯燥的講述,將循序漸進從Spark的基礎知識、矩陣向量的基礎知識開始,然後再透徹講解各個演算法的理論、詳細展示Spark原始碼實現,最後均會通過例項進行解析實戰,幫助大家真正從理論到實踐全面掌握Spark MLlib分散式機器學習。
通過該課程的學習,同學們可以全面掌握Spark MLlib機器學習,進而能夠在實際工作中進行MLlib的應用開發和定製開發。且該課程優異畢業生均可獲得老師內推機會,職位:資料探勘工程師,就職企業:久邦數碼、唯品會、騰訊等。掌握技術,高薪就業,課程等待你的加入!
課程大綱:
第一課 Spark MLlib基礎入門
1、Spark介紹
2、Spark MLlib介紹
3、課程的基礎環境
4、Spark RDD操作
5、RDD操作的程式碼實操
第二課 Spark MLlib矩陣向量
1、Spark MLlib矩陣向量
2、矩陣向量的程式碼實操
第三課 Spark MLlib線性迴歸演算法
1、線性迴歸演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第四課 Spark MLlib邏輯迴歸演算法
1、邏輯迴歸演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第五課 Spark MLlib貝葉斯分類演算法
1、貝葉斯分類演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第六課 Spark MLlib決策樹演算法
1、決策樹演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第七課 Spark MLlib KMeans聚類演算法
1、KMeans聚類演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第八課 Spark MLlib FPGrowth關聯規則演算法
1、FPGrowth關聯規則演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第九課 Spark MLlib協同過濾推薦演算法
1、協同過濾推薦演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
第十課 Spark MLlib神經網路演算法
1、神經網路演算法
2、原始碼分析
3、例項
4、例項的程式碼實操
學習基礎:
學習者需要有一些Spark/Scala/線性代數基礎知識。
課程環境:
Spark1.4.1, Spark 1.5.1
預期收穫:
通過該課程的學習,同學們可以全面掌握Spark MLlib機器學習,進而能夠在實際工作中進行MLlib的應用開發和定製開發。該課程優異畢業生均可獲得老師內推機會,職位:資料探勘工程師,就職企業:久邦數碼、唯品會、騰訊等。
個人處女秀,歡迎大家多多支援!
連線地址: