Spark MLlib 機器學習演算法（一）

阿新 • • 發佈：2020-12-31

一 協同過濾演算法
協同過濾（Collaborative filtering）演算法是一種基於群體使用者或者物品的典型推薦演算法，主要有兩種：一種是通過考察具有相同愛好的使用者對相同物品的評分標準進行計算。一種是考察具有相同特質的物品從而推薦給選擇了某件物品的使用者。
協同過濾演算法關鍵是計算相似度，主要有以下幾種方法：
1、 基於歐幾里得距離計算
公式：
在這裡插入圖片描述

主要從不同目標的絕對差異性考慮
2、 基於餘弦角度計算
公式：
在這裡插入圖片描述

主要從方向趨勢上考慮
3、 交替最小二乘法（ALS）

Val ratings = data.map(_.split 
(‘ ’)match{
case Array(user,item,rate) => Rating(user.toInt,item.toInt,rate.toDouble)})
val model = ALS.train(ratings,rank,numIterations,0.01)
var rs = model.recommendProducts(2,1)
rs.foreach(println)

二 線性迴歸

val parsedData = sc.textFile().map{line => val parts = line.split(‘,’)
LabeledPoint(parts 
(0).toDouble,
Vectors.dense(parts(1).split(‘,’).map(_.toDouble)))}.cache()
val model = LinearRegressionWithSGD.train(parsedData,100,0.1)
val result = model.predict(Vectors.dense(2))

三 邏輯迴歸
1、一元邏輯迴歸

val model = LogisticRegressionWithSGD.train(parsedData,50)
val target = Vectors.dense(-1)
val result = model. 
predict(target)

2、支援向量機

val model = SVMWithSGD.train(parsedData,50)

3、樸素貝葉斯

val model = NaiveBayes.train(data,1.0)
val predictionAndLable = testData.map(p => (model.predict(p.features),p.label))
val accuracy = 1.0 * predictionAndLable.filter(label => label._1 == label._2).count()

(待續)

Spark MLlib 機器學習演算法（一）

Spark MLlib 機器學習演算法（一）

機器學習演算法（一）: 基於邏輯迴歸的分類預測

機器學習演算法（六）：基於決策樹的分類預測

機器學習筆記（一）——一元線性迴歸（梯度下降法）

機器學習記錄（一）

spark機器學習從0到1之Spark MLlib 機器學習（十九）

機器學習sklearn（57）：演算法例項（十四）分類（七）邏輯迴歸（二）linear_model.LogisticRegression(一) 重要引數

機器學習sklearn（77）：演算法例項（三十四）迴歸（六）線性迴歸大家族（四）多重共線性：嶺迴歸與Lasso（一）嶺迴歸

機器學習sklearn（83）：演算法例項（40）分類（19）樸素貝葉斯（二）不同分佈下的貝葉斯（一）高斯樸素貝葉斯GaussianNB

Spark學習筆記（一）Spark初識【特性、組成、應用】

演算法圖解學習筆記（一）——二分法

機器學習sklearn（六）：資料處理（三）數值型資料處理（一）歸一化( MinMaxScaler/MaxAbsScaler)

機器學習sklearn（八）：特徵工程（一）特徵離散化（一）K-bins 離散化

機器學習sklearn（十三）：特徵工程（三）特徵編碼（一）特徵雜湊(一)

機器學習sklearn（58）：演算法例項（十五）分類（八）邏輯迴歸（三）linear_model.LogisticRegression(二) 重要引數

機器學習sklearn（72）：演算法例項（二十九）分類（十六）SVM（七）sklearn.svm.SVC（六）使用SVC時的其他考慮（選）

機器學習sklearn（75）：演算法例項（三十二）迴歸（四）線性迴歸大家族（二）多元線性迴歸LinearRegression

機器學習sklearn（76）：演算法例項（三十三）迴歸（五）線性迴歸大家族（三）迴歸類的模型評估指標

機器學習sklearn（78）：演算法例項（三十五）迴歸（七）線性迴歸大家族（五）多重共線性：嶺迴歸與Lasso（二）Lasso

機器學習sklearn（85）：演算法例項（42）分類（21）樸素貝葉斯（四）不同分佈下的貝葉斯（三）多項式樸素貝葉斯以及其變化

Spark MLlib 機器學習演算法（一）

相關推薦