ML.NET 示例：推薦之One Class 矩陣分解

阿新 • • 發佈：2018-12-12

exc together abi key defining oba ace 解決方案 ember

寫在前面

準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。
如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn

產品推薦 - 矩陣分解問題示例

ML.NET 版本	API 類型	狀態	應用程序類型	數據類型	場景	機器學習任務	算法
v0.8	動態 API	最新版本	控制臺應用程序	.txt 文件	推薦	矩陣分解	MatrixFactorizationTrainer (One Class)

在這個示例中，您可以看到如何使用ML.NET來構建產品推薦方案。

本示例中的推薦方式基於共同購買或經常一起購買的產品，這意味著它將根據客戶的購買歷史向客戶推薦一組產品。

技術分享圖片

在這個示例中，基於經常一起購買的學習模型來推薦產品。

問題

在本教程中，我們將使用亞馬遜共同購買產品數據集。

我們將使用One-Class因式分解機來構建我們的產品推薦器，它使用協同過濾方法。

我們介紹的one-class和其他因式分解機的區別在於，在這個數據集中，我們只有購買歷史的信息。

我們沒有評分或其他詳細信息，如產品描述等。

“協同過濾”是在一個基本假設的情況下運作的，即如果某人A在一個問題上與某人B具有相同的意見，則在另一個問題上，相對其他隨機選擇的人，A更傾向於B的觀點。

數據集

原始數據來自SNAP:
https://snap.stanford.edu/data/amazon0302.html

ML 任務 - 矩陣分解 (推薦)

這個示例的ML任務是矩陣分解，它是一個執行協同過濾的有監督的機器學習任務。

解決方案

要解決此問題，您需要在現有訓練數據上建立和訓練ML模型，評估其有多好（分析獲得的指標），最後您可以使用/測試模型來預測給定輸入數據變量的需求。

技術分享圖片

1. 建立模型

建立模型包括:

從 https://snap.stanford.edu/data/amazon0302.html 下載並復制數據集文件Amazon0302.txt。
使用以下內容替換列名：ProductID ProductID_Copurchased
在讀取器中，我們已經提供了KeyRange，並且產品ID已經編碼，我們需要做的就是使用幾個額外的參數調用MatrixFactorizationTrainer。

下面是用於建立模型的代碼：

 
    //STEP 1: Create MLContext to be shared across the model creation workflow objects 
    var ctx = new MLContext();

    //STEP 2: Create a reader by defining the schema for reading the product co-purchase dataset
    //        Do remember to replace amazon0302.txt with dataset from 
              https://snap.stanford.edu/data/amazon0302.html
    var reader = ctx.Data.TextReader(new TextLoader.Arguments()
    {
        Separator = "tab",
        HasHeader = true,
        Column = new[]
        {
                new TextLoader.Column("Label", DataKind.R4, 0),
                new TextLoader.Column("ProductID", DataKind.U4, new [] { new TextLoader.Range(0) }, new KeyRange(0, 262110)),
                new TextLoader.Column("CoPurchaseProductID", DataKind.U4, new [] { new TextLoader.Range(1) }, new KeyRange(0, 262110))
            }
        });

        //STEP 3: Read the training data which will be used to train the movie recommendation model
        var traindata = reader.Read(new MultiFileSource(TrainingDataLocation));


        //STEP 4: Your data is already encoded so all you need to do is call the MatrixFactorization Trainer with a few extra hyperparameters:
        //        LossFunction, Alpa, Lambda and a few others like K and C as shown below. 
        var est = ctx.Recommendation().Trainers.MatrixFactorization("ProductID", "CoPurchaseProductID",  
                                     labelColumn: "Label",
                                     advancedSettings: s =>
                                     {
                                         s.LossFunction = MatrixFactorizationTrainer.LossFunctionType.SquareLossOneClass;
                                         s.Alpha = 0.01;
                                         s.Lambda = 0.025;
                                         // For better results use the following parameters
                                         //s.K = 100;
                                         //s.C = 0.00001;
                                     });

2. 訓練模型

一旦定義了評估器，就可以根據可用的訓練數據對評估器進行訓練。

這將返回一個訓練過的模型。


    //STEP 5: Train the model fitting to the DataSet
    //Please add Amazon0302.txt dataset from https://snap.stanford.edu/data/amazon0302.html to Data folder if FileNotFoundException is thrown.
    var model = est.Fit(traindata);

3. 使用模型

我們將通過創建預測引擎/函數來執行此模型的預測，如下所示。

    public class Copurchase_prediction
    {
        public float Score { get; set; }
    }

    public class ProductEntry
    {
        [KeyType(Contiguous = true, Count = 262111, Min = 0)]
        public uint ProductID { get; set; }

        [KeyType(Contiguous = true, Count = 262111, Min = 0)]
        public uint CoPurchaseProductID { get; set; }
        }

一旦創建了預測引擎，就可以預測兩個產品被共同購買的分數。

    //STEP 6: Create prediction engine and predict the score for Product 63 being co-purchased with Product 3.
    //        The higher the score the higher the probability for this particular productID being co-purchased 
    var predictionengine = model.MakePredictionFunction<ProductEntry, Copurchase_prediction>(ctx);
    var prediction = predictionengine.Predict(
                             new ProductEntry()
                             {
                             ProductID = 3,
                             CoPurchaseProductID = 63
                             });

ML.NET 示例：推薦之One Class 矩陣分解

exc together abi key defining oba ace 解決方案 ember 寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://g

ML.NET 示例：推薦之矩陣分解

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn 電影推薦 - 矩陣

ML.NET 示例：推薦之場感知分解機

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn Movie Rec

ML.NET 示例：迴歸之銷售預測

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn eShopDash

ML.NET 示例：二元分類之信用卡欺詐檢測

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn 基於二元分類和PC

ML.NET 示例：多類分類之鳶尾花分類

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn 鳶尾花分類

ML.NET 示例：回歸之銷售預測

odin soft metrics nsf append sco 生成 ont 銷售寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.

ML.NET 示例：聚類之客戶細分

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn 客戶細分-聚類示例

ML.NET 示例：聚類之鳶尾花

準備 del 群集 www selected machine context 運行科技寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://githu

ML.NET 示例：深度學習之整合TensorFlow

　　寫在前面　　　　準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。　　　　如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn

ML.NET 示例：開篇

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn ML.NE

ML.NET 示例：目錄

ML.NET 示例中文版，英文原版請訪問：https://github.com/dotnet/machinelearning-samples ML.NET 示例 ML.NET 是一個跨平臺的開源機器學習框架，使.NET開發人員使用機器學習變得很容易。在這個GitHub 儲存庫中，我們提供了示例，這些示

文字主題模型之非負矩陣分解(NMF)

在文字主題模型之潛在語義索引(LSI)中，我們講到LSI主題模型使用了奇異值分解，面臨著高維度計算量太大的問題。這裡我們就介紹另一種基於矩陣分解的主題模型：非負矩陣分解(NMF)，它同樣使用了矩陣分解，但是計算量和處理速度則比LSI快，它是怎麼做到的呢？ 1. 非負矩陣分解(NMF)概述　　　

文本主題模型之非負矩陣分解(NMF)

slist 做到主題模型直觀推薦算法語言開始 2.6 如果在文本主題模型之潛在語義索引(LSI)中，我們講到LSI主題模型使用了奇異值分解，面臨著高維度計算量太大的問題。這裏我們就介紹另一種基於矩陣分解的主題模型：非負矩陣分解(NMF)，它同樣使用了矩陣分解，但

學習筆記：聚類降維矩陣分解

學習內容： lightgbm, pca, clustering, k-means關鍵詞：聚類，降維LightGBM： LightGBM（Light Gradient Boosting Machine）是微軟開發基於決策樹演算法的分散

第五章：Python 之 RabbitMQ 基本示例

rabbitmq#send 端import pikacredentials = pika.PlainCredentials(‘root‘, ‘Password1‘)connection = pika.BlockingConnection(pika.ConnectionParameters(‘10.3.151.

轉-NET(C#)：線程本地存儲(Thread-Local Storage)之ThreadStatic, LocalDataStoreSlot和ThreadLocal<T>

輸出修改 pla star 目錄 div .net 4.0 current cor NET(C#)：線程本地存儲(Thread-Local Storage)之ThreadStatic, LocalDataStoreSlot和ThreadLocal<T>

ML.NET 示例：推薦之One Class 矩陣分解

寫在前面

產品推薦 - 矩陣分解問題示例

問題

數據集

ML 任務 - 矩陣分解 (推薦)

解決方案

1. 建立模型

2. 訓練模型

3. 使用模型

ML.NET 示例：推薦之One Class 矩陣分解

ML.NET 示例：推薦之矩陣分解

ML.NET 示例：推薦之場感知分解機

ML.NET 示例：迴歸之銷售預測

ML.NET 示例：二元分類之信用卡欺詐檢測

ML.NET 示例：多類分類之鳶尾花分類

ML.NET 示例：回歸之銷售預測

ML.NET 示例：聚類之客戶細分

ML.NET 示例：聚類之鳶尾花

ML.NET 示例：深度學習之整合TensorFlow

ML.NET 示例：開篇

ML.NET 示例：目錄

文字主題模型之非負矩陣分解(NMF)

文本主題模型之非負矩陣分解(NMF)

推薦系統中的矩陣分解總結

學習筆記：聚類降維矩陣分解

推薦系統中的矩陣分解

推薦系統實踐 0x0b 矩陣分解

第五章：Python 之 RabbitMQ 基本示例

轉-NET(C#)：線程本地存儲(Thread-Local Storage)之ThreadStatic, LocalDataStoreSlot和ThreadLocal<T>

ML.NET 示例：推薦之One Class 矩陣分解

寫在前面

產品推薦 - 矩陣分解問題示例

問題

數據集

ML 任務 - 矩陣分解 (推薦)

解決方案

1. 建立模型

2. 訓練模型

3. 使用模型

相關推薦