電商推薦系統七：基於物品的協同過濾相似推薦

阿新 • • 發佈：2021-02-08

7.2 基於物品的協同過濾相似推薦

基於物品的協同過濾（Item-CF），只需收集使用者的常規行為資料（比如點選、收藏、購買）就可以得到商品間的相似度，在實際專案中應用很廣。

我們的整體思想是，如果兩個商品有同樣的受眾（感興趣的人群），那麼它們就是有內在相關性的。所以可以利用已有的行為資料，分析商品受眾的相似程度，進而得出商品間的相似度。我們把這種方法定義為物品的“同現相似度”，可以概括為喜歡同一商品的使用者能喜歡同一組使用者喜歡的別的商品，即人以群分的理念。

公式如下：
在這裡插入圖片描述

其中，Ni 是購買商品 i （或對商品 i 評分）的使用者列表，Nj 是購買商品 j 的使用者列表。

核心程式碼實現如下：

package com.recom.itemcf

import org.apache.spark.SparkConf
import org.apache.spark.sql.SparkSession


case class ProductRating(userId: Int,productId:Int,score:Double,timestamp:Int)
case class MongoConfig(uri:String,db:String)

//定義標準推薦物件
case class Recommendation(productId: Int,score:Double 
)
//定義使用者推薦列表
case class UserRecs(userId:Int,recs:Seq[Recommendation])
//定義商品相似度列表
case class ProductRecs(productId:Int,recs:Seq[Recommendation])


object ItemCFRecommender {
  
  //定義表名和常量
  val MONGODB_RATING_COLLECTION = "Rating"
  val USER_MAX_RECOMMENDATION=10
  val ITEM_CF_PRODUCT_RECS = "ItemCFProductRecs" 

  
  
  def main(args: Array[String]): Unit = {
  
    //定義基礎配置的集合（可以放入配置檔案，通過方法獲取屬性的值）
    val config = Map(
      "spark.cores"->"local[*]",
      "mongo.uri"->"mongodb://hadoop102:27017/recommender",
      "mongo.db"->"recommender"
    )
  
    //建立一個spark config
    val sparkConf = new SparkConf().setMaster(config("spark.cores")).setAppName("OfflineRecommender")
    //建立一個spark session
    val spark = SparkSession.builder().config(sparkConf).getOrCreate()
  
    //匯入隱式轉換類，在DF和DS轉換的過程中會使用到
    import spark.implicits._
    //通過隱式類的方法建立mongodb連線物件
    implicit val mongoConfig = MongoConfig(config("mongo.uri"),config("mongo.db"))
  
    //載入資料
    val ratingDF = spark.read
      .option("uri", mongoConfig.uri)
      .option("collection", MONGODB_RATING_COLLECTION)
      .format("com.mongodb.spark.sql")
      .load()
      .as[ProductRating]
      .map(rating=>(rating.userId,rating.productId,rating.score))
      .toDF("userId","productId","score")
      .cache()
    
    
    //TODO:核心演算法，計算同現相似度，得到商品的相似列表
    //統計每個商品的評分個數，按照productId來做group by
    val productRatingCountDF =  ratingDF.groupBy("productId").count()
    //在原有評分表上新增count
    val ratingWithCountDF = ratingDF.join(productRatingCountDF,"productId")
    
    //將評分表按照使用者id兩兩配對，統計兩個商品被同一個使用者評分過的次數
    val joinDF = ratingWithCountDF.join(ratingWithCountDF,"userId")
      .toDF("userId","product1","score1","count1","product2","score2","count2")
      .select("userId","product1","count1","product2","count2")
    //joinDF.show()
    
    //建立一張臨時表，用於寫sql查詢
    joinDF.createOrReplaceTempView("joined")
    
    //按照product1，product2做group by，統計userId的數量，即同時對兩個商品評分的人數
    val cooccurrenceDF = spark.sql(
      """
        |select product1,product2, count(userId) as cocount,
        |first(count1) as count1, first(count2) as count2
        |from joined
        |group by product1,product2
        |""".stripMargin
    ).cache()
    
    //提取需要的資料，包裝成（product1,(product2,score)）
    val simDF = cooccurrenceDF.map{
      raw =>
        val coocSim = cooccurrenceSim(raw.getAs[Long]("cocount"),raw.getAs[Long]("count1")
        ,raw.getAs[Long]("count2"))
        
        (raw.getInt(0),(raw.getInt(1),coocSim))
    }
        .rdd
        .groupByKey()
        .map{
          case (productId,recs)=>
            ProductRecs(productId,recs.toList.filter(x=>x._1!=productId)
                .sortWith(_._2>_._2)
                .take(USER_MAX_RECOMMENDATION)
                .map(x=>Recommendation(x._1,x._2))
            )
        }
        .toDF()
    
    //儲存到mongodb
    simDF.write
        .option("uri",mongoConfig.uri)
        .option("collection",ITEM_CF_PRODUCT_RECS)
        .mode("overwrite")
        .format("com.mongodb.spark.sql")
        .save( )
    
    spark.stop()
  }
  
  //按照公式計算現同相似度
  def cooccurrenceSim(coCount: Long, count1: Long, count2: Long)={
    coCount/math.sqrt(count1*count2)
  }
  
}

電商推薦系統七：基於物品的協同過濾相似推薦

技術標籤：推薦系統大資料推薦系統 7.2 基於物品的協同過濾相似推薦基於物品的協同過濾（Item-CF），只需收集使用者的常規行為資料（比如點選、收藏、購買）就可以得到商品間的相似度，在實際專案中應用很廣。

電商推薦系統二：工具環境搭建

技術標籤：推薦系統大資料推薦系統二、工具環境搭建目錄二、工具環境搭建2.1 MongoDB（單節點）環境配置2.2 Redis（單節點）環境配置2.3 Spark（單節點）環境配置2.4 Zookeeper（單節點）環境配置2.5 Flume

C#開發PACS醫學影像處理系統(七)：讀取影像Dicom資訊

Dicom的檔案資訊一般是由裝置資訊、影象資訊、病人資訊等Tag標記組成的，用位元組長度和偏移量來區分，

前端 ----Vue電商管理系統

編寫過程中的外掛：執行依賴 axios ajax請求， element-ui 前端樣式 lodash進行物件深拷貝和物件的合併

電商下沉“過國慶”：補貼茅臺、一元包郵與小鎮購物節

在網際網路公司涉足的眾多領域中，沒有什麼行業比電商更能反應民生脈搏的了。

推薦系統 Task01：推薦系統簡介

文章目錄推薦系統Task01：推薦系統簡介推薦系統本次跟隨Datawhale組織的推薦系統組隊學習，對新的領域進行初步嘗試，希望能看懂一點=。=。Datawhale是一個很好的開源組織，會組織很多優質、開源的系

推薦系統 00：概述

核心內容：協同過濾矩陣分解 FM GBDT + LR Wide&Deep 一、什麼是推薦系統 1.What

做電商成為各大平臺的執念，教你搭建自己的電商直播系統，直播原始碼

臨近雙11，百度又按捺不住做電商的心。近日，百度App上線“購物”頻道，該頻道包括“達人直播”“發現好物”等板塊，目前銷售的物品包括電子產品、日用百貨、生鮮水果、美妝洗護、服飾家裝等。使用者可在

淘寶成為央視春晚獨家電商合作伙伴：今晚清空 40000 個購物車

2 月 11 日訊息根據淘寶官方的訊息，淘寶再度成為央視春晚獨家電商合作伙伴。

電商產品經理必修課-巨量電商庫存系統+倉庫管理+進貨商貨系統課程答疑+專案原始檔

連結: https://pan.baidu.com/s/1NN8FVw_RVE_CIrn2s8QHoA 提取碼: 1jvn 教程地址：http://www.heike123.com/forum.php?mod=viewthread&tid=5459

電商平臺首家：京東貨運航空籌建獲批，機型為波音 737-800 系列

8 月 3 日訊息民航局今日釋出《關於擬批准江蘇京東貨運航空有限公司籌建的公示》，公示稱江蘇京東貨運航空有限公司申請籌建已經民航華東地區管理局初審同意。

攜程迴應擬收購韓國電商怡百購：訊息不實

8 月 4 日訊息今日外媒《韓國經濟新聞》報道稱，攜程旅行有意收購韓國線上零售商怡百購（Interpark）。此外，韓國旅行平臺龍頭 Yanolja 等 6 家公司，也在尋求收購怡百購。

央視曝光電商直播亂象：得物產品抽樣不合格率 50%，快手小紅書等同樣存在問題

1 月 16 日訊息，電商直播帶貨近來非常火熱。主播一吆喝，大家紛紛下單，成交量和金額十分驚人。那麼，大家通過電商直播平臺購買的商品質量如何呢？央視新聞今日就帶來了一期特別節目，為大家揭示了直播電商背部的祕

小紅書合併社群電商業務，迴應：系組織自然迭代

1 月 25 日上午訊息，小紅書於近日進行了組織架構調整，原有的社群部和電商部將合併成新的社群部門。此外，有訊息稱，小紅書 COO 柯南要帶電商業務。對此，小紅書方面迴應，此次合併社群和電商業務，系組織在實現共同

索賠 21 億歐元鉅款，谷歌被瑞典電商平臺 Pricerunner 起訴：稱搜尋結果不公正，涉嫌壟斷

2 月 7 日訊息，據路透社報道，購物比價公司 PriceRunner 週一表示，它已在斯德哥爾摩法院以約 21 億歐元（約 153.3 億元人民幣）起訴 Alphabet 旗下的谷歌，稱該公司通過操縱搜尋違反了反壟斷法，搜尋結果有利於自

【推薦演算法】基於使用者協同過濾演算法

\"\"\" ORM外部呼叫的配置： \"\"\" import numpy as np import math import os def orm_standby(): os.environ.setdefault(\"DJANGO_SETTINGS_MODULE\", \"TravelRecommend.settings\")# manage.py檔案中有同樣的

python 多維向量相似度計算_推薦系統-協同過濾-相似度計算

技術標籤：python 多維向量相似度計算餘弦相似度餘弦相似度（Cosine Similarity）：衡量了兩個使用者向量之間的向量夾角大小；夾角越小，證明餘弦相似度越大，兩個使用者也就越相似。

基於協同過濾的推薦引擎（理論部分）

記得原來和朋友猜測過網易雲的推薦是怎麼實現的，大概的猜測有兩種：一種是看你聽過的和收藏過的音樂，再看和你一樣聽過這些音樂的人他們喜歡聽什麼音樂，把他喜歡的你沒聽過的音樂推薦給你；另一種是看他聽過的音樂

電商推薦系統七：基於物品的協同過濾相似推薦

7.2 基於物品的協同過濾相似推薦

電商推薦系統七：基於物品的協同過濾相似推薦

電商推薦系統二：工具環境搭建

C#開發PACS醫學影像處理系統(七)：讀取影像Dicom資訊

前端 ----Vue電商管理系統

電商下沉“過國慶”：補貼茅臺、一元包郵與小鎮購物節

推薦系統 Task01：推薦系統簡介

推薦系統 00：概述

做電商成為各大平臺的執念，教你搭建自己的電商直播系統，直播原始碼

推薦系統實踐 0x06 基於鄰域的演算法（1）

推薦系統實踐 0x09 基於圖的模型

淘寶成為央視春晚獨家電商合作伙伴：今晚清空 40000 個購物車

電商產品經理必修課-巨量電商庫存系統+倉庫管理+進貨商貨系統課程答疑+專案原始檔

電商平臺首家：京東貨運航空籌建獲批，機型為波音 737-800 系列

攜程迴應擬收購韓國電商怡百購：訊息不實

央視曝光電商直播亂象：得物產品抽樣不合格率 50%，快手小紅書等同樣存在問題

小紅書合併社群電商業務，迴應：系組織自然迭代

索賠 21 億歐元鉅款，谷歌被瑞典電商平臺 Pricerunner 起訴：稱搜尋結果不公正，涉嫌壟斷

【推薦演算法】基於使用者協同過濾演算法

python 多維向量相似度計算_推薦系統-協同過濾-相似度計算

基於協同過濾的推薦引擎（理論部分）

電商推薦系統七：基於物品的協同過濾相似推薦

7.2 基於物品的協同過濾相似推薦

相關推薦