計算物品之間的相似度矩陣

阿新 • • 發佈：2021-04-27

公式一:

在這裡插入圖片描述

構建資料集

import pandas as pd
import numpy as np

user_score_dict = pd.DataFrame({
            "A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
            "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d" 
: 0.0, "e": 3.5},
            "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0.0, "e": 3.0},
            "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 3.0},
        })
user_score_dict = user_score_dict. 
T
user_score_dict

在這裡插入圖片描述

構建使用者倒排表、共現矩陣

user_score_dict = {
            "A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
            "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d": 0.0, "e": 3.5}, 

            "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0.0, "e": 3.0},
            "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 3.0},
        }
def ItemSimilarity():
        itemSim = dict()
        # 得到每個物品有多少使用者產生過行為
        item_user_count = dict()
        # 同現矩陣
        count = dict()
        for user, item in user_score_dict.items():
            for i in item.keys():
                item_user_count.setdefault(i, 0)
                if user_score_dict[user][i] > 0.0:
                    item_user_count[i] += 1
                for j in item.keys():
                    count.setdefault(i, {}).setdefault(j, 0)
                    if (
                        user_score_dict[user][i] > 0.0
                        and user_score_dict[user][j] > 0.0
                        and i != j
                    ):
                        count[i][j] += 1
         # 共現矩陣 -> 相似度矩陣
        for i, related_items in count.items():
            itemSim.setdefault(i, dict())
            for j, cuv in related_items.items():
                itemSim[i].setdefault(j, 0)
                itemSim[i][j] = cuv / item_user_count[i]
        return itemSim
sim = ItemSimilarity()
pd.DataFrame(sim).T

在這裡插入圖片描述

公式二:

在這裡插入圖片描述

構建資料集

import pandas as pd
import numpy as np

user_score_dict = pd.DataFrame({
            "A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
            "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d": 0.0, "e": 3.5},
            "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0.0, "e": 3.0},
            "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 3.0},
        })
user_score_dict = user_score_dict.T
user_score_dict

構建使用者倒排表、共現矩陣

import math
user_score_dict = {
            "A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
            "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d": 0.0, "e": 3.5},
            "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0.0, "e": 3.0},
            "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 3.0},
        }
def ItemSimilarity():
        itemSim = dict()
        # 得到每個物品有多少使用者產生過行為
        item_user_count = dict()
        # 同現矩陣
        count = dict()
        for user, item in user_score_dict.items():
            for i in item.keys():
                item_user_count.setdefault(i, 0)
                if user_score_dict[user][i] > 0.0:
                    item_user_count[i] += 1
                for j in item.keys():
                    count.setdefault(i, {}).setdefault(j, 0)
                    if (
                        user_score_dict[user][i] > 0.0
                        and user_score_dict[user][j] > 0.0
                        and i != j
                    ):
                        count[i][j] += 1
         # 共現矩陣 -> 相似度矩陣
        for i, related_items in count.items():
            itemSim.setdefault(i, dict())
            for j, cuv in related_items.items():
                itemSim[i].setdefault(j, 0)
                itemSim[i][j] = cuv / math.sqrt(item_user_count[i]*item_user_count[j])
        return itemSim
sim = ItemSimilarity()
pd.DataFrame(sim).T

在這裡插入圖片描述

基於python實現計算物品之間的相似度矩陣演算法二

計算物品之間的相似度矩陣例如現在有A、B、C、D四個使用者，分別對a、b、c、d、e五個物品表達了自己喜好程度（通過評分高低來表現自己的偏好程度高低），計算物品之間的相似度矩陣

計算物品之間的相似度矩陣

公式一: 構建資料集 import pandas as pd import numpy as np user_score_dict = pd.DataFrame({ "A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e&qu

基於python計算物品之間的相似度矩陣

計算字串的相似度 (HJ79)

一：解題思路這道題目和leetcode72題，編輯距離差不多，只是定義2個字串距離不一樣而已。可以放在一起進行學習。Time:O(m*n),Space:O(m*n)

Python 餘弦相似度與皮爾遜相關係數計算例項

夾角餘弦(Cosine) 也可以叫餘弦相似度。幾何中夾角餘弦可用來衡量兩個向量方向的差異，機器學習中借用這一概念來衡量樣本向量之間的差異。

python Opencv計算影象相似度過程解析

這篇文章主要介紹了python Opencv計算影象相似度過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

keras實現基於孿生網路的圖片相似度計算方式

我就廢話不多說了，大家還是直接看程式碼吧！ import keras from keras.layers import Input,Dense,Conv2D

BM25演算法語義相似度計算

原理 BM25演算法，通常用來作搜尋相關性平分。一句話概況其主要思想：對Query進行語素解析，生成語素qi；然後，對於每個搜尋結果D，計算每個語素qi與D的相關性得分，最後，將qi相對於D的相關性得分進行加權求和，從

TF-IDF計算相似度為什麼要對稀疏向量建立索引？

TF-IDF的向量表示的稀疏問題之前在看tf-idf程式碼時候思考了一個問題，不知道對於初學的大部分同學有沒有這樣一個疑惑，用tf-idf值構成的向量，維度可能跟詞表的大小有關，那麼對於一句話來說，這樣的向量表

餘弦相似度計算

餘弦相似度用向量空間中兩個向量夾角的餘弦值作為衡量兩個個體間差異的大小。餘弦值越接近1，就表明夾角越接近0度，也就是兩個向量越相似，這就叫"餘弦相似性"。

多視幾何_計算兩幅影象之間的基礎矩陣F和一副影象上的點在另一福影象上的極線L

技術標籤：三維重建SLAM 功能說明: 輸入：兩幀影象的相對變換Tji =(R,t) (從影象i變換到影象j), 相機的內參K (假設兩幅影象使用的相機是同一個), 輸入影象i中的點m輸出：計算影象i的m點, 在影象j上的極線l\'m= (

python 多維向量相似度計算_推薦系統-協同過濾-相似度計算

技術標籤：python 多維向量相似度計算餘弦相似度餘弦相似度（Cosine Similarity）：衡量了兩個使用者向量之間的向量夾角大小；夾角越小，證明餘弦相似度越大，兩個使用者也就越相似。

用python呼叫百度地圖API實現地址轉經緯度並計算兩地之間的距離（下）

技術標籤：python小工具python 接上篇，我用的AK是瀏覽器端的第一段根據給出的地址返回經緯度輸入地址越詳細經緯度越準確

ESIM計算文字相似度

ESIM計算文字相似度 #3折，連線層進行了改變，x1,x2,x3,x4,連線的地方進行改變，最後在連線

NLP（二十三）：用tf-idf得到句子向量，並計算相似度

一、基於gensim 1、模型類 import os import jieba import pickle import logging import numpy as np from gensim import corpora, models, similarities

計算兩張圖的餘弦相似度

# 結果餘弦相似度對比 import numpy as np import pdb def count_difference(groundtruth, inputs): statistical_method = {

java演算法（1）---餘弦相似度計算字串相似率

餘弦相似度計算字串相似率功能需求：最近在做通過爬蟲技術去爬取各大相關網站的新聞，儲存到公司資料中。這裡面就有一個技術點，就是如何保證你已爬取的新聞，再有相似的新聞

自然語言處理之文字相似度的計算

自然語言處理中，文字相似度的計算至關重要，在計算文字相似度的時候，通常將特徵表示為向量的形式，目前常用的簡單文字相似度計算有以下幾種，文末上程式碼。

轉--Golang影象處理工具庫，影象相似度計算，影象二值化

imgo golang影象處理工具庫，影象相似度計算，影象二值化(golang image process lib) 目前只支援jpg,png

計算物品之間的相似度矩陣

公式一:

公式二:

相關推薦