機器學習基礎(三十五)—— 協同過濾(從匹配使用者到匹配商品)
阿新 • • 發佈:2019-01-07
考慮如下的使用者對影片的打分,由巢狀字典定義:
critics = {'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5,
'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5,
'The Night Listener': 3.0},
'Gene Seymour': {'Lady in the Water' : 3.0, 'Snakes on a Plane': 3.5,
'Just My Luck': 1.5, 'Superman Returns': 5.0, 'The Night Listener': 3.0,
'You, Me and Dupree': 3.5},
'Michael Phillips': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.0,
'Superman Returns' : 3.5, 'The Night Listener': 4.0},
'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0,
'The Night Listener': 4.5, 'Superman Returns': 4.0,
'You, Me and Dupree': 2.5},
'Mick LaSalle': {'Lady in the Water': 3.0, 'Snakes on a Plane' : 4.0,
'Just My Luck': 2.0, 'Superman Returns': 3.0, 'The Night Listener': 3.0,
'You, Me and Dupree': 2.0},
'Jack Matthews': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0,
'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5},
'Toby': {'Snakes on a Plane': 4.5, 'You, Me and Dupree': 1.0, 'Superman Returns': 4.0}}
我們知道如何為指定人員尋找品味相近者,通過歐氏距離或者皮爾遜相關度係數。假如我們想了解哪些商品之間是彼此接近的,又該如何做呢。這一現實應用即是,各大電商網站的“瀏覽該商品的使用者同時購買了”諸如此類的推薦。
我們通過檢視哪些人喜歡某一特定物品,如同某個人喜歡哪些商品一樣,然後像定義使用者之間的相似度一樣,定義商品之間的相似度。
def transformPrefs(prefs):
result = {}
for p in prefs:
for item in prefs[p]:
result.setdefault(item, {})
result[item][p] = prefs[p][item]
# 活脫脫一個轉置
return result