關聯分析--實際應用案例
實際應用案例
相信你在逛超市時一定發現過兩種商品捆綁銷售的情況,這可能是因為商家想要促銷其中的某種商品。比如我們現在想要促銷一種比較冷門的商品——芥末(mustard),可以通過將函式 apriori)中的關聯結果(rhs)引數設定為“mustard”,來搜尋出rhs中僅包含mustard 的關聯規則,從而有效地找到mustard 的強關聯商品,來作為捆綁商品。
如下輸出結果顯示蛋黃醬(mayonnaise)是芥末( mustard)的強關聯商品,因此我們可以考慮將它們捆綁起來擺放在貨架上,並制定一個合適的共同購買價格,從而對兩種商品同時產生促銷效果。另外,我們還用到了引數 maxlen,這裡將其設為
rules4<-apriori(Groceries,parameter = list(maxlen=2,support=0.001,confidence=0.1),appearance = list(rhs="mustard",default="lhs"))
inspect(rules4)
改變輸出結果形式
我們知道,apriori()和eclat()函式都可以根據需要輸出頻繁項集(frequent itemsets)等其他形式結果。比如當我們想知道某超市這個月銷量最高的商品,或者捆綁銷售策略在哪些商品簇中作用最顯著等,選擇輸出給定條件下的頻繁項集即可。
如下即是將目標引數(target)設為“frequent itemsets”後的結果:
itemsets_apr<-apriori(Groceries,parameter = list(supp=0.001,target="frequent itemsets"),control = list(sort=-1))
itemsets_apr #顯示生成頻繁項集的個數
inspect(itemsets_apr[1:5]) #觀察前5個頻繁項集
結果分析:我們看到以sort引數對項集頻率進行降序排序後,銷量前5的商品分別為全脂牛奶、蔬菜、麵包卷、蘇打以及酸奶。
我們使用eclat()函式來獲取最適合進行捆綁銷售,或者說相近擺放的
itemsets_ecl<-apriori(Groceries,parameter = list(minlen=1,maxlen=3,supp=0.001,target="frequent itemsets"),control = list(sort=-1))
itemsets_ecl
inspect(itemsets_ecl[1:5])
本文來自部落格園,作者:zhang-X,轉載請註明原文連結:https://www.cnblogs.com/YY-zhang/p/15244216.html