1. 程式人生 > 其它 >關聯分析--關聯規則的視覺化

關聯分析--關聯規則的視覺化

關聯規則的視覺化

我們嘗試用圖形的方式更直觀地顯示出關聯分析結果,這裡需要用到R的擴充套件軟體包arulesViz

rules5<-apriori(Groceries,parameter = list(supp=0.002,conf=0.5))

rules5 #顯示生成的關聯規則條數

plot(rules5)

結果分析:圖中每個點對應於相應的支援度和置信度值,分別由圖形的橫縱軸顯示,且其中關聯規則點的顏色深淺由lift值的高低決定。

另外也可以通過更改引數設定,來變換橫縱軸及顏色條所對應的變數,如:

plot(rules5,measure = c("support","lift"),shading="confidence")

結果分析:從圖中我們可以看出大量規則的引數取值分佈情況,如提升度較高的關聯規則的支援度往往較低,支援度與置信度具有明顯反相關性等。但不足之處在於,並不能具體得知這些規則對應的是哪些商品,及它們的關聯強度如何等資訊。而這一缺陷可通過互動引數(interactive)的設定來彌補。

plot(rules,interactive = T)

結果分析:在圖形下端有5個按鈕。我們可以在圖上通兩次單擊圈定感興趣的若干個點,如上圖所示。有十字形標示的陰影區域中有兩個關聯規則被選定,然後單擊“inspect”按鈕就可以獲取選定點的詳細資訊。

結果分析:當單擊filter”過濾按鈕後,再單擊圖形右側

lift 顏色條中的某處,即可將小於單擊處 lif值的關聯規則點都過濾掉,如圖所示即為過濾掉lift值小於3的點後的互動散點圖。

將引數shading設定為order來繪製Two-key圖,橫縱軸為支援度和可信度,更換連規則點的顏色深淺則表示其所代表的關聯穀子額含有商品多少,商品種類越多,點的顏色越深。

plot(rules5,shading ="order",control=list(main="Two-key plot") )

將圖形型別更改為grouped”。從圖中按照 lift引數來看,關聯性最強(圓點顏色最深)的兩種商品為黃油(butter)與生/酸奶油(whipped/sour cream);

而以 support引數來看則是熱帶水果(tropical fruit)與全脂牛奶(whole milk)關聯性最強(圓點尺寸最大)

plot ( rules5 , method = "grouped" ) ##rules5作分組圖

本文來自部落格園,作者:zhang-X,轉載請註明原文連結:https://www.cnblogs.com/YY-zhang/p/15244222.html