1. 程式人生 > >頻繁模式挖掘的模式評估方法

頻繁模式挖掘的模式評估方法

頻繁模式挖掘可以出很多模式,但是判斷一個模式是否有趣,需要用到模式的評估方法。下面介紹常用的模式評估方法。(假設項集AB

1、支援度

  包含項集AB的項的元組數與所有元組數的比值,一般計為PAB)。

2、置信度

  模式A--> B的置信度為PB|A

3、提升度

       liftA, B= P(AB)/(P()*P(B)),提升度大於1為正相關,小於1為負相關,等於1為獨立。

4、卡方度量

5、全置信度

       all_conf(A, B) = min{P(A|B), P(B|A)}

6、最大置信度

       max_conf(A, B) = max{P(A|B), P(B|A)}

7Kulczynski度量

Kulc(A, B) = 1/(2*(P(A|B) + P(B|A)

8、餘弦度量

cosine = sqrt(P(A|B) * P(B|A))

這些度量中,只有提升度和卡方度量不是零不變度量,但是其他度量也會面臨不平衡問題,為此,引入不平衡比:


   其中,sup表示置信度。