基於約束的頻繁模式挖掘
阿新 • • 發佈:2018-12-23
7.3.1 關聯規則的元規則制導挖掘
元規則的作用是什麼?
元規則使得使用者可以說明他們感興趣的規則的語法形式。規則的形式可以作為約束,幫助提高
挖掘的效能。也是說,它挖掘一種規則的形式(或者說,屬性的組合模式而不是這種組合本身。)
那麼如何使用元規則指導挖掘過程呢?
首先元規則的模板:
P1&&P2&&…Pl=>Q1&&Q2&&…Qr
所以元規則的謂詞的總數是(l+r),為了找出滿足這個模板的維間關聯規則:需要注意下面兩點:
- 需要找出所有的頻繁p-謂詞集 Lp。
- 還需要Lp中的l-謂詞集的支援度計數,方便計算Lp匯出的規則的置信度。
7.3.2 在挖掘期間對搜尋空間剪枝的辦法是?
- 模式搜尋空間剪枝
- 資料搜尋空間剪枝
模式空間剪枝約束
- 單調的
- 反單調的
- 簡潔的約束
- 可轉變的約束
- 不可轉變的約束
什麼是反單調的模式剪枝約束?
如果一個項集不滿足該規則約束,那麼它的任何超集也不滿足該規則約束。
eg:
min(J.price)>=50,一旦存在一個項集中有小於50的價格,那麼它的所有超集都不滿則
這個約束了。
count(I)<=10 等等都是如此。
資料空間剪枝約束
策略是什麼?
減掉對其後挖掘過程中可滿足模式的產生沒有貢獻的資料片段。
兩個性質:
- 資料的簡潔性
- 資料的反單調性
什麼是資料的反單調性?
在挖掘過程中,如果基於當前模式,一個數據項不滿足資料反單調性約束,則可以減掉它。
我們剪掉它,因為在剩下的挖掘過程中,它不能對當前模式的超模式的產生有任何形式的貢獻。
因此,我們說,資料反單調性對搜尋空間剪枝僅限於基於模式增長的挖掘演算法。