1. 程式人生 > >基於約束的頻繁模式挖掘

基於約束的頻繁模式挖掘

7.3.1 關聯規則的元規則制導挖掘

元規則的作用是什麼?

元規則使得使用者可以說明他們感興趣的規則的語法形式。規則的形式可以作為約束,幫助提高
挖掘的效能。也是說,它挖掘一種規則的形式(或者說,屬性的組合模式而不是這種組合本身。)

那麼如何使用元規則指導挖掘過程呢?

首先元規則的模板:
P1&&P2&&…Pl=>Q1&&Q2&&…Qr
所以元規則的謂詞的總數是(l+r),為了找出滿足這個模板的維間關聯規則:需要注意下面兩點:

  1. 需要找出所有的頻繁p-謂詞集 Lp。
  2. 還需要Lp中的l-謂詞集的支援度計數,方便計算Lp匯出的規則的置信度。

7.3.2 在挖掘期間對搜尋空間剪枝的辦法是?

  • 模式搜尋空間剪枝
  • 資料搜尋空間剪枝

模式空間剪枝約束

  1. 單調的
  2. 反單調的
  3. 簡潔的約束
  4. 可轉變的約束
  5. 不可轉變的約束

什麼是反單調的模式剪枝約束?

如果一個項集不滿足該規則約束,那麼它的任何超集也不滿足該規則約束。
eg:
min(J.price)>=50,一旦存在一個項集中有小於50的價格,那麼它的所有超集都不滿則
這個約束了。

count(I)<=10 等等都是如此。

資料空間剪枝約束

策略是什麼?

減掉對其後挖掘過程中可滿足模式的產生沒有貢獻的資料片段。

兩個性質:

  1. 資料的簡潔性
  2. 資料的反單調性

什麼是資料的反單調性?

在挖掘過程中,如果基於當前模式,一個數據項不滿足資料反單調性約束,則可以減掉它。
我們剪掉它,因為在剩下的挖掘過程中,它不能對當前模式的超模式的產生有任何形式的貢獻。
因此,我們說,資料反單調性對搜尋空間剪枝僅限於基於模式增長的挖掘演算法。