1. 程式人生 > >FP-growth 頻繁項集計算方法

FP-growth 頻繁項集計算方法

自學關聯分析的時候,發現樹和各種部落格上對FP-growth演算法的介紹中主要集中在FP-tree的構建上,而對FP-tree的挖掘,稍微有些不清楚,特別是在獲取頻繁項集的具體做法的介紹有些模糊。

《機器學習實戰》中對從FP-tree中抽取頻繁項集的三個基本步驟介紹如下:

(1)從FP-tree中獲得條件模式基。

(2)利用條件模式基,構建一個條件FP樹。

(3)迭代重複步驟(1)和步驟(2),直到樹包含一個元素項為止。

在此沒有介紹如何在FP條件樹中獲取頻繁項集,韓家煒老師的《資料探勘》也沒有詳細介紹,並且沒有明確的例子。在此我將搜尋資料過程中的遇到的一個圖片,其是基於FP-tree獲取頻繁項集的詳細過程記錄。通過這個圖片,對具體的過程有了更好的理解。

 

image