1. 程式人生 > >來自語義資訊理論的多標籤分類方法——有簡單方法幹嘛要用複雜的?

來自語義資訊理論的多標籤分類方法——有簡單方法幹嘛要用複雜的?

流行的多標籤分類方法大多把多分類化為多個二分類。流行的有One-to-Rest方法和Binary Relevance方法。

One-to-Rest方法的問題是, 圍繞一個標籤y1分類, 把一個沒有y的例子當成y1的反例, 這時不對的。 比如兩個例子(25歲, “年輕人”)和(24歲,“成年人”)都是對的。 設y1="年輕人", 把24歲劃到rest=非年輕人,就錯了.

Binary Relevance能可這個問題, 但是對樣本要求太高,運算複雜。

新的方法很簡單, 學習的時候 得到邏輯分類函式或隸屬函式 T(qj|X) (q=theta), 令它正比於轉移概率函式 P(yj|X).

分類的時候用最大語義資訊準則就行了。