1. 程式人生 > >為什麽聚類不能用來作分類算法?

為什麽聚類不能用來作分類算法?

得到 任務 分類 郵件 類方法 還需要 好的 可能 信息

關於常見的聚類算法的詳解可以參見K均值聚類和高斯混合聚類一文。
本文內容僅適於機器學習初學者

可能剛接觸機器學習過後都知道,聚類屬於無監督學習的範疇,而分類問題是有監督學習裏常見的任務,二者都有個劃分類別的過程,為什麽聚類方法不能用於分類呢?


我們做分類任務的時候首先需要一批已標註好的樣本,這裏的標註除了一個標簽值以外,還需要的一個信息就是,標簽,即坐標軸所代表的意義,比方說 垃圾郵件分類任務裏標簽的意義就是垃圾郵件, 貓狗大戰裏標簽的意義就是是貓還是狗。 而聚類中不一樣的是,它的類別只包含我們按照某種特征聚類方法得到的標簽值,但究竟這個值所代表的類別,它對應的含義,是沒有解釋的。

為什麽聚類不能用來作分類算法?