1. 程式人生 > >機器學習課程-第8周-聚類(Clustering)

機器學習課程-第8周-聚類(Clustering)

標簽 一個 無監督學習 學習課程 裏的 font 系列 函數 inf

1. 聚類(Clustering)

1.1 無監督學習: 簡介

在一個典型的監督學習中,我們有一個有標簽的訓練集,我們的目標是找到能夠區分正樣本和負樣本的決策邊界,在這裏的監督學習中,我們有一系列標簽,我們需要據此擬合一個假設函數。與此不同的是,在非監督學習中,我們的數據沒有附帶任何標簽,我們拿到的數據就是這樣的:

技術分享圖片

非監督學習中,我們需要將一系列無標簽的訓練數據,輸入到一個算法中,然後我們告訴這個算法,快去為我們找找這個數據的內在結構給定數據。我們可能需要某種算法幫助我們尋找一種結構。圖上的數據看起來可以分成 兩個分開的點集(稱為簇),一個能夠找到我圈出的這些點集的算法,就被稱為聚類算法

技術分享圖片

這將是我們介紹的第一個非監督學習算法。當然,此後我們還將提到其他類型的非監督學習算法,它們可以為我們找到其他類型的結構或者其他的一些模式,而不只是簇。

1.11 聚類算法用途

技術分享圖片

1.2 K-均值算法

機器學習課程-第8周-聚類(Clustering)