1. 程式人生 > >監督學習、無監督學習、半監督學習和強化學習

監督學習、無監督學習、半監督學習和強化學習

Author: LiChong0309
Lable: Reinforcement learning、Artificial intelligence、Deep learning、Machine learning

1.Machine learning

機器學習—>模擬人的學習方式—>獲取新的知識和技能—>重組已有的知識結構—>改善自身的效能。
Machine learning是Artificial intelligence的核心,是讓計算機具有智慧的根本途徑。

比如,中學階段通過大量的習題訓練,學習解題方法,為的是能夠在高考的時候取得好的成績,但是高考的題目是之前沒有見過的,但是這並不說明高考的題目是不能做出來的,我們可以通過對之前做過的習題的分析,找到解題的方法。
機器學習的原理和上面的例子差不多,利用一些已知的資料訓練機器(做習題),然後機器分析資料,找到內在聯絡(學習解題方法),從而對未知的資料進行做出判斷和決策(做高考題)。

根據訓練方法的不同,可以將機器學習分為四類:
①:Supervised learning 監督學習
②:Unsupervised learning 無監督學習
③:Semi-Supervised learning 半監督學習

2.Classification of Machine learning

2.1. Supervised learning

Supervised Learning的資料是有特徵(feature)和標籤(label)的。機器可以尋找到標籤和特徵之間的聯絡,當面對只有特徵而沒有標籤的資料時,可以判斷出標籤。

用上面的高考題的例子:所謂的Supervised Learning,就是高考前的做的所有的題目都是有標準答案的,在學習和做題的過程中,可以對照答案,分析問題找出方法。在高考沒有答案的時候,也能夠正確的解決。這和我們大多數人在中學時的學習方法是一樣的。

2.2. Unsupervised learning

與Supervised Learning(監督學習)相對的是Unsupervised Learning(無監督學習)。Supervised的資料只有特徵(feature),沒有標籤(label)。
再舉高中做練習題的例子,就是所做的練習題沒有標準答案,換句話說,你也不知道自己做的是否正確,沒有參照。但是就算不知道答案,我們還是可以大致的將語文,數學,英語這些題目分開,因為這些問題內在還是具有一定的聯絡。 這種問題在機器學習領域中就被稱作聚類(Clustering)。在只有特徵沒有標籤的訓練資料集中,通過資料之間的內在聯絡和相似性將他們分成若干類。

2.3. Semi-Supervised learning

處在監督學習和無監督學習之間的是半監督學習。Semi-Supervised Learning中使用的資料,有一部分是標記過的,而大部分是沒有標記的。因此和監督學習相比,半監督學習的成本較低,但是又能達到較高的準確度。

2.4 Reinforcement Learning

強化學習也是使用未標記的資料,但是可以通過某種方法知道你是離正確答案越來越近還是越來越遠(即獎懲函式)。可以把獎懲函式想象成正確答案的一個延遲的、稀疏的形式。在監督學習中,能直接得到每個輸入的對應的輸出。強化學習中,訓練一段時間後,你才能得到一個延遲的反饋,並且只有一點提示說明你是離答案越來越遠還是越來越近。

3. Reference