1. 程式人生 > 其它 >監督學習、非監督學習、半監督學習和增強學習

監督學習、非監督學習、半監督學習和增強學習

監督學習

給機器的訓練資料有“標記”或者“答案”

如MNIST資料集中指明每個數字圖案代表的數字

常用的監督學習演算法如下:

  • k近鄰
  • 線性迴歸和多項式迴歸
  • 邏輯迴歸
  • SVM
  • 決策樹和隨機森林

非監督學習

給機器的訓練資料沒有任何“標記”或者“答案”

非監督學習的意義:對沒有“標記”的資料進行分類——聚類分析

非監督學習常用領域:

  • 對資料進行降維處理
  1. 特徵提取:移除非必要、無關的特徵
  2. 特徵壓縮:多多個特徵進行整合
  3. 降維的意義:方便視覺化(高維轉為低維)
  • 異常檢測
  1. 異常檢測的目的:排除資料集中的與其他大多資料相背離的資料(如某個值過高或過低)

半監督學習

一部分資料有“標記”或者“答案”,另一部分則沒有

通常都先使用無監督學習對資料進行處理,之後使用監督學習做模型的訓練和預測

增強學習

根據周圍環境的情況,採取行動,根據採取行動後的結果,再學習行動方式(如AlphaGo,自動駕駛)

把圈子變小,把語言變乾淨,把成績往上提,把故事往心裡收,現在想要的以後你都會有。