喜歡打醬油的老鳥
機器學習(machine learning)是一門多領域交叉學科,涉及了概率論、統計學、演算法複雜度等多門學科。專門研究計算機怎樣模擬或實現人的學習行為,它能夠發現和挖掘資料所包含的潛在價值。機器學習已經成為了人工智慧的一個分支,通過自學習演算法,發現和挖掘資料潛在的規律,從而對未知的資料進行預測。機器學習已經廣泛的運用在了,電腦科學研究、自然語言處理、機器視覺、語音、遊戲等。機器學習的方法主要分為三種,監督學習(supervised learging)、無監督學習(unsupervised learning)、強化學習(reinforcement learning),下面將介紹這三種方法的本質區別以及它們的應用領域。
一、監督學習
上圖展示了監督學習訓練模型的過程,在監督學習中的訓練資料是帶類標的。監督學習通過使用有類標的訓練資料構建模型,我們可以通過訓練得到的模型對未知的資料進行預測。比如,在對手寫數字識別所使用的機器學習演算法就屬於監督學習,在訓練模型之前,我們需要先定義那張圖片表示的是數字幾,以便計算機從資料中提取特徵更好的像類標靠近。監督學習可以被分為分類和迴歸,像上面手寫數字的識別就屬於監督學習中的分類,像房間的預測就屬於迴歸。
1、分類
分類是基於對於已知資料(帶類標)的學習,實現對新樣本類標的預測。類標是離散的、無序的值。像對於垃圾郵件的分類就屬於二分類,其中五角星表示非垃圾郵件而原表示垃圾郵件,而我們所需要訓練的模型就是圖中的直線,能夠將垃圾郵件和分垃圾郵件進行區分。我們可以將橫軸和縱軸理解為對於區分郵件的兩個特徵,可以發現這些資料都是離散的。上面所提到的手寫數字的識別屬於多分類。
2、迴歸
迴歸是針對連續型輸出變數進行預測,我們通過從大量的資料中尋找自變數(輸入)和相應連續的因變數(輸出)之間的關係,通過學習這種關係來對未知的資料進行預測。如下圖,通過自變數和因變數來擬合一條直線,使得訓練資料與擬合直線之間的距離最短,最常用的距離是採用平均平方距離。通過對訓練資料的分析我們可以獲取到這條直線的斜率和截距,從而可以對於未知資料進行預測。
二、強化學習
強化學習是通過構建一個系統(agent),在與環境(environment)互動的過程中提高系統的效能。環境的當前狀態資訊會包括一個反饋訊號,我們可以通過這個反饋訊號對當前的系統進行評價改善系統。通過與環境的互動,agent可以通過強化學習來得到一系列行為,通過對激勵系統的設計使得正向反饋最大。強化學習經常被使用在遊戲領域,比如圍棋比賽,系統會根據當前棋盤上的局態來決定下一步的位置,通過遊戲結束時的勝負來作為激勵訊號。
三、無監督學習
無監督學習所處理的是無類標或者資料的總體趨勢不明朗,通過無監督學習我們可以將這些不知道類標和輸出標量以及沒有反饋訊號的情況下,來尋找資料中所潛在的規律。無監督學習可以分為聚類和降維。
1、聚類
聚類屬於一種探索性的資料分析技術,在沒有任何已知資訊(類標、輸出變數、反饋訊號)的情況下,我們可以將資料劃分為簇。在分析資料的時候,所劃分的每一個簇中的資料都有一定的相似度,而不同簇之間具有較大的區別。
2、降維
在實際情況中所處理的資料都是高維的(成百上千),那麼這將會導致我們每次所處理的資料量是非常的龐大,而儲存空間通常都是有限的。無監督的降維技術經常被使用在資料特徵的預處理中,通過降維技術我們可以去掉資料中的噪聲,以及不同維度中所存在的相似特徵,最大程度上在保留資料的重要資訊情況下將資料壓縮到一個低維的空間中,但同時也還是會降低演算法的準確性。
--------------------- 本文來自 修煉之路 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/sinat_29957455/article/details/78817379?utm_source=copy