斯坦福大學機器學習第一課“引言(Introduction)”
1)機器學習定義:機器學習是人工智慧的一個分支,目標是賦予機器一種新的能力。機器學習的應用很廣泛,例如大規模的資料探勘(網頁點選資料,醫療記錄等),無人駕駛飛機、汽車,手寫手別,大多數的自然語言處理任務,計算機視覺,推薦系統等。 機器學習有很多定義,廣為人知的有如下兩條:
Arthur Samuel (1959): Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
注:Arthur Lee Samuel (1901–1990) 教授是美國人工智慧領域的先驅,他設計了一些下棋程式,可以通過不斷的下棋來學習,從而達到很高的下棋水平。
Tom Mitchell (1998) : Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
例子:對於一個垃圾郵件識別的問題,將郵件分類為垃圾郵件或非垃圾郵件是任務T,檢視哪些郵件被標記為垃圾郵件哪些被標記為非垃圾郵件是經驗E,正確識別的垃圾郵件或非垃圾郵件的數量或比率是評測指標P。
2)機器學習演算法的型別
1、有監督學習(Supervised learning):通過生成一個函式將輸入對映為一個合適的輸出(通常也稱為標記,多數情況下訓練集都是有人工專家標註生成的)。例如分類問題,分類器 根據輸入向量和輸出的分類標記模擬了一個函式,對於新的輸入向量,得到它的分類結果。
2、無監督學習(Unsupervised learning):與有監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習演算法有聚類。
3、半監督學習: 介於監督學習與無監督學習之間。
4、強化學習(Reinforcement learning): 通過觀察來學習如何做出動作,每個動作都會對環境有所影響,而環境的反饋又可以引導該學習演算法。
其他的型別包括推薦系統,Transduction,Learning to learn等。