【Mark Schmidt課件】機器學習中的最優化問題
本課件的4個目的:
-
監督學習的機器學習技術概述與動機。Give an overview and motivation for the machine learning techniqueof supervised learning.
-
概括了梯度法的收斂速率,用於解決線性系統中的一般光滑凸優化問題。Generalize convergence rates of gradient methods for solving linearsystems to general smooth convex optimization problems.
-
介紹了求解一類特殊非光滑凸優化問題的最有效的演算法之一——近似梯度演算法。Introduce the proximal-gradient algorithm, one of the most efficientalgorithms for solving special classes of non-smooth convex optimizationproblems.
-
介紹了隨機梯度演算法,用於解決資料量非常大的情況下的資料擬合問題。Introduce the stochastic-gradient algorithm, for solvingdata-fitting problems when the size of the data is very large.
機器學習是研究使用計算機自動檢測資料中的模式(結構),並使用檢測結果進行預測或決策。Study of using computers to automatically detect patterns in data,and use these to make predictions or decisions.
機器學習的成功應用領域包括:Kinect、書籍/電影推薦、垃圾郵件檢測、信用卡欺詐檢測、人臉識別、語音識別、目標識別、自動駕駛。Recent successes: Kinect, book/movie recommendation, spam detection,credit card fraud detection, face recognition, speech recognition, objectrecognition, self-driving cars.
有監督學習的特點:
-
已知輸入與輸出的正確示例。Given input and output examples.
-
建立一個模型來預測輸入資料的輸出。Build a model that predicts the output from the inputs.
-
可以使用該模型來預測新輸入資料的輸出。You can use the model to predict the output on new inputs.
典型例項:手寫數字識別
有監督學習的兩個階段:
-
訓練階段:建立從輸入特徵對映到標籤的模型。(前提是基於許多正確行為的例子,即訓練資料)Training phase: build model that maps from input features to labels.(based on many examples of the correct behaviour)
-
測試階段:模型用於標記新的輸入特徵。Testing phase: modelis used to label new inputs.
一般來說,訓練階段可以認為是以下的優化問題:
資料擬合項:x與資料樣本的擬合程度如何?
正則化:x的複雜度問題,簡單的模型學習效果更好。
更多內容下載地址:
更多精彩文章請關注微訊號: