吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

阿新 • • 發佈：2018-11-09

建議記住的實用符號

符號	含義
m	樣本數目
x	輸入變數
y	輸出變數/目標變數
（x,y）	訓練樣本
（x^(i),y^(i)）	第i個訓練樣本
h	假設的函式( h(x) = y )

H函式：

θ(x) = θ0 + θ1*x( h(x) ) 【單變數線性迴歸模型】

備註：常用希臘字母

Α α：阿爾法 Alpha	Β β：貝塔 Beta	Γ γ：伽瑪 Gamma	Δ δ：德爾塔 Delte
Ε ε：艾普西龍 Epsilon	Ζ ζ ：捷塔 Zeta	Ε η：依塔 Eta	Θ θ：西塔 Theta
Ι ι：艾歐塔 Iota	Κ κ：喀帕 Kappa	∧ λ：拉姆達 Lambda	Μ μ：繆 Mu
Ν ν：拗 Nu	Ξ ξ：克西 Xi	Ο ο：歐麥克輪 Omicron	∏ π：派 Pi
Ρ ρ：柔 Rho	∑ σ：西格瑪 Sigma	Τ τ：套 Tau	Υ υ：宇普西龍 Upsilon
Φ φ：fai Phi	Χ χ：器 Chi	Ψ ψ：普賽 Psi	Ω ω：歐米伽 Omega

1、已知訓練集

2、計算出恰當的θ0和θ1的值，使之得到的結果最接近已知的訓練集（ hθ(x) = θ0 + θ1*x ），儘可能的讓其方差的1/2M的值最小。

代價函式（平方誤差函式）: J(θ0, θ1) = 1/(2m)∑(h(x^(i) – y ^(i))²

代價函式和假設函式

左邊是假設函式：假設函式是為了確定θ1的值，是一個關於x的函式

右邊是代價函式：是一個關於θ1的函式，求得不同θ1的情況下，代價函式的值（即誤差的大小）。

同時考慮θ0和θ1所繪製的代價函式，其中點最低的部分則是我們理想的假設函式。

求θ0和θ1的演算法

【梯度下降】將代價函式的值（就房價問題的訓練集）進行視覺化，想象如果你在山頂，以最快的速度走到山腳（即快速找到θ0和θ1恰當的值，使代價函式的值在某個較小的值的範圍內）

梯度下降函式會給我們返回區域性最優解，不同的初始值也許到達的點不同（即對θ0和θ1剛開始賦值不同，得到的最終值也會不一樣）

給θ0和θ1設定初始值
通過梯度下降演算法得到區域性最優解

梯度下降演算法

解析：

：= 賦值運算子（對的就是一個冒號加等號）

= 類似於C語言中的==（不知道老師使用的是哪裡的語法，matlab不是這樣的 [○･｀Д´･ ○]）

α 學習速率，是一個數字（控制下山的距離，即控制θ值變化的大小，其大小與α成正比，α>0 ）

學過微積分的應該都知道，下面要進行推導

每一次都會重新對θ0和θ1重新賦值（同時更新，即兩個微分中的θ0和θ1都是它們原來的值）

第一個它的導數值為負數，因為y值隨著x值的升高而降低

第二個它的導數值為正數，因為y值隨著x值的升高而升高

由於代價函式的值恆大於零（有其表示式可知），所以我們可以很容易得到，無論θ所在的斜率是正是負，它永遠是朝中J(θ)值降低的方向移動。因此，導數項的意義是為了保證隨著θ的變化是朝著代價函式的值下降的那個方向。
α的值的大小也會影響到我們最終的結果，α值太小，會導致下降的比較慢，α太多，有可能會導致越過最低點。

如下圖

代價函式和導數的值同樣起到對下降距離的調節作用，隨著代價函式的值逐步降低，下降的距離逐漸變小，也就如下圖所示。

下降演算法的之所以存在區域性最優解，與其演算法有關。當到達一個位置θ0和θ1的偏導數都為0時，θ0和θ1將不再改變，也就是說，會出現求得的值為極小值而不是最小值的情況。（如果存在θ0和θ1都為0的多個點）

這也就是我們的梯度下降，其中圈著的部分，分別是各自偏導數求出的結果

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

吳恩達機器學習課程筆記章節二單變數線性迴歸

1、模型描述 Univariate（One variable）Linear Regression m=訓練樣本的數目，x's=輸入的變數/特徵，y's=輸出變數/目標變數 2、代價函式基本定義： 3、代價函式（一）回顧一下，前面一些定義：簡化的假設函式，theta0=0，得到假

吳恩達機器學習課程筆記——第二週

1. 多變數線性迴歸(Linear Regression with Multiple Variables) 也稱為多元線性迴歸，一元就是一個變數，多元就是多個變數，在這裡也可以叫做多個特徵 1.1 多維特徵(Multiple Features) 之前，

吳恩達機器學習課程筆記第五週

Costfunction代價函式：在前面的課程總我們瞭解了邏輯迴歸的代價函式：在神經網路中，我們增加了對k個輸出的誤差進行了求和。得到代價函式如下：K為輸出的個數，在正則項中L表示神經網路的層數Backpropagation algorithm反向傳播演算法：當我們進行梯度下

吳恩達機器學習課程筆記——第一週

1. 單變數線性迴歸(Linear Regression with One Variable) 1.1 模型表示像上述公式，因為只含有一個特徵/輸入變數，因此這樣的問題叫作單變數線性迴歸問題。例子如下：單變數線性方程，就是我們初中就學的

Coursera 斯坦福吳恩達機器學習課程筆記 (1)

看了課程一週後發現忘光了，決定做一個筆記用作複習。如果涉及到侵權問題請聯絡我，我會立馬刪除並道歉。同時，禁止任何形式的轉載，包括全文轉載和部分轉載。如需使用請聯絡本人 [email protected]。如若發現侵權行為，我學過智慧財產權法的，嘿嘿第一週：基礎概念和

斯坦福CS229機器學習課程筆記一：線性迴歸與梯度下降演算法

機器學習三要素機器學習的三要素為：模型、策略、演算法。模型：就是所要學習的條件概率分佈或決策函式。線性迴歸模型策略：按照什麼樣的準則學習或選擇最優的模型。最小化均方誤差，即所謂的 least-squares(在spss裡線性迴歸對應的模組就叫OLS即Ordinary Least Squares)：

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第5周神經網路續

Neural Networks:Learning 上週的課程學習了神經網路正向傳播演算法，這周的課程主要在於神經網路的反向更新過程。 1.1 Cost function 我們先回憶一下邏輯迴歸的價值函式 J(θ)=1m[∑mi=1y(i)log(hθ

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第1,2周

Linear’regression 發現這個教程是最入門的一個教程了，老師講的很好，也很通俗，每堂課後面還有程式設計作業，全程用matlab程式設計，只需要填寫核心程式碼，很適合自學。 1.1 Model representation 起始給出了

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第6周有關機器學習的小建議

1.1 Deciding what to try next 當你除錯你的學習演算法時，當面對測試集你的演算法效果不佳時，你會怎麼做呢？獲得更多的訓練樣本？嘗試更少的特徵？嘗試獲取附加的特徵？嘗試增加多項式的特徵？嘗試增加λ? 嘗試減小λ?

機器學習筆記--吳恩達機器學習課程2

梯度下降法對於梯度下降法而言，當偏導數的學習效率過大或過小時，收斂的速率會變得很緩慢，α過大時甚至會無法收斂。學習效率α是一個正數。同樣梯度下降法初始點在區域性最低點時同樣不會再更新，此時偏導數的值為0.

學習筆記——吳恩達-機器學習課程-1.3 用神經網路進行監督學習

神經網路有時媒體炒作的很厲害，考慮到它們的使用效果，有些說法還是靠譜的，事實上到目前為止，幾乎所有的神經網路創造的經濟價值都基於其中一種機器學習，我們稱之為“監督學習”，那是什麼意思呢？我們來看一些例子，在監督學習中輸入x，習得一個函式

學習筆記——吳恩達-機器學習課程 1.2 什麼是神經網路

1.2 什麼是神經網路 “深度學習”指的是訓練神經網路，有的時候規模很大，那麼神經網路是什麼呢？我們從一個房價預測的例子開始，假設有一個六間房屋的資料集已知房屋的面積，單位是平房英尺或者平方米，已知房屋價格，想要找到一個函式，根據房屋面積，預測房價的函式，

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

吳恩達-深度學習-課程筆記-6: 深度學習的實用層面( Week 1 )

data 絕對值 initial 均值化 http 梯度下降法 ati lod 表示 1 訓練/驗證/測試集( Train/Dev/test sets ) 構建神經網絡的時候有些參數需要選擇，比如層數，單元數，學習率，激活函數。這些參數可以通過在驗證集上的表現好壞來進行選擇

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

吳恩達機器學習視訊筆記03——矩陣和向量

注：非常基礎的內容，學過線性代數的童鞋可以跳過矩陣介紹：左邊是一個4×2的矩陣，右邊是一個2×3的矩陣 A是一個四行而列的矩陣 A11=1402(表示第一行第一列) A12=191(第一行第二列)

吳恩達機器學習視訊筆記——簡單知識背景

1、生活的機器學習：電腦區分垃圾郵件淘寶的智慧推薦照相時候的美顏什麼是人工智慧： Arthur Samuel(1959):部分特定程式碼賦予計算機自動學習的能力。世界上第一個機器學習的程式：Samuel編寫的西洋棋程式 &n

吳恩達機器學習視訊筆記——梯度下降簡化技巧

房價預測多個因素作用下，即θ有多個的情況下，如何得到假設函式。第二行的訓練樣本，用矩陣進行表示如下：同樣，假設函式在4個變數的情況下，其表示方法為：有n個因素作用的情況下（即預設X0 = 1）：

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

16 決策樹決策樹是一種監督學習演算法，以樹狀圖為基礎，其輸出結果為一系列簡單實用的規則。它就是一系列的if-then語句，既可以用於分類問題，也可以用於迴歸問題。構建決策樹之通常包括三個步驟： 1）特徵選擇 &n

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

相關推薦