[Python]Python版吳恩達《機器學習》習題——線性迴歸

阿新 • • 發佈：2021-01-13

胡話

主要給自己備忘，放部落格方便檢視，程式碼梯度下降部分主要參考文末連結，正規方程法程式碼自己寫的，雖然很簡單但算是機器學習的“Hello World”，有點小激動。

雖然之前也看著《機器學習實戰》也寫出過梯度下降，但那時候理解不深，並沒有太多欣喜，現在對它理解程度進了一步，再寫才感覺是真的第一次。

我是懶人，所以不太願意花太多時間在部落格上，所以看官可能不會太方便，但我註釋儘量寫全呼了，複製貼上看應該還好。

程式碼

梯度下降

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Author: CK 

# Date: 2021/1/11
import os
import sys
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

abs_path = os.path.dirname(os.path.abspath(sys.argv[0]))
sys.path.append(os.path.dirname(abs_path))


class GradientDescent:
    def __init__(self):
        pass

    @staticmethod
    def cost 
(x, y, theta):
        """
        計算損失函式
        :param x: 資料集
        :param y: 標籤
        :param theta: 引數
        :return:
        """
        # 誤差計算公式
        return sum(np.power((np.dot(x, theta.T) - y), 2)) / (2 * len(x))

    def gradient_descent(self, x, y, theta, 
 alpha, epoch=1000):
        """
        梯度下降
        :param x: 訓練集
        :param y: 標籤
        :param theta: 引數
        :param alpha: 學習率
        :param epoch: 迭代次數
        :return:
        """
        cost = np.zeros(epoch)  # 為之後繪圖作資料準備
        m = x.shape[0]  # 資料集數量
        for i in range(epoch):
            # 梯度下降公式
            theta -= (alpha / m) * (x.dot(theta.T) - y).T.dot(x)
            cost[i] = self.cost(x, y, theta)
        return theta, cost

    def run(self):
        """主入口"""
        data = pd.read_csv(os.path.join(abs_path, 'ex1', 'ex1data1.txt'),
                           names=['Population', 'Profit'], header=None)
        # 新增x_0
        data.insert(0, 'Ones', 1)
        column_num = data.shape[1]
        # 獲取x、y數列
        x = np.array(data.iloc[:, : column_num-1].values)
        y = np.array(data.iloc[:, column_num-1: column_num].values)
        # 初始化theta
        theta = np.zeros([1, 2])
        print(self.cost(x, y, theta))
        final_theta, cost = self.gradient_descent(x, y, theta, 0.01)
        # print(final_theta, cost)
        final_cost = self.cost(x, y, final_theta)
        print(final_theta, final_cost)
        population = np.linspace(data.Population.min(), data.Population.max(), 100)
        # 計算相應值以便之後編制曲線
        profit = final_theta[0, 0] + (final_theta[0, 1] * population)
        # matplotlib繪圖
        fig, ax = plt.subplots(figsize=(8, 6))
        ax.plot(population, profit, 'r', label='Prediction')
        ax.scatter(data['Population'], data['Profit'], label='TrainingData')  # 原始資料散點
        ax.legend(loc=4)
        ax.set_xlabel('Population')
        ax.set_ylabel('Profit')
        ax.set_title('PredictionProfit')
        plt.show()


def main():
    gd = GradientDescent()
    gd.run()


if __name__ == '__main__':
    main()

正規方程

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Author: CK
# Date: 2021/1/12
import os
import sys
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

abs_path = os.path.dirname(os.path.abspath(sys.argv[0]))
sys.path.append(os.path.dirname(abs_path))
from gradient_descent import GradientDescent


class NormalEquation:
    def __init__(self):
        pass

    @staticmethod
    def normal_equation(x, y):
        """
        正規方程法
        :param x: 資料集
        :param y: 標籤
        :return:
        """
        return np.linalg.pinv(x.T.dot(x)).dot(x.T).dot(y)

    def run(self, x, y, theta):
        """主入口"""
        # 呼叫之前寫的梯度下降法，得到的theta
        gd = GradientDescent()
        final_theta, cost = gd.gradient_descent(x, y, theta, 0.4)
        print(final_theta, gd.cost(x, y, theta))
        # 繪製學習曲線，1000是因為梯度下降預設迭代數量
        plt.plot(range(1000), cost)
        plt.show()
        # 通過正規方程法直接計算得到theta
        ne_theta = self.normal_equation(x, y)
        print(ne_theta.T, gd.cost(x, y, ne_theta.T))


def main():
    ne = NormalEquation()
    data = pd.read_csv(os.path.join(abs_path, 'ex1', 'ex1data2.txt'),
                       names=['Size', 'Bedrooms', 'Price'], header=None)
    column_num = data.shape[1]
    x = data.iloc[:, : column_num-1]
    y = data.iloc[:, column_num-1: column_num]
    # 資料歸一化
    # x_normalization = (x - x.min()) / (x.max() - x.min())
    x_normalization = (x - x.mean()) / x.std()
    x_normalization.insert(0, 'Ones', 1)
    x_set = np.array(x_normalization.values)
    y_set = np.array(y.values)
    theta = np.zeros([1, column_num])
    ne.run(x_set, y_set, theta)


if __name__ == '__main__':
    main()

參考連結

吳恩達機器學習課後習題ex1

吳恩達機器學習筆記--ex1(Python實現)

單變數的線性迴歸(Linear Regression with one variable) 匯入所需要的庫 import numpy as np import pandas as pd

【吳恩達機器學習筆記】梯度下降演算法

目錄前言一、梯度下降演算法二、梯度下降演算法公式同步下降總結前言延續上文，本節將介紹梯度下降演算法來計算代價函式的最小值。

吳恩達機器學習---自己的筆記（Day1-6）

Day1 機器學習：有監督學習：有監督學習指的就是我們給學習演算法一個數據集。這個資料集由“正確答案”組成。在房價的例子中，我們給了一系列房子的資料，我們給定資料集中每個樣本的正確價格，即它們實際

《吳恩達機器學習》學習筆記003_邏輯迴歸、正則化

http://www.ai-start.com/ml2014/html/week3.html 邏輯迴歸(Logistic Regression) 分類問題如果我們要用線性迴歸演算法來解決一個分類問題，對於分類， $y$ 取值為 0 或者1，但如果你使用的是線性迴歸，那麼假設函

《吳恩達機器學習》學習筆記008_聚類(Clustering)

http://www.ai-start.com/ml2014/html/week8.html 聚類(Clustering) K-Means聚類用$μ1$,$μ2$,...,$μ^k$ 來表示聚類中心，用$c{(1)}$,$c{(2)}$,...,$c^{(m)}$來儲存與第$i$個例項資料最近的聚類中心的索引，K-均

吳恩達機器學習ex1

小小小小白剛剛開始學機器學習參考部落格吳恩達機器學習ex1 python實現需要用到的庫

吳恩達-機器學習筆記-第一章

參考：機器學習筆記： 1.2機器學習是什麼？即使是在機器學習的專業人士中，也不存在一個被廣泛認可的定義來準確定義機器學習是什麼或不是什麼

吳恩達機器學習（5）梯度下降

1.梯度下降是一種常用的使代價函式最小化的演算法，不僅用線上性迴歸中，也用到機器學習的很多方面，是一個非常經典的演算法。

吳恩達機器學習（6）多元梯度下降法

1. 多引數模型　　存在多個引數，模型更加複雜，在求梯度下降時需要對每個引數求偏導數，再同時更新引數

h3 { background: rgba(42, 92, 170, 1); box-shadow: 0 1px 6px 1px rgba(10, 10, 0, 0.5); color: rgba(255, 255, 255, 1); font-size: 18px; font-weight: bold; height: 30px; padding: 8px 0 5px 10px; text-sh

[Python]Python版吳恩達《機器學習》習題——線性迴歸

技術標籤：機器學習Pandas機器學習python 胡話主要給自己備忘，放部落格方便檢視，程式碼梯度下降部分主要參考文末連結，正規方程法程式碼自己寫的，雖然很簡單但算是機器學習的“Hello World”，有點小激動。

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-5 Matrix multiplication properties 矩陣相乘法則

不滿足交換律 A、B均是矩陣，通常情況下： \\[A \\times B \\not= B \\times A \\]E.g \\[\\begin{bmatrix}

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-4 Marix-matrix multiplication 矩陣-矩陣相乘

例 - 1 \\[\\begin{bmatrix} 1&3&2\\\\ 4&0&1\\\\ \\end{bmatrix}\\times\\begin{bmatrix} 1&3\\\\

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-3 Matrix-vector multiplication 矩陣-向量乘法

例 - 1 \\[\\begin{bmatrix} 1&3\\\\ 4&0\\\\ 2&1\\\\ \\end{bmatrix}\\begin{bmatrix} 1\\\\ 5\\\\ \\end{bmatrix}=\\begin{bmatrix}

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

原文連結 https://www.cnblogs.com/szxspark/p/8439066.html 1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：

吳恩達深度學習課件_吳恩達深度學習筆記02.改善深層神經網路 W3.超引數除錯、Batch Norm和程式框架...

技術標籤：吳恩達深度學習課件 1. 除錯處理2. 為超引數選擇合適的範圍3. 超引數除錯的實踐4. 歸一化網路的啟用函式5. 將 Batch Norm 擬合進神經網路6. Batch Norm 為什麼奏效7. 測試時的 Batch Norm8. Softmax

吳恩達深度學習課後作業第一課第二週-邏輯迴歸的拓展，自己做資料來進行預測是否是貓

技術標籤：吳恩達深度學習課後作業python深度學習首先宣告：本文在參考[https://blog.csdn.net/u013733326/article/details/79639509](https://blog.csdn.net/u013733326/article/details/79639509)的部落格基

機器學習中線性迴歸python程式設計注意事項

技術標籤：python機器學習先把公式列在這裡方便表述：我們設x0永遠為1 ，用來表示 y = kx+b 中的 b

吳恩達深度學習筆記-2（程式設計基礎）

目錄神經網路的程式設計基礎邏輯迴歸梯度下降導數計算圖（Computation Graph）計算圖中的導數計算反向傳播單個樣本多個樣本向量化LR with 向量化梯度下降 with 向量化Python的廣播Python中的向量注意事項

[Python]Python版吳恩達《機器學習》習題——線性迴歸

胡話

程式碼

梯度下降

正規方程

參考連結

吳恩達機器學習筆記--ex1(Python實現)

【吳恩達機器學習筆記】梯度下降演算法

吳恩達機器學習---自己的筆記（Day1-6）

吳恩達機器學習筆記1 初識機器學習

《吳恩達機器學習》學習筆記003_邏輯迴歸、正則化

《吳恩達機器學習》學習筆記008_聚類(Clustering)

吳恩達機器學習ex1

吳恩達-機器學習筆記-第一章

吳恩達機器學習（5）梯度下降

吳恩達機器學習（6）多元梯度下降法

吳恩達機器學習筆記——分類（二）

[Python]Python版吳恩達《機器學習》習題——線性迴歸

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-5 Matrix multiplication properties 矩陣相乘法則

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-4 Marix-matrix multiplication 矩陣-矩陣相乘

[ 機器學習 - 吳恩達 ] Linear Algebra review 線性代數回顧 | 3-3 Matrix-vector multiplication 矩陣-向量乘法

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

吳恩達深度學習課件_吳恩達深度學習筆記02.改善深層神經網路 W3.超引數除錯、Batch Norm和程式框架...

吳恩達深度學習課後作業第一課第二週-邏輯迴歸的拓展，自己做資料來進行預測是否是貓

機器學習中線性迴歸python程式設計注意事項

吳恩達深度學習筆記-2（程式設計基礎）

[Python]Python版吳恩達《機器學習》習題——線性迴歸

胡話

程式碼

梯度下降

正規方程

參考連結

相關推薦