1. 程式人生 > >梯度下降解決線性迴歸

梯度下降解決線性迴歸

今天主要是想和大家分享一下使用梯度下降解決線性迴歸問題,使用的框架是TensorFlow,開發環境在Linux ubuntu

其中需要用到的Python庫有numpy和matplotlib,大家對這兩個庫不清楚的可以直接Google 或者百度一下哈。

首先我們使用numpy的正態分佈函式隨機生成100個點,這些(x,y)對應的線性方程為y=0.1*x+0.2,weigth=0.1,bias=0.2;然後我們使用py去生成100個真實data

# 構建資料
points_num = 100
vectors = []
# 用 Numpy 的正態隨機分佈函式生成 100 個點
# 這些點的(x, y)座標值對應線性方程 y = 0.1 * x + 0.2
# 權重(Weight)為 0.1,偏差(Bias)為 0.2
for i in xrange(points_num):
    x1 = np.random.normal(0.0, 0.66)
    y1 = 0.1 * x1 + 0.2 + np.random.normal(0.0, 0.04)
    vectors.append([x1, y1])

x_data = [v[0] for v in vectors] # 真實的點的 x 座標
y_data = [v[1] for v in vectors] # 真實的點的 y 座標

生成了100個隨機點之後,我們就需要利用matplotlib庫來繪製圖標,進行資料展示

# 影象 1 :展示 100 個隨機資料點
plt.plot(x_data, y_data, 'r*', label="Original data") # 紅色星形的點
plt.title("Linear Regression using Gradient Descent")
plt.legend()#將oraginal data 標籤展示
plt.show()

接著,我們需要利用tensorflow框架來構建我們的線性迴歸模型

# 構建線性迴歸模型
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0)) # 初始化 Weight
b = tf.Variable(tf.zeros([1]))                     # 初始化 Bias
y = W * x_data + b                                 # 模型計算出來的 y


瞭解過一點深度學習的人都知道,有一個概念非常重要,loss function。基本上所有模型的訓練都是求這個loss最小,所以接下來我們需要求loss function,然後再去優化我們的loss function來擬合出最優的直線

# 定義 loss function(損失函式)或 cost function(代價函式)
# 對 Tensor 的所有維度計算 ((y - y_data) ^ 2) 之和 / N
loss = tf.reduce_mean(tf.square(y - y_data))

# 用梯度下降的優化器來優化我們的 loss functioin
optimizer = tf.train.GradientDescentOptimizer(0.5) # 設定學習率為 0.5
train = optimizer.minimize(loss)

深度學習模型需要不斷去使用資料訓練才可以得到比較優的model,然後因為這個model比較簡單,所以訓練20次就差不多了。

# 建立會話
sess = tf.Session()

# 初始化資料流圖中的所有變數
init = tf.global_variables_initializer()
sess.run(init)

# 訓練 20 步
for step in xrange(20):
    # 優化每一步
    sess.run(train)
    # 打印出每一步的損失,權重和偏差
    print("Step=%d, Loss=%f, [Weight=%f Bias=%f]") \
            % (step, sess.run(loss), sess.run(W), sess.run(b))

model訓練完成後,我們可以使用matplotlib來將訓練的model進行展示出來,看看我們訓練的效果,程式碼如下:

# 建立會話
sess = tf.Session()

# 初始化資料流圖中的所有變數
init = tf.global_variables_initializer()
sess.run(init)

# 訓練 20 步
for step in xrange(20):
    # 優化每一步
    sess.run(train)
    # 打印出每一步的損失,權重和偏差
    print("Step=%d, Loss=%f, [Weight=%f Bias=%f]") \
            % (step, sess.run(loss), sess.run(W), sess.run(b))

備註:下面為所有的程式碼,總的來說,這個demo還是比較簡單的,感興趣的小夥伴們可以自己去跑一下我這個demo哦


-*- coding: UTF-8 -*-

'''
用梯度下降的優化方法來快速解決線性迴歸問題
'''

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

# 構建資料
points_num = 100
vectors = []
# 用 Numpy 的正態隨機分佈函式生成 100 個點
# 這些點的(x, y)座標值對應線性方程 y = 0.1 * x + 0.2
# 權重(Weight)為 0.1,偏差(Bias)為 0.2
for i in xrange(points_num):
    x1 = np.random.normal(0.0, 0.66)
    y1 = 0.1 * x1 + 0.2 + np.random.normal(0.0, 0.04)
    vectors.append([x1, y1])

x_data = [v[0] for v in vectors] # 真實的點的 x 座標
y_data = [v[1] for v in vectors] # 真實的點的 y 座標

# 影象 1 :展示 100 個隨機資料點
plt.plot(x_data, y_data, 'r*', label="Original data") # 紅色星形的點
plt.title("Linear Regression using Gradient Descent")
plt.legend()
plt.show()

# 構建線性迴歸模型
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0)) # 初始化 Weight
b = tf.Variable(tf.zeros([1]))                     # 初始化 Bias
y = W * x_data + b                                 # 模型計算出來的 y

# 定義 loss function(損失函式)或 cost function(代價函式)
# 對 Tensor 的所有維度計算 ((y - y_data) ^ 2) 之和 / N
loss = tf.reduce_mean(tf.square(y - y_data)
# 用梯度下降的優化器來優化我們的 loss functioin
optimizer = tf.train.GradientDescentOptimizer(0.5) # 設定學習率為 0.5
train = optimizer.minimize(loss)

# 建立會話
sess = tf.Session()

# 初始化資料流圖中的所有變數
init = tf.global_variables_initializer()
sess.run(init)

# 訓練 20 步
for step in xrange(20):
    # 優化每一步
    sess.run(train)
    # 打印出每一步的損失,權重和偏差
    print("Step=%d, Loss=%f, [Weight=%f Bias=%f]") \
            % (step, sess.run(loss), sess.run(W), sess.run(b))

# 影象 2 :繪製所有的點並且繪製出最佳擬合的直線
plt.plot(x_data, y_data, 'r*', label="Original data") # 紅色星形的點
plt.title("Linear Regression using Gradient Descent")
plt.plot(x_data, sess.run(W) * x_data + sess.run(b), label="Fitted line") # 擬合的線
plt.legend()
plt.xlabel('x')
plt.ylabel('y')
plt.show()

# 關閉會話
sess.close()