1. 程式人生 > >pytorch入門——邊學邊練02線性迴歸

pytorch入門——邊學邊練02線性迴歸

訪問本站觀看效果更佳

寫在前面

如果您先前看過吳恩達的機器學習教程,想必您對線性迴歸並不陌生。這個問題要如何用pytorch實現呢?接下來我們進行實戰操作。完整程式碼請參見linear_regression

我們會用到什麼包呢?

本節,我打算要用到Linear那麼肯定要引入torch.nn。然後要畫圖,還要設定資料~所以我們先匯入下面的包吧,不夠再加。

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

資料從哪裡來?

這裡我們構造一個簡單的資料集合,用x

去擬合y吧。

# Toy dataset
x_train = np.array([[3.3], [4.4], [5.5], [6.71], [6.93], [4.168], 
                    [9.779], [6.182], [7.59], [2.167], [7.042], 
                    [10.791], [5.313], [7.997], [3.1]], dtype=np.float32)

y_train = np.array([[1.7], [2.76], [2.09], [3.19], [1.694], [1.573], 
                    [3.366], [2.596], [2.53], [1.221], [2.827], 
                    [3.465], [1.65], [2.904], [1.3]], dtype=np.float32)

基本思路說一下

還記得上一節我們介紹的複雜一些的例子嗎?裡面提到了如何去構造一組線性關係。我們的思路很簡單,確定好輸入輸出tensor的維度,再利用nn.Linear()算一下就好了。
之前的例子裡,我們只進行了一次求導,似乎效果不是很好。這次我們就加個迴圈多做幾次。而且本例是線性迴歸,直接就是一條直線,其實還比前面的例子簡單些……

具體實現

記住我們的目標就是讓預測值與真實值y之間的差距越小越好。預測值是什麼?就是x經過Linear後得到的東西吧!讓我們先看看程式碼。

# Hyper-parameters
input_size = 1
output_size = 1
num_epochs = 60
learning_rate = 0.001
# Linear regression model
model = nn.Linear(input_size, output_size)

# Loss and optimizer
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)  

# Train the model
for epoch in range(num_epochs):
    # Convert numpy arrays to torch tensors
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    # Forward pass
    outputs = model(inputs)
    loss = criterion(outputs, targets)
    
    # Backward and optimize
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    if (epoch+1) % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, loss.item()))

結果如下所示:

Epoch [5/60], Loss: 1.7156
Epoch [10/60], Loss: 0.8695
Epoch [15/60], Loss: 0.5265
Epoch [20/60], Loss: 0.3873
Epoch [25/60], Loss: 0.3308
Epoch [30/60], Loss: 0.3077
Epoch [35/60], Loss: 0.2981
Epoch [40/60], Loss: 0.2941
Epoch [45/60], Loss: 0.2923
Epoch [50/60], Loss: 0.2913
Epoch [55/60], Loss: 0.2908
Epoch [60/60], Loss: 0.2904

上一節只是單純的求導一次,現在我們看看多次求導的情況。每一輪從numpy中讀取訓練資料以及目標資料y。把input送入model(實際上就是一個nn.Linear),計算損失MSE。這裡的損失計算我們為了減少工作量,採用pytorch提供的包來完成,具體計算過程參見上節,裡面有詳細公式以及說明。
設定好了loss,我們求一下導數,利用優化器裡提供的方法使loss不斷變小。每輪optimizer.step()執行一次。就是這麼簡單。

看看結果如何

說了這麼多,我們看看怎麼視覺化訓練結果吧。此處我們用到了plt模組。複雜的功能後續再接觸。注意經過之前的訓練model的引數已經優化了。我們只要再把traindata再輸入一遍model就可以了,此處detach的意思也就是不再跟蹤梯度。

# Plot the graph
predicted = model(torch.from_numpy(x_train)).detach().numpy()
plt.plot(x_train, y_train, 'ro', label='Original data')
plt.plot(x_train, predicted, label='Fitted line')
plt.legend()
plt.show()

image
別忘了儲存一下模型:

# Save the model checkpoint
torch.save(model.state_dict(), 'model.ckpt')

線性迴歸的內容就介紹到這裡了~