多分類任務中不同隱藏層層數對實驗結果的影響（使用GPU）

阿新 • • 發佈：2022-03-09

1 匯入包

import torch 
import torch.nn as nn
import numpy as np
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
from torch.utils.data import DataLoader,TensorDataset

2 匯入資料

train_dataset = torchvision.datasets.MNIST('../Dataset/MNIST/',download = True,train = True,transform = transforms.ToTensor() )
test_dataset  
= torchvision.datasets.MNIST('../Dataset/MNIST/',download = True,train = False,transform = transforms.ToTensor() )
train_x = train_dataset.data.cuda().type(torch.float32)
train_y = train_dataset.targets.cuda()
test_x = test_dataset.data.cuda().type(torch.float32)
test_y = test_dataset.targets.cuda()
batch_size  
= 64
train_data = TensorDataset(train_x,train_y)
train_iter = DataLoader(
    dataset = train_data,
    shuffle = True,
    batch_size = batch_size
)
test_data = TensorDataset(test_x,test_y)
test_iter = DataLoader(
    dataset = test_data,
    shuffle = True,
    batch_size = batch_size
)

3 定義模型

class 
 flatten(nn.Module):
    def __init__(self):
        super(flatten,self).__init__()
    def forward(self,x):
        return x.view(x.shape[0],784)

class  Linear1(nn.Module ):
    def __init__(self,num_input,num_hidden,num_output):
        super(Linear1,self).__init__()
        self.linear1 = nn.Linear(num_input,num_hidden)
        self.linear2 = nn.Linear(num_hidden,num_output)
        self.flatten = flatten()
        self.relu = nn.ReLU()
    def forward(self,input):
        out = self.flatten(input)
        out = self.relu(self.linear1(out))
        out = self.linear2(out)
        return out
class  Linear2(nn.Module ):
    def __init__(self,num_input,num_hidden1,num_hidden2,num_output):
        super(Linear1,self).__init__()
        self.linear1 = nn.Linear(num_input,num_hidden1)
        self.linear2 = nn.Linear(num_hidden1,num_hidden2)
        self.linear3 = nn.Linear(num_hidden2,num_output)
        self.flatten = flatten()
        self.relu = nn.ReLU()
    def forward(self,input):
        out = self.flatten(input)
        out = self.relu(self.linear1(out))
        out = self.relu(self.linear2(out))
        out = self.linear3(out)
        return out
class  Linear3(nn.Module ):
    def __init__(self,num_input,num_hidden1,num_hidden2,num_hidden3,num_output):
        super(Linear1,self).__init__()
        self.linear1 = nn.Linear(num_input,num_hidden1)
        self.linear2 = nn.Linear(num_hidden1,num_hidden2)
        self.linear3 = nn.Linear(num_hidden2,num_hidden3)
        self.linear4 = nn.Linear(num_hidden3,num_output)
        self.flatten = flatten()
        self.relu = nn.ReLU()
    def forward(self,input):
        out = self.flatten(input)
        out = self.relu(self.linear1(out))
        out = self.relu(self.linear2(out))
        out = self.relu(self.linear3(out))
        out = self.linear4(out)
        return out

4 定義損失函式和優化器

num_input,num_hidden,num_output = 784,256,10
lr = 0.001
net = Linear1(num_input,num_hidden,num_output).cuda()
loss = nn.CrossEntropyLoss(reduction='mean')
# optimizer = torch.optim.Adam(net.parameters(),lr = lr)
optimizer = torch.optim.SGD(net.parameters(),lr = lr)

5 定義訓練模型

def train(net,train_iter,test_iter,loss,num_epochs,batch_size,optimizer):
    train_ls ,test_ls, train_acc,test_acc = [],[],[],[]
    for epoch in range(num_epochs):
        train_ls_sum,train_acc_sum,n = 0,0,0
        for x,y in train_iter:
            y_pred = net(x)
            l = loss(y_pred,y)
            optimizer.zero_grad()
            l.backward()
            optimizer.step()
            train_ls_sum +=l
            train_acc_sum += (y_pred.argmax(dim = 1) == y).sum().item()
            n += x.shape[0] 
        train_ls.append(train_ls_sum)
        train_acc.append(train_acc_sum/n)
        
        test_ls_sum,test_acc_sum ,n = 0,0,0
        for x,y in test_iter:
            y_pred = net(x)
            l = loss(y_pred,y)
            test_ls_sum +=l
            test_acc_sum += (y_pred.argmax(dim = 1) == y).sum().item()
            n += x.shape[0] 
        test_ls.append(test_ls_sum)
        test_acc.append(test_acc_sum/n)
        print('epoch: %d, train loss: %f, test loss: %f , train acc: %f, test acc: %f  '
              %(epoch+1,train_ls[-1],test_ls[-1],train_acc[-1],test_acc[-1]))
    return train_ls,test_ls

6 開始訓練

num_epochs = 40
train_ls,test_ls = train(net,train_iter,test_iter,loss,num_epochs,batch_size,optimizer)

多分類任務中不同隱藏層層數對實驗結果的影響

1 匯入實驗所需要的包 import torch import torch.nn as nn import numpy as np import torchvision import torchvision.transforms as transforms

多分類任務中不同隱藏層層數對實驗結果的影響（使用GPU）

1 匯入包 import torch import torch.nn as nn import numpy as np import torchvision import torchvision.transforms as transforms

多分類任務中不同隱藏單元個數對實驗結果的影響

1 匯入實驗所需要的包 import torch import torch.nn as nn import numpy as np import torchvision import torchvision.transforms as transforms

關於NLP多分類任務評價指標的總結

點選這裡檢視sklearn官方文件 sklearn.metrics模組實現了幾個損失、得分和效用函式來衡量分類效能

分類任務中效能度量及程式碼

樣本　　正樣本：即屬於某一類（一般是所求的那一類）的樣本。在本例中是及格的學生。　　負樣本：即不屬於這一類的樣本。在本例中是不及格的學生。

不拆分單詞也可以做 NLP，哈工大最新模型在多項任務中打敗 BERT，還能直接訓練中文

眾所周知，BERT 在預訓練時會對某些單詞進行拆分（術語叫做“WordPiece”）。比如把“loved”、“loving”和“loves”拆分成“lov”、“ed”、“ing”和”es”。目的是縮減詞表、加快訓練速度，但這樣一來，在某些時

利用 torch.nn 實現前饋神經網路解決多分類任務

1 匯入實驗需要的包 import torch import numpy as np from torch import nn from torchvision.datasets import MNIST

神經網路訓練中，錯誤資料集對模型結果的影響有多大丨曼孚科技

人工智慧本質上是一門研究如何用機器代替人類的學科，工程師們嘗試用各種演算法模型來賦予機器像人類一樣的思考與聯想能力。

532--陣列中的 k-diff 數對（技巧+感悟）

題目給定一個整數陣列和一個整數 k，你需要在數組裡找到不同的 k-diff 數對，並返回不同的 k-diff 數對的數目。

python中單下劃線(_)和雙下劃線（__）的特殊用法

函式使用單下劃線_開頭　　使用單下劃線(_)開頭的函式_func不能被模組外部以: from module import *形式匯入。

vue專案中使用tinymce富文字的踩坑經歷（一）

在專案開發中，一般在後臺管理系統會有編輯需求，那我們就需要使用到富文字這個東西。現在在寫vue專案中就需要到富文字編輯器，所以給大家推薦一款富文字編輯器（TinyMCE）

牛客多校(2020第六場)C Combination of Physics and Maths（貪心）

題目連結：傳送門題解：　　此題就是一個矩陣的最後一行的數代表底面積，所有數的和為重量，求壓強P

Ubuntu中MySQL的安裝和配置 ——Ubuntu系統配置（三）

Ubuntu：20.04.1 MySQL：8.0.21 步驟來源：卡拉先生（裡面有些更詳細的說明） 1.安裝MySQL

儲存引擎系列（四）：不同型別的查詢語句如何設定索引（上）—— 資料表初始化

B+ 索引樹回顧上篇教程學院君給大家介紹了不同型別的資料庫索引對應的 B+ 樹是如何維護的，這其實是對資料庫表記錄進行更新時底層所做的（插入、修改、刪除）事情，我們來簡單回顧下 B+ 索引樹：

在JAVA中使用文件物件模型DOM經驗小結（轉）

文件物件模型 (DOM) 是一個文件標準，對於完備的文件和複雜的應用程式，DOM 提供了大量靈活性。DOM標準是標準的。它很強壯且完整，並且有許多實現。這是許多大型安裝的決定因素--特別是對產品應用程式，以避免在API發

Imagination推出IMG B系列圖形處理器（GPU）：多核技術創造更多可能

全新的多核選擇為所有市場提供最佳的GPU智慧財產權（IP）產品英國倫敦，2020年10月13日– Imagination Technologies宣佈推出全新的IMG B系列（IMG B-Series）圖形處理器（GPU），進一步擴充套件了其GPU智

jmeter中集合點和執行緒組的區別（四）

1.設定執行緒數：第一條請求的時間：最後一條請求的時間：你會發現：最後一條和第一條請求的時間相差5s

.NET中的執行緒本地儲存(TLS)與AsyncLocal（一）

技術標籤：C#教程c# 一、TLS# 執行緒本地儲存（Thread Local Storage），字面意思就是專屬某個執行緒的儲存空間。變數大體上分為全域性變數和區域性變數，一個程序中的所有執行緒共享地址空間，這個地址空間被劃

qt 用檔案存多個賬號密碼應該怎樣提取_本地檔案系統小記（一）：扇區和塊

技術標籤：qt 用檔案存多個賬號密碼應該怎樣提取簡單來說，扇區是對硬碟而言，塊是對檔案系統而言

Pytorch中的Distributed Data Parallel與混合精度訓練（Apex）

Pytorch中的Distributed Data Parallel與混合精度訓練（Apex）磐創AI昨天以下文章來源於Smarter，作者薰風初入弦

多分類任務中不同隱藏層層數對實驗結果的影響（使用GPU）

1 匯入包

2 匯入資料

3 定義模型

4 定義損失函式和優化器

5 定義訓練模型

6 開始訓練

相關推薦