pytorch實現帶標籤格式資料的模型訓練

阿新 • • 發佈：2019-01-26

1.訓練資料讀入

注：以下模擬資料，主要講解方法。

標籤資料

下面函式即為實現標籤資料的讀入

def reader(txt):

fh = open(txt)
c=0
imgs=[]
class_names=[]
for line in fh.readlines():
if c==0:
class_names=[n.strip() for n in line.rstrip().split(' ')]
else:
cls = line.split()
fn = cls.pop(0)
imgs.append((fn, tuple([float(v) for v in cls])))
c=c+1

return class_names,imgs

其中，返回imgs是標籤元組，即[1,0,0,1]，class_names為屬性名，即sex。

如人臉特徵資料，也可以通過reader()讀入。

2.簡單模型設計（以全連層為例）

cmodel=nn.Linear(100, 2) ，（或者nn.Sequential(nn.Linear(100, 2))

class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.classify=cmodel
def forward(self, x):
x=self.classify(x)
return x,

3.模型訓練

訓練集讀入

train_data_loader = torch.utils.data.DataLoader( \
ImageFloder(root = "./fea.txt", label = "./label.txt"), batch_size= 2, shuffle= False, num_workers= 4)

其中，root，label分別是特徵與標籤檔案地址， ImageFloder類定義如下：

class ImageFloder(data.Dataset):
def __init__(self, root, label）：

self.classes1,self.imgs1 = reader(label)
self.classes2,self.imgs2 = reader(root)

def __getitem__(self, index):
fn1, label1 = self.imgs1[index]
fn2, label2 = self.imgs2[index]

return torch.Tensor(label1),torch.Tensor(label2)

def __len__(self):
return len(self.imgs1)

訓練程式碼詳見專案：

https://github.com/eeric/pytorch-model-training-label

pytorch實現帶標籤格式資料的模型訓練

pytorch實現帶標籤格式資料的模型訓練

【php】jquery中$.get實現解析json格式資料及jsonp跨域

Spark中元件Mllib的學習14之從文字中讀取帶標籤的資料，生成帶label的向量

Tika結合Tesseract-OCR 實現光學漢字識別（簡體、宋體的識別率百分之百）—附Java原始碼實現及真實測試資料和訓練集下載地址

實現yolo3模型訓練自己的資料集總結

【資源下載】《Pytorch模型訓練實現教程》（附下載連結）

Caffe中LMDB介面實現多標籤資料準備及訓練

Caffe 實現多標籤分類支援Multi-Label的ＬＭＤＢ資料格式輸入

CUHK 行人資料集　及　轉為ｙｏｌｏ訓練標籤格式

TensorFlow學習實踐（三）：使用TFRecord格式資料和tf.estimator API進行模型訓練和預測

韓國小哥哥用Pytorch實現谷歌最強NLP預訓練模型BERT | 程式碼

輕量化模型訓練加速的思考（Pytorch實現）

DL之Attention-ED：基於TF NMT利用帶有Attention的 ED模型訓練、測試(中英文平行語料庫)實現將英文翻譯為中文的LSTM翻譯模型過程全記錄

利用sklearn 中的線性迴歸模型訓練資料使用到的庫有numpy pandas matplotlib

基於Python3.7和opencv的人臉識別（含資料收集，模型訓練）

caffe之利用mnist資料集訓練好的lenet_iter_10000.caffemodel模型測試一張自己的手寫體數字

Navicat實現將資料模型匯出SQL檔案，迅速生成表

基於自制資料集的MobileNet-SSD模型訓練

Keras之DNN：利用DNN演算法【Input(8)→12+8(relu)→O(sigmoid)】利用糖尿病資料集訓練、評估模型(利用糖尿病資料集中的八個引數特徵預測一個0或1結果)

使用自己製作的coco格式的資料，訓練時候遇到的問題+roidb[0]['dataset'].classes IndexError: list index out of range

pytorch實現帶標籤格式資料的模型訓練

相關推薦