serviceWorker離線載入與訊息推送
阿新 • • 發佈:2020-09-12
基礎⭐
生成模型
低維向量——高維資料(影象、文字、語音)
生成式對抗網路的目的就是訓練一個這樣的生成模型,生成我們想要的資料
程式碼部分
首先實現CGAN。下面分別是判別器和生成器的網路結構
- 生成器:(784 + 10) ==> 512 ==> 256 ==> 1
- 判別器:(100 + 10) ==> 128 ==> 256 ==> 512 ==> 784
下面為初始化
然後開始訓練
# 開始訓練,一共訓練total_epochs for epoch in range(total_epochs):# torch.nn.Module.train() 指的是模型啟用 BatchNormalization 和 Dropout # torch.nn.Module.eval() 指的是模型不啟用 BatchNormalization 和 Dropout # 因此,train()一般在訓練時用到, eval() 一般在測試時用到 generator = generator.train() # 訓練一個epoch for i, data in enumerate(dataloader): # 載入真實資料 real_images, real_labels = data real_images= real_images.to(device) # 把對應的標籤轉化成 one-hot 型別 tmp = torch.FloatTensor(real_labels.size(0), 10).zero_() real_labels = tmp.scatter_(dim=1, index=torch.LongTensor(real_labels.view(-1, 1)), value=1) real_labels = real_labels.to(device) # 生成資料 # 用正態分佈中取樣batch_size個隨機噪聲z = torch.randn([batch_size, z_dim]).to(device) # 生成 batch_size 個 ont-hot 標籤 c = torch.FloatTensor(batch_size, 10).zero_() c = c.scatter_(dim=1, index=torch.LongTensor(np.random.choice(10, batch_size).reshape([batch_size, 1])), value=1) c = c.to(device) # 生成資料 fake_images = generator(z,c) # 計算判別器損失,並優化判別器 real_loss = bce(discriminator(real_images, real_labels), ones) fake_loss = bce(discriminator(fake_images.detach(), c), zeros) d_loss = real_loss + fake_loss d_optimizer.zero_grad() d_loss.backward() d_optimizer.step() # 計算生成器損失,並優化生成器 g_loss = bce(discriminator(fake_images, c), ones) g_optimizer.zero_grad() g_loss.backward() g_optimizer.step() # 輸出損失 print("[Epoch %d/%d] [D loss: %f] [G loss: %f]" % (epoch, total_epochs, d_loss.item(), g_loss.item()))
隨機噪聲生成一組影象
#用於生成效果圖 # 生成100個隨機噪聲向量 fixed_z = torch.randn([100, z_dim]).to(device) # 生成100個one_hot向量,每類10個 fixed_c = torch.FloatTensor(100, 10).zero_() fixed_c = fixed_c.scatter_(dim=1, index=torch.LongTensor(np.array(np.arange(0, 10).tolist()*10).reshape([100, 1])), value=1) fixed_c = fixed_c.to(device) generator = generator.eval() fixed_fake_images = generator(fixed_z, fixed_c) plt.figure(figsize=(8, 8)) for j in range(10): for i in range(10): img = fixed_fake_images[j*10+i, 0, :, :].detach().cpu().numpy() img = img.reshape([28, 28]) plt.subplot(10, 10, j*10+i+1) plt.imshow(img, 'gray')
結果