pytorch筆記：08)使用LSTM寫古詩詞

阿新 • • 發佈：2018-11-10

測試環境：
centos7 + python3.6 + pytorch0.4 +cuda9

下面是用模型生成的藏頭詩(深度學習)

深宮昔時見，古貌多自有。
度日不相容，年年生一目。
學者若為霖，百姓貽憂厄。
習坎與天聰，優遊寧敢屢。

訓練資料
57580首詩歌，每首詩歌，書(pytorch入門與實踐)的作者對其進行了預處理，每首詩歌長度125字元(不足補空格，超過則丟棄)
下面data.py檔案用於提取資料

import numpy as np
import os

def get_data(conf):
    '''
    生成資料
    :param conf: 配置選項,Config物件
    :return: word2ix: 每個字元對應的索引id,如u'月'->100
    :return: ix2word: 每個字元對應的索引id,如100->u'月'
    :return: data: 每一行是一首詩對應的字的索引id
    ''' 

    if os.path.exists(conf.data_path):
        datas = np.load(conf.data_path) #np資料檔案
        data = datas['data']
        ix2word = datas['ix2word'].item()
        word2ix = datas['word2ix'].item()
        return data, word2ix, ix2word

配置檔案

class Config(object):
    """Base configuration class.For custom configurations, create a
    sub-class that inherits from this one and override  properties that
    need to changed
    """ 

    #模型儲存路徑字首(幾個epoch後儲存)
    model_prefix='checkpoints/tang'

    #模型儲存路徑
    model_path='checkpoints/tang.pth'

    #start words
    start_words='春江花月夜'

    #生成詩歌的型別,預設為藏頭詩
    p_type='acrostic'

    # 訓練次數
    max_epech = 200

    #資料存放的路徑
    data_path='tang.npz'

    #mini批大小
    batch_size=128

    #dataloader載入資料使用多少程序 

    num_workers=4

    #LSTM的層數
    num_layers=2

    #詞向量維數
    embedding_dim=128

    #LSTM隱藏層維度
    hidden_dim=256

    #多少個epoch儲存一次模型權重和詩
    save_every=10

    #訓練是生成詩的儲存路徑
    out_path='out'

    #測試生成詩的儲存路徑
    out_poetry_path='out/poetry.txt'

    #生成詩的最大長度
    max_gen_len=200

模型定義

class PoetryModel(nn.Module):
    def __init__(self, vocab_size, conf, device):
        super(PoetryModel, self).__init__()
        self.num_layers = conf.num_layers
        self.hidden_dim = conf.hidden_dim
        self.device = device
        # 定義詞向量層
        self.embeddings = nn.Embedding(vocab_size, conf.embedding_dim)
        # 定義2層的LSTM，並且batch位於函式引數的第一位
        self.lstm = nn.LSTM(conf.embedding_dim, conf.hidden_dim, num_layers=self.num_layers)
        # 定義全連線層,後接一個softmax進行分類
        self.linear_out = nn.Linear(conf.hidden_dim, vocab_size)

    def forward(self, input, hidden=None):
        '''
        :param input: (seq,batch)
        :return: 模型的結果
        '''
        seq_len, batch_size = input.size()
        # embeds_size:(seq_len,batch_size,embedding_dim)
        embeds = self.embeddings(input)
        if hidden is None:
            h0 = torch.zeros(self.num_layers, batch_size, self.hidden_dim).to(self.device)
            c0 = torch.zeros(self.num_layers, batch_size, self.hidden_dim).to(self.device)
        else:
            h0, c0 = hidden
        output, hidden = self.lstm(embeds, (h0, c0))
        # output_size:(seq_len*batch_size,vocab_size)
        output = self.linear_out(output.view(seq_len * batch_size, -1))
        return output, hidden

模型訓練

def train(**kwargs):
    conf = Config()
    for k, v in kwargs.items():
        setattr(conf, k, v)
    # 獲取資料
    data, word2ix, ix2word = get_data(conf)
    # 生成dataload
    dataloader = DataLoader(dataset=data, batch_size=conf.batch_size,
                            shuffle=True,
                            drop_last=True,
                            num_workers=conf.num_workers)
    # 定義模型
    model = PoetryModel(len(word2ix), conf, device).to(device)
    # 定義優化器
    optimizer = Adam(model.parameters())
    # 定義損失函式
    criterion = nn.CrossEntropyLoss()
    # 開始訓練模型
    for epoch in range(conf.max_epech):
        epoch_loss = 0
        for i, data in enumerate(dataloader):
            data = data.long().transpose(1, 0).contiguous()
            input, target = data[:-1, :], data[1:, :]
            input, target = input.to(device), target.to(device)
            optimizer.zero_grad()
            output, _ = model(input)
            loss = criterion(output, target.view(-1))
            loss.backward()
            optimizer.step()
            epoch_loss += loss.item()
        print("epoch_%d_loss:%0.4f" % (epoch, epoch_loss / conf.batch_size))
        if epoch % conf.save_every == 0:
            fout = open('%s/p%d' % (conf.out_path, epoch), 'w')
            for word in list('春江花月夜'):
                gen_poetry = generate(model, word, ix2word, word2ix, conf)
                fout.write("".join(gen_poetry) + "\n\n")
            fout.close()
            torch.save(model.state_dict(), "%s_%d.pth" % (conf.model_prefix, epoch))

本內容參考陳雲《pytorch入門與實踐》

pytorch筆記：08)使用LSTM寫古詩詞

測試環境： centos7 + python3.6 + pytorch0.4 +cuda9 下面是用模型生成的藏頭詩(深度學習) 深宮昔時見，古貌多自有。度日不相容，年年生一目。學者若為霖，百姓貽憂厄。習坎與天聰，優遊寧敢屢。訓練資料 57580首詩歌，每首詩歌，

pytorch筆記：07)LSTM

LSTM的介紹博文：https://colah.github.io/posts/2015-08-Understanding-LSTMs/ 官方AIP：https://pytorch.org/docs/stable/nn.html?#torch.nn.LSTM 一個栗子，假如我們輸入

pytorch筆記：05)UNet網路簡單實現

語義分割的相關介紹可參考該部落格： https://blog.csdn.net/u012931582/article/details/70314859 程式碼參考圖1設計，黑色加粗的標註是筆者新增的，和程式碼中的變數對應圖1 Unet

pytorch筆記：04)resnet網路&解決輸入影象大小問題

因為torchvision對resnet18-resnet152進行了封裝實現，因而想跟蹤下原始碼(^▽^) 首先看張核心的resnet層次結構圖(圖1)，它詮釋了resnet18-152是如何搭建的，其中resnet18和resnet34結構類似，而resnet50-resnet1

pytorch筆記：03)softmax和log_softmax，以及CrossEntropyLoss

softmax在神經網路裡面比較常見，簡而言之，就是多分類的概率輸出 sotfmax(xi)=exp(xi)∑jexp(xj) s o t

pytorch筆記：06)requires_grad和volatile

requires_grad Variable變數的requires_grad的屬性預設為False,若一個節點requires_grad被設定為True，那麼所有依賴它的節點的requires_grad都為True。 x=Variable(torch.ones(1)) w=Vari

學習筆記：利用markdown寫readme文件（Udacity學城）

週末逛知乎等資訊平臺的時候，無意間瞭解到Udacity學城有一期關於利用markdown撰寫readme文件的教程，想到CSDN部落格也提供了markdown編輯功能，而自己到現在還不會用，看著自己寫的醜陋的部落格，決定趁此機會學習一下。於是乎，在學習過程中寫了

pytorch筆記：09)Attention機制

剛從影象處理的hole中攀爬出來，剛走一步竟掉到了另一個hole（fire in the hole*▽*） 1.RNN中的attention pytorch官方教程：https://pytorch.org/tutorials/intermediate/seq2seq_translatio

pytorch學習：MNIST手寫數字識別程式碼

# -*- coding: utf-8 -*- """ Created on Mon Sep 3 08:38:27 2018 @author: www """ import torch from torch import nn from torchvision.data

百度微服務架構師隨手筆記：教你如何手寫Docker

names lar 朋友 -i oot 封裝路由必須 spa 模擬Docker實現一個簡單的容器，不到 200行代碼（包括空行、註釋、異常處理），這並不是吹牛B。容器技術幾乎是Linux kernel內置的模塊，我們簡單調用一下API就能搞定很多事情。當然你要考慮各種商

網站建設筆記：為什麽中小學生寫讀後感都上百家筆記網？（圖）

信息推薦 pan left 就是人工 ali http 通過網站建設筆記：為什麽中小學生寫讀後感都上百家筆記網？（圖）一到寒暑假，所有的學生們都萬的不亦樂乎，但是到了寒暑假尾期，大家又要開始寫作業了，那麽，為什麽百家筆記網得到了廣大學生們的喜愛，並且寫讀後感和讀書筆記

STM32學習筆記：讀寫內部Flash（介紹+附程式碼）

原文地址::https://www.cnblogs.com/pertor/p/9484663.html 相關文章 1、STM32學習筆記：讀寫內部Flash----https://blog.csdn.net/qq_33559992/article/details/77676716 2、S

opencv學習筆記三十九：視訊讀寫

VideoCapture：視訊抓取的類 VideoWriter ：寫視訊的類 fps（frame per second）幀率：每秒抓取顯示多少幀 #include<opencv2\opencv.hpp> using namespace cv; int m

機器學習筆記：tensorflow實現卷積神經網路經典案例--識別手寫數字

從識別手寫數字的案例開始認識神經網路，並瞭解如何在tensorflow中一步步建立卷積神經網路。安裝tensorflow 資料來源 kaggle新手入門的數字識別案例，包含手寫0-9的灰度值影象的csv檔案，下載地址：https://www.

Tensorflow學習筆記：讀取二進位制檔案、讀寫TFRecord檔案

#影象基本知識 OpenCV已經學過 #圖片操作目的：增加圖片資料的統一性：大小與格式統一縮小圖片資料量，防止增加開銷 #圖片操作：放大或縮小

pytorch入門與實踐學習筆記：chapter5 工具篇

目錄 1.資料載入 2.資料預處理 torchvision.transforms.Compose(transforms) torchvision.transforms.Scale(size, interpolation=2) torchvision.transf

pytorch入門與實踐學習筆記：chapter6 貓狗大戰

1. 程式的組成架構前面提到過，程式主要包含以下功能：模型定義資料載入訓練模型訓練過程視覺化測試 2.關於__init__.py 可以看到，幾乎每個資料夾下都有`__init__.py`，一個目錄如果包含了`__init

學習筆記：《深度學習框架PyTorch入門與實踐》（陳雲）Part1

學習筆記：《深度學習框架PyTorch入門與實踐》（陳雲）Part1 2017年1月，FAIR團隊在GitHub上開源了PyTorch。常見的深度學習框架：

TensorFlow筆記之一：MNIST手寫數字識別

本人剛剛開始接觸深度學習不久，對於tensorflow的瞭解也有限，想通過tensorflow這個框架來學習深度學習及其優化與識別。現在直接進入主題。 1.手寫識別的介紹： MNIST手寫識別在機器學習中就像c語言中Hello Wor

影象隱寫術分析論文筆記：Deep learning for steganalysis via convolutional neural networks

好久沒有寫論文筆記了，這裡開始一個新任務，即影象的steganalysis任務的深度網路模型。現在是論文閱讀階段，會陸續分享一些相關論文，以及基礎知識，以及傳統方法的思路，以資借鑑。這一篇是Media Watermarking, Security, and Forensi

pytorch筆記：08)使用LSTM寫古詩詞

相關推薦