tensorflow實戰3-利用seq2seq實現一個聊天機器人

阿新 • • 發佈：2019-02-09

具體介紹網路結構與訓練這塊
1、seq2seq程式碼

import tensorflow as tf
import numpy as np
import sys
class Seq2Seq(object):

    def __init__(self, xseq_len, yseq_len, 
            xvocab_size, yvocab_size,
            emb_dim, num_layers, ckpt_path,
            lr=0.0001, 
            epochs=10000, model_name='seq2seq_model' 
):

        # attach these arguments to self
        self.xseq_len = xseq_len
        self.yseq_len = yseq_len
        self.ckpt_path = ckpt_path
        self.epochs = epochs
        self.model_name = model_name


        # build thy graph
        #  attach any part of the graph that needs to be exposed, to the self 

        def __graph__():

            # placeholders
            tf.reset_default_graph()
            #  encoder inputs : list of indices of length xseq_len
            self.enc_ip = [ tf.placeholder(shape=[None,], 
                            dtype=tf.int64, 
                            name='ei_{}' 
.format(t)) for t in range(xseq_len) ]

            #  labels that represent the real outputs
            self.labels = [ tf.placeholder(shape=[None,], 
                            dtype=tf.int64, 
                            name='ei_{}'.format(t)) for t in range(yseq_len) ]

            #  decoder inputs : 'GO' + [ y1, y2, ... y_t-1 ]
            self.dec_ip = [ tf.zeros_like(self.enc_ip[0], dtype=tf.int64, name='GO') ] + self.labels[:-1]


            # Basic LSTM cell wrapped in Dropout Wrapper
            self.keep_prob = tf.placeholder(tf.float32)
            # define the basic cell
            basic_cell = tf.contrib.rnn.core_rnn_cell.DropoutWrapper(
                    tf.contrib.rnn.core_rnn_cell.BasicLSTMCell(emb_dim, state_is_tuple=True),
                    output_keep_prob=self.keep_prob)
            # stack cells together : n layered model
            stacked_lstm = tf.contrib.rnn.core_rnn_cell.MultiRNNCell([basic_cell]*num_layers, state_is_tuple=True)


            # for parameter sharing between training model
            #  and testing model
            with tf.variable_scope('decoder') as scope:
                # build the seq2seq model 
                #  inputs : encoder, decoder inputs, LSTM cell type, vocabulary sizes, embedding dimensions
                self.decode_outputs, self.decode_states = tf.contrib.legacy_seq2seq.embedding_rnn_seq2seq(self.enc_ip,self.dec_ip, stacked_lstm,
                                                    xvocab_size, yvocab_size, emb_dim)
                # share parameters
                scope.reuse_variables()
                # testing model, where output of previous timestep is fed as input 
                #  to the next timestep
                self.decode_outputs_test, self.decode_states_test = tf.contrib.legacy_seq2seq.embedding_rnn_seq2seq(
                    self.enc_ip, self.dec_ip, stacked_lstm, xvocab_size, yvocab_size,emb_dim,
                    feed_previous=True)

            # now, for training,
            #  build loss function

            # weighted loss
            #  TODO : add parameter hint
            loss_weights = [ tf.ones_like(label, dtype=tf.float32) for label in self.labels ]
            self.loss = tf.contrib.legacy_seq2seq.sequence_loss(self.decode_outputs, self.labels, loss_weights, yvocab_size)
            # train op to minimize the loss
            self.train_op = tf.train.AdamOptimizer(learning_rate=lr).minimize(self.loss)

        sys.stdout.write('<log> Building Graph ')
        # build comput graph
        __graph__()
        sys.stdout.write('</log>')



    '''
        Training and Evaluation

    '''

    # get the feed dictionary
    def get_feed(self, X, Y, keep_prob):
        feed_dict = {self.enc_ip[t]: X[t] for t in range(self.xseq_len)}
        feed_dict.update({self.labels[t]: Y[t] for t in range(self.yseq_len)})
        feed_dict[self.keep_prob] = keep_prob # dropout prob
        return feed_dict

    # run one batch for training
    def train_batch(self, sess, train_batch_gen):
        # get batches
        batchX, batchY = train_batch_gen.__next__()
        # build feed
        feed_dict = self.get_feed(batchX, batchY, keep_prob=0.5)
        _, loss_v = sess.run([self.train_op, self.loss], feed_dict)
        return loss_v

    def eval_step(self, sess, eval_batch_gen):
        # get batches
        batchX, batchY = eval_batch_gen.__next__()
        # build feed
        feed_dict = self.get_feed(batchX, batchY, keep_prob=1.)
        loss_v, dec_op_v = sess.run([self.loss, self.decode_outputs_test], feed_dict)
        # dec_op_v is a list; also need to transpose 0,1 indices 
        #  (interchange batch_size and timesteps dimensions
        dec_op_v = np.array(dec_op_v).transpose([1,0,2])
        return loss_v, dec_op_v, batchX, batchY

    # evaluate 'num_batches' batches
    def eval_batches(self, sess, eval_batch_gen, num_batches):
        losses = []
        for i in range(num_batches):
            loss_v, dec_op_v, batchX, batchY = self.eval_step(sess, eval_batch_gen)
            losses.append(loss_v)
        return np.mean(losses)

    # finally the train function that
    #  runs the train_op in a session
    #   evaluates on valid set periodically
    #    prints statistics
    def train(self, train_set, valid_set, sess=None ):

        # we need to save the model periodically
        saver = tf.train.Saver()

        # if no session is given
        if not sess:
            # create a session
            sess = tf.Session()
            # init all variables
            sess.run(tf.global_variables_initializer())

        sys.stdout.write('\n<log> Training started </log>\n')
        # run M epochs
        for i in range(self.epochs):
            try:
                self.train_batch(sess, train_set)
                if i  % 1000  == 0 and i != 0: # TODO : make this tunable by the user
                    # save model to disk
                    saver.save(sess, self.ckpt_path + self.model_name + '.ckpt', global_step=i)
                    # evaluate to get validation loss
                    val_loss = self.eval_batches(sess, valid_set, 16) # TODO : and this
                    # print stats
                    print('\nModel saved to disk at iteration #{}'.format(i))
                    print('val   loss : {0:.6f}'.format(val_loss))
                    sys.stdout.flush()
            except KeyboardInterrupt: # this will most definitely happen, so handle it
                print('Interrupted by user at iteration {}'.format(i))
                self.session = sess
                return sess

    def restore_last_session(self):
        saver = tf.train.Saver()
        # create a session
        sess = tf.Session()
        # get checkpoint state
        ckpt = tf.train.get_checkpoint_state(self.ckpt_path)
        # restore session
        if ckpt and ckpt.model_checkpoint_path:
            saver.restore(sess, ckpt.model_checkpoint_path)
        # return to user
        return sess

    # prediction
    def predict(self, sess, X):
        feed_dict = {self.enc_ip[t]: X[t] for t in range(self.xseq_len)}
        feed_dict[self.keep_prob] = 1.
        dec_op_v = sess.run(self.decode_outputs_test, feed_dict)
        # dec_op_v is a list; also need to transpose 0,1 indices 
        #  (interchange batch_size and timesteps dimensions
        dec_op_v = np.array(dec_op_v).transpose([1,0,2])
        # return the index of item with highest probability
        return np.argmax(dec_op_v, axis=2)

tensorflow實戰3-利用seq2seq實現一個聊天機器人

具體介紹網路結構與訓練這塊 1、seq2seq程式碼 import tensorflow as tf import numpy as np import sys class Seq2Seq(object): def __init__(sel

利用python製作一個聊天機器人

該程式基於TCP服務，首先上一下成果圖先是利用手機和服務端聊天(手機端用的是QPython3執行的python程式碼)：當然也可以在電腦上執行：程式碼如下：首先是服務端的

微信公眾平臺網頁開發實戰--3.利用JSSDK在網頁中獲取地理位置（HTML5+jQuery）

fff .html 1.4 style minimum log fill rdquo 位置復制一份JSSDK環境，創建一份index.html文件，結構如圖7.1所示。圖7.1 7.1節文件結構在location.js中，封裝“getLoc

3-3利用生成器實現可叠代對象

start info com cal prim 生成 rime shell div 包含yield語句的函數就是生成器函數。函數裏有yield關鍵字，則是生成器，生成器內置有__iter__方法，只不過調用__iter__返回的是生成器本身，利用這一特性，可以創建一個可叠

WPF和Expression Blend開發實例:充分利用Blend實現一個探照燈的效果

scree 時機調整位置 shift 矩形同時效果最終原文:WPF和Expression Blend開發實例:充分利用Blend實現一個探照燈的效果本篇文章閱讀的基礎是在讀者對於WPF有一定的了解並且有WPF相關的編碼經驗,對於Blend的界面布局有基礎的知識.

利用AOP實現一個簡單的快取儲存、清除的工具

基本要求：利用aop實現一個簡單的快取儲存、清除的工具，從實際使用上來說，切面應該在provider層。在service層方法呼叫和資料庫查詢之間生效。為了簡化過程，不要求與資料庫互動，資料可以隨機生成，不要求使用redis等中介軟體，可以直接快取到記憶體中。程式碼實現非常的基礎，能夠很好

前端每日實戰3.純 CSS 創作一個容器厚條紋邊框特效

原文地址：3.純 CSS 創作一個容器厚條紋邊框特效沒有啥好點子呀，不爽 HTML程式碼： <div class="box"> <div class="content"> <h2>What is Lorem Ip

.NET Core微服務之路：利用DotNetty實現一個簡單的通訊過程

　　上一篇我們已經全面的介紹過《基於gRPC服務發現與服務治理的方案》，我們先複習一下RPC的呼叫過程（筆者會在這一節的幾篇文章中反覆的強調這個過程呼叫方案），看下圖

Python實戰：利用Tkinter實現屏保程式

利用Tkinter實現綵球碰撞屏保一、架構與思路 (1)主函式： main()：通過類啟動程式； (2)類： ScreenSaver()：用於定義屏保和主畫布，呼叫球建立、運動等函式； RandomBall()：定義球的基本屬性、球建立與運動

C++利用模板實現一個佇列

開頭總結：.利用模板類實現了一個佇列，利用模板的好處是提供泛型程式設計，在儲存資料的時候會適應不同型別的資料，減少了程式碼的書寫，簡化了程式的結構。#include <iostream>

微信公眾平臺網頁開發實戰--3.利用JSSDK在網頁中獲取地理位置

複製一份JSSDK環境，建立一份index.html檔案，結構如圖7.1所示。圖7.1 7.1節檔案結構在location.js中，封裝“getLocation”介面，如下： 01 wxJSSDK.location = function(locationApi){

Python 3 利用 subprocess 實現管道( pipe )互動操作讀/寫通訊

1 # -*- coding:utf-8 -*- 2 3 import subprocess 4 import sys 5 import threading 6 7 class LoopException(Exception): 8 """迴圈異常自定義異常

利用Django實現一個部落格（附全部原始碼）

不論什麼語言，學Web開發必做的專案——個人部落格。本次專案基於Python的知名Web框架Django，從資料庫到檢視邏輯、再到模板語法，完整的走了一遍MTV開發流程。 markdown非常適合寫部落格、新聞類文章，也快成為了開發者寫開發文件的標配了。所

利用java實現一個簡單的連結串列結構

定義：所謂連結串列就是指在某節點儲存資料的過程中還要有一個屬性用來指向下一個連結串列節點，這樣的資料儲存方式叫做連結串列連結串列優缺點：優點：易於儲存和刪除缺點：查詢起來較麻煩下面我們用java來實現如下連結串列結構：首先定義節點類：複製程式碼package LinkTest;/*

利用java實現一個簡單的鏈表結構

oot null pri lin 遞歸遍歷 tom args oid per 定義：所謂鏈表就是指在某節點存儲數據的過程中還要有一個屬性用來指向下一個鏈表節點，這樣的數據存儲方式叫做鏈表鏈表優缺點：優點：易於存儲和刪除缺點：查詢起來較麻煩下面我們用java來實現如

evpp設計細節系列(1)：利用 enable_shared_from_this 實現一個自管理的定時器

0. 前言現在我們覆盤一下這個功能的實現細節和演化過程。 1. 基礎程式碼定時器原型宣告可能是下面的樣子： class InvokeTimer { public: InvokeTimer(struct event_base* ev

利用avalon 實現一個簡單的成績單

本文的靈感是來自Halower的這篇博文，他是使用knockout與jQuery實現的。不過我覺得MVVM本來就強大的事件繫結功能，因此用jQuery 是多此一舉。另，他也用了一些面向物件的寫法。我個人認為，純資料就該好好當純資料，作為資料模型（M）而存在，想操作資料，則交由檢視模型（VM）。在angular

Python利用heapq實現一個優先順序佇列

實現一個優先順序佇列，每次pop的元素要是優先順序高的元素，由於heapq.heapify(list)預設構建一個小頂堆，因此要將priority變為相反數再push，程式碼如下： import he

【IOS】利用ASIHTTPRequest 實現一個簡單的登陸驗證

【原創作品，歡迎轉載，轉載請在明顯處註明！謝謝。今天給大家帶來一個簡單的登陸驗證，用的是ASIHttpRequest 這個開源類庫，使用的方法很簡單，從網上下載下來以後，新增到專案中，並新增一下這些框架。下面上程式碼 // // ViewControll

【TensorFlow實戰】用Python實現自編碼器

程式碼： import numpy as np import sklearn.preprocessing as prep import tensorflow as tf from tensorflow.examples.tutorials.mnist impor

tensorflow實戰3-利用seq2seq實現一個聊天機器人

相關推薦