seq2seq聊天模型（三）—— attention 模型

阿新 • • 發佈：2019-01-26

num 同仁 gif 技術 .com lstm 一起 coder 一個

註意力seq2seq模型

大部分的seq2seq模型，對所有的輸入，一視同仁，同等處理。

但實際上，輸出是由輸入的各個重點部分產生的。

比如：
技術分享圖片

（舉例使用，實際比重不是這樣）
對於輸出“晚上”，

各個輸入所占比重: 今天-50%，晚上-50%，吃-100%，什麽-0%

對於輸出“吃”，

各個輸入所占比重: 今天-0%，晚上-0%，吃-100%，什麽-0%

特別是在seq2seq的看圖說話應用情景中

技術分享圖片

睡覺還握著筆的baby

這裏的重點就是baby，筆！通過這些重點，生成描述。

下面這個圖，就是attention的關鍵原理

技術分享圖片

tensorlfow 代碼

encoder 和常規的seq2seq中的encoder一樣，只是在attention模型中，不再需要encoder累計的state狀態，需要的是各個各個分詞的outputs輸出。

在訓練的時候，將這個outputs與一個權重值一起擬合逼進目標值。

這個權重值，就是各個輸入對目標值的貢獻占比，也就是註意力機制！

dec_cell = self.cell(self.hidden_size)

attn_mech = tf.contrib.seq2seq.LuongAttention(
    num_units=self.attn_size,  # 註意機制權重的size
    memory=self.enc_outputs,  # 主體的記憶，就是decoder輸出outputs
    memory_sequence_length=self.enc_sequence_length,
    #   normalize=False,
    name=‘LuongAttention‘)

dec_cell = tf.contrib.seq2seq.AttentionWrapper(
    cell=dec_cell,
    attention_mechanism=attn_mech,
    attention_layer_size=self.attn_size,
    #  attention_history=False, # (in ver 1.2)
    name=‘Attention_Wrapper‘)
initial_state = dec_cell.zero_state(dtype=tf.float32, batch_size=batch_size)

# output projection (replacing `OutputProjectionWrapper`)
output_layer = Dense(dec_vocab_size + 2, name=‘output_projection‘)


 # lstm的隱藏層size和attention 註意機制權重的size要相同

seq2seq聊天模型（三）—— attention 模型

num 同仁 gif 技術 .com lstm 一起 coder 一個註意力seq2seq模型大部分的seq2seq模型，對所有的輸入，一視同仁，同等處理。但實際上，輸出是由輸入的各個重點部分產生的。比如：（舉例使用，實際比重不是這樣）對於輸出“晚上”，各個

YII用戶註冊和用戶登錄（三）之模型中規則制定和分析

模型 als del 郵箱收信 com unique mark div 3 模型中規則制定和分析 YII模型主要分為兩類，一個數據模型，處理和數據庫相關的增刪改查。繼承CActiveRecord。還有一個是表單模型，繼承CFormModel。不與數據庫進行交互。操作

隱馬爾可夫模型（三）

image 之前下標如何最大路 mage 局部最優 .com 紅色預測算法還記得隱馬爾可夫模型的三個問題嗎？本篇介紹第三個問題：預測問題，即給定模型參數和觀測序列，求最有可能的狀態序列，有如下兩種算法。近似算法在每個時刻t選出當前最有可能的狀態 it，從而得到

如何“謹慎”使用“數據驅動”的風控模型（三）——監控篇

pro sha nag -o 異常靈活目的去除決策體系之前小編介紹了謹慎使用“數據驅動”的風控模型，需要“高質量的數據 + 審慎嚴謹的決策模型 + 實時全面的監控分析”動態閉環。動態閉環能夠“動態”起來，需要最後一個步驟“監控”把關，全面、細致的分析、評估決策效果

Django中模型（三）

filter 將不 urn object delete tro super 數據庫 delet Django中模型（三）四、模型成員 1、類屬性 objects：是Manager類的一個對象，作用是與數據庫進行交互。定義模型類時，沒有定義管理器，則默認創建名為o

深入理解Java內存模型（三）——順序一致性

內存空間寫入方便語言 body 一半同步 java語言 post 本文轉自：http://www.infoq.com/cn/articles/java-memory-model-3 數據競爭與順序一致性保證當程序未正確同步時，就會存在數據競爭。java內存模型規範

統計學（二）之一般線性模型（三）

多因素方差分析與單因素方差分析不同的是，多個處理的自變數。表中第四行第五行都是主效應，第六行是互動效應。對互動作用的進一步檢驗當方差分析發現一個兩次互動作用時，需要進一步檢驗，以說明兩個因素之間互動作用的實質。方法一：互動作用的圖解一般線性模型-繪製相

opengl學習筆記（三）——玩弄模型（使用者互動）

經過前面兩節的功夫，我們算是搞到了一個還算可以的模型，但我們想要把模型翻來翻去，移動一下還是不行的。並且，根據使用者（老師）需求，我們要讓模型能以線框，點的方式繪製。也就有了這最後一講。首先，我們通過滑鼠左鍵來旋轉物體。這就需要在滑鼠回撥函式裡下功夫了 if (state == GLUT_DO

達觀杯_構建模型（三）lightGBM

countvector(a)+doc(a)+hash(a) """ 1.特徵：countvector(a)+doc(a)+hash(a) 2.模型：lgb """ import numpy as np import pandas as pd from sklea

C++學習筆記（三）記憶體模型、名稱空間、物件和類

1、標頭檔案中通常包含的內容：函式原型、使用#define和const定義的符號常量、結構宣告、類宣告、模板宣告、行內函數 2、同樣可以使用條件編譯 3、靜態持續變數：外部連結性、內部連結性、無連結性靜態持續變數：外部連結性、內部連結性、無連結性外部連結性：在程式碼塊

（三）Django2——模型與站點

資料庫配置開啟 mysite/settings.py 。這是個包含了 Django 專案設定的 Python 模組。通常，這個配置檔案使用 SQLite 作為預設資料庫。本篇文章將利用MySQL作為示例。修改mysite/settings.py配置檔案資料庫設定模

Netty Reator（三）Reactor 模型

Netty Reator（三）Reactor 模型 Netty 系列目錄 (https://www.cnblogs.com/binarylei/p/10117436.html) 本文介紹 DC Schmidt 大神的一篇文章《Reactor: an object behavioral pattern fo

JVM——記憶體模型（三）：堆與方法區

前兩篇部落格我們認識了程式計數器、虛擬機器棧與本地方法棧。今天我們來一起認識一下堆與方法區。關於堆記憶體，我之前有寫過一篇關於堆外記憶體的部落格，裡面有詳細介紹堆記憶體。這裡為了觀看方便，就直接把關於堆內記憶體的部分拿過來咯。（想了解堆內記憶體與堆外記憶體的夥伴們，可以參考：Java——堆外記

IO通訊模型（三）多路複用IO

多路複用IO 從非阻塞同步IO的介紹中可以發現，為每一個接入建立一個執行緒在請求很多的情況下不那麼適用了，因為這會漸漸耗盡伺服器的資源，人們也都意識到了這個問題，因此終於有人發明了IO多路複用。最大的特點就是不需要開那麼多的執行緒和程序。多路複用IO是指使

深入理解Java記憶體模型（三）——順序一致性

資料競爭與順序一致性保證當程式未正確同步時，就會存在資料競爭。java記憶體模型規範對資料競爭的定義如下：在一個執行緒中寫一個變數，在另一個執行緒讀同一個變數，而且寫和讀沒有通過同步來排序。當代碼中包含資料競爭時，程式的執行往往產生違反直覺的結果（前一章的示例正是如此）。如果一

Akka併發程式設計——第四節：Actor模型（三）

本將主要內容： 1. Actor引用、Actor路徑 1. Actor引用、Actor路徑下圖是Akka官方文件中給出的一張圖該圖清晰地說明了ActorPath，ActorRef，Actor及ActorSystem之間的關係，並說明了Actor整

隱馬爾科夫模型（三）學習演算法

隱馬爾科夫模型的學習，根據訓練資料時包括觀測序列和對應的狀態序列還是隻有觀測序列，可以分別有監督學習和非監督學習實現。監督學習方法假設已給的訓練資料中，包含S個長度相同的觀測序列和對應的狀態序列 {

java執行緒深度解析（三）——併發模型（Future）

Main：啟動系統，呼叫Client發出請求； Client：返回Data物件，理解返回FutureData，並開啟ClientThread執行緒裝配RealData； Data：返回資料的介面； FutureData：Future資料，構造很快，但是是一個虛擬的資料，需要裝配RealData； RealD

SpringMVC之http的請求響應模型（三）

URL組成：協議（http，https）+域名(.cn /.com)+埠號（預設為8080/80）+請求的資源請求引數定位（#如錨點） request：請求行-----請求方法（get/post）請求的資源協議版本號狀態碼

卷積神經網路簡單的應用（三）：模型測試

模型測試模型訓練好之後通過重新載入模型的方式進行模型測試，使用Tensorflow中的Saver物件。相關程式碼如下：def test_cnn(x_data): output = create_cnn(4) saver = tf.train.Saver()

seq2seq聊天模型（三）—— attention 模型

註意力seq2seq模型

下面這個圖，就是attention的關鍵原理

tensorlfow 代碼

相關推薦