神經網路機器翻譯(Neural Machine Translation, NMT)是最近幾年提出來的一種機器翻譯方法。相比於傳統的統計機器翻譯（SMT）而言，NMT能夠訓練一張能夠從一個序列對映到另一個序列的神經網路，輸出的可以是一個變長的序列，這在翻譯、對話和文字概括方面能夠獲得非常好的表現。NMT其實是一個encoder-decoder系統，encoder把源語言序列進行編碼，並提取源語言中資訊，通過decoder再把這種資訊轉換到另一種語言即目標語言中來，從而完成對語言的翻譯。

神經網路的seq2seq學習

序列對序列的學習，顧名思義，假設有一箇中文句子“我也愛你”和一個對應英文句子“I love you too”，那麼序列的輸入就是“我也愛你”，而序列的輸出就是“I love you too”，從而對這個序列對進行訓練。對於深度學習而言，如果要學習一個序列，一個重要的困難就是這個序列的長度是變化的，而深度學習的輸入和輸出的維度一般是固定的，不過，有了RNN結構，這個問題就可以解決了，一般在應用的時候encoder和decoder使用的是LSTM或GRU結構。

這裡寫圖片描述
如上圖，輸入一個句子ABC以及句子的終結符號< EOS>，輸出的結果為XYZ及終結符號< EOS>。在encoder中，每一時間步輸入一個單詞直到輸入終結符為止，然後由encoder的最後一個隱藏層 $h_{t}$ 作為decoder的輸入，在decoder中，最初的輸入為encoder的最後一個隱藏層，輸出為目標序列詞X，然後把該隱藏層以及它的輸出X作為下一時間步的輸入來生成目標序列中第二個詞Y，這樣依次進行直到< EOS>。下面看它詳細的模型。
給定一個輸入序列 $(x_{1}, \dots, x_{T})$ ，經過下面的方程迭代生成輸出序列 $(y_{1}, \dots, y_{T^{^{'}}})$

,⋯,yT′)：

\begin{matrix} (1) & h_{t} = f (W^{h x} x_{t} + W^{h h} h_{t - 1}) y_{t} = W^{y h} h_{t} \end{matrix}

其中，

W^{h x}

為輸入到隱藏層的權重，

W^{h h}

為隱藏層到隱藏層的權重，

h_{t}

為隱藏結點，

W^{y h}

為隱藏層到輸出的權重。
在這個結構中，我們的目標是估計條件概率

p (y_{1}, \dots, y_{T^{^{'}}} | x_{1}, \dots, x_{T})

，首先通過encoder的最後一個隱藏層獲得

(x_{1}, \dots, x_{T})

的固定維度的向量表示

v

，然後通過decoder進行計算

y_{1}, \dots, y_{T^{^{'}}}

的概率，這裡的初始隱藏層設定為向量

v

：

\begin{matrix} (2) & p (y_{1}, \dots, y_{T^{^{'}}} | x_{1}, \dots, x_{T}) = Π_{t = 1}^{T^{^{'}}} p (y_{t} | v, y_{1}, \dots, y_{t - 1}) \end{matrix}

在這個方程中，每個

p (y_{t} | v, y_{1}, \dots, y_{t - 1})

為一個softmax函式。
Sutskever等人在實際建模中有三點與上述描述不同：
1. 使用兩個LSTM模型，一個是用於encoder的，另一個用於decoder
2. 由於深層模型比淺層模型表現要好，所以使用了4層LSTM結構
3. 對輸入序列進行翻轉，即由原來的輸入ABC變成CBA。假設目標語言是XYZ，則LSTM把CBA對映為XYZ，之所以這樣做是因為A在位置上與X相近，B、C分別於Y、Z相近，實際上使用了短期依賴，這樣易於優化

帶注意力機制的seq2seq學習

Bahdanau等人在Sutskever研究的基礎上又提出了注意力機制，這種機制的主要作用就是在預測一個目標詞彙的時候，它會自動的查詢源語言序列中哪一部分與它相對應，並且在後續的查詢生詞中可以直接複製相對應的源語言詞，這在後面再講。

Encoder

Bahdanau等人使用的encoder是一個雙向RNN（bi-directional RNN），雙向RNN有前向和後向RNN組成，前向RNN $\vec{f}$ 正向讀取輸入序列（從 $x_{1}$ 到 $x_{T}$ ），並計算前向隱藏層狀態 $(\vec{h_{1}}, &a相關推薦 .r{ margin-bottom:10px; border-bottom:1px solid #f1f1f1; padding-bottom:10px;}
.r p{ color:#999; line-height:25px;}
.r h5 a{ font-size:16px; line-height:25px;}
.r h5 a:hover{ color:#ff6600} 神經網路機器翻譯總結神經網路機器翻譯(Neural Machine Translation, NMT)是最近幾年提出來的一種機器翻譯方法。相比於傳統的統計機器翻譯（SMT）而言，NMT能夠訓練一張能夠從一個序列對映到另一個序列的神經網路，輸出的可以是一個變長的序列，這在翻譯、對話和神經網路機器翻譯模型介紹以下是這個系列會引用的文獻：

References:
[1] Google’s Neural Machine Translation System:Bridging the Gap between Human and Machine Translation, 輕量化神經網路模型總結：SqueezeNet、Xception、MobileNet、ShuffleNet 總結今年來的幾個輕量化模型：SqueezeNet、Xception、MobileNet、ShuffleNet
下面給出時間軸：

2016.02 伯克利&斯坦福提出 SqueezeNet
2016.10 google提出 Xception
2017 卷積神經網路大總結大家都清楚神經網路在上個世紀七八十年代是著實火過一回的，尤其是後向傳播BP演算法出來之後，但90年代後被SVM之類搶了風頭，再後來大家更熟悉的是SVM、AdaBoost、隨機森林、GBDT、LR、FTRL這些概念。究其原因，主要是神經網路很難解決訓練的問題，比如梯度消神經網路大總結 1、感知神經網路
構造方法： net=newp(PR,S,TF,LF) PR：表示R*2矩陣，表示資料的大小範圍，minmax函式就可以
S：表示神經元個數，主要表示隱含層和輸 Amazon Translate 神經網路機器翻譯_自然語言處理 “Isentia 使用一種語言構建媒體情報軟體。為了提高我們的能力並滿足客戶的多樣化語言需求，我們需要翻譯支援，以便從非英語媒體內容中生成並提供寶貴的見解。在嘗試了多種機器翻譯服務後，我們對 Amazon Translate 印象深刻，它非常易於整合到我們的流程中，而且能輕鬆擴充套 6、神經網路學習總結 package com.jd;

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.List;

// 輸 NMT：神經網路機器翻譯前言

　　SMT是在神經網路之前最主流的翻譯模式，統計機器翻譯；NMT則是基於神經網路的翻譯模式，也是當前效果最好的翻譯模式。現在基於幾篇paper來梳理下神經網路下的翻譯模型。

NMT based RNN

1) First End-to-En Tensorflow學習筆記 (基礎-第一篇)------ 搭建神經網路，總結搭建八股 ---- 內容

1、基本概念

2、神經網三分鐘看懂神經網路機器翻譯神經網路機器翻譯 (NMT) 已成為本地化行業中最熱門的話題之一，與以往基於統計的機器翻譯 (SMT) 相比，可以使翻譯質量提升 30％，同時解決了遠距離語言對的複雜性問題，如中文到英語、日語到英語等。

SDL 的一項近期調查顯示，61％的受訪者認為機器翻譯 TensorFlow從1到2（十）帶注意力機制的神經網路機器翻譯基本概念
機器翻譯和語音識別是最早開展的兩項人工智慧研究。今天也取得了最顯著的商業成果。
早先的機器翻譯實際脫胎於電子詞典，能力更擅長於詞或者短語的翻譯。那時候的翻譯通常會將一句話打斷為一系列的片段，隨後通過複雜的程式邏輯對每一個片段進行翻譯，最終組合在一起。所得到的翻譯結果應當說似是而非，最大的問題是可卷積神經網路總結轉載自：https://www.cnblogs.com/skyfsm/p/6790245.html

從神經網路到卷積神經網路（CNN）我們知道神經網路的結構是這樣的：
那捲積神經網路跟它是什麼關係呢？其實卷積神經網路依舊是層級網路，只是層的功能和形式做了變化，可以說是傳關於訓練神經網路的諸多技巧Tricks(完全總結版) 歡迎訪問Oldpan部落格，分享人工智慧有趣訊息，持續醞釀深度學習質量文。
前言
很多人都說訓練神經網路和鍊金術師煉藥的過程相像，難以破解其中的黑盒子。其實不然，在訓練的時候我們依然可以通過大量的技巧去最大化我們的訓練效果，從而幫助我們的任務取得不錯的精度，這些技巧是訓練神經網路不可缺少的一環。
本文儘可能說關於RBF 神經網路的學習總結在這裡總結下科研需要用到的RBF神經網路知識。 https://www.cnblogs.com/pinking/p/9349695.html https://blog.csdn.net/guoyunlei/article/details/74529320 https://www.cnblog 神經網路總結（tensorflow） import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #匯入mnist資料集minst=input_data.read_data_sets($

神經網路機器翻譯總結

神經網路的seq2seq學習

帶注意力機制的seq2seq學習

Encoder

深度神經網路優化論文總結

神經網路常見概念總結

吳恩達深度學習筆記(15-21)總結-淺層神經網路總結

關於神經網路的一些心得總結

# [cs231n （八）神經網路總結：最小網路案例研究 ][1]