1. 程式人生 > >Transformer【Attention is all you need】

Transformer【Attention is all you need】

nsf 打開 enc 一個 png 分別是 att 參考 for

前言

Transfomer是一種encoder-decoder模型,在機器翻譯領域主要就是通過encoder-decoder即seq2seq,將源語言(x1, x2 ... xn) 通過編碼,再解碼的方式映射成(y1, y2 ... ym), 之前的做法是用RNN進行encode-decoder,但是由於RNN在某一時間刻的輸入是依賴於上一時間刻的輸出,所以RNN不能並行處理,導致效率低效,而Transfomer就避開了RNN,因此encoder-decoder效率高。

Transformer

從一個高的角度來看Transformer,它就是將源語言 轉換 成目標語言

技術分享圖片

打開Transformer單元,我們會發現有兩個部分組成,分別是encoder和decoder

技術分享圖片

參考:

https://jalammar.github.io/illustrated-transformer/

Transformer【Attention is all you need】