1. 程式人生 > 實用技巧 >TENER: Adapting Transformer Encoder for Named Entity Recognition TENER命名實體識別 思維導圖筆記

TENER: Adapting Transformer Encoder for Named Entity Recognition TENER命名實體識別 思維導圖筆記

TENER 命名實體識別論文

  • TENER: Adapting Transformer Encoder for Named Entity Recognition
  • TENER:適用於命名實體識別的改進Transformer
  • 作者: Hang Yan, Bocao Deng等
  • 單位:復旦大學
  • 發表會議及時間: ACL2019

思維導圖

在這裡插入圖片描述

模型架構

在這裡插入圖片描述
英文NER: Character Embedding + Extracted Character Features + Word Embedding
中文NER: Character Embedding

細節一:改進的Transformer編碼器

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

論證了兩個位置向量的點積可以反映單詞間距離

在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

細節二:改進Transformer應用於NER任務

1. TENER

在這裡插入圖片描述
2. FLAT

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

總結

關鍵點

  1. 使用Transformer進行特徵抽取,提高推斷速度
  2. 更改絕對位置編碼

創新點

  1. 優化Transformer,增加距離與方向感知的注意力
  2. 使用非縮放的點乘注意力機制

另外,這個部落格講的比較好,可以參考:
TENER: Adapting Transformer Encoder for Named Entity Recognition

命名實體識別新SOTA:改進Transformer模型