arXiv 最火論文：研究“注意力機制”，來自清華大學計算機系胡事民團隊

阿新 • • 發佈：2021-11-21

清華計圖胡事民團隊的這篇注意力機制的綜述火了！

在上週的 arXiv 上，這是最熱的一篇論文。

推特以及 GitHub 上也有不低的熱度。

而這篇論文引用近 200 篇內容，對計算機視覺領域中的各種注意力機制進行了全面回顧。

在大量調查之後，論文將注意力機制分為多個類別，GitHub 還給出了各類別下提到內容的 PDF 下載檔案：

現在，就來一起看看這篇論文。

文章主要內容

論文首先將基於注意力的模型在計算機視覺領域中的發展歷程大致歸為了四個階段：

1.將深度神經網路與注意力機制相結合，代表性方法為 RAM
2.明確預測判別性輸入特徵，代表性方法為 STN
3.隱性且自適應地預測潛在的關鍵特徵，代表方法為 SENet
4.自注意力機制

同時，注意力機制也被分為了通道注意、空間注意、時間注意、分支注意，以及兩個混合類別：

針對不同類別，研究團隊給出了其代表性方法和發展背景：

通道注意力（Channel Attention）

在深度神經網路中，不同特徵圖的不同通道常代表不同物件。

而通道注意力作為一個物件選擇過程，可以自適應地重新校準每個通道的權重，從而決定關注什麼。

因此，按照類別和出版日期將代表性通道關注機制進行分類，應用範圍有分類（Cls）、語義分割（SSeg）、例項分割（ISeg）、風格轉換（ST）、動作識別（Action）。

其中，(A) 代表 Channel-wise product，(I）強調重要通道，（II）捕捉全域性資訊。

空間注意力（Spatial Attention）

空間注意力可以被看作是一種自適應的空間區域選擇機制。

其應用範圍比通道注意力多出了精細分類（FGCls）和影象字幕（ICap）。

時間注意力（Temporal Attention）

時間注意力可以被看作是一種動態的時間選擇機制，決定了何時進行注意，因此通常用於視訊處理。

分支注意力（Branch Attention）

分支注意可以被看作是一種動態的分支選擇機制，通過多分支結構決定去注意什麼。

通道空間注意力（Channel & Spatial Attention）

通道和空間結合的注意力機制可以自適應地選擇重要的物件和區域，由殘差注意力（Residual Attention）網路開創了這一內容。

在殘差注意力之後，為了有效利用全域性資訊，後來的工作又相繼引入全域性平均池化（Global Average Pooling），引入自注意力機制等內容。

時空注意力（Spatial & Temporal Attention）

時空注意力機制可以自適應地選擇重要區域和關鍵幀。

最後，作者也提出了注意力機制在未來的一些研究方向：

探索注意力機制的必要和充分條件
是否可以有一個通用的注意塊，可以根據具體的任務在各類注意力機制之間進行選擇
開發可定性和可解釋的注意力模型
注意力機制可以產生稀疏的啟用，這促使我們去探索哪種架構可以更好地模擬人類的視覺系統
進一步探索基於注意力的預訓練模型
為注意力模型研究新的優化方法
找到簡單、高效、有效的基於注意力的模型，使其可以廣泛部署

關於作者

這篇論文來自清華大學計算機系胡事民團隊。

胡事民為清華大學計算機系教授，教育部長江學者特聘教授，曾經和現任 IEEE、Elsevier、Springer 等多個期刊的主編、副主編和編委。

同時，他也是清華“計圖”框架團隊的負責人，這是首個由中國高校開源的深度學習框架。

文章一作為胡事民教授的博士生國孟昊，現就讀於清華大學計算機系，也是清華計圖團隊的一員。

arXiv 最火論文：研究“注意力機制”，來自清華大學計算機系胡事民團隊

清華計圖胡事民團隊的這篇注意力機制的綜述火了！在上週的 arXiv 上，這是最熱的一篇論文。推特以及 GitHub 上也有不低的熱度。而這篇論文引用近 200 篇內容，對計算機視覺領域中的各種注意力機制進行了全面回顧。在

java面試官最愛問的垃圾回收機制，這位阿里P7大佬分析的屬實到位

前言 JVM 記憶體模型一共包括三個部分：堆 ( Java程式碼可及的 Java堆和 JVM自身使用的方法區)、

Clubhouse 之後 Dispo 相機又火了：採用邀請制，明天才能看到照片

“我們要重塑 Instagram”。伴隨著這些呼喊，又一個應用程式已經成為矽谷這兩週的熱門話題。

任天堂 Switch 系統更新 12.1.0 上線：優化儲存機制，修復 Bug

7 月 6 日訊息任天堂今日向 Switch 遊戲主機推送了 12.1.0 更新，本次更新主要調整了系統儲存的機制，並修復了一些 Bug。

中國臺灣最賺錢產業：半導體產業第一，IC 設計第二

據中國臺灣媒體《財經新報》7 月 3 日報道，2021 版“臺灣大型企業排名 TOP5000”調查顯示，半導體產業登上 2020 年臺灣地區產業經營績效榜首，已經連續 8 年進入榜單前十，是長期經營績效最好的產業。

中國廣電啟動大規模公開招聘：實行市場化機制，全員績效考核

7 月 7 日訊息中國廣電網路股份有限公司（簡稱“中國廣電”）現已釋出了公開招聘公告。

北理工通報碩士“原文照搬”頂會論文：嚴重學術不端，留校察看

標題、圖表、公式完全一致！論文幾乎一字不差！前段時間，北京理工大學碩士生張某某幾乎“原文照搬”式抄襲事件，在網上傳得可謂是沸沸揚揚。而就在最近，北理工研究生院正式釋出了對此事調查後的通報：經充分討論，

英國研製世界上最環保火箭：使用生物燃料，排放減少至多 96%

北京時間 10 月 22 日訊息，英國 Orbex 公司研發的 Prime 號稱世界上最環保的火箭，它使用生物燃料，比化石燃料火箭減少排放 96%，可以多次發射，不會在陸地、海洋或大氣中留下殘骸。▲圖：Prime 號稱對環境最友好的

谷歌 Pixel 6 / 6 Pro 獲釋出以來最大更新：修復大量 Bug，改進相機與指紋識別

12 月 14 日訊息，據 The Verge 訊息，Pixel 6 和 Pixel 6 Pro 今天收到了自谷歌 10 月份釋出這兩款手機以來最重要的軟體更新。本次更新最重要的變化是對指紋感測器的調整，以及對相機的改進。在 bug 修復方面，谷歌

類載入機制，雙親委派的那些事

　　首先我們來看張圖，自己就不畫了，網上找了張圖。　　（記憶體模型就先不看了，1。8之後已經不是這個模型了）

蘋果黃牛已“躁動”起來：iPhone 12藍色最火，最多加價一千

10 月 14 日訊息今天蘋果正式釋出了 5G 新機，包括 iPhone12、iPhone 12 mini、iPhone 12 Pro 以及 iPhone 12 Pro Max 四款，國行售價為 5499 元起，而每年的蘋果 iPhone 新機發佈會也是黃牛們最活躍的時候。

中國區塊鏈的“最強大腦” ：21位兩院院士參與實踐與研究

前幾日，李彥巨集落選中國工程院院士，登上熱搜榜單，成為一時的焦點話題。

《和平精英》全新賽制「巔峰賽」來了！騰訊：最嚴安全監測與處罰機制

10月17日訊息近日，隨著 SS10 賽季開啟，《和平精英》全新賽制「巔峰賽」也已上線，並將於賽季第三週正式開賽。

微博釋出 2021 春節假期大資料：《和平精英》為最火遊戲，電影熱搜共 131 個 - IT之家

2月20日訊息新浪微博今日釋出了 2021 微博新春使用者行為報告。報告顯示，除夕夜及春晚期間，共有 2.89 億網友在微博集體守歲，共迎新春。在 2 月 12 日農曆牛年第一分鐘，共有來自全球 69 個國家和地區的網友發表祝

谷歌最新薪資曝光：研究崗年薪最高達 200 多萬，但遠遜於人事主管

作為全球有名的科技巨頭，谷歌無疑是給工資最大方的企業之一。那麼，在谷歌工作的員工每年究竟能賺多少錢？

國家天文臺：研究人員基於郭守敬望遠鏡（LAMOST）資料構建最大亞矮星星表

6 月 26 日訊息據國家天文臺網站，近日，國家天文臺 LAMOST 資料部團隊基於 LAMOST 資料構建了迄今最大的 M 型亞矮星星表，並對 M 型亞矮星的大氣引數和運動學特性進行了研究，提出了證認 MK 分類系統中光度分類為

AlphaFold2 成功祕訣：注意力機制取代卷積網路，預測準確性提升超 30%

最近，DeepMind 開源 AlphaFold2，讓學術圈再一次沸騰了。這意味著，對於普通研究人員而言曾需要花幾年時間才能破解的蛋白質結構，現在用 AlphaFold2 幾小時就能算出來了！

復旦團隊“人體經絡圖”火了！耗時9年，證明茶可疏通經絡，網友：啊這都可以發論文

https://mp.weixin.qq.com/s/n9LShjiEQIm5QTi9C0neOw 一張“人體經絡圖”，最近在全網火了。

美國研究人員設計出最小的人造飛行器：僅沙粒大小，可用於疾病追蹤

北京時間 9 月 23 日訊息，據國外媒體報道，工程師們對“微型飛行器”的未來有過這樣的展望，它們可以輕輕地飄浮在空中以蒐集環境資料，當任務執行完畢後，它們將徐徐降落到地上並自我溶解。研究人員表示，他們受到大

【自然語言處理】：seq2seq當中的Attention注意力機制

一.seq2seq機制傳統的seq2seq機制在語言翻譯當中使用了兩個RNN，一個是encoder，將語言進行編碼，另一個是decoder，將我們的得到的語言編碼進行解碼，解碼的過程當中就可以對我們的語言進行翻譯成另外一種語言。其

arXiv 最火論文：研究“注意力機制”，來自清華大學計算機系胡事民團隊

文章主要內容

通道注意力（Channel Attention）

空間注意力（Spatial Attention）

時間注意力（Temporal Attention）

分支注意力（Branch Attention）

通道空間注意力（Channel & Spatial Attention）

時空注意力（Spatial & Temporal Attention）

關於作者

相關推薦