論文解讀-ACL-2021-ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

阿新 • • 發佈：2021-12-09

本篇論文美團已經給出了很詳細的解讀

論文：https://arxiv.org/abs/2105.11741

程式碼：https://github.com/yym6472/ConSERT

本文的想法思路也是一樣即對比學習，主要創新點就是試了一些資料增強如對抗攻擊、打亂詞序、裁剪、dropout等等。通過一個數據增強模組，作用於Embedding層，為同一個句子生成兩個不同的增強版本，作為正樣本，一個batch內的其他樣本作為負樣本
首先，作者對Bert的“坍縮”現象進行了說明，即BERT對所有的句子都傾向於編碼到一個較小的空間區域內，這使得大多數的句子對都具有較高的相似度分數，即使是那些語義上完全無關的句子對。作者認為這種現象是由於句子中的高頻詞的影響

，即當通過平均詞向量的方式計算句向量時，那些高頻詞的詞向量將會主導句向量，使之難以體現其原本的語義。當計算句向量時去除若干高頻詞時，坍縮現象可以在一定程度上得到緩解。
並對一些資料增強方法進行了比較得出：Token Shuffle > Token Cutoff >> Feature Cutoff ≈ Dropout >> None還對怎麼組合這些資料增強進行了實驗得到：Token Shuffle和Feature Cutoff的組合取得了最優效能。各部分具體如下：
- 對抗攻擊（Adversarial Attack）：這一方法通過梯度反傳生成對抗擾動，將該擾動加到原本的Embedding矩陣上，就能得到增強後的樣本。由於生成對抗擾動需要梯度反傳，因此這一資料增強方法僅適用於有監督訓練的場景。
- 打亂詞序（Token Shuffling）：這一方法擾亂輸入樣本的詞序。由於Transformer結構沒有“位置”的概念，模型對Token位置的感知全靠Embedding中的Position Ids得到。因此在實現上，我們只需要將Position Ids進行Shuffle即可。
- 裁剪（Cutoff）：又可以進一步分為兩種：Token Cutoff：隨機選取Token，將對應Token的Embedding整行置為零。Feature Cutoff：隨機選取Embedding的Feature，將選取的Feature維度整列置為零。
- Dropout：Embedding中的每一個元素都以一定概率置為零，與Cutoff不同的是，該方法並沒有按行或者按列的約束。
  這四種方法均可以方便地通過對Embedding矩陣（或是BERT的Position Encoding）進行修改得到，因此相比顯式生成增強文字的方法更為高效。

本文來自部落格園，作者：xingye_z，轉載請註明原文連結：https://www.cnblogs.com/xyzhrrr/p/15669357.html

論文解讀-ACL-2021-ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

本篇論文美團已經給出了很詳細的解讀論文：https://arxiv.org/abs/2105.11741 程式碼：https://github.com/yym6472/ConSERT

位元組跳動機器翻譯技術論文獲 ACL 2021 年度最高獎項，中國團隊第二次

8 月 6 日訊息今日位元組跳動官方宣佈，8 月 5 日，國際頂級學術會議 ACL 2021 正式頒發了大會獎項，位元組跳動 AI Lab 的機器翻譯技術論文當選今年度“最佳論文”。這是 ACL 成立 59 年以來，中國科學家團隊第二次

論文解讀（CSSL）《Contrastive Self-supervised Learning for Graph Classification》

論文資訊論文標題：Contrastive Self-supervised Learning for Graph Classification論文作者：Jiaqi Zeng, Pengtao Xie論文來源：2020, AAAI論文地址：download 論文程式碼：download

文獻分析 Squidpy: a scalable framework for spatial single cell analysis

Prograss Challenge demand background Dissociation-based single cell technologies cellular diversity constitutes tissue organization

[論文理解] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

Bootstrap Your Own Latent A New Approach to Self-Supervised Learning Intro 文章提出一種不需要負樣本來做自監督學習的方法，提出交替更新假說解釋EMA方式更新target network防止collapse的原因，同時用梯度解釋

論文解讀（MPNN）Neural Message Passing for Quantum Chemistry

　　論文標題：DEEP GRAPH INFOMAX　　論文方向：　　論文來源：ICML 2017　　論文連結：https://arxiv.org/abs/1704.01212　　論文程式碼：

[論文解讀]A Quantitative Analysis Framework for Recurrent Neural Network

A Quantitative Analysis Framework for Recurrent Neural Network 文章目錄 A Quantitative Analysis Framework for Recurrent Neural Network簡介摘要動機THE DeepStellar FRAMEWORK抽象模型構建應用

A Unified Deep Model of Learning from both Data and Queries for Cardinality Estimation 論文解讀（SIGMOD 2021 UAE）

A Unified Deep Model of Learning from both Data and Queries for Cardinality Estimation 論文解讀（SIGMOD 2021）

Tsunami: A Learned Multi-dimensional Index for Correlated Data and Skewed Workloads 論文解讀（VLDB 2021）

《T-GCN: A Temporal Graph Convolutional Network for Trafﬁc Prediction》論文解讀

論文連結：https://arxiv.org/abs/1811.05320 最近發現部落格好像會被CSDN和一些奇怪的野雞網站爬下來？看見有人跟爬蟲機器人單方面討論問題我也蠻無奈的。總之原作者Missouter，部落格連結https://www.cnblogs.com/

【論文解讀】隱式篇章關係分類：我們需要談一談評估（ACL 2020）

論文地址：https://www.aclweb.org/anthology/2020.acl-main.480.pdf 程式碼連結： https://github.com/najoungkim/pdtb3

《A Unified MRC Framework for Named Entity Recognition》ACL2020論文閱讀

技術標籤：論文閱讀深度學習自然語言處理論文aclmrc 機構為浙江大學、香儂科技。

論文解讀（Survey）《Self-supervised Learning on Graphs: Contrastive, Generative,or Predictive》第一部分：問題闡述

論文資訊論文標題：Self-supervised Learning on Graphs: Contrastive, Generative,or Predictive論文作者：Lirong Wu, Haitao Lin, Cheng Tan,Zhangyang Gao, and Stan.Z.Li論文來源：2022, ArXiv論文地址：downl

論文解讀（MLGCL）《Multi-Level Graph Contrastive Learning》

論文資訊論文標題：Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learning論文作者： Kaize Ding 、Yancheng Wang 、Yingzhen Yang、Huan Liu論文來源：2021, Neuroco

論文解讀（Survey）《Self-supervised Learning on Graphs: Contrastive, Generative,or Predictive》第二部分：對比學習

論文解讀（MCGC）《Multi-view Contrastive Graph Clustering》

論文資訊論文標題：Multi-view Contrastive Graph Clustering論文作者：Erlin Pan、Zhao Kang論文來源：2021, NeurIPS論文地址：download論文程式碼：download

Fauce：Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 論文解讀（VLDB 2021）

論文解讀（GCC）《GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training》

論文資訊論文標題：GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training論文作者：Jiezhong Qiu, Qibin Chen, Yuxiao Dong, Jing Zhang, Hongxia Yang, Ming Ding, Kuansan Wang, Jie Tang論文來

論文解讀（PCL）《Probabilistic Contrastive Learning for Domain Adaptation》

論文資訊論文標題：Probabilistic Contrastive Learning for Domain Adaptation論文作者：Junjie Li, Yixin Zhang, Zilei Wang, Keyu Tu論文來源：aRxiv 2022論文地址：download 論文程式碼：download

論文解讀-ACL-2021-ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

相關推薦