還在為週會發愁？你需要這13篇最新論文

640

640?

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。

在這個欄目裡，你會快速 get 每篇精選論文的亮點和痛點，時刻緊跟 AI 前沿成果。

點選本文底部的「閱讀原文」即刻加入社群，檢視更多最新論文推薦。

這是 PaperDaily 的第 81 篇文章

640?

FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension

@shaness 推薦

#Attention Mechanism

本文是微軟和臺灣大學發表於 ICLR 2018 的工作，論文最大的價值是融合了當前主流的 Attention 模型的各個層次表示

，並且一一作了介紹，可以通過本文了解當前主流 Attention 模型所用到的資訊都是怎麼得到的。文章使用了 GloVe 表示單詞，CoVe 表示上下文。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2005

程式碼連結

https://github.com/momohuang/FusionNet-NLI

640?

From Word to Sense Embeddings: A Survey on Vector Representations of Meaning

@qqfly1to19 推薦

#Word Embedding

眾所周知，Word Embedding 這種從語言結構中學習出來的低維表示存在著很多問題，諸如將原本的多義詞 Embedding 進了一個向量裡，具有相同語言結構的 Word（如反義詞）具有相近的向量，這些問題在實際的工程領域往往是致命的。本篇長文總共 40 頁，篇幅較長。主要是從 Word Embedding 的工作出發去講Sense Embedding

，內容很厚，建議好好閱讀。

640

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1999

640?

Hybrid semi-Markov CRF for Neural Sequence Labeling

@zxye 推薦

#CRF

本文是中科大發表於 ACL 2018 的工作，這篇文章聯合使用 CRF 和改進的 Semi-CRF 在 CoNLL 2003 命名實體識別任務上達到了 state-of-the-art 的效能。

640

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1998

程式碼連結

https://github.com/ZhixiuYe/HSCRF-pytorch

640?

DialogWAE: Multimodal Response Generation with Conditional Wasserstein Auto-Encoder

@guxd 推薦

#Dialog Systems

現有的對話模型通常採用變分自編碼器（VAE）實現多樣化的應答生成，然而VAE模型假定對話的隱變數服從簡單的高斯分佈，從而限制了應答的範圍（比如單模態應答）。

本文提出一種基於 Wasserstein 自編碼器的應答生成模型，不同於 VAE 模型的單一高斯先驗假設，本文通過在隱變數上進行 GAN 訓練，實現對真實資料分佈的擬合。同時引入高斯混合先驗網路實現多模態回答生成。實驗結果表明採用高斯混合先驗的 GAN 模型在產生更連貫，資訊豐富和多樣化的迴應方面優於現有技術。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2001

640?

Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting

@paperweekly 推薦

#Abstractive Summarization

本文是 UNC Chapel Hill 發表於 ACL 2018 的工作，論文提出了新穎的基於強化學習的句子級的文字摘要生成模型，達到了 state-of-art 效果。

通過先抽取在生成的方式，加快了訓練和測試解碼速度，同時引入強化學習將抽取和生成巧妙聯合起來，構成了一個整體的端到端模型而不是一個 pipeline 系統。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2017

程式碼連結

https://github.com/ChenRocks/fast_abs_rl

640

Learning Domain-Sensitive and Sentiment-Aware Word Embeddings

@paperweekly 推薦

#Word Embeddings

本文是香港中文大學與 Tencent AI Lab 聯合發表於 ACL 2018 的工作。論文提出了一種學習領域適應和情感感知的詞嵌入的新方法，能夠同時捕獲詞的情感語義和領域資訊。

與已有方法不同的是，該方法利用評論中的情感資訊和上下文資訊來自動確定和生成領域無關的詞向量和領域相關的詞向量，從而利用來自於多個領域的共同情感詞的資訊，並且同時捕獲來自不同領域的領域相關詞的不同語義。

實驗結果表明，該方法能夠更好的學習多領域情況下的情感詞表示，提高了句子層面和詞彙層面的情感分類任務的效能。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2015

640

Two-Stage Synthesis Networks for Transfer Learning in Machine Comprehension

@shaness 推薦

#Machine Comprehension

機器閱讀理解在最近的文章中，主要是針對特定資料集上的表現做模型改進。而微軟的這篇文章更加貼近現實問題：如何讓機器自己從一個數據集上通過監督學習生成答案和生成問題的能力，然後無監督地應用在其他的 domain 裡面，對缺少標註資料的 MRC 問題提出了遷移學習的解決思路。

本文思路分兩步合成，先根據 paragraph（後簡稱 p）生成答案（後簡稱 a），然後根據 p 和 a 生成 quenstion。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2012

程式碼連結

https://github.com/davidgolub/QuestionGeneration

640

PyramidBox: A Context-assisted Single Shot Face Detector

@yinnxinn 推薦

#Face Detection

本文來自百度，論文達到了超級好的人臉檢測效果。從工程角度將 FPN，RCNN，anchor 等多種結構的優勢結合起來。論文將 FPN 和 S^3^FD 的優勢結合起來，主幹框架採取 VGG16 進行特徵提取，在 conv3_3，conv4_3，conv5_3 層使用 FPN 構建 branch 對底層 feature 的背景資訊進行保留，最後將高低層的資訊進行組合得到 predict_layer。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2006

640

Quantization Mimic: Towards Very Tiny CNN for Object Detection

@darksoul 推薦

#Object Detection

本文來自清華大學和商湯科技，文章使用量化的方法加強 Mimic 的效能，對 Mimic 的方法擴充套件有新的指導意義。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2010

640?

Towards Personalized Image Captioning via Multimodal Memory Networks

@born2 推薦

#Image Caption

對於 Image Caption 任務，給出一張圖，生成一句話，已經取得了長足的進步。本文提出了 Caption 方向的一個新問題：如何產生個性化的 Caption。因為不同的人對同樣的圖片會做出不同的描述，其中包含了描述者本身的用詞表達習慣等特徵，如何針對性的學習某個人的表示式本文提出的新問題。

這個問題很有強的實用價值，我們日常生活中的微信朋友圈，微博等等，圖片所配的問題之中，都隱藏著個人平日的用詞習慣，如果能夠學習到一個相應的模型，那麼將會為我們節省大量的時間，我們只需要在機器生成的句子上做簡單的修改，甚至不需要修改，就可以直接釋出朋友圈。

存在兩個問題，首先是資料庫的問題，其次就是如何構建一個能夠學習這種個性化的模型。

本文構建了一個個性化的 Caption 資料庫，並提出了使用記憶網路進行個人習慣用詞的提取，利用卷積的方式來獲取單詞和影象之間的關係，最終取得了很好的效果。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2014

程式碼連結

https://github.com/cesc-park/attend2u

640?

Attention to Scale: Scale-aware Semantic Image Segmentation

@DeepTrial 推薦

#Image Segmentation

通過對輸入圖片的尺度進行放縮，構造多尺度。傳統的方法是使用 average-pooling 或 max-pooling 對不同尺度的特徵進行融合，而本文通過構造 Attention model（由兩個卷積層構成）從而自動地去學不同尺度的權重，進行融合（效果提升 1 到 2 個點吧，不同的資料集不一樣）。

從論文中的權重視覺化的結果，能發現小尺寸輸入上，對應網路關注於 small-scale objects，而在大一點的尺寸上，網路就關注於 middle-scale，large-scale 甚至 background contextual information。視覺化效果感覺非常有意思。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1950

程式碼連結

http://liangchiehchen.com/projects/DeepLab.html

640

Metric Factorization: Recommendation beyond Matrix Factorization

@daven88 推薦

#Recommender System

本文提出了一種新型的推薦系統演算法——Metric Factorization（距離分解），該方法旨在改進傳統的基於矩陣分解的推薦系統演算法。矩陣分解一個很大的問題就是不符合 inequality property，這很大程度上阻礙了其表現。

本文提出新型的解決方案，通過把使用者和商品看作是一個低緯空間裡面的點，然後用他們之間的距離來表示他們的距離。通過類似於矩陣分解的 squared loss 就能很好的從已有的歷史資料中學出使用者和商品在這個低維空間的位置。

Metric Factorization 可以用在評分預測和排序兩個經典的推薦場景，並且都取得了 state-of-the-art 的結果，超過基於 deep learning 以及已有的 Metric learning 的推薦演算法。

▲論文模型：點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2002

640

Distributed Prioritized Experience Replay

@Davidzhang 推薦

#Reinforcement Learning

本文是 DeepMind 發表於 ICLR 2018 的工作。Exploration 是強化學習裡面比較難的問題，這篇 paper 通過分散式，可以說用一個最簡單的做法卻實現了非常好的 exploration。同時，這篇 paper 也讓我們要意識到 RL 的分散式計算是非常重要的一個環節，不僅僅是加快訓練速度，還可以更好的提升效果。