1. 程式人生 > >還在為週會發愁?你需要這13篇最新論文 | 本週值得讀

還在為週會發愁?你需要這13篇最新論文 | 本週值得讀

640

640?

在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。

在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。

點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。

這是 PaperDaily 的第 81 篇文章

640?

FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension

@shaness 推薦

#Attention Mechanism

本文是微軟和臺灣大學發表於 ICLR 2018 的工作,論文最大的價值是融合了當前主流的 Attention 模型的各個層次表示

,並且一一作了介紹,可以通過本文了解當前主流 Attention 模型所用到的資訊都是怎麼得到的。文章使用了 GloVe 表示單詞,CoVe 表示上下文。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2005

程式碼連結

https://github.com/momohuang/FusionNet-NLI

640?

From Word to Sense Embeddings: A Survey on Vector Representations of Meaning

@qqfly1to19 推薦

#Word Embedding

眾所周知,Word Embedding 這種從語言結構中學習出來的低維表示存在著很多問題,諸如將原本的多義詞 Embedding 進了一個向量裡,具有相同語言結構的 Word(如反義詞)具有相近的向量,這些問題在實際的工程領域往往是致命的。本篇長文總共 40 頁,篇幅較長。主要是從 Word Embedding 的工作出發去講Sense Embedding

,內容很厚,建議好好閱讀。

640

640

640

640

640

640

640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1999

640?

Hybrid semi-Markov CRF for Neural Sequence Labeling

@zxye 推薦

#CRF

本文是中科大發表於 ACL 2018 的工作,這篇文章聯合使用 CRF 和改進的 Semi-CRF 在 CoNLL 2003 命名實體識別任務上達到了 state-of-the-art 的效能

640

640

640

640

640

640

640

640

640

640

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1998

程式碼連結

https://github.com/ZhixiuYe/HSCRF-pytorch

640?

DialogWAE: Multimodal Response Generation with Conditional Wasserstein Auto-Encoder

@guxd 推薦

#Dialog Systems

現有的對話模型通常採用變分自編碼器(VAE)實現多樣化的應答生成,然而VAE模型假定對話的隱變數服從簡單的高斯分佈,從而限制了應答的範圍(比如單模態應答)。

本文提出一種基於 Wasserstein 自編碼器的應答生成模型,不同於 VAE 模型的單一高斯先驗假設,本文通過在隱變數上進行 GAN 訓練,實現對真實資料分佈的擬合。同時引入高斯混合先驗網路實現多模態回答生成。實驗結果表明採用高斯混合先驗的 GAN 模型在產生更連貫,資訊豐富和多樣化的迴應方面優於現有技術。

640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2001

640?

Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting

@paperweekly 推薦

#Abstractive Summarization

本文是 UNC Chapel Hill 發表於 ACL 2018 的工作,論文提出了新穎的基於強化學習的句子級的文字摘要生成模型,達到了 state-of-art 效果。

通過先抽取在生成的方式,加快了訓練和測試解碼速度,同時引入強化學習將抽取和生成巧妙聯合起來,構成了一個整體的端到端模型而不是一個 pipeline 系統。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2017

程式碼連結

https://github.com/ChenRocks/fast_abs_rl

640

Learning Domain-Sensitive and Sentiment-Aware Word Embeddings

@paperweekly 推薦

#Word Embeddings

本文是香港中文大學與 Tencent AI Lab 聯合發表於 ACL 2018 的工作。論文提出了一種學習領域適應和情感感知的詞嵌入的新方法,能夠同時捕獲詞的情感語義和領域資訊

與已有方法不同的是,該方法利用評論中的情感資訊和上下文資訊來自動確定和生成領域無關的詞向量和領域相關的詞向量,從而利用來自於多個領域的共同情感詞的資訊,並且同時捕獲來自不同領域的領域相關詞的不同語義。

實驗結果表明,該方法能夠更好的學習多領域情況下的情感詞表示,提高了句子層面和詞彙層面的情感分類任務的效能。

640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2015

640

Two-Stage Synthesis Networks for Transfer Learning in Machine Comprehension

@shaness 推薦

#Machine Comprehension

機器閱讀理解在最近的文章中,主要是針對特定資料集上的表現做模型改進。而微軟的這篇文章更加貼近現實問題:如何讓機器自己從一個數據集上通過監督學習生成答案和生成問題的能力,然後無監督地應用在其他的 domain 裡面,對缺少標註資料的 MRC 問題提出了遷移學習的解決思路

本文思路分兩步合成,先根據 paragraph(後簡稱 p)生成答案(後簡稱 a),然後根據 p 和 a 生成 quenstion。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2012

程式碼連結

https://github.com/davidgolub/QuestionGeneration

640

PyramidBox: A Context-assisted Single Shot Face Detector

@yinnxinn 推薦

#Face Detection

本文來自百度,論文達到了超級好的人臉檢測效果。從工程角度將 FPN,RCNN,anchor 等多種結構的優勢結合起來。論文將 FPN 和 S^3^FD 的優勢結合起來,主幹框架採取 VGG16 進行特徵提取,在 conv3_3,conv4_3,conv5_3 層使用 FPN 構建 branch 對底層 feature 的背景資訊進行保留,最後將高低層的資訊進行組合得到 predict_layer。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2006

640

Quantization Mimic: Towards Very Tiny CNN for Object Detection

@darksoul 推薦

#Object Detection

本文來自清華大學和商湯科技,文章使用量化的方法加強 Mimic 的效能,對 Mimic 的方法擴充套件有新的指導意義。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2010

640?

Towards Personalized Image Captioning via Multimodal Memory Networks

@born2 推薦

#Image Caption

對於 Image Caption 任務,給出一張圖,生成一句話,已經取得了長足的進步。本文提出了 Caption 方向的一個新問題:如何產生個性化的 Caption。因為不同的人對同樣的圖片會做出不同的描述,其中包含了描述者本身的用詞表達習慣等特徵,如何針對性的學習某個人的表示式本文提出的新問題。 

這個問題很有強的實用價值,我們日常生活中的微信朋友圈,微博等等,圖片所配的問題之中,都隱藏著個人平日的用詞習慣,如果能夠學習到一個相應的模型,那麼將會為我們節省大量的時間,我們只需要在機器生成的句子上做簡單的修改,甚至不需要修改,就可以直接釋出朋友圈。

存在兩個問題,首先是資料庫的問題,其次就是如何構建一個能夠學習這種個性化的模型。

本文構建了一個個性化的 Caption 資料庫,並提出了使用記憶網路進行個人習慣用詞的提取,利用卷積的方式來獲取單詞和影象之間的關係,最終取得了很好的效果。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2014

程式碼連結

https://github.com/cesc-park/attend2u

640?

Attention to Scale: Scale-aware Semantic Image Segmentation

@DeepTrial 推薦

#Image Segmentation

通過對輸入圖片的尺度進行放縮,構造多尺度。傳統的方法是使用 average-pooling 或 max-pooling 對不同尺度的特徵進行融合,而本文通過構造 Attention model(由兩個卷積層構成)從而自動地去學不同尺度的權重,進行融合(效果提升 1 到 2 個點吧,不同的資料集不一樣)。

從論文中的權重視覺化的結果,能發現小尺寸輸入上,對應網路關注於 small-scale objects,而在大一點的尺寸上,網路就關注於 middle-scale,large-scale 甚至 background contextual information。視覺化效果感覺非常有意思。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1950

程式碼連結

http://liangchiehchen.com/projects/DeepLab.html

640

Metric Factorization: Recommendation beyond Matrix Factorization

@daven88 推薦

#Recommender System

本文提出了一種新型的推薦系統演算法——Metric Factorization(距離分解), 該方法旨在改進傳統的基於矩陣分解的推薦系統演算法。矩陣分解一個很大的問題就是不符合 inequality property, 這很大程度上阻礙了其表現。

本文提出新型的解決方案,通過把使用者和商品看作是一個低緯空間裡面的點,然後用他們之間的距離來表示他們的距離。通過類似於矩陣分解的 squared loss 就能很好的從已有的歷史資料中學出使用者和商品在這個低維空間的位置。

Metric Factorization 可以用在評分預測和排序兩個經典的推薦場景,並且都取得了 state-of-the-art 的結果,超過基於 deep learning 以及已有的 Metric learning 的推薦演算法。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2002

640

Distributed Prioritized Experience Replay

@Davidzhang 推薦

#Reinforcement Learning

本文是 DeepMind 發表於 ICLR 2018 的工作。Exploration 是強化學習裡面比較難的問題,這篇 paper 通過分散式,可以說用一個最簡單的做法卻實現了非常好的 exploration。同時,這篇 paper 也讓我們要意識到 RL 的分散式計算是非常重要的一個環節,不僅僅是加快訓練速度,還可以更好的提升效果。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/1994

640?#推 薦 有 禮#

本期所有入選論文的推薦人

均將獲得PaperWeekly紀念週邊一份

640?640640

▲ 深度學習主題行李牌/卡套 + 防水貼紙

禮物領取方式

推薦人請根據論文詳情頁底部留言

新增小助手領取禮物

想要贏取以上週邊好禮?

點選閱讀原文即刻加入社群吧!

640?

相關推薦

在熬夜憋思路?12最新論文打包送給 | 本週值得

在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。在這個欄目裡,你會快速

暑假沒人帶怎麼辦?還有我們推薦論文 | 本週值得

在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。在這個欄目裡,你會快速

需要,可以讓 “吃透” 負載均衡

我們都對高可用有一個基本的認識,其中負載均衡是高可用的核心工作。本文將通過如下幾個方面,讓你妥妥的吃透“”負載均衡”。 負載均衡是什麼 常用負載均衡策略圖解 常用負載均衡策略優缺點和適用場景 用健康探測來保障高可用 結語 負載均衡是什麼 正如上圖所示的這樣,由

如何正確選擇開源資料庫?需要的5個技巧

你或許會遇到需要選擇合適的開源資料庫的情況。但這無論對於開源方面的老手或是新手,都是一項艱鉅的任務。在過去的幾年中,採用開源技術的企業越來越多。面對這樣的趨勢,眾多開源應用公司都紛紛承諾自己提供的解決方案能夠各種問題、適應各種負載。但這些承諾不能輕信,在開源應用上的選擇是重要而艱難的,尤其是資料庫這種關鍵的應

提升深度學習模型的表現,需要20個技巧

機器之心編譯  本文原文的作者 Jason Brownlee 是一位職業軟體開發者,沒有博士學位的他通過「從應用中學習」的方法自學了機器學習,他表示對幫助職業開發者應用機器學習來解決複雜問題很有熱情,也為機器學習社群貢獻了很多實用的建議和指南,本文所講解的是「

如何走近深度學習人臉識別?需要超長綜述 | 附開原始碼

相信做機器學習或深度學習的同學們回家總會有這樣一個煩惱:親朋好友詢問你從事什麼工作的時候,如何通俗地解釋能避免尷尬?我嘗試過很多名詞來形容自己的工作:機器學習,深度學習,演算法工程師/研究員,搞計算機的,程式設計師…這些詞要麼自己覺得不滿意,要麼對方聽不懂。經歷無數次失敗溝通,最後總結了一個簡單實用的答案:“

快被系統性能逼瘋了?需要份效能優化策略

劉迪偉,就職於世界五百強銀行。負責公司網銀業務系統的設計和交付,擅長並持續關注Java效能優化、DevOps等領域。 XX銀行網銀系統是一套全新的對公業務渠道類系統,經過兩年的建設,將逐步對外提供服務。 該系統融合了原來多個對公渠道系統,併發量是以前多個系統之和,吞吐量要求將大幅上升。為了使廣大對公客戶使

裁員潮下,需要 10 大神器

相信大家都感受到了,當下環境裁員潮非常廣泛,很多公司已經在裁員或者變相裁員了,那麼對於 IT 職

想要成為一名優秀的Java程式設計師,需要8個錦囊

私底下,隔三差五就有讀者問我:“二哥,怎麼樣才能像你一樣,成為一名優秀的 Java 開發者呢?”假如把“怎麼才能像你一樣”去掉的話,這個問題就是一個好問題,否則的話,總有點彩虹屁的嫌疑。但話說回來,我喜歡這種提問的藝術。 從上大學那會學 Java 到現在,我已經積攢了 10 多年的程式設計經驗,雖然離優秀

本週值得 | ACL2017 對話系統 GAN 總有一適合

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

品牌推廣發愁嗎?那是沒找到營銷圈

便是 fad 大小 展望 不必要 ges 發揮 等等 互聯 何謂營銷圈?簡單點說,就是一個基於互聯網絡及社會關系網絡的平臺,致力於連接企業、用戶及大眾,向大眾傳遞有價值的信息的平臺。在互聯網的大浪潮下,尤其是移動時代的到來,以新媒體為依托的新型營銷形式更是像一股前線之風,牽

在抱怨pandas執行速度慢?幾個方法顛覆的看法

前言 當大家談到資料分析時,提及最多的語言就是Python和SQL。Python之所以適合資料分析,是因為它有很多第三方強大的庫來協助,pandas就是其中之一。pandas的文件中是這樣描述的: “快速,靈活,富有表現力的資料結構,旨在使”關係“或”標記“資料的使用既簡單又直觀。”

如何巧妙的拒絕別人,用幾個方法,保證拒絕他們感激

如果在人際交往中,你需要拒絕人時,不妨用下列方法試一試:   不要立刻就拒絕:立刻拒絕,會讓人覺得你是一個冷漠無情的人,甚至覺得你對他有成見。   不要輕易地拒絕:有時候輕易地拒絕別人,會失去許多幫助別人、獲得友誼的機會。   不要在盛怒下拒絕:

在害怕學不Python嘛?文章讓瞬間懂Python入門!

零基礎學習Python能學會嗎?這個問題幾乎是所有初學Python的小白都會問到的問題。其實Python是非常適合初學者入門的,相較於其他主流類程式語言,Python具有更好的可讀性,因此上手更容易,而且即便你是零基礎也一樣能學會。 獻給Python初學者,零基礎學習Python能學會嗎?

Java程式設計師漲薪發愁嗎?學會這些,我讓薪資翻倍。

網際網路架構師+大資料工程師+機器學習與人工智慧 第一部分: Java高併發程式設計 1.Java 執行緒、鎖基礎知識 2.深入剖析volatile、synchronized、Lock、AtomicX關鍵字(一) 3.深入剖析volatile、synchronized、Lo

看完,媽媽擔心Docker入不了門?

“上週物件突然心血來潮說想養個小寵物,我問想養啥她又說隨便,你看著辦!!! 這我真的比較難辦啊!但是咱們程式設計師能有個物

作為運營新人,取標題的10個小技巧需要掌握

運營當我們一看到“ 標題黨 ” 這三個字,不用多說,心裏絕對都是壞的印象。一篇 shit 一樣的文章,靠一個好的標題,是可以獲得不錯的點擊量,但 內容運營 的最終目的是為了數據好看嗎?起一個好的標題確實是一個文章能否獲得關註和點擊率的關鍵,但如何在不成為“ 標題黨 ” 的前提下取 好標題呢?近日fansir

跨境電商賣家需要的一款跨境電商ERP在裏?

內部 而且 應該 優化 折扣 前端 降低成本 個人 自然 跨境電商發展在這幾年發展異常迅猛,連續多年高增長,除了國內淘寶賣家轉型和傳統外貿賣家之外,老賣家發展到一定階段必然會出現管理和運營的瓶頸,瓶頸不攻破,勢必會影響企業的發展。 所以跨境電商運營在電商企業至關