1. 程式人生 > >本週份AI論文推薦新鮮出爐!真的很skr了~

本週份AI論文推薦新鮮出爐!真的很skr了~

640

640?

在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。

在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。

點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。

這是 PaperDaily 的第 91 篇文章

640?

Sliced Recurrent Neural Networks

@Ttssxuan 推薦

#Recurrent Neural Networks

本文是上海交大發表於 COLING 2018 的工作,論文提出了一種對 RNN 進行加速的方法,相對標準 RNN 其可以加速達到 136 倍,如果針對長序列,可以得到更大的加速比,此外從數學上證明了,RNN 是 SRNN 的一個特例。 

SRNN 把 RNN 序列分成每份 K 份,這樣每份可以各自執行(並行),得到長度為 N 的新序列,後續可以新序列上繼續如上操作,一直到序列長度等於 1 或滿足需求。通過在 6 個較大規模的情感分類資料集上測試,相比於 RNN,SRNN 都取得很大的效能優勢。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2143

原始碼連結

https://github.com/zepingyu0512/srnn

640?

SentEval: An Evaluation Toolkit for Universal Sentence Representations

@pwathrun 推薦

#Sentence Representations

SentEval 是 Facebook AI Research 推出的一個用於測評 Sentence representation model 效能的 framework。其中自定義了至少 13 個任務(後續有新增),任務資料包括了文字文類,文字相似性檢測,NLI,圖片摘要的任務。其著眼點是目前 NLP 領域內不同模型的跑分不能很好的進行復現,進而導致橫向比較模型效能比較困難的痛點。 

任何已訓練的模型都已放在 SentEval 框架內,SentEval 會使用目標任務來對提供的模型進行測試,因為測試環境統一,以此獲得的評測結果可以和其它的模型的測試分數進行統一的比較,而不是隻是比較論文中的紙面資料,有利於復現相關模型的真實效能,而且是相關模型針對不同 NLP 任務的效能。 

具體實現是通過自定義和修改 SentEval 的固定命名方法(batcher (),prepare ()等)使得 SentEval 可以將目標任務的文字匯入模型,獲得向量輸出,進而進行相關任務的比較。比如文字分類就是獲得向量輸出之後訓練一個分類器來比較分類的準確率。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2105

原始碼連結

https://github.com/facebookresearch/SentEval

640?

Learning Chinese Word Representations From Glyphs Of Characters

@mwsht 推薦

#Chinese Word Representations

本文是臺灣大學發表於 EMNLP 2017 的工作,論文提出了一種基於中文字元影象的 embedding 方法,將中文字元的影象輸入卷積神經網路,轉換成為詞向量。因為中文是象形文字,這樣的詞向量能夠包含更多的語義資訊。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2141

640?

Competitive Inner-Imaging Squeeze and Excitation for Residual Network

@superhy 推薦

#Residual Network

本文來自華南理工大學,論文在 SE-Net(Squeeze-Excitation)的基礎上,根據已有的殘差對映作為恆等對映的一種補充建模的論點,提出了殘差和恆等流進行競爭建模共同決定 channel-wise attention 輸出的改進,使得恆等流能自主參與對自身補充的權重調控。

另外,本文針對網路中間特徵的精煉建模任務,提出了對 channel squeezed 特徵進行重成像,將各個通道的 global 特徵重組為一張新的 feature map,並使用卷積(21,11 兩種)操作完成對重組特徵圖的建模,以此學習來自殘差流和恆等流所有 channels 的通道關係資訊,將之前的:1. 分別建模 chanel-wise 關係;2. 再合併建模殘差對映和恆等對映競爭關係,這樣兩步融合為建模綜合通道關係一步;稱這一機制為 CNN內部特徵的重成像(Inner-Imaging),探索了一種新的,考慮位置關係的,使用卷積進行 SE(channel-wise attention)建模的 CNNs 設計方向。 

本文實驗在 CIFAR-10,100,SVHN,ImageNet2012 資料集上進行,驗證了提出方法的有效性,並發現提出方法對較小規模網路的潛力挖掘作用,使其能用更少的引數達到甚至超越原先更大網路才能達到的效果。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2161

原始碼連結

https://github.com/scut-aitcm/CompetitiveSENet

640?

TequilaGAN: How to easily identify GAN samples

@TwistedW 推薦

#GAN

本文來自 UC Berkeley,GAN 生成的樣本在視覺方面已經達到與真實樣本很相近的程度了,有的生成樣本甚至可以在視覺上欺騙人類的眼睛。區分生成樣本和真實樣本當然不能簡單的從視覺上去分析,TequilaGAN 從影象的畫素值和影象規範上區分真假樣本,證明了真假樣本具有在視覺上幾乎不會被注意到的屬性差異從而可以將它們區分開。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2116

640

SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text

@born2 推薦

#Image Caption

本文提出了一個 caption 資料庫,特點是能夠生成故事性的描述句子。相對於傳統一般的 caption 任務,這個新提出的任務,生成的句子更具有故事性的特色,而不是單純無感情的描述。為了解決這個問題,首先需要構建一個數據庫,相對於一般的需要人工標記的資料庫而言,這裡採用無監督的方式,直接使用一些既有的自然語言處理的技術來解決這個問題。

作者提出了一套框架,以此來構建從傳統的句子到故事性句子的對映。為了方便訓練和解決這個問題,作者提出兩段式的訓練,從影象到關鍵詞,再從關鍵詞到故事性的句子,避免了標註,方便了訓練,值得一讀。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2160

原始碼連結

https://github.com/computationalmedia/semstyle

640

Log-DenseNet: How to Sparsify a DenseNet

@mwsht 推薦

#DenseNet

本文是 CMU 和微軟發表於 ICLR 2018 的工作,DenseNet 是 ResNet 的改進,本文在 DenseNet 的基礎上提出了一種較為接近的但同時更少連線數目的 skip connecting 的方法:選擇性地連線更多的前幾個層,而不是全部連線。相較於 DenseNet,本文擁有更少的連線數目,較大幅度地減少了計算量,但同時擁有較為接近的 performance。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2103

640

Training Neural Networks Using Features Replay

@jhs 推薦

#Neural Networks

本文來自匹茲堡大學,論文提出了一種功能重播演算法,對神經網路訓練有更快收斂,更低記憶體消耗和更好泛化誤差

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2114

640

Learning to Ask Good Questions: Ranking Clarification Questions using Neural Expected Value of Perfect Information

@paperweekly 推薦

#Question Generation

本文是馬里蘭大學發表於 ACL 2018 的工作,論文基於完全資訊期望值(EVPI,expected value with perfect information)架構構建了一個用於解決澄清問題排序的神經網路模型,並利用問答網站“StackExchange”構建了一個新的三元組(post, question, answer)資料集,用於訓練一個能根據提問者所提出的問題來給出澄清問題的模型。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2146

原始碼連結

https://github.com/raosudha89/ranking_clarification_questions

640?

NCRF++: An Open-source Neural Sequence Labeling Toolkit

@PatrickLiu 推薦

#Sequence Labeling

本文主要介紹了神經網路序列標註工具包“NCRF++”。NCRF++ 被設計用來快速實現帶有 CRF 推理層的不同神經序列標註模型。使用者可以通過配置檔案靈活地建立模型。工具包使用 PyTorch 實現。解釋該工具包架構的論文已被 ACL 2018 作為 demonstration paper 接受,即本篇論文。 使用 NCRF++ 的詳細實驗報告和分析已被 COLING 2018 接受,詳細論文解讀:COLING 2018 最佳論文解讀:序列標註經典模型復現

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2138

原始碼連結

https://github.com/jiesutd/NCRFpp

640?

SEE: Towards Semi-Supervised End-to-End Scene Text Recognition

@jxlxt 推薦

#Object Recognition

本文設計了一個端到端的半監督文字檢測和識別模型,通過在 SVNH 和 FSNS 資料集上驗證了該模型的 work。文章的模型不需要提供文字檢測的 bounding box 只需要提供正確的 label,然後通過預測誤差反向傳播修正文字檢測結果。

端到端的模型 loss 設計困難,通常識別只專注於文字檢測或文字識別,但本文使用了 STN 來進行文字檢測結合 ResNet 進行識別。先通過 STN 檢測文字位置,輸出特定區域的文字圖片後再通過 CNN 識別文字。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2113

原始碼連結

https://github.com/Bartzi/see

640

Inferring Semantic Layout for Hierarchical Text-to-Image Synthesis

@jamiechoi 推薦

#Image Synthesis

本文是密歇根大學和 Google Brain 發表於 CVPR 2018 的工作,論文首先從文字用一個 box generator 預測出物體類別所在的 bounding box 的位置,然後用 shape generator 在 box 的基礎上生成更細膩的 mask,最後把 mask 和文字資訊輸送到 image generator 進行圖片的生成。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2112

640

Deep Inductive Network Representation Learning

@xuzhou 推薦

#Network Representation Learning

本文是由 Adobe Research、Google 和 Intel Labs 發表於 WWW ’18 上的工作,論文提出了通用的歸納圖表示學習框架 DeepGL,DeepGL 具有多種優勢,對今後的研究具有一定的參考意義。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2151

640

Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction

@paperweekly 推薦

#Attention Mechanism

本文是南洋理工大學發表於 KDD 2018 的工作,論文在問答和對話建模方向為各種檢索和匹配任務提出了一個通用神經排序模型。該模型在神經網路模型的基礎上引入了 attention 機制,不再僅僅將 attention 作為 pooling 操作,而是將其作為一種特徵增強方法。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2159

640

Modeling Polypharmacy Side Effects with Graph Convolutional Networks

@xuehansheng 推薦

#Bioinformatics

本文來自斯坦福大學,論文將 Graph Convolution Neural Network 應用於藥物副作用研究中。本文提出了一種通用的多關聯鏈路預測方法——Decagon,該方法可以應用於任何多模態網路中,能夠處理大量邊緣型別的多模態網路。

640640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2127

原始碼連結

https://github.com/Bartzi/see

640?#推 薦 有 禮#

本期所有入選論文的推薦人

相關推薦

Ntfs for Mac端午大放價新鮮

Ntfs for Mac 在之前的各大節日上,NTFS for Mac一直在低調得做好自己的產品,不過在這次端午節中,Ntfs for Mac表示:屬於本軟件的優惠時間來了! 那麽這次Ntfs for Mac在端午節會給大家帶來怎麽樣的優惠活動呢?接下來就為大家具體介紹一下優惠信息。

2018年12月程式語言排行榜新鮮Visual Basic.NET首次進入前五

TIOBE釋出了2018年12月的程式語言排行榜,令人驚訝的是,微軟的Visual Basic.NET排名正在上升。與去年排名第七相比,現在排名第五。 Visual Basic是一種多正規化、面向物件的程式語言。TIOBE認為,它的崛起之所以令人驚訝,是因為沒有多少專業軟體開發人員會對這種語言給

撒花吳恩達《Machine Learning Yearning》中文版新鮮

紅色石頭的個人網站:redstonewill.com 我相信紅色石頭的很多讀者朋友都受惠於吳恩達的 deeplearning.ai 專項課程。紅色石頭也不例外,之前在我的公眾號裡連載了 deeplearning.ai 的所有課程筆記,需要的朋友請戳下面的傳送門:

2018全美程式設計師薪資報告新鮮

  我的工資和我同事相比,是高還是低?  哪些城市和地區,給程式設計師的待遇最高?  哪些行業和公司,付給程式設計師的薪水最高?  哪些技術和崗位需求量最高?  種族和年齡,會影響我的薪酬嗎?  如果你也對這些問題感興趣,就快來看看美國的科技獵頭公司Hired最新發布的《全美

重磅:GIS平臺管理小能手再升級,OneMap 4.0新鮮

OneMap v4.0 期待您的關注! 新品嚐鮮: Welcome,第三方系統。 4.0版本支援接入自定義服務引擎型別,幫助您實現對第三方服務的管理;另外,支援瓦片服務的輕鬆接入,支援海圖瓦片、天地圖標準格式瓦片的釋出與管理,並具備自定義瓦片型別擴充套件功能,通過定製可以釋出與管理第三方的瓦片格式資料。

機器學習中的數學:一新鮮的熱門草稿

近日,Marc Peter Deisenroth、A Aldo Faisal 和 Cheng Soon Ong 所著書籍《Mathematics for Machine Learning》的全部草稿已放出,我們整理了這本書的簡要概述。感興趣的讀者可從以下連結獲取全文(英文版)。 書籍地址:https://m

7款HTML5/CSS3應用新鮮

點擊 tick tro letter itl ces pro 這樣的 投影 這段時間我們已經陸續向大家分享了很多絢麗實用的HTML5/CSS3應用插件,今天,我從資料庫中精選了7款最新出爐的HTML5/CSS3應用分享給大家,希望大家喜歡。 1、HTML5/CSS3發光文字

新鮮的JSON,拿走不謝

今天 而不是 信息 ipo 轉義字符 ray geometry turn base 一、JSON簡介 1、JSON全稱是JavaScript Object Notation即JavaScript對象標記法。 JSON是一種輕量級(Light-Weight)、基於文本的(Te

今年新鮮的30個流行Android庫,你一定需要

architect 9.png 布局管理 文檔 邊框 fmt 擴展 介紹 算法 作者|Michal Bialas 2017年快過去了,你年初的定的目標都快完成了嗎?總結過去三個月內發布的 最新的30 個 Android 庫和項目。你一定需要,建議收藏!讓你事半功倍 1

新鮮的頭條面試演算法

昨天下午實驗室有一個同學參加了今日頭條的面試,面試最終是以一個演算法題結束。 題目如下:   給你一個有序整數陣列,陣列中的數可以是正數、負數、零,請實現一個函式,這個函式返回一個整數:返回這個陣列所有數的平方值中有多少種不同的取值。舉例: nums = {-1,1

CES2019創新獎新鮮,地平線Matrix自動駕駛計算平臺獲獎

北京2018年11月9日電 /美通社/ -- 11月8日,CES主辦方公佈了2019 CES創新獎( Innovation Awards)獲獎名單,由地平線自主研發的Matrix自動駕駛計算平臺從眾多參展廠商的技術產品中脫穎而出,獲得車輛智慧和自動駕駛技術類的創新獎,此外一同獲獎的還有W

2135億2018 雙11阿里資料庫技術戰報新鮮

00:02:05 成交額超100億00:57:56 成交額超666億01:47:26 成交額超1000億15:49:39 成交額超1682億22:28:37 成交額超2000億 2018新紀錄2135億 在年度大考面前阿里資料庫技術的小哥哥和小姐姐們又一次為大眾遞交了誠意滿滿的答卷 讓我

2018年度詞彙(科技類熱詞)新鮮,提前劇透最吸金的行業

什麼?身為一個網際網路人,你還不知道2018年度詞彙以及科技類熱詞。那麼,請收下我鄙視的眼神。你求我啊我就告訴你。什麼?就不求,那我也要說,哼~   1、“確認過眼神,是遇到對的人” 這首《醉赤壁》是收錄在林俊杰2008年發行的專輯《JJ陸》中的一首歌,由方文山填詞,酷愛赤壁故事的林俊杰親自操

維科杯·OFweek2018中國高科技產業年度評選獲獎名單新鮮

隨著智慧互聯時代的到來,以人工智慧、雲端計算、大資料、物聯網、機器人、新能源等新技術引領的全新商業模式不斷興起,巨大的市場機遇也隨之觸發,併為國內高新企業提供了良好的發展環境。 在此背景下,中國高科技行業門戶OFweek維科網和高科會籌辦了“維科杯·OFweek 2018中國高科技產業年

【開班計劃】奧斯科十二月開班計劃新鮮

科技 針對性 中心 cci roc 學會 建立 emc 培訓中心 旅人窸窸窣窣踩過落葉和枯枝將沈沈暮色收入身後的背囊北風穿山越嶺而來呼嘯著敲響新的鐘聲2018,僅剩最後一個月那你做好準備了嗎年初許下的願望是否實現制定的目標是否達成呢畢竟從來沒有來日方長有的只是時光匆匆所以與

來來來。。新鮮的java程式設計題,搜**遊

這2019屆遊戲校招我感覺巨坑,選擇題分為三部分,遊戲知識部分,基本資料分析部分(給一段文字,按題目選擇資料正確的),還有基礎知識部分,這次做感覺java的基本知識較少,jvm好多。。根本不瞭解,作業系統也好多。。。感覺筆試很懸。。複習不足呀。。牛客網的題目真的沒啥用這和說好

11月程式語言排行榜新鮮,這些經典圖書等你來撩

​再過兩個月,TIOBE 就將宣佈 2018 年的年度程式語言。年度語言有望出現在前 5 名:Java、C、C+、Python 和 Visual Basic.NET 中。每年,我們都希望一些有創意特性的程式語言獲獎,但是 2018 年度語言桂冠很可能由一個成熟的語言摘得。 當然,今年也有出現了一

蘋果 2018 年 App Store 年度精選榜單新鮮

2018年已經接近尾聲,在這一年裡,相信大家都發現了不少好用又好看的APP。來自各個地區的 App Store 編輯團隊回顧了過去一年裡推出的所有應用作品,最終推選出了實用性更強、完成度更高、設計更精美的幾款佳作,下面就讓佐佐和大家分享一下這些出色的作品吧。   年度 iPh

新鮮,2019最新大廠面試題總彙

   在這個網際網路技術快速迭代的時代,每個程式設計師都知道技術對於職業發展的重要性,那些技術好的程式設計師不僅薪資高,而且大多數集中在一線網際網路企業工作,讓人感覺非常高大上的同時,也想去大廠做程式設計師。然而很多人沒有入職大廠並不是自己沒有技術,而是自己沒有在大廠任職過的經驗,對於大廠