暑假沒人帶怎麼辦?還有我們為你推薦論文 | 本週值得讀
在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。
在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。
這是 PaperDaily 的第 87 篇文章@paperweekly 推薦
#Dialogue Generation
本文是 CMU 發表於對話系統頂會 SIGDIAL 2018 的工作,並且獲得最佳論文提名,角逐今年 SIGDIAL 最佳論文獎。此文提出零資源對話生成的問題,目的讓端到端神經對話系統可以在沒有新的對話資料的情況下迅速的遷移到全新的領域
測試表明利用提出的 AM 演算法,可以讓配有拷貝機制的神經對話系統在全新的 domain 實現相當於有訓練資料時 80% 的效能。本文研究同時也引出了多個前沿的研究課題。
論文假設在一類對話領域中存在可以共享的對話狀態跟蹤和對話策略,模型只需建立來著不同領域中對話句子之間的關係,就可以繼續在新的領域正常運作。作者將有對話資料的領域稱為源領域(source domain),將沒有對話資料的領域稱為目標領域(target domain)。然後通過把近似對話功能來自 source domain 的句子和來自 target domain 句子投射到相近的隱空間上,就可以讓在 source domain domain 上訓練出來的對話狀態跟蹤和對話策略直接在 target domain 上使用。這個目標可以通過 AM 演算法中交替優化兩種不同的目標函式實現。
實驗資料結果表明 AM 是在所有對比模型中唯一可以實現在全新領域零資源遷移的方法。此外,為了更加高效的驗證未來的零資源對話模型,除了利用現有的多領域人人對話資料,論文還開源了一個多領域的人機對話模擬器,可以自動生成不同領域,不同難度的對話。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2077
原始碼連結
https://github.com/snakeztc/NeuralDialog-ZSDG
Design Challenges and Misconceptions in Neural Sequence Labeling@handsome 推薦
#Neural Sequence Labeling
本文是 COLING 2018 的 Most reproducible Paper。作者用 PyTorch 實現了一個統一的序列標註框架,重現了 CoNLL 2003 English NER、CoNLL 2000 Chunking 和 PTB POS tagging 這三個資料集上不同模型的的表現。值得一提的是,基於這個統一的框架,作者對一些已有工作的一些不一致的結論進行了反駁,提出了一些新的看法。對於實踐者而言,這篇論文還是很有借鑑意義的。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2061
原始碼連結
https://github.com/jiesutd/NCRFpp
Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures
@paperweekly 推薦
#Dialog Systems
本文是新加坡國立大學、復旦大學和京東發表於 ACL 2018 的工作,論文提出了一個名為 Sequicity 的框架,可將任務型對話的狀態追蹤和文字生成通過 Seq2Seq 模型來完成。
此外,在此任務的基礎上,作者還提出了 Two Stage CopyNet 模型。相比傳統模型,該模型引數較少且訓練速度更快。實驗表明,本文模型在大規模語料中優於當前最新模型的 baseline,並且在處理 out-of-vocabulary 問題時,也有著出色表現。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2095
Semantic Sentence Matching with Densely-connected Recurrent and Co-attentive Information@zhkun 推薦
#Sentence Matching
句子匹配(Sentence Matching)是自然語言理解任務中一個非常重要的任務,例如 Natural Language Inference,Paraphrase Identification,Question Answering 等都可以歸屬於這個任務。這個任務主要就是理解句子語義,理解句子之間的語義關係。因此如何去表示這些內容就變得十分重要了。
為了更好的利用原始特徵資訊,作者參考 DenseNet,提出了一種 densely-connected co-attentive recurrent neural network 模型,該模型最突出的地方就是可以從最底層到最頂層一直保留原始資訊以及利用 co-attention 得到的互動資訊。
本文將 DenseNet 的一些想法引入到了 stack RNN 中,還是可以給人一些靈感的,比如說從殘差連線到 DenseNet,比如說注意力權值的使用方法,比如說利用 AutoEncoder 來壓縮向量,這些還是十分值得學習的。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2082
Unsupervised Neural Machine Translation with Weight Sharing@paperweekly 推薦
#Neural Machine Translation
本文是中科大發表於 ACL 2018 的工作,論文提出對無監督機器翻譯進行權重共享約束,使模型能夠為每種語言使用獨立的編碼器。為了實施共享潛在空間,模型還提出了嵌入增強編碼器和兩個不同的 GAN。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2094
原始碼連結
https://github.com/ZhenYangIACAS/unsupervised-NMT
Exploiting Spatial-Temporal Modelling and Multi-Modal Fusion for Human Action Recognition@zhaoqijie 推薦
#Action Recognition
本文來自百度,該論文是獲得 CVPR18-ActivityNet18 視訊分類(行為識別)task 第一名的比賽方法描述。作者提出了一個 Spatial-Temporal Network (STNet),在 TSN 的基礎上,深度整合空間和時間上的特徵,學習出更具行為代表性的時序表徵特徵。
此外,本文還提出了一個多流資訊整合的方案 Improved Temporal Xception Network,將 5 種不同的輸入流資訊整合學習,並得到 top1 accuracy = 82.4 的單模型最高精度。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2079
Performance Comparison of Convolutional AutoEncoders, Generative Adversarial Networks and Super-Resolution for Image Compression@TwistedW 推薦
#Image Compression
本文來自早稻田大學,論文用精煉的語言對比了幾類影象生成模型,將卷積自編碼器(CAE)、生成對抗網路(GAN)和超解析度(SR)在生成影象效能上做了比較。通過提取影象緊湊的特徵,文章得出 CAE 比 JPEG 具有更好的編碼效率,GAN 顯示出在大壓縮比和高主觀質量重建方面的潛在優勢,超解析度在其中實現了最佳的速率失真(RD)效能,與 BPG 相當。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2085
ISTA-Net: Interpretable Optimization-Inspired Deep Network for Image Compressive Sensing@sawako 推薦
#Image Reconstruction
本文是 KAUST 發表於 CVPR 2018 的工作,論文研究了影象的 CS 重建問題,並且基於經典的 ISTA 提出了 ISTA-Net。ISTA-Net 的每一層先對輸出進行編碼,即卷積提取特徵,然後對特徵進行壓縮(shrinkage),最後再進行解碼。與眾多傳統 CS 演算法以及 ADMM-Net 相比,ISTA-Net 的速度最快,重建效果最好。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2056
原始碼連結
https://github.com/jianzhangcs/ISTA-Net
CFENet: An Accurate and Efficient Single-Shot Object Detector for Autonomous Driving@zhaoqijie 推薦
#Object Detection
本文來自北京大學和阿里巴巴,論文為自動駕駛場景提供了一種新的單步檢測器,對小目標的檢測做了極大的優化。該文章是基於 SSD 改進的方法裡效果最好的版本,論文方法在 CVPR 2018 的 workshop of autonomous driving(WAD) 中獲得目標檢測專案的第二名,結果為本方法的單模型、多尺度預測結果。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2070
Eye In-painting with Exemplar Generative Adversarial Networks@zhangjichao 推薦
#Image Inpainting
本文來自 Facebook,論文提出了一種基於 Exemplar 的人眼修復演算法,除了得到高質量的修復結果,而且能夠保持修復結果的身份特徵。論文提出的框架具有一定的通用性,可以被應用到其他修復問題,以及超解析度等問題中。論文還開源了一個新的資料集來作為 benchmark。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2058
原始碼連結
https://github.com/bdol/exemplar_gans
Policy Optimization With Penalized Point Probability Distance: An Alternative To Proximal Policy Optimization@figo 推薦
#Deep Reinforcement Learning
本文來自小米,論文對標 OpenAI PPO, 提出了一種與 PPO(OpenAI, Google Brain 預設強化學習演算法,也是到目前最好的 RL 演算法)相比均有很強競爭力的 RL 演算法。
在與 PPO 保持相同複雜度和計算量的前提下,嚴格按照 OpenAI 的測試評價指標,在 Atari 49 + Mujoco 7 上取得了 state of the art 的效果,且同時可以應用在離散和連續的情形。論文開放了原始碼和實驗資料,這在 RL 領域,確是為數不多的開源如此徹底的論文。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2091
原始碼連結
https://github.com/cxxgtxy/POP3D.git
Supervised Reinforcement Learning with Recurrent Neural Network for Dynamic Treatment Recommendation@xiaolu 推薦
#Deep Reinforcement Learning
本文是華東師範大學發表於 SIGKDD 2018 的工作。近幾年,許多機器學習演算法致力於輔助醫生更好地開展工作,例如生成醫療影象報告,輔助診斷等。其中輔助醫生開藥(藥物推薦)的研究已經有很長曆史。傳統藥物推薦演算法主要分為監督學習(SL)和強化學習(RL)。SL 通過匹配醫生的藥方來訓練模型,RL 通過優化病人輸出進行學習。本文嘗試通過融合 SL 的指示訊號和 RL 的評估訊號來提升藥物推薦效果。
早期,許多研究工作通過構建專家系統來進行藥物推薦。隨著近年海量電子病歷的湧現,一些工作利用這些大量的個性化資料,結合人工智慧演算法進行基於模型的藥物推薦。基於模型的藥物推薦演算法大致分為 SL 和 RL 兩類。
SL 通過減少模型輸出和指示訊號(醫生藥方)之間的差異來訓練模型。但是,在真實醫療環境中好的 label 或者指示訊號是不明確的。另一方面,藥物推薦的根本目的是為了優化病人的輸出(減少死亡率,減少腫瘤大小等),而不僅是匹配醫生的藥方。
第二類方法是基於 RL 的藥物推薦。RL 通過最大化評估訊號(reward)即病人的輸出來訓練模型。此外,醫生的開藥過程實際是一個多步決策過程,所以 RL 能更好地反應真實的醫療場景。可是,由於缺少指示訊號,RL 可能輸出高風險的藥物。
Barto 曾提出指示訊號和評估訊號是互補的關係,基於此,我們提出一種同時融合這兩種訊號的模型來解決藥物推薦問題。模型融合了 DDPG 和 RNN,其中DDPG中的 Actor 由指示訊號和評估訊號共同訓練。通過在公開電子病歷 MIMIC-3 上進行實驗,驗證了本文模型的有效性。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2092
On the Spectral Bias of Deep Neural Networks@herb 推薦
#Fourier Analysis
根據前人的工作告訴我們,過參的(over-parameterized) DNN 會對簡單的光滑(smooth) 函式優先擬合,也就是說更容易破獲到資料的整體結構(global structure),而不是對每個樣本的過擬合。這一現象對於真實資料和隨機生成的資料都是會發生的。可見,DNNs 對擬合光滑資料很有傾向性(bias)。
本文工作並不是研究泛化性或者優化方法的表現,而是用傅立葉分析證明 DNNs 對光滑函式的內稟傾向性。具體來說(這裡默認了一個事實:越高頻,越不光滑):
1. 對於任意有限引數值 θ,DNN 中 ReLU 函式裡的相應幅度,會隨著頻譜中的頻率分量 k 以衰減。對於高頻特徵的捕獲,DNN 的寬度是 polynomially 的,深度是 exponentially 。說白了,資料的高頻分量在網路中貢獻很小,所以體現了對光滑低頻函式的傾向性(在一定的 steps 上)。這是 paper 最重要最核心的結果。
2. 於是有了理論上的推論:對於擬合擬合類 δ 函式來說,DNN 的能力就會大大受限。
3. 論文還證明了:加入 DNN 對映的是一個低微微分流形,那麼 DNN 就可以充分利用流形的幾何特徵去近似地擬合高頻特徵分量。
4. 經驗上證明了:對於 CIFAR-10 資料來說,所有的樣本(甚至包括對抗樣本)被 DNN 分類後,相同特定類別裡的樣本都在某種程度上存在著線性關聯(用的AutoNEB)。
5. 經驗上證明了:對於高頻函式分量的 DNN 引數佔坑較小。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2080
Generative Adversarial Image Synthesis with Decision Tree Latent Controller@TwistedW 推薦
#Image Synthesis
本文是 NTT 集團發表於 CVPR 2018 的工作,文章提出了決策樹潛在控制器生成對抗網路(DTLC-GAN)模型,該模型可以在不依賴詳細監督的情況下學習到影象的分層解釋表示。DTLC-GAN 以層次分解的方式捕捉影象的顯著語義特徵,在有限的標籤資訊下以粗到細的方式控制影象的語義特徵,實現了同一類別下不同語義特徵影象的生成。
▲論文模型:點選檢視大圖
論文連結
https://www.paperweekly.site/papers/2068
Mixed Link Networks@chlr1995 推薦
#Scaffolding Networks
本文從拓撲結構的角度,分析了 ResNet(Eccv版本)和 DenseNet 的結構特性,並以此提出了 Dense Topology。從 Dense Topology 出發,對層與層之間的連線方式進行了變換,主要方式有拼接(DenseNet Concatenation)和累加(ResNet Addition)兩種,最終構造了一種混合 concat 和 addition的 Mixed link 結構,兩種操作的數量由 k1 和 k2 兩個超引數決定。最後通過實驗驗證了網路結構的有效性,以及超引數的穩定性。
相關推薦
暑假沒人帶怎麼辦?還有我們為你推薦論文 | 本週值得讀
在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。在這個欄目裡,你會快速
「珍藏」老司機為你推薦10個炫酷的開源庫,看完的人都收藏了
前言 技術群裡面經常有人問到一些炫酷的UI效果實現方法,有時候我都是給一個相同或者相似效果的Github連結,有同學私信給我說,大佬,怎麼這些效果你都能找到?你是怎麼搜尋的,或者有其他什麼祕方?會利用Google、百度等搜尋工具搜尋是一方面,另一個重要的方面是:記錄蒐藏,當看到一個炫酷的效果的時候,記得
我們為你精心整理了2018年最重要的10項AI研究
https://mp.weixin.qq.com/s/kQ0VFSh1HCqPwlKlGyS-QA 作者 | Mariya Mao 譯者 | 馬卓奇 編輯 | Natalie AI 前線導讀: 想跟上 AI 研究的論文會讓人覺得這是徒勞無益的,因為這個領域發展
linux部署神器(附壓縮包):一鍵安裝centos 7環境基礎環境,lanmp懶人版,還有tomat等你想不到的linux神器
文章目錄 壓縮包 一、安裝版本指南 二、開始安裝 三、安裝完成 四、安裝虛擬環境 壓縮包 http://mirrors.linuxeye.com/oneinstack-full.tar.gz 一、安裝版本指南 可選擇
在Python 2.7即將停止支援時,我們為你準備了一份3.x遷移指南
目前,Python 科學棧中的所有主要專案都同時支援 Python 3.x 和 Python 2.7,不過,這種情況很快即將結束。去年 11 月,Numpy 團隊的一份宣告引發了資料科學社群的關注:這一科學計算庫即將放棄對於 Python 2.7 的支援,全面轉向 Py
如何為你的論文建立一個優秀的大綱?
在大學裡寫論文有時是非常有創意的方法來構造你的論文。花時間起草一份大綱可以幫助你確定你的想法是否相互聯絡,什麼想法的順序最有效,你是否有足夠的證據來支援你的每一個觀點,這也是一種有效的方式來思考,你需要多少時間來完成你的論文的每一部分,然後你開始寫作。 Papertime論文檢測系統關於
為你推薦一份深度學習書單,來學習吧~
來源:雲棲社群本文共4400字,建議閱讀8分鐘。本文為大家帶來目前網際網路上12本最好的深度學習
為你推薦10款開發常用的程式碼編輯器
程式碼編輯器對於程式設計師來說十分重要,一個好的編輯器可以節省開發時間,提高工作效率。這篇文章會介紹10個優秀且免費的編輯器,它們都是非常方便易用的環境,你可以用它們來編寫程式碼,檢視原始檔和文件等,簡化你的工作。 本文由PHP100中文網編譯,轉載請看文末的
人不理財,財不理你,2019年應該讀的理財書
如果 你是 技巧 有趣 style 程序員 擁有 普通 16px 我讀過的第一本理財啟蒙書是《富爸爸,窮爸爸》,作者是一名擁有傳奇人生的美國人羅伯特清崎,書中介紹的理財知識非常震撼:作者有兩個爸爸,富爸爸是一個沒有讀過大學的當地巨富,窮爸爸是一個擁有博士學歷的大學教授,作者
為什麽我這麽努力,還是沒人認可我?
故事 經歷 如果 成功 告訴 是不是 努力 方式 關心 我想了很久,突然想通了:這世界根本不在乎你多麽努力,只在乎你是不是有所成就,在乎你的努力是否有效。其實,在人有所成就前,所以的努力都不會被人歌頌,只有在人成長一顆蒼天大樹後,他的傷痛和努力才會被別人認可,被人發
十年過去了,還沒人真正地為區塊鏈找到突破性運用
交易所 權限 電子郵件 不足 結算 行為 都是 發布 你是 十年過去了,還沒人真正地為區塊鏈找到突破性運用http://www.bieryun.com/1185.html是虛幻的價值泡沫?還是顛覆社會經濟秩序的天才發明?對於區塊鏈技術,資本屆和媒體圈多充滿憧憬,認為該技術可
#程式設計師華為跳槽阿里,吐槽阿里太辛苦,但為什麼沒人黑阿里呢!
國內的網際網路企業我想阿里無疑數一數二,尤其當阿里發年終獎的時候,網上很多程式設計師都在晒在阿里的年終獎,獎金當然與你的績效成正比,所以阿里的加班也算是很平常的一件事,幾乎沒人會那這是來說。有程式設計師網友就在網上吐槽了剛加入阿里所遭受的高強度的加班文化。 如果
【Python3爬蟲】為什麽你的博客沒人看呢?
需要 相關 數據量 block form table 進行 for 不能 我相信對於很多愛好和習慣寫博客的人來說,如果自己的博客有很多人閱讀和評論的話,自己會非常開心,但是你發現自己用心寫的博客卻沒什麽人看,多多少少會覺得有些傷心吧?我們今天就來看一下為什麽你的博客沒人看呢
Java程式記憶體分析:jdk自帶的jmap能為我們帶來什麼
jmap 打印出某個java程序(使用pid)記憶體內的,所有‘物件’的情況(如:產生那些物件,及其數量)。 可以輸出所有記憶體中物件的工具,甚至可以將VM 中的heap,以二進位制輸出成文字。使用方法 jmap -histo pid。如果連用SHELL jmap -histo pid&g
人智化轉型 華為雲微認證帶你實力進階
所有 愛好者 整體 process 增長 資源 偽命題 廣度 在線學習 人智化轉型 華為雲微認證帶你實力進階人智化轉型不是一個偽命題或是一個超前的命題。這是一個實實在在正在發生的趨勢,是所有已經完成雲轉型的大型科技企業的下一步。國內外的雲計算企業已經對人工智能全力以赴,其
要想人不知除非己莫為!!!!
media 難度 而是 學生 以及 技術分享 抽象類 data- 載體 現實世界中,隨處可見的一種事物就是對象,對象是事物存在的實體,如人類、書桌、計算機、高樓大廈等。人類解決問題的方式總是將復雜的事物簡單化,於是就會思考這些對象都是由哪些部分組成的。通常都會將對象
高考帶給了我們什麽..........
中國人 知識點 二元論 北京 聯想 高考帶給了我們什麽?最近一直在思考這個問題。或者擴展一下思考,高考為我們的未來帶來的哪些可能?高考的智商,情商二元對立論? 我一直不同意上邊的這個觀點,相反,一直以為。智商高的人情商也低不到哪去!中國人一般會用成績的好壞來定義智商
前端十萬個為什麽(之一):我們為什麽需要npm?
重要 col 以及 檢索 xxx 存在 你在 語句 16px p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px ".PingFang SC"; color: #454545 } span.s1 { font: 12.0