推薦|深度學習領域引用最多的20篇論文,建議收藏!
作者:Pedro Lopez,資料科學家,從事金融與商業智慧
深度學習是機器學習和統計學交叉領域的一個子集,在過去的幾年裡得到快速的發展。強大的開源工具以及大資料爆發使其取得令人驚訝的突破進展。本文根據微軟學術(academic.microsoft.com)的引用量作為評價指標,從中選取了20篇頂尖論文。注意,引用量會隨著時間發生快速的變化,本文參考的是本文發表時候的引用量。
在這份清單中,超過75%的文章都提到了深度學習和神經網路,尤其是卷積神經網路(CNN),其中,50%的文章是計算機領域模式識別應用。隨著硬體效能、資料量及開源工具的發展,使用基於GPU的工具箱,如TensorFlow、Theano等,有利於資料科學家和機器學習工程師擴充套件相應的應用領域。
1.Deep Learning,Yann L., Yoshua B. & Geoffrey H. (2015) (引用量: 5,716)
本文是深度學習大牛Hinton的開山之作,引用量高達5700多次。在這篇文章中,提出了深度學習的方法,它允許由多個處理層組成的計算模型來學習具有多個抽象層次的資料表示。這些方法極大地促進了語言識別、視覺物體識別、目標檢測以及藥物發現、基因組合燈許多領域的進展。
論文地址:
https://www.cs.toronto.edu/~hinton/absps/NatureDeepReview.pdf?spm=a2c4e.11153940.blogcont576283.17.3ac27677LdbpjU&file=NatureDeepReview.pdf
2.TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems, by Martín A., Ashish A. B., Eugene B. C., et al. (2015) (引用量: 2,423)
這篇文章釋出了TensorFlow工具箱,該工具箱使用非常靈活,十分受研究者的追捧,很多研究者認為該工具箱在之後的研究中會佔據主導地位。TensorFlow可以用來表示各種各樣的演算法,包括深層神經網路模型以及推理演算法等。TensorFlow已經被用於研究,並將計算機學習系統部署到電腦科學和其它的多個領域,包括語言識別、計算機視覺、機器人、資訊檢索、自然語言處理、地理資訊提取等。
論文地址:
http://download.tensorflow.org/paper/whitepaper2015.pdf?spm=a2c4e.11153940.blogcont576283.18.3ac27677XarSxP&file=whitepaper2015.pdf
3.TensorFlow: a system for large-scale machine learning, by Martín A., Paul B., Jianmin C., Zhifeng C., Andy D. et al. (2016) (引用量: 2,227)
TensorFlow支援各種應用,對深層神經網路的訓練和推理能力成為了研究者的關注點。谷歌在其一些產品中使用了TensorFlow,並將其公開為一個開源專案,目前已被廣泛用於機器學習的研究中。
論文地址:
https://www.usenix.org/legacy/system/files/conference/osdi16/osdi16-abadi.pdf%20rel=?spm=a2c4e.11153940.blogcont576283.19.3ac27677wXFSLT&file=osdi16-abadi.pdf%20rel=
4.Deep learning in neural networks, by Juergen Schmidhuber (2015) (引用量: 2,196)
這篇文中是一個綜述類文章,總結了深度學習和神經網路的發展歷史。淺層和深層學習器是通過網路層數的數量區分,並且詳細講解了有監督學習(簡要介紹反向傳播演算法的歷史)、無監督學習、強化學習、進化計算以及深層編碼網路。
論文地址:
https://arxiv.org/pdf/1404.7828.pdf?spm=a2c4e.11153940.blogcont576283.20.3ac27677wM2vCk&file=1404.7828.pdf
5.Human-level control through deep reinforcement learning, by Volodymyr M., Koray K., David S., Andrei A. R., Joel V et al (2015) (引用量: 2,086)
這篇文章主要是使用深層神經網路的最新進展——強化學習,並訓練了一種新穎且智慧的代理,被稱為Q網路。Q網路使用端到端強化學習直接從高維感官輸入學習到成功的策略,並使用經典遊戲Atari 2600對其進行測試,結果表明其效果非常好。
論文地址:
https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf?spm=a2c4e.11153940.blogcont576283.21.3ac27677khlbo4&file=MnihEtAlHassibis15NatureControlDeepRL.pdf
6.Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks, by Shaoqing R., Kaiming H., Ross B. G. & Jian S. (2015) (引用量: 1,421)
這篇文章的主要工作是引入了區域推薦網路(RPN),該網路能夠與檢測網路共享全影象卷積特徵,從而使無成本的區域推薦成為可能。一個RPN網路是一個全卷積網路,同時預測每個位置物件的範圍和其分數。
論文地址:
https://arxiv.org/pdf/1506.01497.pdf?spm=a2c4e.11153940.blogcont576283.22.3ac276779Ttljn&file=1506.01497.pdf
7.Long-term recurrent convolutional networks for visual recognition and description, by Jeff D., Lisa Anne H., Sergio G., Marcus R., Subhashini V. et al. (2015) (引用量: 1,285)
與當前假設固定時空感受野或簡單時間平均序列的模型處理相比而言,遞迴卷積模型是“雙份深度”,這是由於該模型是“時間層”和“空間層”的組合。
論文地址:
https://arxiv.org/pdf/1411.4389.pdf?spm=a2c4e.11153940.blogcont576283.23.3ac27677bXpou7&file=1411.4389.pdf
8.MatConvNet: Convolutional Neural Networks for MATLAB, by Andrea Vedaldi & Karel Lenc (2015) (引用量: 1,148)
本文是針對MATLAB開發的深度學習工具箱,它揭露了CNN模型也可以通過簡單使用MATLAB函式完成搭建。該工具箱提供了卷積層、池化層等功能。該文件簡單介紹了CNN,並說明如何在matconvnet工具箱中實現模型的搭建,並給出了每個計算塊的技術細節。
論文地址:
https://arxiv.org/pdf/1412.4564.pdf?spm=a2c4e.11153940.blogcont576283.24.3ac27677k3MDgU&file=1412.4564.pdf
9.Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks, by Alec R., Luke M. & Soumith C. (2015) (引用量: 1,054)
在這篇文章中,希望通過CNN縮小有監督學習和無監督學習二者之間的差距。引入了一類新的CNN模型,被稱作深層卷積生成對抗網路(DCGANs)。該網路具有一定體系結構約束,也被證明是無監督學習問題中一種有效方法。
論文地址:
https://arxiv.org/pdf/1511.06434.pdf?spm=a2c4e.11153940.blogcont576283.25.3ac276771TzGAy&file=1511.06434.pdf
10.U-Net: Convolutional Networks for Biomedical Image Segmentation, by Olaf R., Philipp F. &Thomas B. (2015) (引用量: 975)
對於深度學習而言,人們大多有個共識——深層網路訓練成功需要依賴於大量的訓練樣本。而在本篇文章中,提出了一種新的網路和訓練策略,其訓練策略依賴於資料增強,使其可以更高效地使用現有樣本。
論文地址:
https://arxiv.org/pdf/1505.04597.pdf?spm=a2c4e.11153940.blogcont576283.26.3ac276770IHiyG&file=1505.04597.pdf
11.Conditional Random Fields as Recurrent Neural Networks, by Shuai Z., Sadeep J., Bernardino R., Vibhav V. et al (2015) (引用量: 760)
在這篇文章中,引入了一種新的模型,它將卷積神經網路(CNN)與條件隨機場(CRF)二者的優點相結合,構造出RNN網路。
論文地址:
http://www.robots.ox.ac.uk/~szheng/papers/CRFasRNN.pdf?spm=a2c4e.11153940.blogcont576283.27.3ac27677wwmxH5&file=CRFasRNN.pdf
12.Image Super-Resolution Using Deep Convolutional Networks, by Chao D., Chen C., Kaiming H. & Xiaoou T. (2014) (引用量: 591)
這篇文章採用方法是直接學習低解析度到高解析度影象的端到端對映,該對映被表示為一個深層卷積神經網路(CNN),它以低解析度影象作為輸入,輸出的是高解析度影象。
論文地址:
https://arxiv.org/pdf/1501.00092.pdf?spm=a2c4e.11153940.blogcont576283.28.3ac27677uoRVt5&file=1501.00092.pdf
13.Beyond short snippets: Deep networks for video classification, by Joe Y. Ng, Matthew J. H., Sudheendra V., Oriol V., Rajat M. & George T. (2015) (引用量: 533)
在這篇文章中,提出了將CNN與LSTM結合在一起對視訊資料進行特徵提取,單幀的影象資訊通過CNN獲取特徵,然後將CNN的輸出按時間順序通過LSTM,最終將視訊資料在空間和時間維度上進行了特徵表達。
論文地址:
https://arxiv.org/pdf/1503.08909.pdf?spm=a2c4e.11153940.blogcont576283.29.3ac27677qJnF3L&file=1503.08909.pdf
14.Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning, by Christian S., Sergey I., Vincent V. & Alexander A A. (2017) (引用量: 520)
卷積網路變得越來越深,網路模型也變得越來越複雜。谷歌公司提出的Inception-v4網路結構是近年來影象識別領域取得的最大進展。該網路結構具有三個殘差網路和一個Inception-v4結構單元。在ImageNet挑戰賽(CLS)top-5中實現3.08%的錯誤率。
論文地址:
https://arxiv.org/pdf/1602.07261.pdf?spm=a2c4e.11153940.blogcont576283.30.3ac27677uhbfsE&file=1602.07261.pdf
15.Salient Object Detection: A Discriminative Regional Feature Integration Approach, by Huaizu J., Jingdong W., Zejian Y., Yang W., Nanning Z. & Shipeng Li. (2013) (引用量: 518)
在這篇文章中,將顯著圖計算轉化為一個迴歸問題。採用的方法是基於多層次的影象分割,並利用監督學習方法將區域特徵向量對映為一個顯著性分數。
論文地址:
https://arxiv.org/pdf/1410.5926.pdf?spm=a2c4e.11153940.blogcont576283.31.3ac27677YZbKox&file=1410.5926.pdf
16.Visual Madlibs: Fill in the Blank Description Generation and Question Answering, by Licheng Y., Eunbyung P., Alexander C. B. & Tamara L. B. (2015) (引用量: 510)
在這篇文章中,介紹了一個新的資料集——Visual Madlibs。該資料集包含360001個針對10738幅影象的自然語言描述,它是在空白模板中利用自動生成進行收集,收集的是有針對性的描述,比如人和物體、外貌、活動和互動、以及對一般場景或更廣闊背景的推論。
論文地址:
https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Yu_Visual_Madlibs_Fill_ICCV_2015_paper.pdf?spm=a2c4e.11153940.blogcont576283.32.3ac27677NTzhEK&file=Yu_Visual_Madlibs_Fill_ICCV_2015_paper.pdf
17.Asynchronous methods for deep reinforcement learning, by Volodymyr M., Adrià P. B., Mehdi M., Alex G., Tim H. et al. (2016) (引用量: 472)
A3C演算法是AC演算法的非同步變體,在Atari領域是最先進的演算法。訓練時候採用的多核CPU,而不是單個GPU,節約了一半的時間。此外,還發現A3C演算法在各種各樣的連續電機控制問題上效能表現優異。
論文地址:
http://proceedings.mlr.press/v48/mniha16.pdf?spm=a2c4e.11153940.blogcont576283.33.3ac27677kBRXJT&file=mniha16.pdf
18.Theano: A Python framework for fast computation of mathematical expressions., by by Rami A., Guillaume A., Amjad A., Christof A. et al (2016) (引用量: 451)
Theano是一個Python庫,它允許使用者定義、優化以及有效地評估涉及多維陣列的數學表示式。自推出以來,它一直是最常用的CPU和GPU數學編譯器,尤其是在機器學習社群中顯示出其效能的穩定提升。
論文地址:
https://arxiv.org/pdf/1605.02688.pdf?spm=a2c4e.11153940.blogcont576283.34.3ac27677blRucu&file=1605.02688.pdf
19.Deep Learning Face Attributes in the Wild, by Ziwei L., Ping L., Xiaogang W. & Xiaoou T. (2015) (引用量: 401)
該框架不僅大大提升了系統的效能,而且表明了學習人臉表徵是有價值的事實。(1)展示了人臉定位(LNET)和屬性預測(ANET)可以通過不同的預訓練方法改進;(2)儘管只微調了LNet過濾器,但它們在整個影象上的響應圖對人臉位置有很強的指示性。
論文地址:
https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Liu_Deep_Learning_Face_ICCV_2015_paper.pdf?spm=a2c4e.11153940.blogcont576283.35.3ac27677CwhXcF&file=Liu_Deep_Learning_Face_ICCV_2015_paper.pdf
20.Character-level convolutional networks for text classification, by Xiang Z., Junbo Jake Z. & Yann L. (2015) (引用量: 401)
這篇文章使用字元級卷積神經網路(Char-CNN)實現文字的分類,並構建了幾個大規模資料集,實驗結果表明,字元級卷積神經網路可以實現很好的效能。
論文地址:
http://papers.nips.cc/paper/5782-character-level-convolutional-networks-for-text-classification.pdf?spm=a2c4e.11153940.blogcont576283.36.3ac276778WChsu&file=5782-character-level-convolutional-networks-for-text-classification.pdf
相關推薦
推薦|深度學習領域引用最多的20篇論文,建議收藏!
作者:Pedro Lopez,資料科學家,從事金融與商業智慧深度學習是機器學習和統計學交叉領域的
深度學習領域引用量前20篇論文簡介
轉自:七月演算法點選開啟連結 深度學習是機器學習和統計學交叉領域的一個子集,在過去的幾年裡得到快速的發展。強大的開源工具以及大資料爆發使其取得令人驚訝的突破進展。本文根據微軟學術(academic.microsoft.com)的引用量作為評價指標,從中選取了20篇頂尖論文。注意,引用量會隨著時間發
推薦|深度學習領域引用量最多的前20篇論文簡介
來源:全球人工智慧作者:Pedro Lopez,資料科學家,從事金融與商業智慧。譯者:海棠,審閱
機器學習和深度學習引用量最高的20篇論文(2014-2017)
機器學習和深度學習的研究進展正深刻變革著人類的技術,本文列出了自 2014 年以來這兩個領域發表的最重要(被引用次數最多)的 20 篇科學論文,以饗讀者。 機器學習,尤其是其子領域深度學習,在近些年來取得了許多驚人的進展。重要的研究論文可能帶來使全球數十億人受益的技術突破。這一領域的研究目前發展
在機器學習領域,怎樣寫好一篇論文
當你做好了一個研究工作, 準備發表出來與同仁們分享, 一個首要的任務是把你的工作變成一篇文章。問題來了,怎樣寫作一篇高質量的文章呢?我們以機器學習領域的應用型文章為例,探討一下論文寫作的問題。注意,任何好的文章都要以好的研究工作為基礎,我們這裡不談你的研究工作質量如何,只討論文章的寫作問題。要把一個
四個國產軟體大推薦!功能強大到無法無天,建議收藏!
今天小編要給大家分享的是四款國產軟體,這四款國產軟體幾乎沒有人知道,但是功能卻非常的強大! 軟體一:火絨安全軟體 自從網際網路誕生以來,各種病毒都在到處傳播,這個時候就自然有了一系列的防毒軟體,火絨防毒軟體可以說是網際網路上的一股清流了,不僅沒有各種外掛,而且增加電腦系統在應對出現安全問題時的防禦
五個國產軟體大推薦!功能強大到無法無天,建議收藏!
今天小編要給大家分享的是五款國產軟體,這五款國產軟體幾乎沒有人知道,但是功能卻非常的強大! 軟體一:迅捷視訊轉換器 這是一款功能非常強大的視訊格式轉換器,各種視訊格式音訊格式,多種手機格式的轉換。比如愛奇藝中的qsv轉mp3,騰訊的qlv轉mp4,這些都可以輕鬆轉換! 軟體二:火絨安全軟體
大話程式猿眼裡最全的高併發,快收藏!
前言 高併發經常會發生在有大活躍使用者量,使用者高聚集的業務場景中,如:秒殺活動,定時領取紅包等。 為了讓業務可以流暢的執行並且給使用者一個好的互動體驗,我們需要根據業務場景預估達到的併發量等因素,來設計適合自己業務場景的高併發處理方案。 在電商相關產品開發的這些年,我有幸的遇到
python零基礎系統學習步驟安排,建議收藏!
學習Python程式設計技術的流程與步驟,自學與參加培訓學習都適用。 一、清楚學習目標 無論是學習什麼知識,都要有一個對學習目標的清楚認識。只有這樣才能朝著目標持續前進,少走彎路,從學習中得到不斷的提升,享受python學習計劃的過程。 雖然目前的程式語言有很多,但是基礎語法上的概念,本
學習Java必備網站,建議收藏!
社區 ext 考試 類型 cto ora 進入 免費 實用工具 在進入今天的主題前,先給大家分享一個資源非常豐富的網站。 學習Java必備網站,建議收藏! http://www.bangongziyuan.com/ 對,就是辦公資源在線網站,為什麽給大家分享這個網站呢?因為
30篇計算機視覺和深度學習論文推薦,被國外專家引用最多【可下載】
在2012年,我整理了一份有關計算機視覺的熱門論文清單。我把論文的研究重點放在視覺科學上,避免其與圖形處理、調研和純靜態處理等方向產生重疊。但在2012年後隨著深度學習技術的興起,計算機視覺科學發生了巨大的變化–從深度學習中產生了大量的視覺科學基線。雖然不知道該趨勢還會持續
128篇論文,21大領域,深度學習最值得看的資源全在這裡
從全域性到枝幹、從經典到前沿、從理論到應用、還有最新的研究…,所有你不需要的需要的,現在不需要的未來需要的,你不需要的周邊小夥伴需要的…反正全都在這了。對於大多數想上手深度學習的小夥伴來說,“我應當從那篇論文開始讀起?”這是一個亙古不變的話題。而對那些已經入門的
深度學習TensorFlow如何使用多GPU並行模式?
深度學習 tensorflow TensorFlow可以用單個GPU,加速深度學習模型的訓練過程,但要利用更多的GPU或者機器,需要了解如何並行化地訓練深度學習模型。常用的並行化深度學習模型訓練方式有兩種:同步模式和異步模式。下面將介紹這兩種模式的工作方式及其優劣。如下圖,深度學習模型的訓練是一個叠代
阿裏雲CPFS在人工智能/深度學習領域的實踐
保護 分析 負載 高可用 同時 照片 應用 機器學習 3.5 摘要: AI/DL在迅速發展 隨著數據量的爆發式增長和計算能力的不斷提升,以及在算法上的不斷突破,人工智能(AI,Artificial Intelligence )和其支持的深度學習(DL,Deep Learni
深度學習第三課 多層感知機
多層感知機針對於中間有隱藏層的神經網路結構,對於資料的每一層傳遞都會相應的多一層[w,b],這中間使用的傳參函式稱之為啟用函式,如果啟用函式是線性的話,那麼就沒什麼意義,無論中間有多少層,其實和沒有隱藏層是一樣的,所以需要非線性的函式作為啟用函
【火爐煉AI】深度學習008-Keras解決多分類問題
【火爐煉AI】深度學習008-Keras解決多分類問題 (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2, Keras 2.1.6, Tensorflow 1.9.0) 在我前面的文章【火爐煉AI】深
六天搞懂“深度學習”之三:多層神經網路
為了克服單層神經網路只能解決線性可分問題的侷限性,神經網路進化為多層結構。然而,花費了將近30年的時間,才將隱藏層新增到單層神經網路中。很難理解為什麼花費了這麼長時間,其中的主要問題是學習規則。 單層神經網路中的增量規則對於多層神經網路的訓練是無效的,這是因為訓練中在隱藏層產生的誤差並沒
推薦一個深度學習應用於圖形學的網站
2018年12月4日-7日,全亞洲最大的計算機圖形與互動技術會議與展會——SIGGRAPH Asia 2018大會在日本東京隆重舉行。作為計算機圖形學頂級會議,SIGGRAPH大會邀請了國際上在影像技術方面有建樹的學者、技術名流大咖及高新技術企業共同研討交流,展示最先進的圖形學技術。來自英國倫敦大學
深度學習為什麼需要那麼多的資料?
歡迎訪問Oldpan部落格,分享人工智慧有趣訊息,持續醞釀深度學習質量文。 前言 深度學習近兩年來發展極為迅速,在計算能力大大提高的情況下,很多深度學習方向的思想都得以實現。但是,深度學習有一個令人頭疼的缺點,那就是需要大量樣本來進行訓練才能達到較好的泛化。
推薦《深度學習原理與TensorFlow實踐》附下載連結
《深度學習原理與TensorFlow實踐》主要介紹了深度學習的基礎原理和TensorFlow系統基本使用方法。TensorFlow是目前機器學習、深度學習領域更優秀的計算系統之一,《深度學習原理與TensorFlow實踐》結合例項介紹了使用TensorFlow開發機器學習應用