人工智能和機器學習的最新技術 - 帶代碼的論文的亮點
人工智能和機器學習的最新技術 - 帶代碼的論文的亮點
標簽:人工智能,機器學習,多任務學習,NLP,帶代碼的論文,推薦系統,語義分割,TensorFlow,轉移學習
我們介紹包含代碼的論文,最先進的機器學習論文,代碼和評估表的免費和開放資源。
作者:Dan Clark,KDnuggets。 評論任何機器學習,AI或計算機科學家愛好者都會知道,找到您感興趣的主題的資源和論文可能會很麻煩。通常,您需要註冊一個網站,有些人甚至會嘗試向您收取閱讀其他人工作的訂閱費。
這就是使網站Papers代碼如此出色的原因; 它們提供了大量免費資源,涵蓋了大量主題。他們的使命宣言如下:
Papers With Code的使命是利用機器學習論文,代碼和評估表創建一個免費和開放的資源。
我們相信這最好與社區一起完成,並由自動化提供支持。
我們已經自動將代碼鏈接到論文,我們現在正致力於從論文中自動提取評估指標。
除此之外,它們還有自己的松弛通道,它們允許用戶下載有助於運行網站的所有數據。他們對捐款持開放態度,因此請隨意潛入並保持社區的成長!
為了慶祝這個偉大的資源,我們試圖總結我們最喜歡的6個主題(網站上稱之為“任務”)在網站上以及他們提供的一些論文:
語義分割
語義分割的概念是識別和理解像素級圖像中的內容。這是網站內容最大的類別之一,有322篇論文和代碼。其中最受歡迎的是題為具有用於語義圖像分割的Atrous可分離卷積的編碼器 - 解碼器。本文旨在結合兩種語義分割方法的優點:空間金字塔池模塊和編碼 - 解碼器結構。
關於語義分割的其他頂級論文:
MobileNetV2:倒置殘差和線性瓶頸
重新思考用於語義圖像分割的Atrous卷積
面具R-CNN
金字塔場景解析網絡
NLP
自然語言處理是網站上最大的任務集合之一,包括機器翻譯,語言建模,情感分析,文本分類等等。其中最受歡迎的類別之一是Question Answering,有200多篇關於這個主題的論文。關於這一主題的排名靠前的論文是Jacob Devlin,Ming-Wei Chang,Kenton Lee和Kristina Toutanova,名為BERT:用於語言理解的深度雙向變換器的預訓練。
關於NLP的其他頂級論文:
探索語言建模的局限性
具有交叉視訓練的半監督序列建模
活動內存可以取代註意嗎?
BERT:深度雙向變壓器的預訓練,用於語言理解
轉學習
轉移學習是一種方法,其中從一個任務訓練的模型的權重被采用並使用:
- 構造固定特征提取器
- 作為權重初始化和/或微調
關於轉移學習的最受歡迎的論文是來自私人培訓數據的深度學習的半監督知識轉移。本文旨在解決影響使用私有數據的模型的問題,因為模型可能無意中和隱含地存儲了一些訓練數據,因此隨後對模型的仔細分析可能會揭示敏感信息。為了解決這個問題,本文演示了一種為敏感數據提供安全性的普遍適用的方法:教師合奏的私人聚合(PATE)。該方法以黑盒方式組合了使用不相交數據集訓練的多個模型,例如來自不同用戶子集的記錄。本文還包含一個指向GitHub倉庫的鏈接,其中包含TensorFlow中該項目的所有代碼。
關於轉學習的其他頂級論文:
內存網絡的大規模簡單問題回答
DeCAF:用於通用視覺識別的深度卷積激活功能
騰訊ML圖像:用於視覺表現學習的大型多標簽圖像數據庫
基於卷積神經網絡的圖像分類技巧
多任務學習
多任務學習旨在同時學習多個不同的任務,同時最大化一個或所有任務的性能。目前大多數明星的論文是:DRAGNN:基於過渡的動態連接神經網絡框架。這項工作提出了一個緊湊的模塊化框架,用於構建新穎的遞歸神經結構。同樣,本文還介紹了TensorFlow中的完整工作代碼示例。
關於多任務學習的其他頂級論文:
具有交叉視訓練的半監督序列建模
一種模式來學習它們
通過大規模多任務學習學習通用分布式句子表示
一種從語義任務中學習嵌入的分層多任務方法
推薦系統
推薦系統的目標是為用戶生成推薦列表。此類別中的一篇頗受歡迎的論文是由Oleksii Kuchaiev和Boris Ginsburg 為Collaborative Filtering培訓Deep AutoEncoders。本文提出了推薦系統中評級預測任務的新模型,該模型在時間分割的Netflix數據集上明顯優於先前的現有技術模型。該模型基於6層深度自動編碼器,端到端訓練,無需任何分層預訓練。這是PyTorch的NVIDIA研究項目,所有代碼都可供公眾使用。
關於推薦系統的其他頂級論文:
fastFM:分解機器的庫
AutoInt:通過自註意神經網絡自動進行特征交互學習
基於產品的神經網絡用於多場分類數據的用戶響應預測
DeepFM:用於CTR預測的端到端廣泛和深度學習框架
人工智能和機器學習的最新技術 - 帶代碼的論文的亮點