送你6份最新開原始碼!含NLP、ML、計算機視覺方向(附程式碼&論文)
本文長度為636字,建議閱讀3分鐘
本文為你分享6份最新的開原始碼,包括自然語言處理、計算機視覺和機器學習3個方面。
自然語言處理
1
DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications
@zhangjun 推薦
#Machine Reading Comprehension
大型中文閱讀理解資料集,工作來自百度。
論文連結
https://www.paperweekly.site/papers/1137
程式碼連結
https://github.com/baidu/DuReader
2
TransNets - Learning to Transform for Recommendation
@ccclyu 推薦
#Transfer Learning
引入了遷移學習的隱含表示層來減少 test dataset 的稀疏性。
論文連結
https://www.paperweekly.site/papers/1181
程式碼連結
https://github.com/rosecatherinek/TransNets
計算機視覺
3
Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering
@xiaolu 推薦
#Visual Question Answering
視覺問答任務(Viual Question Answering)是最近 2-3 年興起的多模態任務。對於視覺問答任務,演算法需要同時理解圖片內容和語言資訊,然後推理出正確的答案。目前常見的方法有多模態特徵融合和以及視覺注意力機制。
已有的注意力機制主要有兩類,一類是基於全圖區域的注意力機制,一類是基於檢測框區域的注意力機制,前者容易關注到物體的一部分,後者會缺少一些檢測框。
本文第一次嘗試將基於全圖區域的與基於檢測框區域的注意力機制融合在一個框架下,充分利用全圖區域和檢測框之間的互補資訊;並且提出新的多模態特徵融合方法,將問題特徵、全圖特徵、檢測框特徵進行有效的融合。模型在 VQA 和 COCO-QA 兩個主流資料集上實現了目前最好的結果。
論文連結
https://www.paperweekly.site/papers/1175
程式碼連結
https://github.com/lupantech/dual-mfa-vqa
4
Image Crowd Counting Using Convolutional Neural Network and Markov Random Field
@cornicione 推薦
#People Counting
文章融合了 MRF 和 deep 網路,提出了一種統計靜態圖片中人數的方法。
論文連結
https://www.paperweekly.site/papers/1195
程式碼連結
https://github.com/hankong/crowd-counting
機器學習
5
Social Attention - Modeling Attention in Human Crowds
@zk5580752 推薦
#Attention Model
本文是一篇基於 Social LSTM 的後續論文,Social LSTM 是李飛飛團隊於 2016 年提出的行人路徑預測方法。本文則在原文基礎上改進了預測方式,不僅僅基於 RNN 模型,還引入了 Attention Model,使得預測更加精準和全面。
論文連結
https://www.paperweekly.site/papers/1115
程式碼連結
https://github.com/vvanirudh/social-lstm-tf
6
Breaking the Softmax Bottleneck: A High-Rank RNN Language Model
@paperweekly 推薦
#RNN
本文嘗試改進了語言模型在預測 next token 時用 softmax 遇到的計算瓶頸。
論文連結
https://www.paperweekly.site/papers/1112
程式碼連結
https://github.com/zihangdai/mos
分享朋友圈 也是另一種讚賞
The more we share, The more we have
歡迎加入資料君高效資料分析社群
加我私人微信進入大資料乾貨群:tongyuannow
目前100000+人已關注加入我們