1. 程式人生 > 實用技巧 >跟小夥伴們做了個高效刷論文的小站

跟小夥伴們做了個高效刷論文的小站

好久木有在知乎冒泡了,不知道還能不能出現在大家的timeline上哇QAQ

正文開始之前還是先習慣性的碎碎念一下。前段時間換了研究方向,重新pick了問答和檢索,為了追上相關問題的最新進展,就顧不上寫文的刷了一堆paper,加上幾件事情的從0到1確實費了一些精力,因此停更了好幾個月。

這幾個月的時間裡,大部分為數不多的業餘精力都放在了運營賣萌屋上,跟小夥伴們努力維持一些有趣有料的原創輸出,小屋也更好看啦。另一些精力就是放在本文要講的事情上啦!幾個演算法工程師強行上陣web前後端甚至UI,做了一個幫助大家高效率刷paper的學術小站。一頓踩坑之後,終於近期把小站收拾的“看起來像個樣子了”(´Д` )

小站地址!

arxiv.xixiaoyao.cn

很好記有木有( ̄∇ ̄)別忘了傳送回來贊贊贊!

賣萌屋學術站的誕生

顧名思義,學術站就是為學術資訊而生嗒!

雖然AI行業變得越來越卷,但CV、NLP等熱點方向依然在持續高速的發(灌)展(水)中,經常湧現出一些有趣的paper,可能哪天就被借鑑用於解決手上的問題了。所以入門後,養成追前沿、刷paper的習慣是非常非常必要的,無論你是在學術界還是工業界。

不過由於眾所周知的某牆,以及某些不是很好用的國外服務,導致新手刷paper的效率很低,又經常分不清哪些paper(可能)含金量更高一些,哪些疑似不可靠的灌水,很容易出現費力不討好的情況,受挫之後又開始選擇咀嚼各大小媒體的論文解讀了。以賣萌屋為例,雖然每週能為大家遞上兩三篇原創已經看起來很高產了,但是實話講,那些我們發現的有趣的paper裡,最終能呈現到粉絲面前的可能只有2~3成。畢竟,理解容易生成難哇。。。

所以本著授人以魚不如授人以漁的想法,就跟小夥伴們把自己平時刷paper的服務努力優化了一下,開放出來啦~希望能幫到各位愛追AI前沿的小夥伴們。

小站的目標

就是為了方便大家更加高效便捷的獲取CV、NLP、IR等領域的學術資訊啦(後面悄咪咪觀察一下,用的人多的話再考慮加研究方向)。這裡的高效便捷體現在幾方面吧

  1. 不用跟那個什麼牆鬥智鬥勇了,訪問速度很快的
  2. 抽出來了一些paper質量相對比較高的機構名和學術會議/期刊名,如果精力有限,可以優先刷刷這些,如下圖所示,一篇paper錄用的會議名會在標題上放用橙色的tag標出,機構名會用藍色的tag標出。比如圖裡這篇《TeaForN:Teacher-Forcing with N-grams》的paper就是今天剛放出來的Google發表於EMNLP20的論文(快誇誇我們

v2-b00682951f3828c4343c335189086574_b.jpg

不過,這種抽取會議名和機構名置頂的做法也會導致一些公平性問題。有的好paper確實沒投頂會也不是來自大廠或名校,就容易被淹沒掉。對於這個為求便捷導致的公平性問題,我們也在努力優化中,後續會同時通過NLP和排序演算法優化,以及人的力量來努力不讓金子埋沒(認真臉

建議&吐槽

學術站右側有專門的交(吐)流(槽)群,很懶的小夥伴也可以直接在本文評論區留言~