UCI資料集和原始碼

阿新 • • 發佈：2019-02-15

在看別人的論文時，別人使用的資料集會給出資料集的出處或下載地址（除非是很機密的資料，例如與國家安全有關）。如果你看的論文沒有給出資料集的出處，請立即停止看這篇論文，並且停止看刊發這篇論文的期刊上的所有文章。因為可以斷定這些文章質量很差。

關於原始碼，網上有很多公開原始碼的演算法包，例如最為著名的Weka，MLC++等。Weka還在不斷的更新其演算法，下載地址：
http://www.cs.waikato.ac.nz/ml/weka/
很多的機器學習的經典演算法都在裡面。而且公佈源程式，易於修改。

如果作者沒有公佈源程式，可以到作者主頁找找，也可以寫信給作者要，一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌，否則作者，尤其是著名學者，很有可能不會理睬。如果演算法簡單，可以自己實現。

再囑咐兩點，要做研究，首先要打好基礎，例如數學基礎和程式設計能力，要學會熟練使用google等搜尋引擎，還有一定要看高質量的論文。