1. 程式人生 > >UCI資料集和原始碼

UCI資料集和原始碼

在看別人的論文時,別人使用的資料集會給出資料集的出處或下載地址(除非是很機密的資料,例如與國家安全有關)。如果你看的論文沒有給出資料集的出處,請立即停止看這篇論文,並且停止看刊發這篇論文的期刊上的所有文章。因為可以斷定這些文章質量很差。

關於原始碼,網上有很多公開原始碼的演算法包,例如最為著名的Weka,MLC++等。Weka還在不斷的更新其演算法,下載地址:
http://www.cs.waikato.ac.nz/ml/weka/
很多的機器學習的經典演算法都在裡面。而且公佈源程式,易於修改。

如果作者沒有公佈源程式,可以到作者主頁找找,也可以寫信給作者要,一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌,否則作者,尤其是著名學者,很有可能不會理睬。如果演算法簡單,可以自己實現。

再囑咐兩點,要做研究,首先要打好基礎,例如數學基礎和程式設計能力,要學會熟練使用google等搜尋引擎,還有一定要看高質量的論文。