UCI資料集和原始碼
在看別人的論文時,別人使用的資料集會給出資料集的出處或下載地址(除非是很機密的資料,例如與國家安全有關)。如果你看的論文沒有給出資料集的出處,請立即停止看這篇論文,並且停止看刊發這篇論文的期刊上的所有文章。因為可以斷定這些文章質量很差。
關於原始碼,網上有很多公開原始碼的演算法包,例如最為著名的Weka,MLC++等。Weka還在不斷的更新其演算法,下載地址:
http://www.cs.waikato.ac.nz/ml/weka/
很多的機器學習的經典演算法都在裡面。而且公佈源程式,易於修改。
如果作者沒有公佈源程式,可以到作者主頁找找,也可以寫信給作者要,一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌,否則作者,尤其是著名學者,很有可能不會理睬。如果演算法簡單,可以自己實現。
再囑咐兩點,要做研究,首先要打好基礎,例如數學基礎和程式設計能力,要學會熟練使用google等搜尋引擎,還有一定要看高質量的論文。
相關推薦
UCI資料集和原始碼
在看別人的論文時,別人使用的資料集會給出資料集的出處或下載地址(除非是很機密的資料,例如與國家安全有關)。如果你看的論文沒有給出資料集的出處,請立即停止看這篇論文,並且停止看刊發這篇論文的期刊上的所有文章。因為可以斷定這些文章質量很差。 關於原始碼,網上有很多公開原始碼的
神經網路中訓練資料集、驗證資料集和測試資料集的區別
whats the difference between train, validation and test set, in neural networks? Answer: The training and validation sets are used during t
11.何時需要改變資料集和衡量指標 翻譯自 吳恩達新書-Machine Learning Yearning
當開始一個新的專案時,我會快速的選擇開發和測試資料集,這樣可以給團隊定出明確的目標。 我一般會要求我的團隊在一週內,提出初始的開發/測試資料集和初始的衡量指標。一開始的想法不完美並沒關係,但是要快,千萬不能過度思考。但是這一做法不適合成熟的機器學習應用,比如反
Power BI 資料集和資料重新整理
PowerBI報表是基於資料分析的引擎,資料真正的來源(Data Source)是資料庫,檔案等資料儲存媒介,PowerBI支援的資料來源型別多種多樣。PowerBI Service(雲端)有時不直接訪問Data Source,而是直接從PowerBI Service建立的資
法國INRIA Data Sets & Images 資料集和影象庫
Data Sets & Images Rome Patches The dataset introduced in the Patch-CKN paper is available here. Action Movie Franchises Video align
計算機視覺(影象分類、檢測、分割)資料集和比賽
1 ImageNet資料集和ILSVRC Imagenet資料集是目前深度學習影象領域應用得非常多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類
計算機視覺相關資料集和比賽
Imagenet資料集是目前深度學習影象領域應用得非常多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。Image
C# + ArcEngine讀取檔案地理資料庫fileGDB中的資料集和要素類生成目錄樹
首先是得到了工作空間中的要素資料集,即EnumDataSet物件,通過第一個引數傳遞進來;第二個引數是樹節點,要把遍歷得到的資料集的名字新增到該節點上,也是通過引數傳遞進來;當然,此方法前面的程式碼是要讀取工作空間,得到要素資料集EnumDataSet物件,並建立好樹節點,最
深度學習對話系統理論--資料集和評價指標介紹
對話系統常用評價指標 當前對話系統之所以還沒有取得突破性的進展,很大程度上是因為沒有一個可以準確表示回答效果好壞的評價標準。對話系統中大都使用機器翻譯、摘要生成領域提出來的評價指標,但是很明顯對話系統的場景和需求與他們是存在差別的,這也是當前模型效果不是很好的原因之一。從對
Twitter情緒分析全面教程指導--基於實際資料集和程式碼實戰
目錄 原文標題:Comprehensive Hands on Guide to Twitter Sentiment Analysis with dataset and code Introduction 自然語言處理(NLP)是當今資
近日有需要寫點C#程式,有用到Dataset資料集和SQLite資料庫,由於我從來就不擅長記各種程式語言的語法,所以在查閱一堆資料後,留下以下內容備忘: 一、SQLite操作,直接貼程式碼,很簡單
近日有需要寫點C#程式,有用到Dataset資料集和SQLite資料庫,由於我從來就不擅長記各種程式語言的語法,所以在查閱一堆資料後,留下以下內容備忘: 一、SQLite操作,直接貼程式碼,很簡單: //建立一個數據庫檔案 string d
刪除sas work邏輯庫中的資料集和巨集
/*****刪除sas work邏輯庫中的所有巨集*****/proc catalog catalog=work.sasmacr force kill;run; quit;/*****刪除sas work邏輯庫中的資料集*****/proc datasets library
安全資料集和開源工具
由於本人從事安全相關的行業的工作,接觸到很多想用機器學習解決網路安全相關的問題,不可避免的需要用到很多安全相關的開源資料集和工具,這裡記錄一下本人自己用過並感覺不錯的資料集和開源工具。當然,這可能只是安全領域資料集和開源工具極小的一部分,希望能起到拋磚引玉的目的吧,本
UCI 資料集
filename='.\iris\iris.data'; %使用 , 分割符分割每列資料; ‘'headerlines’:表示忽略前N行,從N+1行開始讀取資料集 [attrib1, attrib2,
深度學習對話系統理論篇--資料集和評價指標介紹
對話系統常用評價指標 當前對話系統之所以還沒有取得突破性的進展,很大程度上是因為沒有一個可以準確表示回答效果好壞的評價標準。對話系統中大都使用機器翻譯、摘要生成領域提出來的評價指標,但是很明顯對話系統的場景和需求與他們是存在差別的,這也是當前模型效果不是很好的
CUHK資料集和Market-1501資料集計算CMC方法的差別
Cumulative Matching Characteristics (CMC) curves 是目前行人重識別領域最流行的效能評估方法。考慮一個簡單的 single-gallery-shot 情形,每個gallery identity只有一個instance. 對於每一次
UCI資料集整理(附論文常用資料集)
摘要:UCI資料集作為標準測試資料集經常出現在許多機器學習的論文中,為了更方便使用這些資料集有必要對其進行整理,這裡整理了論文中經常出現的資料集,並詳細介紹如何使用MATLAB將資料集檔案整理成自己需
Matlab讀取UCI資料集Iris中資料
讀取UCI資料集iris.data中資料: >> [attrib1, attrib2, attrib3, attrib4, class] = textread('data\iris.data', '%f%f%f%f%s', 'delimiter', ',');
目標檢測/分類常用資料集和評價指標小彙集
二:混淆矩陣 (Confusion Matrix) 三:召回率(Recall)、精確率(Precision) 四: P-R曲線、平均精度(Average-Precision,AP)、F指標 五:受試者工作特徵曲線(Receiver Operating
機器視覺中常用開源資料集和免費標註工具
科技巨頭如Google,微軟,亞馬遜等都紛紛宣佈在AI領域佈局,AI的影響隨著深度學習的應用日益深入。機器視覺作為一個熱門子領域,無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。這是多麼棒的一件事啊!但是我們應該如何簡單的開始研究機器視覺?以下是幾個主要的