tinymind多標籤圖片分類大賽總結
阿新 • • 發佈:2019-02-03
tinymind是csdn下的一個人工智慧學習交流的平臺,其中也有機器學習的比賽,但由於比較新,所以參與的人並不很多,就像這次參加的多標籤圖片分類大賽,總共參與的隊伍數在300左右,很適合用於練手。
先說下題目,題目內容大致是給與3w張訓練圖片以及他們的標籤,當然,標籤是多個的。最後還有一個資料夾的測試資料,讓你得到這些資料的標籤。賽題的滿分是100,我們最後得分44.17,最高分47。還是挺難的。
至於得到的經驗,一個是對資料的處理,這一直是我的弱勢,表的分分合合一弄起來就腦子短路,還好這次不需要太多的處理,而且也借用了別人的baseline,所以不用太多操作。
還有一方面是深度學習的資料生成器,把所有的圖片讀入記憶體很可能記憶體溢位,一個數據生成器就很重要了,輪流讀入圖片可以降低很多的記憶體使用。
通道,Inception-V3使用的是多通道網路,但是隻會用不會寫,這次在一大佬的指導下,學會了多通道網路的結合。雖然修改的網路分數不比Image-Net訓練好的Inception-V3好,但是這些網路以後可以用於模型融合。這是比賽成績提升的關鍵。
這次比賽的另一個提升點就是標籤的篩選,把所有的標籤用上的效果並不好,但是從裡面把出現次數大於300次的標籤提出使用就很高了。
最後就是模型融合了,整合學習的威力這次終於見識了,在無法訓練出強分類器的情況下,用多個弱學習器去整合,效果就會提升很多。