1. 程式人生 > >神經網路學習引入-影象分類的基本概述

神經網路學習引入-影象分類的基本概述

1. Motivation動機

儘管影象分類聽起來很簡單,但是它在現實中有大量的應用場景。
許多明顯是計算機視覺的任務都可以被簡化成影象分類問題。

2.挑戰

圖片分類問題主要存在的挑戰有:
多視角問題(viewpoint variation):同一個物體的不同角度看到的圖片
大小多樣化問題(scale variation):同一種類的個體存在大小的差異
變形問題(deformation):研究的物體可能不是嚴格意義上不變的,會有多種呈現方式
遮擋問題(occlusion):研究的物體在圖片中可能只有一小部分被看見
光線問題(illumination conditions):不同的光照強度會對圖片畫素產生巨大的影響
保護色問題(background clutter):研究的物體可能會和背景十分相似,混為一體
內部多樣性問題(intra-class variation):研究的物體本身可能包含多種不同特徵的個體
在這裡插入圖片描述

3.資料驅動方法

我們將會為計算機提供不同種類個體的大量樣本,然後使用一個學習演算法來“看”這些樣本,試圖學習不同種類的視覺特點。這樣的方法被稱為資料驅動方法,因為它依賴於最初的有監督訓練資料的學習積累。

4.影象分類流程

輸入—>學習—>預測