1. 程式人生 > 其它 >TF02——感受野

TF02——感受野

TF02——感受野

  • 感受野(Receptive Field):卷積神經網路各輸出特徵圖的每個畫素點,在原始輸入圖片上對映區域的大小

如果對上面這個5*5的原始輸入圖片,用黃色的3*3卷積核作用,會輸出這樣一個3*3的輸出特徵圖,這個輸出特徵圖上的每一個畫素點,對映到原始圖片時3*3的區域,所以他的感受野是3

如果再對這個3*3的特徵圖,用這個綠色的3*3卷積核作用,會輸出一個1*1的輸出特徵圖,這個輸出特徵上的畫素點,對映到原始圖片上是5*5的區域,所以它的感受野是5

如果對這個5*5的輸入圖片,直接用藍色的5*5卷積核作用,會輸出一個1*1的輸出特徵圖,這個畫素點對映到原始輸入圖片是5*5

的區域,所以它的感受野也是5

同樣一個5*5的原始圖片,經過兩層3*3的卷積核作用,和經過一層5*5的卷積核作用,都得到一個感受野是5的輸出特徵圖,所以這兩層3*3的卷積核和一層5*5的卷積核的特徵提取能力是一樣的

是兩層3*3的卷積核和一層5*5的卷積核選擇哪一個更好那?

這時就要考慮,他們要承載的待訓練引數量計算量

對於兩層3*3的卷積核來說,待訓練引數共有18個,對於一層5*5的卷積核計算帶訓練引數共有25個

假設輸入特徵寬和高都是x,卷積計算步長是1

  • 每個3*3*1的卷積核,計算得到一個畫素點,需要9次乘加計算,兩層3*3卷積核,共需要
\[18 x^{2}-108 x+180 \]

​ 次的乘加運算

  • 每個5*5*1的卷積核,計算得到一個畫素點,需要25次乘加計算,兩層3*3卷積核,共需要
\[25 x^{2}-200 x+400 \]

​ 次的乘加運算

當x>10時,兩層3*3的卷積核一層5*5卷積效能好,這也是為什麼現在的神經網路在卷積計算中,常使用3*3卷積核替換一層5*5卷積核的原因