1. 程式人生 > 其它 >vgg/Alexnet最後三組全連線層fc的理解

vgg/Alexnet最後三組全連線層fc的理解

前面的5組pooling層:
feature map 的** width 和 height** 隨著每個pool操作縮小50%,5個pool 操作使得 width 和 height 逐漸變化:224->112->56->28->14->7,
但是深度depth(或說是channel數),隨著5組卷積在每次增大一倍:3->64->128->256->512->512。
特徵資訊從一開始輸入的224x224x3被變換到7x7x512(大概25000),從原本較為local的資訊逐漸分攤到不同channel上,隨著每次的conv和pool操作打散到channel層級上。

三組全連線層:
結構:前兩組fc的形式是:fc4096-relu-dropout0.5,最後一個fc的形式就是:fc1000。
①可以發現feature map的維度在最後一個卷積後達到7x7x512(大概25000),緊接著壓縮到4096維
過渡:可能是作者認為這個過程太急,又接一個fc4096作為緩衝,
同時兩個fc4096後的relu又接dropout0.5 去過渡這個過程,
③因為最後即將給1k-way softmax,所以又接了一個fc1000去降低softmax的學習壓力。