1. 程式人生 > >深度學習基礎--不同網路種類--VGG(visual geometry group,超解析度測試序列)

深度學習基礎--不同網路種類--VGG(visual geometry group,超解析度測試序列)

VGG(visual geometry group,超解析度測試序列)

test過程

  採用multi-scale輸入尺寸的形式(輸入尺寸介於[256:512]),具體執行流程如下:   1)採用不同規格的圖片作為輸入(4種或6種規格);   2)最後一個maxpool層之前按照原有網路執行;   3)修改最後一個maxpool層為shift-max-pool,對網路中的最後一個卷積層的每一個feature map按照(0,1,2)的變化量分別在(x,y)方位上移位操作,之後進行max-pool操作,這樣每個卷積層的feature map得到了9個shift-max-pool後的feature map。

offset max-pooling

  移位過程如下圖所示,假設最後一個卷積層的一個feature map有一個1維的20 pixel的資料,按照size = 3,stride=3進行max_pooling,小於stride的部分不進行pooling。 在這裡插入圖片描述   會產生多種(我們舉個例子是9種)池化結果,分別送入後面的網路層,最後我們的圖片分類輸出結果就可以得到9個預測結果(每個類別都可以得到9種概率值,然後我們對每個類別的9種概率,取其最大值,做為此類別的預測概率值)。