深度學習基礎--不同網路種類--VGG(visual geometry group,超解析度測試序列)
阿新 • • 發佈:2018-12-20
VGG(visual geometry group,超解析度測試序列)
test過程
採用multi-scale輸入尺寸的形式(輸入尺寸介於[256:512]),具體執行流程如下: 1)採用不同規格的圖片作為輸入(4種或6種規格); 2)最後一個maxpool層之前按照原有網路執行; 3)修改最後一個maxpool層為shift-max-pool,對網路中的最後一個卷積層的每一個feature map按照(0,1,2)的變化量分別在(x,y)方位上移位操作,之後進行max-pool操作,這樣每個卷積層的feature map得到了9個shift-max-pool後的feature map。
offset max-pooling
移位過程如下圖所示,假設最後一個卷積層的一個feature map有一個1維的20 pixel的資料,按照size = 3,stride=3進行max_pooling,小於stride的部分不進行pooling。 會產生多種(我們舉個例子是9種)池化結果,分別送入後面的網路層,最後我們的圖片分類輸出結果就可以得到9個預測結果(每個類別都可以得到9種概率值,然後我們對每個類別的9種概率,取其最大值,做為此類別的預測概率值)。