閱讀CVPR論文“Local Relation Networks for Image Recognition”的小結

阿新 • • 發佈：2022-03-31

該論文的研究背景是：卷積層一直是計算機視覺中的主要特徵提取器。然而，卷積中的空間聚合大多應用固定過濾器，但這些過濾器在對具有不同空間分佈的視覺元素進行建模時效率低下。本文提出了一種新的影象特徵提取器，即區域性關係層，它根據區域性畫素對的組成關係自適應地確定聚合權重。

研究動機：人類擁有“以有限的方式看到無限的世界”的非凡能力，人類可以通過感知一組有限的低階視覺行為來組合無限的高階視覺行為，並形成對所觀察場景的理解。本文模擬這種思想，提出區域性關係層，構建了一個可以在區域性區域的視覺元素之間自適應地推斷出有意義的組合結構，通過區域性畫素對的可組合性來調整聚合權重，提出了一種更有效的影象特徵提取器。

主要貢獻：
①卷積層和拓展：提出自下而上的方式確定聚合權重，更加有效提取視覺行為
②提出膠囊網路
③提出自動注意力網路，彌合了將組合性引入表示的一般理念

所提出的網路結構（如下圖）：

實驗結論：本文將區域性關係層作為影象特徵提取器，提出將組合性引入表示的理念。使用自下而上的方法實現聚合權重，顯著提升了視覺行為提取的效果，由這個新層組成的深度網路在 ImageNet 分類上展示了強大的結果，具有 26 層和瓶頸殘差塊的 LR-Net 在 ImageNet 影象分類任務的 top-1 準確度上比常規的 26 層 ResNet 顯著高出了3%。

未來工作展望：
1、優化GPU記憶體排程，提升模型速度
2、探索更好的設計，超越先進的卷積方法

3、探索其他屬性和其他視覺任務的適用性。

閱讀CVPR論文“Local Relation Networks for Image Recognition”的小結

閱讀CVPR論文“Local Relation Networks for Image Recognition”的小結

論文閱讀筆記《Convolutional Neural Networks for Steel Surface Defect Detection from Photometric Stereo》

閱讀論文：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

【論文筆記】Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition

深度學習論文翻譯解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

【論文翻譯】DialogueCRN: Contextual Reasoning Networks for Emotion Recognition in Conversations

SNN_文獻閱讀_Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition

Long-term Recurrent Convolutional Networks for Visual Recognition and Description

Deep Residual Learning for Image Recognition 筆記

殘差網路：《Deep Residual Learning for Image Recognition》

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

[論文理解] Adversarial Examples Improve Image Recognition

論文閱讀筆記《Distribution Consistency Based Covariance Metric Networks for Few-Shot Learning》

論文閱讀筆記：《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

論文閱讀筆記：《CRNet: Cross-Reference Networks for Few-Shot Segmentation》

【CVPR 2022】論文閱讀：MHFormer: Multi-Hypothesis Transformer for 3D Human Pose Estimation

《Non-local Neural Networks》論文閱讀筆記

閱讀論文：《Compositional Attention Networks for Machine Reasoning》

Very Deep Convolutional Networks for Large-Scale Image Recognition-VGGNet解讀

【論文筆記（5）ECCV2020】Graph convolutional networks for learning with few clean and many noisy labels

閱讀CVPR論文“Local Relation Networks for Image Recognition”的小結

相關推薦