深度學習——淺談CNN模型壓縮技術

阿新 • • 發佈：2018-12-31

模型壓縮的動機

最近幾年，CNN已經成為了計算機視覺任務的主要技術手段，在影象分類、目標檢測、深度估計、語義分割等方向都大放異彩。越來越大的資料集和越來越強的計算裝置允許研究者不斷探索更深更復雜的網路模型，例如從AlexNet、VGGNet到GOOGleNet、ResNets。ImageNet分類比賽的冠軍已經將模型由8層提高到了100+層。可是，越複雜的模型越是會佔用越多資源，例如，用152-layer的ReNet對解析度為224×224的圖片推理時，會產生6千萬的引數，需要20G次的浮點操作（FLOPs）。這樣的網路根本不可能移植到計算能力相對較差的平臺上，比如手機、可穿戴裝置。所以要想讓產品落地，模型壓縮是必不可少的一環，這也是近兩年模型壓縮技術越來越受關注的原因。
所謂壓縮模型，無非是從這三個方向入手：

減小模型大小
減小執行時的記憶體佔用
降低計算操作的數量

壓縮技術分類

近年來出現的壓縮技術可歸類到這幾個方面：

低秩分解
知識蒸餾
權值量化、二值化
權重剪枝、稀疏化
結構剪枝、稀疏化
新型的網路

總結

光說不練假把式，復現論文才是理解模型的直接方法，我會把自己對上面一些論文的復現放到GitHub，程式碼水平有限，望多批評指正。

深度學習——淺談CNN模型壓縮技術

模型壓縮的動機

壓縮技術分類

相關論文解析

總結

深度學習——淺談CNN模型壓縮技術

【深度學習系列】CNN模型的視覺化

深度學習-淺談CNNs

機器學習-淺談模型評估的方法和指標

[Keras深度學習淺嘗]實戰三·CNN實現Fashion MNIST 資料集分類

[Keras深度學習淺嘗]實戰二·CNN實現Fashion MNIST 資料集分類

淺談非法外聯檢測技術的演變

關於自動化學習淺談二

基於深度學習的圖像語義分割技術概述之5.1度量標準

【深度學習】常用的模型評估指標

資深程序員帶你玩轉深度學習中的正則化技術（附Python代碼）！

【深度學習篇】---CNN和RNN結合與對比，實例講解

強化學習淺談

深度學習基礎--前饋模型/前饋網路

深度學習目標檢測經典模型比較（RCNN、Fast RCNN、Faster RCNN）

【深度學習】Tensorflow——CNN 卷積神經網路 2

【深度學習】Tensorflow——CNN 卷積神經網路 1

C#學習——淺談介面、抽象類、介面繼承、類繼承

深度學習之影象分類模型AlexNet解讀

深度學習中的Attention模型介紹及其進展（attention入門參考文獻第一篇）

深度學習——淺談CNN模型壓縮技術

模型壓縮的動機

壓縮技術分類

相關論文解析

總結

相關推薦