非監督特徵學習與深度學習(九)----使用卷積進行特徵提取
使用卷積進行特徵提取(Feature Extraction Using Convolution)
概覽(Overview)
在之前的練習中的圖片解析度都偏低,如手寫數字影象。在本節中將會學到一種方法,能夠用在實際中更大的影象資料集上。
全連線網路(Fully Connected Networks)
在稀疏編碼器(譯者注:後文會講到,這部分是老版的教程,所以內容跳躍了)中,一種設計選擇是先前已經講到的“全連線”,即所有的隱含層單元與所有輸入單元完全連線起來。在先前練習中使用的是相對較小的影象(例如,在稀疏編碼的任務中
區域性連線網路(Locally Connected Networks)
該問題的一種簡單解決方案是限制隱含單元與輸入單元的連線數目,也就是說,隱含單元只允許連線一部分的輸入單元(譯者注:即隱藏層的神經元與原圖中的一個小圖建立連線權重)。具體而言,每個隱藏單元將連線到輸入畫素中的一個小的連續區域。(對於不同於影象的資料形式,也有一種自然的方式來選擇從輸入單元到一個隱含單元需要處理的“連續組”,例如,對於音訊,一個隱藏單元可能被連線到一個與之特定時間跨度對應的音訊剪輯的輸入單元上。)
區域性連線網路的這一想法也借鑑了在生物學上早期視覺系統的觀點。具體而言,視覺皮層的神經元有著區域性感受區域(即,它們只會對某一位置的刺激做出反應)。
卷積(Convolutions)
自然世界中的影象有著“固定不變”的屬性(譯者注:或稱為“靜態性”),這也意味這影象的某一部分的資料和另一部分的資料是一樣的。這表明,在一張影象上某部分的特徵也可應用到該圖片的其它部分,基於這一觀點——網路可以使用不同的特徵,應用到區域性資料一樣但不同的位置上。
更確切地說,從一張高解析度影象上隨機地抽樣小圖片(比方說
講個具體的例子,假設您已經從
正式地說,給定解析度大小為
下一節中,將進一步介紹如何將這些特徵“池化”到一起,以獲得用於分類的更好特徵。