cs231 卷積神經網路Convolutional Networks群組歸一化GN( Group Normalization)

阿新 • • 發佈：2018-11-25

cs231 Convolutional Networks Group Normalization:


def spatial_groupnorm_forward(x, gamma, beta, G, gn_param):
    """
    Computes the forward pass for spatial group normalization.
    In contrast to layer normalization, group normalization splits each entry 
    in the data into G contiguous pieces, which it then normalizes independently.
    Per feature shifting and scaling are then applied to the data, in a manner identical to that of batch normalization and layer normalization.

    Inputs:
    - x: Input data of shape (N, C, H, W)
    - gamma: Scale parameter, of shape (C,)
    - beta: Shift parameter, of shape (C,)
    - G: Integer mumber of groups to split into, should be a divisor of C
    - gn_param: Dictionary with the following keys:
      - eps: Constant for numeric stability

    Returns a tuple of:
    - out: Output data, of shape (N, C, H, W)
    - cache: Values needed for the backward pass
    """
    out, cache = None, None
    eps = gn_param.get('eps',1e-5)
    ###########################################################################
    # TODO: Implement the forward pass for spatial group normalization.       #
    # This will be extremely similar to the layer norm implementation.        #
    # In particular, think about how you could transform the matrix so that   #
    # the bulk of the code is similar to both train-time batch normalization  #
    # and layer normalization!                                                # 
    ###########################################################################
    #pass
    N, C, H, W = x.shape
    # 按分組g將大的立方體積木拆成 C/G個小積木體。
    #N, C, H, W = 2, 6, 4, 5;G = 2 ;這裡g為2個一組，拆成6/2=3組小立方體。
    x = x.reshape((N * G, C // G * H * W)) #(N, C, H, W)--->(N * G, C // G * H * W) 
    #接下來就可以將每1個小立方體作為一個Layer Norm的模組去處理。     
    x = x.T #(C // G * H * W,N * G)
    mean_x = np.mean(x,axis =0)
    var_x= np.var(x,axis = 0)
    inv_var_x = 1 / np.sqrt(var_x + eps)
    
    x_hat = (x - mean_x)/np.sqrt(var_x + eps) ##(C // G * H * W,N * G)
    x_hat = x_hat.T #(C // G * H * W,N * G)---->(N * G, C // G * H * W)
    
    
    x_hat = x_hat.reshape((N, C, H, W)) #(N * G, C // G * H * W)---->(N, C, H, W)
   

    
    out = gamma * x_hat + beta  
    cache =( x_hat,gamma,mean_x,inv_var_x, G)

    ###########################################################################
    #                             END OF YOUR CODE                            #
    ###########################################################################
    return out, cache


def spatial_groupnorm_backward(dout, cache):
    """
    Computes the backward pass for spatial group normalization.

    Inputs:
    - dout: Upstream derivatives, of shape (N, C, H, W)
    - cache: Values from the forward pass

    Returns a tuple of:
    - dx: Gradient with respect to inputs, of shape (N, C, H, W)
    - dgamma: Gradient with respect to scale parameter, of shape (C,)
    - dbeta: Gradient with respect to shift parameter, of shape (C,)
    """
    dx, dgamma, dbeta = None, None, None

    ###########################################################################
    # TODO: Implement the backward pass for spatial group normalization.      #
    # This will be extremely similar to the layer norm implementation.        #
    ###########################################################################
    pass

    x_hat,gamma,mean_x,inv_var_x, G = cache 
   
    #x_hat :(N, C, H, W)
    N, C, H, W = x_hat.shape
    # 在(N, H, W)維度上計算
    dgamma = np.sum(dout * x_hat, axis=(0, 2, 3), keepdims=True)
    dbeta = np.sum(dout, axis=(0, 2, 3), keepdims=True)
    #forward時拆分成幾個小立方體積來計算的，backward反向傳播時仍需分組拆成幾個小立方體計算。
   
    #dout :(N, C, H, W)--->(N * G, C // G * H * W) ---->(C // G * H * W, N * G)   
    dxhat = (dout * gamma).reshape((N * G, C // G * H * W)).T 
    
    #x_hat:(N, C, H, W)--->(N * G, C // G * H * W) ---->(C // G * H * W, N * G)
    x_hat = x_hat.reshape((N * G, C // G * H * W)).T    
    
    # d:   C // G * H * W 將每1個小立方體作為一個Layer Norm的反向backward模組去處理
    d = x_hat.shape[0]
    dx = (1. / d) * inv_var_x * (d * dxhat - np.sum(dxhat, axis=0) -
                                 x_hat * np.sum(dxhat * x_hat, axis=0))    
    
    
    dx = dx.T #(C // G * H * W, N * G) ----->(N * G, C // G * H * W) 
    # 將幾個小立方體再重新拼接成一個大立方體
    dx = dx.reshape((N, C, H, W)) #(N * G, C // G * H * W) --->(N, C, H, W)
    
   

    ###########################################################################
    #                             END OF YOUR CODE                            #
    ###########################################################################
    return dx, dgamma, dbeta

https://github.com/duanzhihua

cs231 卷積神經網路Convolutional Networks群組歸一化GN( Group Normalization)

cs231 Convolutional Networks Group Normalization: def spatial_groupnorm_forward(x, gamma, beta, G, gn_param): """ Co

深度學習FPGA實現基礎知識10(Deep Learning（深度學習）卷積神經網路(Convolutional Neural Network，CNN))

第一點，在學習Deep learning和CNN之前，總以為它們是很了不得的知識，總以為它們能解決很多問題，學習了之後，才知道它們不過與其他機器學習演算法如svm等相似，仍然可以把它當做一個分類器，仍然可以像使用一個黑盒子那樣使用它。第二點，Deep Learning強大的地方就是可以利用網路中間某一

機器學習與深度學習系列連載：第二部分深度學習（十）卷積神經網路 1 Convolutional Neural Networks

卷積神經網路 Convolutional Neural Networks 卷積神經網路其實早在80年代，就被神經網路泰斗Lecun 提出[LeNet-5, LeCun 1980]，但是由於當時的資料量、計算力等問題，沒有得到廣泛使用。卷積神經網路的靈感來自50年代的諾貝爾生物學獎

【卷積神經網路的加速】Speeding up Convolutional Neural Networks with Low Rank Expansions

主題：【深度卷積神經網路的加速】 Speeding up Convolutional Neural Networks with Low Rank Expansions 附上論文連結：上一篇中提到的低秩方法的參考文獻 http://citeseerx.ist.psu.ed

Neural Networks and Convolutional Neural Networks Essential Training 神經網路和卷積神經網路基礎教程 Lynda課程中文字幕

Neural Networks and Convolutional Neural Networks Essential Training 中文字幕神經網路和卷積神經網路基礎教程中文字幕Neural Networks and Convolutional Neural Networks

卷積神經網路CNN（3）—— FCN(Fully Convolutional Networks)要點解釋

前言參考FCN論文：Fully Convolutional Networks for Semantic Segmentation FCN作為影象語義分割的先河，實現畫素級別的分類（即end to end，pixel-wise），為後續使用CNN作為基礎的影

卷積神經網路（Convolutional Neural Networks，CNNS/ConvNets）

卷積神經網路非常類似於普通的神經網路：它們都是由具有可以學習的權重和偏置的神經元組成。每一個神經元接收一些輸入，然後進行點積和可選的非線性運算。而整個網路仍然表示一個可微的得分函式：從原始的影象畫素對映到類得分。在最後一層（全連線層）也有損失函

卷積神經網路（一）- Foundations of Convolutional Neuron Networks

歡迎使用Markdown編輯器寫部落格本Markdown編輯器使用StackEdit修改而來，用它寫部落格，將會帶來全新的體驗哦： Markdown和擴充套件Markdown簡潔的語法程式碼塊高亮圖片連結和圖片上傳 LaTex數學公式 UML序列

卷積神經網路：Convolutional Neural Networks(CNN)

卷積神經網路是一種多層神經網路，擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法，成功將資料量龐大的影象識別問題不斷降維，最終使其能夠被訓練。CNN最早由Yann LeCun提出並應用在手寫字型識別上（MINST）。LeCun提出的網路稱為LeNet，其網路結構如下：這是一個最典

Deep Learning（深度學習）學習筆記整理系列之（七）Convolutional Neural Networks卷積神經網路

轉處：http://blog.csdn.net/zouxy09/article/details/8781543/ Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

卷積神經網路影象風格轉移 Image StyleTransfer Using Convolutional Neural Networks

卷積神經網路影象風格轉移 Taylor Guo, 2017年4月24日星期一摘要用不同的風格渲染影象的語義內容是一種比較難的影象處理任務。可以說，之前方法的一個主要侷限因素是缺乏明確表示語義資訊的影象表示，用於將影象內容從風格中分離。這裡用卷積神經網路的影象

Deeplearning-吳恩達-卷積神經網路-第一週作業01-Convolution Networks(python)

Convolutional Neural Networks: Step by StepWelcome to Course 4's first assignment! In this assignment, you will implement convolutional (

Convolution Neural Networks（卷積神經網路大家族）

CNN原理：受哺乳動物視覺系統的結構啟發，人們引入了一個處理圖片的強大模型結構，後來發展成了現代卷積網路的基礎。所謂卷積引自數學中的卷積運算： S

機器學習演算法篇--卷積神經網路基礎（Convolutional Neural Network）

假設輸入影象為如圖中右側的 5 × 5 矩陣，其對應的卷積核為一個 3 × 3 的矩陣。同時，假定卷積操作時每做一次卷積，卷積核移動一個畫素位置，即卷積步長為1。第一次卷積操作從影象 (0, 0) 畫素開始，由卷積核中引數與對應位置影象像素逐位相乘後累加作為一次卷積操作結果，即 1×1+2×0+3×1

Coursera Deep Learning 第四課卷積神經網路程式設計作業: Convolutional Model: Application

Convolutional Neural Networks: Application Welcome to Course 4’s second assignment! In this notebook, you will: Implement helper

Coursera Deep Learning 第四課卷積神經網路第二週程式設計作業殘差神經網路 Residual Networks

Coursera Deep Learning 第四課卷積神經網路第二週程式設計作業殘差神經網路 Residual Networks Welcome to the second assignment of this week! You will l

卷積神經網路學習筆記——Siamese networks（孿生神經網路）

完整程式碼及其資料，請移步小編的GitHub地址　　傳送門：請點選我　　如果點選有誤：https://github.com/LeBron-Jian/DeepLearningNote 　　在整理這些知識點之前，我建議先看一下原論文，不然看我這個筆記，感覺想到哪裡說哪裡，如果看了論文，還有不懂的，正好這篇部落

Keras學習（四）——CNN卷積神經網路

本文主要介紹使用keras實現CNN對手寫資料集進行分類。示例程式碼： import numpy as np from keras.datasets import mnist from keras.utils import np_utils from keras.models impo

深度學習（十九）基於空間金字塔池化的卷積神經網路物體檢測

原文地址：http://blog.csdn.net/hjimce/article/details/50187655 作者：hjimce 一、相關理論本篇博文主要講解大神何凱明2014年的paper：《Spatial Pyramid Pooling in Dee

淺析卷積神經網路的內部結構

提到卷積神經網路（CNN），很多人的印象可能還停留在黑箱子，輸入資料然後輸出結果的狀態。裡面超級多的引數、眼花繚亂的命名可能讓你無法短時間理解CNN的真正內涵。這裡推薦斯坦福大學的CS231n課程，知乎上有筆記的中文翻譯。如果你需要更淺顯、小白的解釋，可以讀讀看本文。文章大部分理解都源自於CS3

cs231 卷積神經網路Convolutional Networks群組歸一化GN( Group Normalization)

相關推薦