Caffe原始碼（三）：layer 分析

阿新 • • 發佈：2019-01-05

簡單介紹

Caffe 中的 layer 是組成 net 的 component . laye 必須執行向前傳播函式，即輸入 Blob bottom，產生一個輸出 Blob top。絕大多數layer 要執行反向傳播函式，即計算關於輸入 Blob 的 error 梯度 diff .

Message LayerParameter

首先讓我們回顧一下定義在caffe.proto中的Message LayerParameter：

message LayerParameter {
  optional string name = 1; // the layer name
  optional string type = 2 
; // the layer type
  repeated string bottom = 3; // the name of each bottom blob
  repeated string top = 4; // the name of each top blob
  optional Phase phase = 10; // The train / test phase for computation.

  // The amount of weight to assign each top blob in the objective.
  // Each layer assigns a default value, usually of 
 either 0 or 1,
  // to each top blob.
  repeated float loss_weight = 5;

  // Specifies training parameters (multipliers on global learning constants,
  // and the name and other settings used for weight sharing).
  repeated ParamSpec param = 6;

  // The blobs containing the numeric parameters of the layer.
  // 
 See detials in message BlobProto 
  repeated BlobProto blobs = 7;

  // Rules controlling whether and when a layer is included in the network,
  // based on the current NetState.  You may specify a non-zero number of rules
  // to include OR exclude, but not both.  If no include or exclude rules are
  // specified, the layer is always included.  If the current NetState meets
  // ANY (i.e., one or more) of the specified rules, the layer is
  // included/excluded.
  repeated NetStateRule include = 8;
  repeated NetStateRule exclude = 9;

  // Parameters for data pre-processing.
  // See detials in message TransformationParameter 
  optional TransformationParameter transform_param = 100;

  // Parameters shared by loss layers.
  // See detials in message LossParameter 
  optional LossParameter loss_param = 101;

  // Layer type-specific parameters.
  // Note: certain layers may have more than one computational engine
  // for their implementation. These layers include an Engine type and
  // engine parameter for selecting the implementation.
  // The default for the engine is set by the ENGINE switch at compile-time.
  optional AccuracyParameter accuracy_param = 102;
  optional ArgMaxParameter argmax_param = 103;
  optional ConcatParameter concat_param = 104;
  optional ContrastiveLossParameter contrastive_loss_param = 105;
  optional ConvolutionParameter convolution_param = 106;
  optional DataParameter data_param = 107;
  optional DropoutParameter dropout_param = 108;
  optional DummyDataParameter dummy_data_param = 109;
  optional EltwiseParameter eltwise_param = 110;
  optional ExpParameter exp_param = 111;
  optional HDF5DataParameter hdf5_data_param = 112;
  optional HDF5OutputParameter hdf5_output_param = 113;
  optional HingeLossParameter hinge_loss_param = 114;
  optional ImageDataParameter image_data_param = 115;
  optional InfogainLossParameter infogain_loss_param = 116;
  optional InnerProductParameter inner_product_param = 117;
  optional LRNParameter lrn_param = 118;
  optional MemoryDataParameter memory_data_param = 119;
  optional MVNParameter mvn_param = 120;
  optional PoolingParameter pooling_param = 121;
  optional PowerParameter power_param = 122;
  optional PReLUParameter prelu_param = 131;
  optional PythonParameter python_param = 130;
  optional ReLUParameter relu_param = 123;
  optional SigmoidParameter sigmoid_param = 124;
  optional SoftmaxParameter softmax_param = 125;
  optional SliceParameter slice_param = 126;
  optional TanHParameter tanh_param = 127;
  optional ThresholdParameter threshold_param = 128;
  optional WindowDataParameter window_data_param = 129;
}

Layer 類

建構函式：

explicit Layer(const LayerParameter& param)
    : layer_param_(param) {
      // Set phase and copy blobs (if there are any).
      phase_ = param.phase();
      if (layer_param_.blobs_size() > 0) {
        blobs_.resize(layer_param_.blobs_size());
        for (int i = 0; i < layer_param_.blobs_size(); ++i) {
          blobs_[i].reset(new Blob<Dtype>());
          blobs_[i]->FromProto(layer_param_.blobs(i));
        }
      }
    }//用protobuf 傳入的引數對blobs_ 做初始化，blobs_ 是一個vector 存放指向Blob類的智慧指標。

LayerSetUp 函式：

  virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom,
      const vector<Blob<Dtype>*>& top) {}

用於各個layer的初始化，不同的layer定義不同，在這裡只做了宣告，在具體的layer中定義。

Forword 函式：

 template <typename Dtype>
inline Dtype Layer<Dtype>::Forward(const vector<Blob<Dtype>*>& bottom,
    const vector<Blob<Dtype>*>& top) {
  Dtype loss = 0;
  switch (Caffe::mode()) {
  case Caffe::CPU:
    Forward_cpu(bottom, top);//對輸入的blob bottom 進行前向傳播，計算輸出blob top 或者loss，具體layer具體定義。
    for (int top_id = 0; top_id < top.size(); ++top_id) {
      if (!this->loss(top_id)) { continue; }
      const int count = top[top_id]->count();
      const Dtype* data = top[top_id]->cpu_data();
      const Dtype* loss_weights = top[top_id]->cpu_diff();
      loss += caffe_cpu_dot(count, data, loss_weights);
    }
    break;
  case Caffe::GPU:
    Forward_gpu(bottom, top);
#ifndef CPU_ONLY
    for (int top_id = 0; top_id < top.size(); ++top_id) {
      if (!this->loss(top_id)) { continue; }
      const int count = top[top_id]->count();
      const Dtype* data = top[top_id]->gpu_data();
      const Dtype* loss_weights = top[top_id]->gpu_diff();
      Dtype blob_loss = 0;
      caffe_gpu_dot(count, data, loss_weights, &blob_loss);
      loss += blob_loss;
    }
#endif
    break;
  default:
    LOG(FATAL) << "Unknown caffe mode.";
  }
  return loss;
}

對輸入的blob bottom 進行前向傳播，計算輸出blob top 或者loss，具體layer具體定義。

Backword 函式：

 template <typename Dtype>
inline void Layer<Dtype>::Backward(const vector<Blob<Dtype>*>& top,
    const vector<bool>& propagate_down,
    const vector<Blob<Dtype>*>& bottom) {
  switch (Caffe::mode()) {
  case Caffe::CPU:
    Backward_cpu(top, propagate_down, bottom);
    //根據blob top 的error 梯度（diff）計算bottom 的 error 梯度。 propagate_down 是長度 和bottom 相同的vector ，用於控制是否需要對對應的bottom 元素傳播梯度。具體layer具體定義。
    break;
  case Caffe::GPU:
    Backward_gpu(top, propagate_down, bottom);
    break;
  default:
    LOG(FATAL) << "Unknown caffe mode.";
  }
}

// Serialize LayerParameter to protocol buffer
template <typename Dtype>
void Layer<Dtype>::ToProto(LayerParameter* param, bool write_diff) {
  param->Clear();
  param->CopyFrom(layer_param_);
  param->clear_blobs();
  for (int i = 0; i < blobs_.size(); ++i) {
    blobs_[i]->ToProto(param->add_blobs(), write_diff);
  }
}

blobs，layer_param函式：

vector<shared_ptr<Blob<Dtype> > >& blobs() {
    return blobs_;
  }//返回vector  blobs_
 const LayerParameter& layer_param() const { 
    return layer_param_;
  }//返回layer parameter

ToProto 函式：

virtual void ToProto(LayerParameter* param, bool write_diff = false);

將layer plarameter 寫入protobuf

loss ,set_loss函式：

inline Dtype loss(const int top_index) const {
    return (loss_.size() > top_index) ? loss_[top_index] : Dtype(0);
  }
inline void set_loss(const int top_index, const Dtype value) {
    if (loss_.size() <= top_index) {
      loss_.resize(top_index + 1, Dtype(0));
    }
    loss_[top_index] = value;
  }

返回 ,設定一個blob top 在給定 index 的 loss

一些返回特定引數的函式：

 virtual inline const char* type() const { return ""; }//返回layer型別

 virtual inline int ExactNumBottomBlobs() const { return -1; }//返回該layer 所需 bottom 的數量，如果沒有要求返回-1

 virtual inline int ExactNumTopBlobs() const { return -1; }//返回該layer 所需 top 的數量

set_param_propagate_down，param_propagate_down 函式：

  inline bool param_propagate_down(const int param_id) {
    return (param_propagate_down_.size() > param_id) ?
        param_propagate_down_[param_id] : false;
  }
  inline void set_param_propagate_down(const int param_id, const bool value) {
    if (param_propagate_down_.size() <= param_id) {
      param_propagate_down_.resize(param_id + 1, true);
    }
    param_propagate_down_[param_id] = value;
  }

設定對於那些bottom 需要反向傳播。

CheckBlobCounts 函式

  virtual void CheckBlobCounts(const vector<Blob<Dtype>*>& bottom,
                               const vector<Blob<Dtype>*>& top) {
    if (ExactNumBottomBlobs() >= 0) {
      CHECK_EQ(ExactNumBottomBlobs(), bottom.size())
          << type() << " Layer takes " << ExactNumBottomBlobs()
          << " bottom blob(s) as input.";
    }// 保證輸入bottom 數量和要求的相同
    if (MinBottomBlobs() >= 0) {
      CHECK_LE(MinBottomBlobs(), bottom.size())
          << type() << " Layer takes at least " << MinBottomBlobs()
          << " bottom blob(s) as input.";
    }//保證輸入的bottom數量大於或等於要求的最小數量
    if (MaxBottomBlobs() >= 0) {
      CHECK_GE(MaxBottomBlobs(), bottom.size())
          << type() << " Layer takes at most " << MaxBottomBlobs()
          << " bottom blob(s) as input.";
    }//保證輸入的bottom數量小於或等於要求的最大數量
    if (ExactNumTopBlobs() >= 0) {
      CHECK_EQ(ExactNumTopBlobs(), top.size())
          << type() << " Layer produces " << ExactNumTopBlobs()
          << " top blob(s) as output.";
    }// 保證輸入top數量和要求的相同
    if (MinTopBlobs() >= 0) {
      CHECK_LE(MinTopBlobs(), top.size())
          << type() << " Layer produces at least " << MinTopBlobs()
          << " top blob(s) as output.";
    }//保證輸入的top數量大於或等於要求的最小數量
    if (MaxTopBlobs() >= 0) {
      CHECK_GE(MaxTopBlobs(), top.size())
          << type() << " Layer produces at most " << MaxTopBlobs()
          << " top blob(s) as output.";
    }//保證輸入的top數量小於或等於要求的最大數量
    if (EqualNumBottomTopBlobs()) {
      CHECK_EQ(bottom.size(), top.size())
          << type() << " Layer produces one top blob as output for each "
          << "bottom blob input.";
    }//保證輸入的bottom數量和輸出的top數量相同
  }

SetLossWeights 函式：


  inline void SetLossWeights(const vector<Blob<Dtype>*>& top) {
    const int num_loss_weights = layer_param_.loss_weight_size();
    if (num_loss_weights) {
      CHECK_EQ(top.size(), num_loss_weights) << "loss_weight must be "
          "unspecified or specified once per top blob.";
      for (int top_id = 0; top_id < top.size(); ++top_id) {
        const Dtype loss_weight = layer_param_.loss_weight(top_id);
        if (loss_weight == Dtype(0)) { continue; }//如果為0不對loss進行操作
        this->set_loss(top_id, loss_weight);
        const int count = top[top_id]->count();
        Dtype* loss_multiplier = top[top_id]->mutable_cpu_diff();
        caffe_set(count, loss_weight, loss_multiplier);//將loss_multiplier設為loss_weight
      } 
    }
  }

Caffe原始碼（三）：layer 分析

目錄簡單介紹 Caffe 中的 layer 是組成 net 的 component . laye 必須執行向前傳播函式，即輸入 Blob bottom，產生一個輸出 Blob top。絕大多數layer 要執行反向傳播函式，即計算關於輸入

Caffe原始碼（四）：math_functions 分析

轉自：https://blog.csdn.net/seven_first/article/details/47378697#1-caffecpugemm-%E5%87%BD%E6%95%B0 主要函式 math_function 定義了caffe 中用到的一些矩陣操作和數值計算的一些函式，這

Caffe原始碼（五）：conv_layer 分析

目錄簡單介紹首先要明確的一點是：ConvolutionLayer 是 BaseConvolutionLayer的子類，BaseConvolutionLayer 是 Layer 的子類。ConvolutionLayer 除了繼承了相應的成員變數和

白話Spring原始碼（三）：spring框架的理解

一、為什麼需要Spring 我們想一下如果沒有spring框架我們是怎麼去開發web應用呢？我估計大部分程式碼是跟業務無關而跟底層或者網路介面互動；物件，模組關係錯綜複雜；開發週期特別的長很容易流產；後期維護時程式碼會越來越爛，最後可能無法維護。。。那spring框架給我們解決什麼問

Device Tree（三）：程式碼分析

一、前言 Device Tree總共有三篇，分別是： 1、為何要引入Device Tree，這個機制是用來解決什麼問題的？（請參考引入Device Tree的原因） 2、Device Tree的基礎概念（請參考DT基礎概念） 3、ARM linux中和Device

caffe學習（三）：caffe視覺層引數

原文見http://www.cnblogs.com/denny402/p/5071126.html 用於備忘本文只講解視覺層（Vision Layers)的引數，視覺層包括Convolution, Pooling, Local Response Normaliz

菜鳥讀caffe原始碼（一）：protoc.exe的使用

caffe感覺都是別人玩剩下的東西，但是結合目前專案和以後對工作的設想，caffe原始碼還是有很好的學習價值。參考入門書籍《深度學習21天實戰caffe-趙永科》學習protobuffer相關知識，瞭解如何讀取proto.txt等相關引數檔案。路線下載protobu

Dubbo原始碼分析（三）：Dubbo之服務端（Service）

如上圖所示的Dubbo的暴露服務的過程，不難看出它也和消費者端很像，也需要一個像reference的物件來維護service關聯的所有物件及其屬性，這裡的reference就是provider。由於ServiceBean實現了 Initializ

EventBus原始碼分析（三）：post方法釋出事件【獲取事件的所有訂閱者，反射呼叫訂閱者事件處理方法】（2.4版本）

EventBus維護了一個重要的HashMap，這個HashMap的鍵是事件，值是該事件的訂閱者列表，因此post事件的時候就能夠從此HashMap中取出事件的訂閱者列表，對每個訂閱者反射呼叫事件處理方法。 private final Map<Cla

Zebra-VTYSH原始碼分析和改造（三）：新增定製命令

一檢視介紹由上面幾篇文章分析可見，所有的命令都是包含在node中的，根據Cisco或者H3常見路由器或者交換機的CLI格式可見，一個node就對應著一個檢視（View）。常用的檢視包括：普通檢視，管理檢視，檔案系統檢視，配置檢視，以及介面配置檢視和VLAN檢視等。

嵌入式Linux——nand flash 驅動（三）：原始碼分析

再次宣告：本文是看過一些文章後寫的，如果與你的文章有相同的地方，敬請告知，如果對你有幫助，是我的榮幸。接下來的這篇文章我們將要分析一下nand flash在S3C2440中的驅動函式。下面我們以一張圖來引入：從上圖可以看出，MTD裝置層與原始裝置層

Scrapy原始碼分析（三）：訊號管理器SignalManager

類的位置scrapy.signalmanager.SignalManager。主要是對pydispatch.dispatcher的一層封裝。首先來看看pydispatch.dispatcher都有哪些功能：專案主頁這個模組主要提供了訊息的傳送和接收功能，主頁的示例：

dubbo遠端呼叫原始碼分析（三）：客戶端接收反饋後的處理

dubbo遠端呼叫的原始碼分析，分成了三篇文章地址分別如下：下面是consumer接收到provider反饋時的處理consumer接收到provider的反饋後，觸發NettyClient的事件處理器，該事件對consumer來說是上行事件，觸發的是NettyCodecAd

JVM 原始碼分析（三）：深入理解 CAS

前言什麼是 CASJava 中的 CASJVM 中的 CAS 前言在上一篇文章中，我們完成了原始碼的編譯和除錯環境的搭建。鑑於 CAS 的實現原理比較簡單，然而很多人對它不夠了解，所以本篇將從 CAS 入手，首先介紹它的使用，然後分析它在 Hotsport 虛擬機器中的具體實現。什麼是 CAS C

Java中String、StringBuilder、StringBuffer常用源碼分析及比較（三）：String、StringBuilder、StringBuffer比較

val str 成員變量相同 += let .get end art 看這篇隨筆之前請務必先看前面兩章： Java中String、StringBuilder、StringBuffer常用源碼分析及比較（一）：String源碼分析 Java中String、StringBui

Caffe 使用記錄（五）：math_functions 分析

nbsp after caf oat 全部 rand() sad oid end 本文轉載自 Caffe源碼（一）：math_functions 分析 math_function 定義了caffe 中用到的一些矩陣操作和數值計算的一些函數，這裏以float類型為例做

數值分析（三）：C++實現線性方程組的高斯-賽德爾迭代法

線性方程組的直接解法之後，就輪到迭代解法了，直接解法針對的是低階稠密矩陣，資料量較少，而工程上有更多的是高階係數矩陣，使用迭代法效率更高，佔用的空間較小。迭代法的最基本思想就是由初始條件，比如說初始解向量隨便列舉一個，就0向量也行，然後進行迭代，k到k+1，一步一步從k=1開始去逼近真實解

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1 配置要求：系統：centos6.5 目標：基於CUDA8.0+Opencv3.1+Cudnnv5.1+python3.6介面的caffe框架寫在前面，本文是在C

Spring原始碼解析（三）：父子容器的概念

　　相信大家現在在使用spring專案開發時可能不只是單單使用spring一個框架進行開發，可能會用到現在主流的ssm，spring和springmvc一起使用。　　而在一起使用的時候我就發現了一個問題，在web.xml配置spring容器初始化的時候存在一個問題。　　　一般我們在配置sprin

OKHttp 3.10原始碼解析（三）：快取機制

本篇我們來講解OKhttp的快取處理，在網路請求中合理地利用本地快取能有效減少網路開銷，提高響應速度。HTTP報頭也定義了很多控制快取策略的域，我們先來認識一下HTTP的快取策略。一.HTTP快取策略 HTTP快取有多種規則，根據是否需要向伺服器發起請求來分類，我們將其分為兩大類：強制

Caffe原始碼（三）：layer 分析

目錄

簡單介紹

Message LayerParameter

Layer 類

建構函式：

LayerSetUp 函式：

Forword 函式：

Backword 函式：

blobs，layer_param函式：

ToProto 函式：

loss ,set_loss函式：

一些返回特定引數的函式：

set_param_propagate_down，param_propagate_down 函式：

CheckBlobCounts 函式

SetLossWeights 函式：

相關推薦