【Caffe】Focal Loss

阿新 • • 發佈：2019-01-14

Pk對zk的求導，以及Pk對zj的求導請參考https://blog.csdn.net/u013066730/article/details/86231215

前向程式碼：

for (int i = 0; i < outer_num_; ++i) {
    for (int j = 0; j < inner_num_; j++) {
      const int label_value = static_cast<int>(label[i * inner_num_ + j]);
      if (has_ignore_label_ && label_value == ignore_label_) {
        continue;
      }
      DCHECK_GE(label_value, 0);
      DCHECK_LT(label_value, channels);
      const int index = i * dim + label_value * inner_num_ + j;
      // FL(p_t) = -(1 - p_t) ^ gamma * log(p_t)
      // loss -= std::max(power_prob_data[index] * log_prob_data[index],
      //                      Dtype(log(Dtype(FLT_MIN))));
      loss -= power_prob_data[index] * log_prob_data[index];
      ++count;
    }
  }

  // prob
  top[0]->mutable_cpu_data()[0] = loss / get_normalizer(normalization_, count);

反向程式碼：

    for (int i = 0; i < outer_num_; ++i) {
      for (int j = 0; j < inner_num_; ++j) {
        // label
        const int label_value = static_cast<int>(label[i * inner_num_ + j]);
        
        // ignore label
        if (has_ignore_label_ && label_value == ignore_label_) {
          for (int c = 0; c < channels; ++c) {
            bottom_diff[i * dim + c * inner_num_ + j] = 0;
          }
          continue;
        }

        // the gradient from FL w.r.t p_t, here ignore the `sign`
        int ind_i  = i * dim + label_value * inner_num_ + j; // index of ground-truth label
        Dtype grad = 0 - gamma_ * (power_prob_data[ind_i] / std::max(1 - prob_data[ind_i], eps)) 
                                * log_prob_data[ind_i] * prob_data[ind_i]
                       + power_prob_data[ind_i];
        // the gradient w.r.t input data x
        for (int c = 0; c < channels; ++c) {
          int ind_j = i * dim + c * inner_num_ + j;
          if(c == label_value) {
            CHECK_EQ(ind_i, ind_j);
            // if i == j, (here i,j are refered for derivative of softmax)
            bottom_diff[ind_j] = grad * (prob_data[ind_i] - 1);
          } else {
            // if i != j, (here i,j are refered for derivative of softmax)
            bottom_diff[ind_j] = grad * prob_data[ind_j];
          }
        }
        // count                    
        ++count;
      }
    }
    // Scale gradient
    Dtype loss_weight = top[0]->cpu_diff()[0] / get_normalizer(normalization_, count);
    caffe_scal(prob_.count(), loss_weight, bottom_diff);

【Caffe】Focal Loss

Pk對zk的求導，以及Pk對zj的求導請參考https://blog.csdn.net/u013066730/article/details/86231215 前向程式碼： for (int i = 0; i < outer_num_; ++i) { for (int j

【caffe】Error parsing text-format NetParameter: **::Expected string.

版本相關信息技術 caf caffe cte cnblogs param alt 錯誤描述： prototxt中第****行，第**列缺少一個整型數或者標識符。解決方法：檢查對應的prototxt文件，第****行，第**列是否遺漏相關信息。我的文件是在代碼新舊

【Caffe】Ubuntu16.04上配置安裝caffe(Only CPU)

nts dia 使用 word sci oos evel 成功 eve 一、首先看看自己的系統，Ubuntu16.04，cpu，沒有Nvidia，沒有opencv 二、安裝依賴包安裝protobuf,leveldb,snappy,OpenCV,hdf5, protob

【caffe】問題記錄："caffe.LayerParameter" has no field named "batch_norm_param".

　　今天使用caffe訓練resnet50的一個二分類模型，在模型訓練好後，打算用Python指令碼載入網路定義檔案deploy.prototxt測模型輸出的準確率時，出現瞭如下錯誤，折騰了好久才解決，在此記錄一下，為同樣碰到此問題的人提供一個trouble shooting的思路。 [libprot

【caffe】模板分離編譯模式和工廠模式

本文轉自: https://blog.csdn.net/raby_gyl/article/details/68489152 caffe中的模板分離編譯模式和工廠模式 1.caffe中模板分離編譯模式的實現方式是在每一個模板原始檔的最後新增一條類似於下面的語句： INST

【caffe】在windows平臺中安裝caffe（一）：基礎安裝及簡單測試

基礎配置本文中的配置：win10 + vs2015 + python2.5 + cmake3.12 + git2.15 + CUDA8.0 + cuDNN-8.0-5 在進行windows下的caffe安裝前，一定要把以上的這些軟體安裝好，並加入系統路徑中。

【Caffe】ubuntu14.04下CPU版caffe配置小結

我的配置過程：（無GPU版） 1.安裝依賴項：依賴項說明： 2.下載caffe： 3.安裝python依賴庫： 4.配置OpenCV環境 5.編譯

【caffe】Windows10+Cuda9.0+Cudnn7.0下配置GPU版caffe

第一步：下載所需軟體 1、下載CUDA9.0，也是目前的最新版本。 2、下載CUDNN V7.0。 3、下載Caffe。第二步：安裝和配置參考網上的大多數教程，對軟體進行安裝配置。 1、安裝CUDA9.0，安裝過程很簡單。 2、CUDA9.0安裝完

【Caffe】Linux安裝Caffe

Linux安裝Caffe 本日誌用於記錄學習Linux學習Caffe的安裝和使用，歡迎交流 Caffe安裝過程安裝通用依賴包 sudo apt-get install libprotob

【caffe】caffe之反捲積層

1.前言傳統的CNN網路只能給出影象的LABLE，但是在很多情況下需要對識別的物體進行分割實現end to end，然後FCN出現了，給物體分割提供了一個非常重要的解決思路，其核心就是卷積與反捲積，所以這裡就詳細解釋卷積與反捲積。對於1維的卷積

linux【ubuntu 14.04】下的【caffe】編譯安裝（CPU 配置）

原文地址：https://www.zybuluo.com/hanxiaoyang/note/364737 特別鳴謝：七月線上 - 專注資料領域的線上教育：https://www.julyedu.com （有部分修正） caffe 是深度學習在影象領域廣泛使用的框架，其 mo

【caffe】caffe結構解析（二）

這次來寫寫caffe是如何來solve的在成員函式Solve()內部， template <typename Dtype> void Solver<Dtype>::Solve(const char* resume_file) {

【Caffe】Python版本Faster R-CNN+ZF程式碼執行

相關參考部落格：下面是我自己在跑python版本Faster R-CNN程式碼ZF模型的流程： 1.git clone --recursive https://github.com/rbg

【Caffe】Matlab介面（make編譯通過，make mattest出錯）

之前一直在用pycaffe，很少接觸MatCaffe，然而幾個論文上的demo需要用到Matcaffe，最近在編譯的時候，出現不少錯誤，記錄一下。環境配置：Ubuntu16.04 + TitanX + Cuda7.5 + Cudnn V4 錯誤如下：

【caffe】使用caffe訓練自己的資料

1.生成lmdb caffe在安裝包裡提供了用於生成lmdb資料的指令碼，在使用時只需修改其中幾個引數。開啟create_imagenet.sh 需要修改的引數有以下幾個： EXAMPLE=examples/imagenet/project#工作資料夾的路徑 DATA=exampl

【Caffe】網路引數詳解（Alexnet舉例）

本文為博主學習caffe的相關筆記。在caffe框架中，網路的各個層的引數可以自己配置。檔名一般是train_val.prototxt。一、Alexnet： 1. 資料層。資料層一般作為網路的第一層，由cpu讀取資料庫中的資料，後面的層的計算由gpu進行。 #資料層（第

【Caffe】多標籤訓練、人臉屬性多工訓練

前言細節有一些問題，我這裡過一遍整個流程，涉及到的問題都會做講解。包括部署問題，最後我也會講講。正文將convert_multilabel.cpp放到caffe/tools/目錄下。修改81行： ‘>>’ should be ‘&g

【Caffe】為什麼Caffe裡頭有mutable_cpu_data和cpu_data

const void* SyncedMemory::cpu_data() { to_cpu(); return (const void*)cpu_ptr_; } void* SyncedMemory::mutable_cpu_data() { to_cpu(); head_ =

【Caffe】softmax和softmaxwithloss層的理解

softmax_axis_表示在那邊切，當為1是，out_num_就表示batchsize，sum_multiplier表示通道數，scale相關的一般表示臨時變數的儲存，dim=C*W*H，spatial_dim=W*H，inner_num_如果fc層就為1，conv層就為H*W。本文所舉得

【Caffe】math_functions檔案分析

Caffe原始碼(caffe version:09868ac , date: 2015.08.15)中有一些重要檔案，這裡介紹下math_functions檔案。 1. include檔案： (1)、<glog/logging

【Caffe】Focal Loss

相關推薦