1. 程式人生 > >純C++版的Faster-Rcnn(通過caffe自定義RPN層實現)


這裡介紹的是通過新增自定義層(RPN層)代替python層,實現c++版的faster-rcnn,因為去掉python了,所以部署時不會因為牽扯到python庫等其它的莫名其妙的錯誤,使用起來就跟單純的caffe一樣,更簡單方便。 核心程式碼,借鑑的是這篇部落格,這裡的話,我們不扣具體的程式碼細節(比如rpn層是怎麼產出候選框啊,非極大值抑制是具體怎麼實現的等等),有興趣的可以自己查下資料,所以主要是走一個步驟,從而完成c++版faster-rcnn的配置。


      (1) 新增自定義層 rpn_layer.hpp  把它放在 caffe/include/caffe/layers/  目錄下

  1. #ifndef CAFFE_RPN_LAYER_HPP_
  2. #define CAFFE_RPN_LAYER_HPP_
  3. #include <vector>
  4. #include "caffe/blob.hpp"
  5. #include "caffe/layer.hpp"
  6. #include "caffe/proto/caffe.pb.h"
  7. //#include"opencv2/opencv.hpp"
  8. #define mymax(a,b) ((a)>(b))?(a):(b)
  9. #define mymin(a,b) ((a)>(b))?(b):(a)
  10. namespace caffe {  
  11.     /** 
  12.     * @brief implement RPN layer for faster rcnn 
  13.     */
  14.     template <typename Dtype>  
  15.     class RPNLayer : public Layer<Dtype> {  
  16.     public:  
  17.         explicit RPNLayer(const LayerParameter& param)  
  18.             : Layer<Dtype>(param) {  
  19.                 m_score_.reset(new Blob<Dtype>());  
  20.                 m_box_.reset(new Blob<Dtype>());  
  21.                 local_anchors_.reset(new Blob<Dtype>());  
  22.             }  
  23.         virtualvoid LayerSetUp(const vector<Blob<Dtype>*>& bottom,  
  24.             const vector<Blob<Dtype>*>& top);  
  25.         virtualvoid Reshape(const vector<Blob<Dtype>*>& bottom,  
  26.             const vector<Blob<Dtype>*>& top){}  
  27.         virtualinlineconstchar* type() const { return"RPN"; }  
  28.         struct abox{  
  29.             Dtype batch_ind;  
  30.             Dtype x1;  
  31.             Dtype y1;  
  32.             Dtype x2;  
  33.             Dtype y2;  
  34.             Dtype score;  
  35.             bool operator <(const abox&tmp) const{  
  36.                 return score < tmp.score;  
  37.             }  
  38.         };  
  39.     protected:  
  40.         virtualvoid Forward_cpu(const vector<Blob<Dtype>*>& bottom,  
  41.             const vector<Blob<Dtype>*>& top);  
  42.         //virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom,
  43.             //const vector<Blob<Dtype>*>& top);
  44.         virtualvoid Backward_cpu(const vector<Blob<Dtype>*>& top,  
  45.             const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom){};  
  46.         int feat_stride_;  
  47.         int base_size_;  
  48.         int min_size_;  
  49.         int pre_nms_topN_;  
  50.         int post_nms_topN_;  
  51.         float nms_thresh_;  
  52.         vector<int> anchor_scales_;  
  53.         vector<float> ratios_;  
  54.         vector<vector<float> > gen_anchors_;  
  55.         int *anchors_;  
  56.         int anchors_nums_;  
  57.         int src_height_;  
  58.         int src_width_;  
  59.         float src_scale_;  
  60.         int map_width_;  
  61.         int map_height_;  
  62.         shared_ptr<Blob<Dtype> > m_score_;  
  63.         shared_ptr<Blob<Dtype> > m_box_;  
  64.         shared_ptr<Blob<Dtype> >local_anchors_;  
  65.         void generate_anchors();  
  66.         vector<vector<float> > ratio_enum(vector<float>);  
  67.         vector<float> whctrs(vector<float>);  
  68.         vector<float> mkanchor(float w,float h,float x_ctr,float y_ctr);  
  69.         vector<vector<float> > scale_enum(vector<float>);  
  70.         //cv::Mat proposal_local_anchor(int width, int height);
  71.         void proposal_local_anchor();  
  72.         void bbox_tranform_inv();  
  73.         cv::Mat bbox_tranform_inv(cv::Mat local_anchors, cv::Mat boxs_delta);  
  74.         void nms(std::vector<abox> &input_boxes, float nms_thresh);  
  75.         void filter_boxs(cv::Mat& pre_box, cv::Mat& score, vector<abox>& aboxes);  
  76.         void filter_boxs(vector<abox>& aboxes);  
  77.     };  
  78. }  // namespace caffe
  79. #endif  // CAFFE_RPN_LAYER_HPP_
然後是原始檔 rpn_layer.cpp  放在 caffe/src/caffe/layers/  目錄下
  1. #include <algorithm>
  2. #include <vector>
  3. #include "caffe/layers/rpn_layer.hpp"
  4. #include "caffe/util/math_functions.hpp"
  5. #include <opencv2/opencv.hpp>
  6. int debug = 0;  
  7. int  tmp[9][4] = {  
  8.     { -83, -39, 100, 56 },  
  9.     { -175, -87, 192, 104 },  
  10.     { -359, -183, 376, 200 },  
  11.     { -55, -55, 72, 72 },  
  12.     { -119, -119, 136, 136 },  
  13.     { -247, -247, 264, 264 },  
  14.     { -35, -79, 52, 96 },  
  15.     { -79, -167, 96, 184 },  
  16.     { -167, -343, 184, 360 }  
  17. };  
  18. namespace



