單目深度估計－基於Caffe

阿新 • • 發佈：2017-09-19

add normal mea opencv2 and git lease 來源 layers

本文的思路主要來源於[1]，模型和參數來源於[2]，這裏只是在Caffe的框架下用C++實現了，效果還可以，目前打算做個三維點雲顯示，做好了再上傳吧．

這裏先貼代碼吧，最近比較忙，就先不講具體的，大家先看吧，有時間了再寫思路吧

#include <vector>
#include <string.h>
#include <caffe/caffe.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui/highgui.hpp>

using 
 namespace caffe;
using namespace std;

int main(){ 
  
  /*Load the network*/
  string proto = "scripts/deploy_resnet50by2_pool.prototxt";
  Phase phase = TEST;
  Caffe::set_mode(Caffe::GPU);
  Caffe::SetDevice(0);
  boost::shared_ptr< Net<float> > net(new caffe::Net<float>(proto, phase));
   
string model = "model/train_iter_40000.caffemodel";
  net->CopyTrainedLayersFrom(model);
  
  CHECK_EQ(net->num_inputs(), 1) << "Network should have exactly one input.";
  CHECK_EQ(net->num_outputs(), 1) << "Network should have exactly one output.";
  
  /*Convert image to input blob. Blob: num, channel, height, width 
*/
  Blob<float>* input_blob = net->input_blobs()[0];
  int input_channel = input_blob->channels();
  int input_height = input_blob->height();
  int input_width = input_blob->width();
  cout << "The size of input image should be " << input_width << "*" << input_height << endl;
  
  vector<cv::Mat> input_channels;  //The value of input image‘s each channel  
  float* input_data = input_blob->mutable_cpu_data();
  for(int i=0;i<input_channel;i++){
    cv::Mat channel(input_height, input_width, CV_32FC1, input_data);
    input_channels.push_back(channel);
    input_data += input_width*input_height;
  }
  
  string imgPath = "images/1.png";
  cv::Mat image = cv::imread(imgPath);
  
  cv::Size input_size = cv::Size(input_width, input_height);
  cv::Mat image_resized;  
  cv::resize(image, image_resized, input_size);
  cv::imshow("image", image_resized);
  cv::waitKey(0);
  
  cv::Mat image_float;
  image_resized.convertTo(image_float, CV_32FC3);
  cv::Mat image_normalized;
  cv::Mat mean(input_height, input_width, CV_32FC3, cv::Scalar(104,117,123));
  cv::subtract(image_float, mean, image_normalized);
  cv::split(image_normalized, input_channels);
  
  net->Forward();
  
  /*Convert output blob to image*/
  Blob<float>* output_blob = net->output_blobs()[0];
  int output_height = output_blob->height();
  int output_width = output_blob->width();
  float *output_data = output_blob->mutable_cpu_data();
  cv::Mat depth(output_height, output_width, CV_32FC1, output_data);
  cout << depth.at<float>(5,5);
  
  cv::Mat depth_uint8;
  depth.convertTo(depth_uint8, CV_8UC1);
  
  cv::imshow("depth", depth_uint8);
  cv::waitKey(0);
  
  /*Generate 3D image with rgb image and estimated depth*/
  
  
  return 0;
}

下面是我的CmakeList.txt，代碼中需要的模型．參數，和圖片都是包含在[2]裏面的．

cmake_minimum_required( VERSION 2.8 )
project( resTest )

add_executable( resTest resTest.cpp )
set( CMAKE_CXX_FLAGS "-std=c++11" )

include_directories( /home/ai/Programs/Caffe/include 
  /home/ai/Programs/Caffe/.build_release/src
  /usr/local/cuda/include
  /usr/local/include
  /usr/include
  
  )
target_link_libraries( resTest
  /home/ai/Programs/Caffe/.build_release/lib/libcaffe.so 
  /usr/lib/x86_64-linux-gnu/libopencv_highgui.so
  /usr/lib/x86_64-linux-gnu/libopencv_imgproc.so
  /usr/lib/x86_64-linux-gnu/libopencv_core.so
  /usr/lib/x86_64-linux-gnu/libboost_system.so  
  /usr/lib/x86_64-linux-gnu/libglog.so 
  )

參考文獻

[1]http://blog.csdn.net/jiongnima/article/details/70197866

[2]https://github.com/Ravi-Garg/Unsupervised_Depth_Estimation

單目深度估計－基於Caffe

add normal mea opencv2 and git lease 來源 layers 本文的思路主要來源於[1]，模型和參數來源於[2]，這裏只是在Caffe的框架下用C++實現了，效果還可以，目前打算做個三維點雲顯示，做好了再上傳吧．這裏先貼代碼吧，最近比較忙，

利用語意關聯和關注驅動損失函式進行單目深度估計

這是一個臨時材料，整理後的內容在這裡。這篇文章把深度估計和語義分割聯絡起來。之前有些工作把深度用於語義分割，大都使用RGBD資料集，本文則使用單張靜態影象。長尾分佈：作者發現畫素個數在畫素深度和語義標籤上呈現長尾分佈，如下圖1。深度值呈現長尾分佈主要由獲取深度時的透視效應(the

乾貨 | Matlab實現單目視覺里程計基於SURF特徵（程式碼類）

博主github：https://github.com/MichaelBeechan 博主CSDN：https://blog.csdn.net/u011344545 SURF特徵提取參考：https://blog.csdn.net/u01134454

【深度學習】基於caffe的表情識別（四）：在Intel AI DevCloud上訓練模型

一、註冊申請Intel AI DevCloud 2.填寫註冊資訊： 3.Submit提交，提交後會出現下面的介面： 4.說明已經申請成功了，大概等2個工作日左右，會收到一封郵件，郵件長這樣：第一個紅框內的連結是使用教程，教你怎麼連線到dev

基於深度學習的單目影象深度估計

基於深度學習的單目深度估計算近年比較火的方向之前蒐集過相關的論文，嘗試回答一下。 NIPS2014，第一篇CNN-based來做單目深度估計的文章。基本思想用的是一個Multi-scale的網路，這裡的Multi-scale不是現在網路中Multi-scale features的做法，而是分為兩

單目視覺SLAM:采用逆深度參數化的方法求取深度信息的過程

ive 魯棒性圖片 lte 有著研究 tla 一次攝像機一種實時的單目視覺SLAM改進算法該算法采用一個攝像頭作為外部傳感器來提取機器人行進過程中周圍環境的特征信息，用實時性良好的FAST提取環境特征點，結合逆深度參數化進行特征點非延時初始化，用壓縮擴展卡爾曼濾波

單目，雙目，深度相機比較

因子 gpu clas 材質 als 分辨率 time 遠的範圍 1.mono優點：結構簡單，成本低缺點：在單張圖片裏，無法確定一個物體的真實大小。它可能是一個很大但很遠的物體，也可能是一個很近很小的物體。通過相機的運動形成視差，可以測量物體相對深度。但是單目SLAM估計

分享《21個項目玩轉深度學習：基於TensorFlow的實踐詳解》PDF+源代碼

更多技術分享書籍詳解 http alt ges text process 下載：https://pan.baidu.com/s/19GwZ9X2E20L3BykhoxhjTg 更多資料：http://blog.51cto.com/3215120 《21個項目玩轉深度學

基於單目視覺的移動機器人室內定位與運動目標跟蹤

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

《21個項目玩轉深度學習：基於TensorFlow的實踐詳解》

源代碼 .com 實踐詳解項目 term vpd 更多 mage mar 下載：https://pan.baidu.com/s/1NYYpsxbWBvMn9U7jvj6XSw更多資料：http://blog.51cto.com/3215120《21個項目玩轉深度學習：基於

分享《21個項目玩轉深度學習：基於TensorFlow的實踐詳解》+PDF+源碼+何之源

技術 -o 詳解 aid mar ref com 經典 baidu 下載：https://pan.baidu.com/s/1U0B5v5844JMvsGJ22Fjk_Q 更多資料：http://blog.51cto.com/14087171 《21個項目玩轉深度學習：基於T

《21個項目玩轉深度學習：基於TensorFlow的實踐詳解》PDF+源代碼

經典 img bubuko 實踐詳解復制玩轉項目 itl log 下載：https://pan.baidu.com/s/1NYYpsxbWBvMn9U7jvj6XSw 更多資料：https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkC

OpenCV相機標定及距離估計（單目）

相機標定基本知識對於針孔攝像機模型，一幅檢視是通過透視變換將三維空間中的點投影到影象平面。投影公式如下：或者這裡(X, Y, Z)是一個點的世界座標，(u, v)是點投影在影象平面的座標，以畫素為單位。A被稱作攝像機矩陣，或者內參數矩陣。(cx, cy)是基

基於CNN的深度估計，沈春華老師

Estimating Depth from Monocular Images as Classification Using Deep Fully Convolutional Residual Networks

深度學習（二十八）基於多尺度深度網路的單幅影象深度估計

基於多尺度深度網路的單幅影象深度估計作者：hjimce一、相關理論本篇博文主要講解來自2014年NIPS上的一篇paper：《Depth Map Prediction from a Single Image using a Multi-Scale Deep Network》，

基於單目視覺的智慧車輛視覺導航系統設計

基於計算機視覺的高速公路防撞系統是當前智慧交通管理系統研究的熱點之一。如何在多變的環境下快速準確地從視訊影象裡檢測到車道和前方車輛是實現這類系統面臨的最關鍵問題。近20年來，國內外很多研究人員對這個問題進行了大量研究，提出了多種多樣的實用演算法併成功開發了一些視覺系統。這

計算機視覺方向簡介(三) | 單目微運動生成深度圖

有什麼用？深度圖在計算機視覺中有非常廣泛的應用，比如前背景分割（用於背景虛化、美顏、重對焦等）、三維重建（用於機器人導航、3D列印、視效娛樂等）。目前能夠直接快速獲得深度圖的方法就是使用深度相機，不同深度相機獲取深度圖原理見：《深度相機原理揭祕–飛行時間（T

OpenCV Using Python——基於SURF特徵提取和金字塔LK光流法的單目視覺三維重建

基於SURF特徵提取和金字塔LK光流法的單目視覺三維重建 1. 單目視覺三維重建問題在前面的文章中，筆者用SIFT提取特徵後用radio測試剔除了匹配中異常的特徵點，然後根據匹配合格的特徵點計算基礎矩陣和本徵矩陣，對本徵矩陣SVD分解來估計和構造透視矩陣，

基於單目視覺的四旋翼定點降落——如何搭建基於gazebo的pixhawk模擬環境（三）-1

搭建模擬環境是相當重要的，因為我們的程式碼如果直接放到飛機上去跑，那麼很容易炸機。通過模擬環境，我們至少可以保證程式碼邏輯的正確性。這篇文章還是要感謝我的隊友舒仔仔的幫助，話不多說，上正文。1 安裝gazebo一般安裝的ROS就已經自己安裝了gazebo，如果已經安裝

基於單目實現微型無人機感知和避撞

1、介紹光流在實際環境中應用很難，因為大部分同質區域，如白牆，沒有足夠的特徵點來計算光流。我們的演算法&實驗： 1. 相對大小探測器感知和避撞前方障礙物； 2. 特徵描述器探測特徵點大小的相對變化並實現實時避撞； 3

單目深度估計－基於Caffe

相關推薦