論文筆記-深度估計(4) Semi-Supervised Deep Learning for Monocular Depth Map Prediction

阿新 • • 發佈：2019-01-07

CVPR2017_Semi-Supervised Deep Learning for Monocular Depth Map Prediction

這是一篇用雙目進行無監督學習估計深度的論文。

對一幅圖進行有監督訓練進行深度估計時，由於採集裝置的侷限，並非影象的每個畫素都有對應的真實值。於是作者提出在影象有真實值的地方進行監督學習，無真實值的地方進行無監督學習（最終作者發現對整個影象都進行無監督學習+部分地方有監督學習效果最好）。這樣的結合，使得無監督學習部分學習起來相對輕鬆甚至不需要很複雜的價值函式而不用擔心陷入區域性最優解，使得有監督學習速度能更快。

最後作者達到了state of art的效果。

1.介紹

作者認為當前有監督學習過程中過於依賴真實值，但真實值可能有以下問題：

有誤差和噪音；
雷達等真值採集的測量值很稀疏；
需要對影象系統的內外參進行標定。
相機和雷達不能很好地對準，特別是兩者中心無法很好對準，導致本來在相機視野之外的真值也投影到圖片中

2.價值函式

整體流程如圖：
這裡寫圖片描述

相比前幾篇論文，此處作者以預測逆深度為目標。我們知道，整個深度的分佈由近及遠是一個長尾分佈，所以比起直接用深度Z，用反逆深度能更好地表達深度的數值特點。
作者總的價值函式包括有監督深度誤差，無監督深度誤差和正則化三個部分：

這裡寫圖片描述

有時會感嘆，雙目匹配和深度估計在很長一段時間是高度相關的，深度估計也形成了形如雙目匹配中 $E = E_{d a t a} + E_{s m o o t h}$

E = E_{d a t a} + E_{s m o o t h}

的價值函式。

2.1有監督誤差：

這裡寫圖片描述
作者對用了一個Berhu函式（類似Huber）。我們知道Huber函式常用來抵消outlier對模型的損害，當某個outlier離模型過遠時，損失就有L2變為L1。而此處用Berhu函式是更希望快速壓制大的深度殘差，所以此處用Berhu函式：
這裡寫圖片描述
其中 $δ$ 大小為所有“真值-誤差”對中差異最大值的0.2倍。

2.2無監督深度誤差：

這裡寫圖片描述

作者先對影象進行高斯平滑消除噪音，然後再利用雙目之間baseline，焦距等內外引數已知的情況下，分別將左檢視中的點投影到右檢視的誤差，以及將右檢視的點投影到左檢視的誤差一同納入誤差計算中。

2.3 正則項

作者採用類似於文章[1]的正則化，使得正則項兼有平滑深度變化，同時保持物體邊界深度的不連續性的功能：

這裡寫圖片描述

作者對每個畫素對x和y方向取梯度，但眾所周知物體邊緣的梯度是不連續的，所以作者取自然指數倒數的函式作為權重，當梯度太大（即遇到邊緣）時權重就小（就不會強行降低邊緣上的梯度了）。上式部分1是權重，部分2是深度的梯度。
對於那些無真值資料且弱紋理的區域，估計深度是ill-posed問題，但正則化有助於很好地在這類區域中估計深度。

2.網路

這裡寫圖片描述

作者沿用大家常用的encoder(sample)-decoder(unsample)方式.decoder部分用ImageNet上的ResetNet-50，但沒有最後的全連線層，畢竟不需要做細分類。卷積層隨機初始化。

隨後的decoder據說比較複雜，其naive版本如下：
這裡寫圖片描述

和主流方法一樣，作者加上了skip的方法，除了第一層外，每層都融合了encoder的某一層。作者發現skip能顯著提高最後輸出的精確度，但不影響系統收斂。

實現細則

最後的實現中，作者完全隨機初始化所有的卷積層引數，這樣一來，最初的預測值（逆深度）接近於0，且無監督部分loss接近於0，有監督部分loss卻會很大。於是作者給有監督部分的loss乘上了一個fade-in數值 $b e^{- 10 / t}$ ，這個數值會隨著迭代次數慢慢變小。同時，對所有的卷積網路的weight加上一個weight decay=0.00004。當然dropout也不能少。然後訓練網路直到驗證集的loss開始上升就停止迭代。

除最後一層輸出外，每層都有batch normalization。RELU啟用函式。
作者最後的結論是在所有畫素上進行無監督學習要比僅僅在無真實值的地方進行無監督學習好，價值函式中用BerHu函式比L2函式好（後者在訓練集中表現更好但在測試集中就栽跟頭；很明顯，測試集中有更多outlier（此處的outlier是相對訓練集的資料分佈來說））。作者同時指出：高斯模糊加分，長skip加分。

最終表現如下：
這裡寫圖片描述

總體看來，無監督和有監督的表現還是差別挺大，無監督學習任重道遠。但兩種模型各有優缺點，相容兩種優點的模型更可能發揮更好效果。作者提到，在0-80米範圍內，增加了無監督學習的模型表現更好，因為這個區域內的真值非常稀疏。

論文筆記-深度估計(4) Semi-Supervised Deep Learning for Monocular Depth Map Prediction

CVPR2017_Semi-Supervised Deep Learning for Monocular Depth Map Prediction 這是一篇用雙目進行無監督學習估計深度的論文。對一幅圖進行有監督訓練進行深度估計時，由於採集裝置的侷限，並非影

IJCAI_論文-深度學習-Deep Learning for Event-Driven Stock Prediction

mark work dai one day app http 深度學習 HERE inter Deep Learning for Event-Driven Stock Prediction Reading time:2019/3/30-2019/4/12 Theme:D

論文筆記：MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

Abstract MatchNet：一個用來從patches中提取特徵的深度卷積網路 + 一個用來比較提取出的特徵相似度的三層全連結網路構成。 Introduction 在MatchNet中，每個patch輸入卷積網路，生成一個固定維度的類似

Joint Deep Learning For Pedestrian Detection（論文筆記-深度學習：行人檢測）

一、摘要：行人檢測主要分為四部分：特徵提取、形變處理、遮擋處理和分類。現存方法都是四個部分獨立進行，本文聯合深度學習將四個部分結合在一起，最大化其能力。二、引言

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

論文筆記-Wide & Deep Learning for Recommender Systems

wiki body pos ear recommend sys con 損失函數 wrapper 本文提出的W&D是針對rank環節的模型。網絡結構：本文提出的W&D是針對rank環節的模型。網絡結構： wide是簡單的線性模型，但

論文筆記5：How to Discount Deep Reinforcement Learning:Towards New Dynamic Strategies

參考資料：How to Discount Deep Reinforcement Learning: ... 為幫助跟我一樣的小白，如果有大神看到錯誤，還請您指出，謝謝~ 知乎同名：uuummmmiiii 創新點：相比於原始DQN不固定折扣因子（discount factor,γ），學習率（

論文筆記及公式推導《Supervised Discrete Hashing》

轉載自http://jikaichen.com/2016/05/31/notes-on-sdh/，僅用作個人學習，如需刪除，請聯絡本人。原論文提出了一種解離散雜湊問題的最優化方法，推出其閉式解。筆者在閱讀該論文的過程中，理解公式推導的過程中遇到了一些問題，

影象隱寫術分析論文筆記：Deep learning for steganalysis via convolutional neural networks

好久沒有寫論文筆記了，這裡開始一個新任務，即影象的steganalysis任務的深度網路模型。現在是論文閱讀階段，會陸續分享一些相關論文，以及基礎知識，以及傳統方法的思路，以資借鑑。這一篇是Media Watermarking, Security, and Forensi

《Wide & Deep Learning for Recommender Systems》論文筆記

推薦系統 CTR預估 CVR預估 0、概述線性模型被廣泛地應用於迴歸和分類問題，具有簡單、快速和可解釋性等優點，但是線性模型的表達能力有限，經常需要人工選擇特徵和交叉特徵才能取得一個良好的效果，但是實際工程中的特徵數量會很多，並且還會有大量的稀

論文筆記---深度學習之VGG模型解讀

———————————————————————————————————————————————優雅的分割線如今深度學習發展火熱，但很多優秀的文章都是基於經典文章，經典文章中的一句一詞都值得推敲和分析。此外，深度學習雖然一直被人詬病缺乏足夠令人信服的理論，但不代表我們不

論文筆記《Chinese Lexical Analysis with Deep Bi-GRU-CRF Network》

Chinese Lexical Analysis with Deep Bi-GRU-CRF Network 百度自然語言處理部的一篇論文，提出了一個結合分詞，詞性標註和命名實體識別的工具。論文指出百度已經開發了各種分詞，詞性標註，實體識別的工具，相互獨立以

論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

visual 視覺尺度 iss https 展開 http stones 使用目錄寫在前面目標檢測任務與挑戰目標檢測方法匯總基礎子問題基於DC

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

最實用的深度學習教程 Practical Deep Learning For Coders (Kaggle 冠軍 Jeremy Howard 親授)

ted del src learning over attention wid multi 美國 Jeremy Howard 在業界可謂大名鼎鼎。他是大數據競賽平臺 Kaggle 的前主席和首席科學家。他本人還是 Kaggle 的冠軍選手。他是美國奇點大學（Singular

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

論文筆記系列-Neural Architecture Search With Reinforcement Learning

control 地方如果 align 並行 inf 筆記靈活 2.4 摘要神經網絡在多個領域都取得了不錯的成績，但是神經網絡的合理設計卻是比較困難的。在本篇論文中，作者使用遞歸網絡去省城神經網絡的模型描述，並且使用增強學習訓練RNN，以使得生成得到的模型在驗證集上

論文筆記——An online EEG-based brain-computer interface for controlling hand grasp using an adaptive probabilistic neural network（10年被引用66次）

不同 -s evel 模型 his ren 虛擬 dem virt 題目：利用自適應概率網絡設計一種在線腦機接口樓方法控制手部抓握概要：這篇文章提出了一種新的腦機接口方法，控制手部，系列手部抓握動作和張開在虛擬現實環境中。這篇文章希望在現實生活中利用腦機接口技術控制抓握。

論文筆記 Locality-Sensitive Deconvolution Networks with Gated Fusion for RGB-D Indoor Semantic Segmentation

extract pear rain bsp ble rgb oge nbsp png 用於RGB-D室內語義分割的具有門控融合的局部敏感反卷積網絡 abstract problem: indoor semantic segmentation using RGB

Python計算機視覺深度學習三合一Deep learning for computer vision with Python高清pdf

Deep Learning for Computer Vision with Python Starter Bundle pdf Deep Learning for Computer Vision with Python Practitioner Bundle pdf Deep Learning for

論文筆記-深度估計(4) Semi-Supervised Deep Learning for Monocular Depth Map Prediction

1.介紹

2.價值函式

2.1有監督誤差：

2.2無監督深度誤差：

2.3 正則項

2.網路

實現細則

相關推薦