Large Pose 3D Face Reconstruction 文章理解

阿新 • • 發佈：2019-02-03

Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric 文章的一點點理解梳理

寫在前面

因為我比較弱，在機器學習和三維重建方面都算是新手，所以並不是很理解這篇文章，只是梳理下文章中的模型結構，當做筆記，我相信大家更加優秀，應該能理解的層次比我更深。我這裡梳理的順序按照由小模組向大模組梳理。

Residual Module

這裡寫圖片描述
文章中稱為 residual module ，引用的文章中稱為 Residual Learning，是微軟發表的文章，中文常翻譯為殘差學習,源自論文Deep Residual Learning for Image Recognition

這種結構主要解決深度學習層次特別深的時候，容易在BackPropagation過程中梯度消失的問題，使得即便網路結構非常深，梯度也不會輕易消失。

他第一行是卷積路，由三個核尺度不同的卷積串聯而成；第二行是跳級路，只包含一個核尺度為1的卷積層。

這裡寫圖片描述
對於多個殘差學習模組串聯的情況也可以展開為如圖的效果。

Hourglass Module

這裡寫圖片描述
Hourglass Module如上圖所示，是Stacked Hourglass Networks for Human Pose Estimation 文章中的一個獨立子模組，圖中每一個立方體都是一個Residual Module。

可以說這篇文章就是直接用Hourglass module堆出來的了，想要理解這個模型，可能必須要讀一下這個模型的出處。這裡附一個文章

理解。

VRN

Volumetric Regression Network(VRN) 本文作者使用的模型，由多個沙漏模型組合在一起形成。
- VRN模型使用兩個沙漏模組堆積而成，並且沒有使用hourglass的間接監督結構。
- VRN-guided 模型是使用了Stacked Hourglass Networks for Human Pose Estimation 的工作作為基礎，在前半部分使用兩個沙漏模組用來獲取68個標記點，後半部分使用兩個沙漏模組，以一張RGB圖片和68個通道（每個通道一個標記點）的標記點作為輸入資料。
- VRN-Multitask 模型，用了三個沙漏模組，第一個模組後分支兩個沙漏模組，一個生成三維模型，一個生成68個標記點。
這裡寫圖片描述

Large Pose 3D Face Reconstruction 文章理解

Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric 文章的一點點理解梳理

寫在前面

Residual Module

Hourglass Module

VRN

參考文獻

Large Pose 3D Face Reconstruction 文章理解

3D【4】人臉重建:Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric

3D Face Reconstruction

3D人臉重建：《Joint 3D Face Reconstruction and Dense Alignment with Position Map Regression Network》

3D【3】人臉重建:Image Based 3D Face Reconstruction: A Survey閱讀筆記

Get Out of My Lab: Large-scale, Real-Time Visual-Inertial Localization文章理解

3D【9】人臉重建:Joint3D Face Reconstruction and Dense Alignment with Position Map Regression

基礎知識《十二》一篇文章理解Cookie和Session

一篇文章理解計算機最基本的運行原理（學C語言之前必懂）

一篇文章理解計算機最基本的運行原理（北京PK10平臺制作學C語言之前必懂）

Paper Reading: Pose-Aware Face Recognition in the wild

一篇文章理解JS繼承——原型鏈/建構函式/組合/原型式/寄生式/寄生組合/Class extends

論文閱讀：Disentangled Representation Learning GAN for Pose-Invariant Face Recognition

Learning 3D Face Morphable Model Out of 2D Image

編譯原理入門篇|一篇文章理解編譯全過程

learning to Estimate 3D Hand Pose from Single RGB Images論文理解

好文章收藏--五分鐘理解一致性哈希算法(consistent hashing)

看完這篇文章就知道VR全景-720全景項目、3D建模市場應該怎樣做

css- @media @font-face 的理解

《深入理解Java集合框架》系列文章

Large Pose 3D Face Reconstruction 文章理解

Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric 文章的一點點理解梳理

寫在前面

Residual Module

Hourglass Module

VRN

參考文獻

相關推薦