RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 閱讀記錄
最近發現將閱讀論文的心得體會記錄下來是很有必要的,一方面將自己的想法用文字表達出來,可以鍛鍊論文寫作表達能力,便於後續論文寫作。另一方面,便於回顧自己的工作。
本文僅代表我自己的觀點,對論文理解有誤的地方,歡迎大家指正。
正如標題說是,本文是利用遷移學習技術將訓練好的CNN模型應用於室內物體(household object)的識別及姿態評估任務。為了獲得物體的姿態,並提高物體識別的精度,本文利用RGB-D資訊訓練神經網路。由於卷積神經網路(本文用的是A. Krizhevsky在ImageNet ILSVRC 2011上用的模型,A. Krizhevsky, I. Sutskever, and G. E. Hinton,“Imagenet classification with deep convolutional neural networks,” in Advancesin Neural Information Processing Systems (NIPS), 2012, pp. 1097–1105.)大部分是使用RGB影象進行訓練,而深度圖是用灰度圖表示的,為了能將深度圖作為輸入,訓練神經網路,作者用了一個技巧,首先從深度圖中提取出需要識別的目標物體,然後對其上色,得到Colorized image,如下圖所示。
然後作者根據卷積神經網路輸出的結果,利用SVM(支援向量機)得到物體類別和姿態(這部分論文為詳細闡述,故不太瞭解具體是怎麼做的)。
相關推薦
RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 閱讀記錄
最近發現將閱讀論文的心得體會記錄下來是很有必要的,一方面將自己的想法用文字表達出來,可以鍛鍊論文寫作表達能力,便於後續論文寫作。另一方面,便於回顧自己的工作。 本文僅代表我自己的觀點,對論文理解有誤的地方,歡迎大家指正。 正如標題說是,本文是利用遷移學習技
6D姿態估計從0單排——看論文的小雞篇——Learning Descriptors for Object Recognition and 3D Pose Estimation
iss dem vol nodes rim ext obj tor triplet 這篇文章和前一篇把神經網絡主要集中於descriptor的對比方面不一樣的是,這一篇中CNN還用來區分不同的物體類別和同類別不同姿態從而確保不同類間距較大同類間距較小(但是足以區分pose)
OS and DSA Concepts based on eight hundred and seven
eight hundred and seven of SE 目錄 (一)緒論 棧 佇列 遞迴 串 陣列 稀疏矩陣 樹 森林 霍夫曼樹 AVL樹 最優二叉樹 (六)圖
Build data driven apps with real time and offline capabilities based on GraphQL
AWS AppSync is a serverless back-end for mobile, web, and enterprise applications. AWS AppSync makes it easy to build data driven mobile a
A NEW HYPERSPECTRAL BAND SELECTION APPROACH BASED ON CONVOLUTIONAL NEURAL NETWORK文章筆記
方法 可能 lec pan 結果 ica repr 貢獻 tps A NEW HYPERSPECTRAL BAND SELECTION APPROACH BASED ON CONVOLUTIONAL NEURAL NETWORK 文章地址:https://ieeexplor
MSCNN論文解讀-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
多尺度深度卷積神經網路進行快速目標檢測: 兩階段目標檢測器,與faster-rcnn相似,分為an object proposal network and an accurate detection network. 文章主要解決的是目標大小不一致的問題,尤其是對小目標的檢測,通過多
MACNN-Learning Multi-Attention Convolutional Neural Network for Fine-Grained Image Recognition
《Learning Multi-Attention Convolutional Neural Network for Fine-Grained Image Recognition》是微軟亞洲研究院17年出的一篇細粒度影象識別論文,它的姊妹篇是《Look Closer to
模型加速--LCNN: Lookup-based Convolutional Neural Network
本文使用查表法加速CNN網路訓練和計算,可以在嵌入式裝置終端進行CNN網路訓練 本文對每個網路層構建一個 字典 Dictionary,每個 weight filter 可以由這個字典中的某些向量線性組合得到 Fast Convolution using a
網路結構搜尋(3) —— Simple and efficient architecture search for convolutional neural network
一、網路態射(Network Morphism) 神經網路的結構幾乎都是朝著越來越深的方向發展,但是由人工來設計網路結構的代價非常大,在網路結構搜尋(1)、網路結構搜尋(2)中分析了NAS、ENAS的網路結構搜尋方法,通過RNN來學習一個網路結構引數構建模型,ENAS又在NAS的基礎上引入權值貢
ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs(閱讀理解)
在卷積前進行attention,通過attention矩陣計算出相應句對的attentionfeature map,然後連同原來的featuremap一起輸入到卷積層。主要的原來是將輸入擴充套件成雙通道,新增的新通道就是通過Attention Matrix計算出來的attention feature map
論文解析《Deep Convolutional Neural Network Features and the Original Image》
這一篇論文詳細分析了人臉識別中CNN網路提取到的features有一些什麼樣的性質,一般人臉識別中CNN出來後面接一個線性層用交叉熵來分類,這裡的features值得就是cnn出來的512或者128維的浮點陣列。文章首先用這個features作為輸入,使用LDA來分類,預測頭
論文筆記:Visual Object Tracking based on Adaptive Siamese and Motion Estimation Network
Visual Object Tracking based on Adaptive Siamese and Motion Estimation 本文提出一種利用上一幀目標位置座標,在本幀中找出目標可能出現的位置的網路--motion es
讀書筆記25:2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning(CVPR2018)
摘要:首先指出背景,即action recognition和human pose estimation是兩個緊密相連的領域,但是總是被分開處理。然後自然地引出本文的模型,本文的模型就針對這個現狀,提出了一個multitask framework,既能從靜態image中進行
Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記
ati 技術分享 mar 最大 ali ndt and 兩個 mat Look into Person: Joint Body Parsing & Pose Estimation Network and A New Benchmark閱讀筆記 這篇論文主要是兩個貢獻
D. Arpa and a list of numbers Codeforces Round #432 (Div. 2, based on IndiaHacks Final Round 2017)
bsp tdi ble mat sum i++ amp ext com http://codeforces.com/contest/851/problem/D 分區間操作 1 #include <cstdio> 2 #include <cstdl
《Frustum PointNets for 3D Object Detection from RGB-D Data》論文及程式碼學習(二)程式碼部分
《Frustum PointNets for 3D Object Detection from RGB-D Data》論文及程式碼學習(二)程式碼部分 文章目錄 《Frustum PointNets for 3D Object Detection from RG
《Frustum PointNets for 3D Object Detection from RGB-D Data》論文及程式碼學習
《Frustum PointNets for 3D Object Detection from RGB-D Data》論文及程式碼學習 《Frustum PointNets for 3D Object Detection from RGB-D Data》一文是Charles R.Qi
《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》論文閱讀之CRNN
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition paper: CRNN 翻譯:CRNN
[論文理解]Region-Based Convolutional Networks for Accurate Object Detection and Segmentation
Region-Based Convolutional Networks for Accurate Object Detection and Segmentation 概括 這是一篇2016年的目標檢測的文章,也是一篇比較經典的目標檢測的文章。作者介紹到,現在表現最好的方法非常的複雜,而本文的方法,簡單又容
深度學習論文翻譯解析(二):An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
論文標題:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 論文作者: Baoguang Shi, Xiang B