YOLO前篇---Real-Time Grasp Detection Using Convolutional Neural Networks

阿新 • • 發佈：2018-11-29

論文地址：https://arxiv.org/abs/1412.3128

1. 摘要

比目前最好的方法提高了14%的精度，在GPU上能達到13FPS

2. 基於神經網路的抓取檢測

A 結構

使用AlexNet網路架構，5個卷積層+3個全連線層，卷積層有正則化和最大池化層
網路結構示意圖如下

B 直接回歸抓取

最後一個全連線層輸出6個神經元，前4個與位置和高度相關，另外2個用來表示方向
該模型假設每幅影象只包含一個可抓取物件，這種假設的好處是不需要用基於滑動視窗的方法對每一個小塊進行分類
loss為最小化抓取位置的平方差，即L2 loss

C 迴歸+分類

結構與B一樣，只需要在輸出層上加上與目標類別相關的神經元即可

D 多抓取檢測（MultiGrasp）

MultiGrasp把影象分成 $N\times N$ 個網格
每個網格最多隻預測一個抓取目標

如果某個網格要預測抓取目標，則該抓取目標中心必須落在該網格內
網路的輸出為 $N \times N \times 7$ 的預測，其中第1個通道為某個區域包含抓取物件的概率熱力圖，另外6個通道為該區域抓取物件的座標
實驗採用 $7 \times 7 \times 7$ 共343個神經元輸出
訓練假設：
a.MultiGrasp看一幅影象時，隨機選擇最多5個ground truth作為抓取目標。在構建熱力圖時，最多5個網格被填充為1，其餘的都置0
b.在訓練時並不是對所有的 $7 \times 7 \times 7$ 網格進行反向傳播（因為許多網格中並沒有抓取物件），而是隻對熱力圖通道中包含抓取目標的網格進行反向傳播

3. 實驗和評價

YOLO前篇---Real-Time Grasp Detection Using Convolutional Neural Networks

論文地址：https://arxiv.org/abs/1412.3128 1. 摘要比目前最好的方法提高了14%的精度，在GPU上能達到13FPS 2. 基於神經網路的抓取檢測 A 結構使用AlexNet網路架構，5個卷積層+3個全連線層，卷積層

faced: CPU Real Time face detection using Deep Learning

What is the problem?There are many scenarios where a single class object detection is needed. This means that we want to detect the location of all objects

論文閱讀筆記（六）Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

采樣分享最終產生 pre 運算減少 att 我們作者：Shaoqing Ren, Kaiming He, Ross Girshick, and Jian SunSPPnet、Fast R-CNN等目標檢測算法已經大幅降低了目標檢測網絡的運行時間。可是盡管如此，仍然

【Faster RCNN】《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》

NIPS-2015 NIPS，全稱神經資訊處理系統大會(Conference and Workshop on Neural Information Processing Systems)，是一個關於機器學習和計算神經科學的國際會議。該會議固定在每年的12月舉行

論文閱讀筆記二十六：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（CVPR 2016）

論文源址：https://arxiv.org/abs/1506.01497 tensorflow程式碼：https://github.com/endernewton/tf-faster-rcnn 摘要目標檢測依賴於區域proposals演算法對目標的位置進

3DmFV: Three-Dimensional Point Cloud Classification in Real-Time Using Convolutional Neural Networks

此篇為對論文的理解。一下關鍵地方直接使用原文，避免誤導。 Abstract—Modern robotic systems are often equipped with a direct three-dimensional (3-D) data acquisit

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

Abstract SPPnet和Fast R-CNN雖然減少了演算法執行時間，但region proposal仍然是限制演算法速度的瓶頸。而Faster R-CNN提出了Region Proposal Network (RPN)，該網路基於卷積特徵預測每個位置是否為物體以及

【論文筆記】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

寫在前面：我看的paper大多為Computer Vision、Deep Learning相關的paper，現在基本也處於入門階段，一些理解可能不太正確。說到底，小女子才疏學淺，如果有錯

【筆記】Faster-R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

論文程式碼：重要：訓練檔案.prototxt說明：http://blog.csdn.net/Seven_year_Promise/article/details/60954553從RCNN到fast R

[論文學習]《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 》

faster R-CNN的主要貢獻提出了 region proposal network（RPN）,通過該網路我們可以將提取region proposal的過程也納入到深度學習的過程之中。這樣做既增加了Accuracy，由降低了耗時。之所以說增加Accura

【翻譯】Faster-R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

摘要目前最先進的目標檢測網路需要先用區域建議演算法推測目標位置，像SPPnet[7]和Fast R-CNN[5]這些網路已經減少了檢測網路的執行時間，這時計算區域建議就成了瓶頸問題。本文中，我們介紹一種區域建議網路（Region Proposal Network, R

深度學習論文翻譯解析（十三）：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

論文標題：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 　　標題翻譯：基於區域提議（Region Proposal）網路的實時目標檢測論文作者：Shaoqing Ren, K

經典論文重讀---風格遷移篇(一)：Image Style Transfer Using Convolutional Neural Networks

核心思想採用深層卷積網路提取影象風格特徵與內容，並將其進行融合生成效果很好的藝術圖。引言部分將一幅影象的風格遷移到另一副影象可以看作是紋理遷移的一個分支。對於紋理遷移，它的目標是從源圖合成一種紋理同時施加一定的限制條件來保留目標影象內容的顯著性。在採用神經網路進行風格遷移之

論文翻譯——Scalable Object Detection using Deep Neural Networks

Scalable Object Detection using Deep Neural Networks 作者：Dumitru Erhan,Christian Szegedy, Alexander Toshev等發表時間

Image classification using convolutional neural networks

Summary If you’re interested in high-performing image classification methodology, this developer code pattern is for you. We use Pyth

卷積神經網路影象風格轉移 Image StyleTransfer Using Convolutional Neural Networks

卷積神經網路影象風格轉移 Taylor Guo, 2017年4月24日星期一摘要用不同的風格渲染影象的語義內容是一種比較難的影象處理任務。可以說，之前方法的一個主要侷限因素是缺乏明確表示語義資訊的影象表示，用於將影象內容從風格中分離。這裡用卷積神經網路的影象

YOLO(You Only Look Once):Real-Time Object Detection

path nor bat pen 2-0 object network file with caffe-yolo:https://github.com/xingwangsfu/caffe-yolo YOLO in caffe Update 12-05-2016: Curre

CPU Real-time Face Detection and Alignment-68 using MTCNN

mtcnn的landmark採用了5點迴歸，博主嘗試了68點迴歸，發現效果不錯！主要特點：同時完成人臉檢測和特徵點回歸，演算法速度實時！開源地址：https://github.com/samylee/mtcnn_landmark68（歡迎star和fork） 1

【目標檢測】[論文閱讀][yolo] You Only Look Once: Unified, Real-Time Object Detection

論文名稱《You Only Look Once: Unified, Real-Time Object Detection》摘要 1、之前的目標檢測方法採用目標分類思想解決檢測問題，本文提出一個基於迴歸的框架，用於目標的定位及識別。 2、一個網路，一次預

《You Only Look Once: Unified, Real-Time Object Detection》論文筆記

1. 論文思想 YOLO（YOLO-v1）是最近幾年提出的目標檢測模型，它不同於傳統的目標檢測模型，將檢測問題轉換到一個迴歸問題，以空間分隔的邊界框和相關的類概率進行目標檢測。在一次前向運算中，一個單一的神經網路直接從完整的影象中預測邊界框和類概率。由於整個檢測管道是一個單一的網路，

YOLO前篇---Real-Time Grasp Detection Using Convolutional Neural Networks

1. 摘要

2. 基於神經網路的抓取檢測

A 結構

B 直接回歸抓取

C 迴歸+分類

D 多抓取檢測（MultiGrasp）

3. 實驗和評價

相關推薦