1. 程式人生 > >SSD論文翻譯

SSD論文翻譯

SSD: Single Shot MultiBox Detector
摘要
我們提出了一種使用單個深度神經網路來檢測影象中的目標的方法。我們的方法命名為SSD,將邊界框的輸出空間離散化為不同長寬比的一組預設框和並縮放每個特徵對映的位置。在預測時,網路會在每個預設框中為每個目標類別的出現生成分數,並對框進行調整以更好地匹配目標形狀。此外,網路還結合了不同解析度的多個特徵對映的預測,自然地處理各種尺寸的目標。相對於需要目標提出的方法,SSD非常簡單,因為它完全消除了提出生成和隨後的畫素或特徵重新取樣階段,並將所有計算封裝到單個網路中。這使得SSD易於訓練和直接整合到需要檢測元件的系統中。PASCAL VOC,COCO和ILSVRC資料集上的實驗結果證實,SSD對於利用額外的目標提出步驟的方法具有競爭性的準確性,並且速度更快,同時為訓練和推斷提供了統一的框架。對於300×300的輸入,SSD在VOC2007測試中以59FPS的速度在Nvidia Titan X上達到74.3%的mAP,對於512×512的輸入,SSD達到了76.9%的mAP,優於參照的最先進的Faster R-CNN模型。與其他單階段方法相比,即使輸入影象尺寸較小,SSD也具有更高的精度。程式碼獲取:

https://github.com/weiliu89/caffe/tree/ssd

相關推薦

SSD論文翻譯

SSD: Single Shot MultiBox Detector 摘要 我們提出了一種使用單個深度神經網路來檢測影象中的目標的方法。我們的方法命名為SSD,將邊界框的輸出空間離散化為不同長寬比的

翻譯SSD論文(Single Shot MultiBox Detector)

轉自http://lib.csdn.net/article/deeplearning/53059 作者:Ai_Smith 本文翻譯而來,如有侵權,請聯絡博主刪除。未經博主允許,請勿轉載。每晚泡腳,閒來無事,所以就邊泡邊翻譯了SSD論文,總感覺英文看著不習慣,還是中文好理解,也是和大家一起學習。菜鳥水

深度學習【50】物體檢測:SSD: Single Shot MultiBox Detector論文翻譯

SSD在眾多的物體檢測方法中算是比較重要的。之前學習過,但是沒過多久就忘了,因此決定將該論文翻譯一下,以加深印象。 Abstract 我們提出了用單個深度神經網路進行物體檢測的方法,稱為SSD。在每個特徵圖中的每個位置,SSD將bbox(bounding

翻譯SSD論文(Single Shot MultiBox Detector),僅作交流~

本文翻譯而來,如有侵權,請聯絡博主刪除。未經博主允許,請勿轉載。每晚泡腳,閒來無事,所以就邊泡邊翻譯了SSD論文,總感覺英文看著不習慣,還是中文好理解,也是和大家一起學習。菜鳥水平有限,懇求大家指出錯誤之處。本翻譯僅作交流之用,請勿用於其他。 SSD: Single Sho

谷歌cartographer 論文翻譯筆記

branch sla 筆記 狀態 對比 graph 獲得 濾波 部分 google cartographer的論文Real-Time Loop Closure in 2D LIDAR SLAM 剛剛研究完gmapping,現在來看看谷歌開源的cartographer,在看源

論文翻譯 DOTA:A Large-scale Dataset for Object Detection in Aerial Images

網絡 操作 邊框 允許 官方 靈活 數量級 image 轉化 簡介:武大遙感國重實驗室-夏桂松和華科電信學院-白翔等合作做的一個航拍圖像數據集 摘要: 目標檢測是計算機視覺領域一個重要且有挑戰性的問題。雖然過去的十幾年中目標檢測在自然場景已經有了較重要的成就

lightgbm論文翻譯

web aux should class vmtools idg feature 上進 measure Lightgbm:高效梯度提升決策樹摘要:梯度提升決策樹(GBDT)是一種流行的機器學習算法,並且有很多有效的實現,例如XGBoost和pGBRT。盡管在這些實現中已經采

論文翻譯:Mastering the Game of Go without Human Knowledge (第一部分)

將在 過程 methods 簡單的 能力 概率 通用 依靠 有著 長久以來,人工智能的一個目標是在那些具有挑戰性的領域實現超過人類表現的算法。最近,AlphaGo成為了在圍棋上第一個打敗了世界冠軍的程序。在AlphaGo中,使用深度神經網絡來進行樹搜索,評估位置,和選擇下一

深度學習論文翻譯解析(一):YOLOv3: An Incremental Improvement

cluster tina ble mac 曾經 media bject batch 因此 原標題: YOLOv3: An Incremental Improvement 原作者: Joseph Redmon Ali Farhadi YOLO官網:YOLO: Real-Tim

CRNN論文翻譯——中文版

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 摘要 基於影象的序列識別一直是計算機視覺中長期存

Exploring Models and Data for Image Question Answering 論文翻譯

這項工作旨在解決基於影象的問答(QA)與新模型和資料集的問題。 在我們的工作中,我們建議使用神經網路和視覺語義嵌入,而不需要諸如物件檢測和影象分割之類的中間階段來預測關於影象的簡單問題的答案。 我們的模型比現有影象質量保證資料集上的唯一公佈結果好1.8倍。 我們還提出了一種問題生成演算法,該演算法將

基於深度卷積神經網路的單通道人聲與音樂的分離-論文翻譯

主體內容:作為當前的一大熱門,語音識別在得到快速應用的同時,也要更適應不同場景的需求,特別是對於智慧手機而言,由於元器件的微型化導致對於語音處理方面的器件不可能很大,因此單通道上的語音分離技術就顯得極為重要,而語音分離正是語音識別的前端部分。而傳統的技術由於資

論文翻譯】ResNet論文中英對照翻譯--(Deep Residual Learning for Image Recognition)

【開始時間】2018.10.03 【完成時間】2018.10.05 【論文翻譯】ResNet論文中英對照翻譯--(Deep Residual Learning for Image Recognition) 【中文譯名】深度殘差學習在影象識別中的應用 【論文連結】https://arx

論文翻譯】中英對照翻譯--(Attentive Generative Adversarial Network for Raindrop Removal from A Single Image)

【開始時間】2018.10.08 【完成時間】2018.10.09 【論文翻譯】Attentive GAN論文中英對照翻譯--(Attentive Generative Adversarial Network for Raindrop Removal from A Single Imag

Visual simultaneous localization and mapping: a survey論文翻譯

Fuentes-Pacheco J, Ruiz-Ascencio J, Rend, et al. Visual simultaneous localization and mapping: a survey[J]. Artificial Intelligence Review, 201

Faster R-CNN 英文論文翻譯筆記

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun reference link:ht

Ontology Understanding Without Tears——本體理解的一篇論文翻譯

Introduction 目前為止,還沒有同時利用結構和語義資訊進行本體摘要的方法。基於此,本文將一個RDF/S資料庫看成兩個不同的但是相互連線的圖:模式層圖和資料層圖。這樣做就能在考慮所有資料的前提下給出本體摘要。 具體來說,本文的貢獻主要如下: 提出了自動生成RDFS

論文翻譯——Scalable Object Detection using Deep Neural Networks

Scalable Object Detection using Deep Neural Networks 作者:Dumitru Erhan,Christian Szegedy, Alexander Toshev等 發表時間

Superpixel Sampling Networks論文翻譯

Superpixel Sampling Networks 超畫素取樣網路 摘要 超畫素提供影象資料的有效低/中級表示,這極大地減少了後續視覺任務的影象基元的數量。 現有的超畫素演算法並不是不可靠的,因此很難將它們整合到其他端到端可訓練的深度神經網路中。 我們開發了一種新的超畫素取樣差分模

DeepPose: Human Pose Estimation via Deep Neural Networks論文翻譯

翻譯點選連結獲取 基本思想 級聯網路架構:在第一階段將影象輸入後得到大致位置,在之後的階段利用相同的網路架構得到更精細的結果。對級聯的所有階段使用相同的網路架構,但學習不同的網路引數。其中網路架構使用的是Alex,所不同的是loss函式,AlexNet是用於分類的,而本文的架構是用於迴