yolo v1演算法理解

阿新 • • 發佈：2019-01-23

寫的比較明確，不是籠統的介紹，yolo 目標檢測演算法個人總結（yolov1） - 朱勇的文章 - 知乎

https://zhuanlan.zhihu.com/p/27515705

yolo v1在檢測目標時，不同於之前RCNN系列的方法，是將檢測物件的類別和位置同時進行預測，是一種迴歸問題。

主要步驟為：卷積層進行影象特徵提取；全連線層用於後續類別和目標位置的迴歸預測。

具體預測方法：目標可能位於影象的不同區域性區域，因此，作者首先將影象分割成S*S個柵格單元，

並同時期望每一個柵格單元能完成識別和檢測落入到該單元的目標。

基於此，作者提出對每一個柵格單元，主要預測以下幾個值：1 預測的B個Box的置信度；

2 每個Box的位置（Box中心座標x,y以及Box的寬和高）；

3 在當前柵格單元有物件的條件下，輸入每個類別的概率；作者同時還指出，一個柵格單元只負責檢測一個目標，

並且B個Box只有一個用於預測目標的位置，這句話為我們對Train的Image的類別標記和計算loss值提供了依據。

具體loss計算文章中有非常詳細的介紹，截圖如下：

關於loss中的引數，原文有非常詳細的介紹，在這裡就不一一展開。只列舉出，我在實現的過程中為難的地方：

1 文章中每一個柵格單元會預測2個Box，那麼類別標記的時候這兩個Box怎麼處理的？

我在實現過程中，並沒有找到作者關於這2個Box的說明，更別說其他的細節了。

後來，我想，其實這裡預測幾個Box其實並不重要，作者的目標是一個柵格單元只檢測出一個目標，

理論上一個Box就能達到要求，作者在這裡選擇兩個Box我想主要是由於不同的物體形狀上可能差異比較大，

兩個Box可以分別負責預測兩種形狀的物體(w>h or w<h)。因此，我在處理時，對於根據目標的長、

寬比確定選擇哪一個Box作為作者所說的"responsible"。並沒有計算Box與ground truth的IOU，

並找到最大的那個。（這裡有處理錯誤，還請指出來）

2 作者說每一個柵格單元是否包含object的判斷方法是：檢測目標Box的中心點是否落入到該單元。

由於我的最終目標是要檢測人，人一般會比較大，Box的中心點位置標記為object往往不能覆蓋到人的有用資訊

(如下圖中黃色矩形示意)，這會較低召回率。為此，類別標記時，我們將一個object差分為4個object，

具體如圖所示（原來的框+3個新框）。這樣明顯增加了類別的召回率。測試時確實效果好了不少。

yolo v1演算法理解

寫的比較明確，不是籠統的介紹，yolo 目標檢測演算法個人總結（yolov1） - 朱勇的文章 - 知乎https://zhuanlan.zhihu.com/p/27515705yolo v1在檢測目標時，不同於之前RCNN系列的方法，是將檢測物件的類別和位置同時進行預測，是

YOLO v1,YOLO v2,YOLO9000演算法總結與原始碼解析

1.YOLO v1簡介 YOLO出自2016 CVPR 《You Only Look Once:Unified, Real-Time Object Detection》。YOLO將目標區域定位於目標類別預測整合於單個神經網路模型中，實現了在準確率較高的情況下快

YOLO v1論文筆記

belle agen cti 努力 scores local cores orm ins You Only Look Once:Unified, Real-Time Object Detection 論文鏈接：https://arxiv.org/abs/1506.026

目標檢測演算法理解：從R-CNN到Mask R-CNN

　　因為工作了以後時間比較瑣碎，所以更多的時候使用onenote記錄知識點，但是對於一些演算法層面的東西，個人的理解畢竟是有侷限的。我一直做的都是影象分類方向，最近開始接觸了目標檢測，也看了一些大牛的論文，雖然網上已經有很多相關的演算法講解，但是每個人對同一個問題的理解都不太一樣，本文主

Candy演算法--理解

Canny邊緣檢測運算元的目標是找到一個最優的邊緣檢測演算法，最優邊緣檢測的含義是：好的檢測 - 演算法能夠儘可能多地標識出影象中的實際邊緣。好的定位 - 標識出的邊緣要與實際影象中的實際邊緣儘可能接近(邊緣過粗，難以精確定位)。最小響應 -

hashcode和equals及雜湊演算法理解

因為會設計到很多equal的知識，所以先深入理解一下equals(). 1.equals（） Object類中的預設equals()方法和==是沒有區別的，都是判斷兩個物件是否指向同一個引用，記憶體地址是否相同，即是否就是一個物件。而string類和integer等，都需要重寫equals（）方

ALS演算法理解和引數調優

在上一篇博文中我們一起學習瞭如何用spark構建一套歌手推薦系統，在模型訓練的時候，我們用到的是ALS演算法，這篇博文我們就一起來學習一下ALS演算法的原理吧。ALS演算法全稱是Alternating Least Squares，從協同過濾的分類來說，這裡的ALS演算法是同時基於使用者和

[深度學習]Object detection物體檢測之YOLO v1(6)

目錄與以往rcnn，SPPNet，fast rcnn，faster rcnn的不同 YOLO的特點 YOLO的流程 YOLO的網路結構圖 YOLO的loss function YOLO的侷限 YOLO的實驗結果論文全稱：《You Only Look Once:

PHP中選擇排序的演算法理解

選擇排序，原理：在每一次大迴圈的時候得出一個最大值或者最小值來替換相應的位置，看程式碼： <?php $arr = [3,2,4,7,5]; for($i=0;$i<count($arr);$i++){ //第一次迴圈假設第一個元

貪心演算法理解

貪心演算法基本思想：貪心演算法通過一系列的選擇來得到問題的解，其中每一個選擇都是當前狀態下區域性最好的選擇，即貪心選擇它有兩個重要性質：貪心選擇性質和最優子結構性質。貪心選擇性質：指問題的最優解可以通過一系列區域性最優解的選擇得到。貪心演算法做貪心選擇可以依賴於以往所做過的選擇，但決不依賴

【轉載】Folyd演算法理解

一篇非常優秀的解析傳送門 floyd演算法:我們真的明白floyd嗎? 2016年08月02日 20:14:18 ljhandlwt 閱讀數：7444 標籤： floyd 演算法更多個人分類：演算法

SMO演算法理解

SMO演算法看了近3遍感覺還是有點朦朦朧朧，模模糊糊。所以索性，理解多少寫多少，避免遺忘。可能會有很多錯誤，歡迎指正。主要基於李航的《統計學習方法》 SMO(sequential minimal optimization)序列最小最優化演算法我們在討論支援向量機的學習問

粒子群演算法理解+求解01揹包問題

最近在學群體優化演算法，做個學習筆記吧，本人蒟蒻，有不對的地方還情多多包涵。 1.粒子群演算法的理解。粒子群演算法是一種智慧優化演算法，模擬的是鳥內捕食行為。假設有一群鳥，在一個區域內覓食，這個區域內只有一個食物（最優解），但是每個鳥只知道自己距食物的距

網路請求中常見的加密機制和加密演算法理解

請求安全性：伺服器端在接收到請求的時候，要主動鑑別該請求是否有效，是否可接受。　　token:已登陸使用者的識別碼　　　　解決的問題:使用者呼叫介面時，不用每次都帶上使用者名稱和密碼，避免了頻繁在網路中傳輸密碼被截獲的風險。　　　　使用場景:使用者登入系統時傳入使用者名稱和密碼，伺服器校驗成功之後，根

SSD演算法理解（2）

作者：葉虎編輯：祝鑫泉前言目標檢測近年來已經取得了很重要的進展，主流的演算法主要分為兩個型別：（1）two-stage方法，如R-CNN系演算法，其主要思路是先通過啟發式方法（selective search）或

yolo v1 v2 v3

YOLO v1 這是繼RCNN，fast-RCNN和faster-RCNN之後，rbg（RossGirshick）針對DL目標檢測速度問題提出的另外一種框架。YOLO V1其增強版本GPU中能跑45fps，簡化版本155fps。論文下載：http

yolo v1, v2

論文地址：YOLO9000: Better, Faster, Stronger 專案主頁：YOLO: Real-Time Object Detection （最近部落格下很多人請求Caffe 程式碼，受人所託，已經不再提供，且關閉

gcForest演算法理解

一、相關理論本篇博文主要介紹南京大學周志華教授在2017年提出的一種深度森林結構——gcForest（多粒度級聯森林）。近年來，深度神經網路在影象和聲音處理領域取得了很大的進展。關於深度神經網路，我們可以把它簡單的理解為多層非線性函式的堆疊，當我們人工很難或者不想去尋找兩個目標之間的非線性

回溯演算法理解

一、演算法含義回溯演算法也叫試探法，它是一種系統地搜尋問題的解的方法。回溯演算法的基本思路是：暴力演算法的改進，在通過遍歷所有路徑基礎上，通過回溯（往回找）篩除不可能的路徑，提高效率。二、解題步驟： 1.確定一個解空間，它包含問題的解；2.利用適於搜尋的方法組織解空間；3.利用深度優先法搜尋解空間；

資料結構篇：校園最短路徑導航（二：弗洛伊德演算法理解與應用）

求最短路徑最常用的有迪傑斯特拉（Dijkstra）和弗洛伊德（Floyd）演算法兩種。本著簡潔為王道的信條，我選擇了Floyd演算法。 Floyd演算法首先來看一個簡單圖，紅色標記代表在陣列的下標，橙色標記代表距離（邊權值）我們用D[6][6]這個矩陣儲存兩點之間最短路徑，

yolo v1演算法理解

相關推薦