1. 程式人生 > >目標檢測--Faster rcnn最新補充

目標檢測--Faster rcnn最新補充

補充1:

在faster rcnn中,

Note

  • 只有在train時,cls+reg才能得到強監督資訊(來源於ground truth)。即ground truth會告訴cls+reg結構,哪些才是真的前景,從而引導cls+reg結構學得正確區分前後景的能力;在reference階段,就要靠cls+reg自力更生了。
  • 在train階段,會輸出約2000個proposal,但只會抽取其中256個proposal來訓練RPN的cls+reg結構;到了reference階段,則直接輸出最高score的300個proposal。此時由於沒有了監督資訊,所有RPN並不知道這些proposal是否為前景,整個過程只是慣性地推送一波無tag的proposal給後面的Fast R-CNN。
  • RPN的運用使得region proposal的額外開銷就只有一個兩層網路。

300個proposal由什麼分數決定的呢?這分數怎麼產生?

(所以。。。。以及,在其他的目標檢測演算法中,怎麼在測試階段通過非極大值抑止選出框呢?由於要先找出分值最高的那個,用剩下的和它去進行比較,所以這個分數最高的怎麼得到?)

補充2:

11*11的特徵圖區域,在原圖中就表示11*11個大黑框,每個大黑框裡面又有9個小顏色框,這樣就會產生11*11*9個不同位置,不同尺度,不同形狀的物體框,基本足夠框出所有物體了。

補充3: