1. 程式人生 > 實用技巧 >2020.10.06-基於改進 YOLO v3 網路的夜間環境柑橘識別方法

2020.10.06-基於改進 YOLO v3 網路的夜間環境柑橘識別方法

主要巨集觀問題

這篇論文要解決什麼問題?

夜間環境柑橘識別問題。

這篇論文用了什麼方法?

改進的YOLO V3——Des-YOLO V3 網路進行檢測。

這篇論文可以達到什麼效果?

網路的精確率可以達到97.67%,召回率為97.46%、F1值為0.976

在測試集下的平均精度為90.75%,檢測速度為53fps,

用的什麼對比演算法?

YOLO V3,YOLO V3 DarkNet53

Faster RCNN

效果比對比演算法高了多少?

精確率比YOLO V3高6.26%,召回率比YOLOV3高6.36%,F1值比YOLO V3高0.063。

在測試集上YOLO v3_DarkNet53 網路的平均精度 88. 48% ,mAP 比 YOLO v3_

DarkNet53 網路提高了 2. 27 個百分點,檢測速度比 YOLO v3_DarkNet53 網路提高了 11FPS。

DesYOLO v3 網路與 Faster R-CNN 網路相比,少了生成候選區域這一步,所以 mAP 比 Faster R-CNN 低了0. 5 個百分點,但是 Des-YOLO v3 網路的速度為 53f /s,明顯快於 Fater R-CNN。

作者最引以為豪的結論是什麼?

在夜間對柑橘進行檢測的時候,比YOLO V3_DarkNet53 網路的檢測精度高,檢測速度快。

且對小目標的檢測精度有所提高,

相對於使用BackBone 為DarkNet 53的 YOLO v3來說,運算量更小,。

這篇論文的創新點是什麼?

改進的Des-YOLO V3網路,實現了網路多層特徵的融合。

這篇論文的難點是什麼?

夜間小體積果實重疊果實識別率較低; 夜間識別方法步驟複雜,採用多階段人工特徵提取方法,不適合大樣本資料集,識別效果有待進一步提升。

這篇論文存在的問題是什麼?

技術細節

主要的操作步驟是什麼?

更換YOLO V3的BackBone

網路的結構是什麼

BackBone:先來3個大小為3x3,padding為1的卷積層(不改變影象大小),再來一個最大池化層;之後是1個Dense Block+3個ResNet Block。

neck :類似於FPN

網路的尺度金字塔(與原始的FPN類似,但是不相同,原始的FPN有4個輸出,而本文的只有3個輸出),通過2次上取樣並與網路上層中相同尺寸特徵圖譜拼接,進行3次迴歸預測,實現對不同尺寸目標的多尺度檢測。

對網路進行修改的依據是什麼

為了有效減少模型的引數,同時儘可能在高層特徵中保留各級底層特徵(包括原始影象資訊),進一步實現網路多層特徵的複用和融合,因此借鑑了密集連線網路的思想。

在保證模型具有較高預測準確率的基礎上縮減了網路的卷積層數量減小了模型尺寸和計算量

資料集有多大?

拍攝了2000幅影象,篩選出來清晰的1600幅

遮擋影象是指柑橘面積遮擋超過1/3遮擋影象749幅,完整影象851幅,其中1200幅作為訓練集,剩餘400幅作為測試集

資料集的預處理?

使用的硬體裝置

計算機配置為 Intel Core i7-8700HQ CPU,3. 20 GHz × 12,顯示卡為 GeForce GTX 1080,作業系統為 Ubuntu16. 04LTS,NVIDIA 430. 26 驅動,CUDA 8. 0. 61 版本,CUDNN神經網路加速庫版本為5. 1. 1。

網路的訓練

batch size為64,共16批次,進行50000次迭代;動量因子設為0.9;衰減係數設為0.0005,學習率調整策略採用setps,初始學習率設為0.001,當網路迭代40000次和45000次時,學習率依此降低為0.0001和0.00001。

實驗如何驗證?

設計了YOLO v3 和 Des-YOLO v3 的對比識別試驗,將原始測試集分為果實稀疏完整果實遮擋 2 個梯度,目的是對比分析 2 種識別網路在以上兩種情況下的檢測效能。

圖 10 為兩種網路 P、R 關係曲線,圖 11 為 2 種網路的識別效果圖。