1. 程式人生 > >YOLO : You Only Look Once

YOLO : You Only Look Once

YOLO

迄今為止已經有三個版本,YOLOv1,YOLOv2, YOLOv3

YOLOv1

CVPR2016.5。經典文章,目標識別速度賊快,但定位有一定誤差。對比R-CNN系列演算法,YOLO是一步到位,同時給出位置資訊和類別資訊。

概述

將圖片resize固定大小,分成s * s 個柵格(grid cell);滑動視窗滑動每一個柵格,對每一個柵格生成2個bounding box,每個bounding box包含4個座標資訊和一個confidence(

P r ( O b j e c t ) I O
U p r e d t r u t h
),對於需要預測C個條件類別概率 P r ( C l a s s i | O b j e c t ) ,最後 P r = P r ( C l a s s i | O b j e c t ) P r ( O b j e c t ) I O U p r e d t r u t h ;總共2*5+20 = 30維向量。綜上每一柵格輸出30維向量資訊,且一個柵格最多隻能預測一個物體,然後進行非極大值抑制(NMS),最後取大於閾值的檢測資訊。

網路架構

這裡寫圖片描述

損失函式

λ c o o r d i = 0 S 2 j = 0 1 i j o b j [ ( x i x ^ i ) 2 + ( y i y ^ i ) 2 ] + λ c o o r d i = 0 S 2 j = 0 1 i j o b j [ ( w i w ^ i ) 2 + ( h i h ^ i ) 2 ] + i = 0 S 2 j = 0 1 i j o b j ( C i C ^ i ) 2 + λ n o o b j i = 0 S 2 j = 0 1 i j n o o b j ( C i C ^ i ) 2 + i = 0 S 2 1 i o b j c c l a s s e s ( p i ( c ) p