Pytorch--yolov3

阿新 • • 發佈：2018-12-09

一、讀取cfg檔案，根據cfg檔案構建網路。

[convolutional]
batch_normalize=1
filters=64
size=3
stride=2
pad=1
activation=leaky

儲存為如下格式：

[{"type":convolutional, "batch_normalize":1, "filters"：64, "size":3, 
"Stride":2, "pad":=1, "activation":leaky},...]

遍歷所有模組，利用torch.nn.Sequential構建網路結構。block的儲存順序與網路順序一致，所以可以用block重新構建網路。

model = torch.nn.Sequential()
conv = torch.nn.Conv2d(prev_filters, filters, kernel_size, stride, pad, bias=bias)
model.add_model("conv_{0}".format(index), conv)

yolov3中，若存在batch_normalization，則無bias，反之亦然。
Conv1d：一維卷積層，輸入的尺度是(N, C_in,L)，輸出尺度（ N,C_out,L_out）；Conv2d：二維卷積層, 輸入的尺度是(N, C_in,H,W)，輸出尺度（N,C_out,H_out,W_out）。
BatchNorm2d：對小批量(mini-batch)3d資料組成的4d輸入進行批標準化(Batch Normalization)操作。
Upsample：bilinear，雙線性差值。
route，shortcut layer，構建nn.Module類的空層，在後面對輸出層進行操作。
yolo層為detection layer，所用anchors不同，所以構建detection layer時，將anchors作為引數。

二.將預測結果，進行格式轉換。

預測輸出的shape為：

(batch_size, num_anchors*bbox_attracs, grid_size*grid_size)

轉換為：

(batch_size, grid_size*grid_size*num_anchors, bbox_attracs)

objectness

confidence score

$\\b_{x} = \delta (t_{x})+c_{x}\\b_{y} = \delta (t_{y})+c_{y} \\b_{w} = p_{w}e^{t_{w}} \\ b_{h} = p_{h}e^{t_{h}}$

根據以上處理prediction。

注意squeeze與unsqueeze的利用，對於Tensor進行操作，一定要注意維度。

三.NMS。

遍歷batch中的圖片，分別進行以下操作：

根據object_score進行判斷，將小於閾值的置零。
統計圖片所有類別，即每個Bbox的預測結果，將每類分別處理，按confidence進行排序，得到索引值。根據NMS原理，逐步消除無用的bbox。

統計類別，用到np.unique()函式，先將Tensor轉為numpy操作，最後再轉回Tensor。
消除bbox時，遍歷排好序的bbox，先判斷與confidence最大的bbox的IOU，等到下一次迴圈，會選擇除上一個之外的confidence最大的bbox繼續進行操作。
消除小於閾值的bbox的方法，即利用torch.nonzero()函式，得到非零值的索引。

pytorch yolov3 yolo層的構建矩陣運算思維啟蒙損失函式要求公示裡面的乘以相應的anchor

上一篇：pytorch yolov3 構建class Darknet 腦海中過一遍其實上一篇講到的，構建route和shortcut層，基本是簡單的層之間的疊加操作，但是yolo層要相對複雜些。寫部落格的過程中意識到了，作者如何將功能分塊實現。你比如： 1. 轉換輸入

pytorch yolov3 構建class Darknet 腦海中過一遍

從一個大體思路角度記錄一下學習的過程。細節不寫在這裡。輸入檔案：只需要一個cfg檔案即可。整體思路：先為網路定義一個Darknet類，然後裡面肯定有init，foward函式，這裡還有load_weight函式，在init初始化的時候，需要將利用cfg構建一個網路框架。具體關係在fo

Pytorch--yolov3簡單整理

一、讀取cfg檔案，根據cfg檔案構建網路。 [convolutional] batch_normalize=1 filters=64 size=3 stride=2 pad=1 activation=leaky 儲存為如下格式： [{"type":convolutional, "bat

Pytorch--yolov3

一、讀取cfg檔案，根據cfg檔案構建網路。 [convolutional] batch_normalize=1 filters=64 size=3 stride=2 pad=1 activation=leaky 儲存為如下格式： [{"type":convolutio

pytorch+yolov3(4)

參考： https://blog.paperspace.com/how-to-implement-a-yolo-v3-object-detector-from-scratch-in-pytorch-part-4/ 如何在PyTorch中從頭開始實現YOLO（v3）物件

pytorch+yolov3(2)

參考：https://blog.paperspace.com/how-to-implement-a-yolo-v3-object-detector-from-scratch-in-pytorch-part-2/ 如何在PyTorch中從頭開始實現YOLO（v3）物件檢測器：第2

pytorch+yolov3（1）

參考：https://blog.paperspace.com/how-to-implement-a-yolo-object-detector-in-pytorch/ 如何在PyTorch中從頭開始實現YOLO（v3）物件檢測器：第1部分圖片來源：Karol Majek。在

Pytorch yolov3 多GPU 訓練

pytorch 多gpu訓練：# -*- coding:utf-8 -*- from __future__ import division import datetime import torch import torch.nn as nn import torch.nn.

Pytorch版本yolov3原始碼閱讀

目錄 Pytorch版本yolov3原始碼閱讀 1. 閱讀test.py 1.1 引數解讀 1.2 data檔案解析 1.3 cfg檔案解析 1.4 根據cfg檔案建立模組 1.5 YOLOLayer 1.

史上最詳細的Pytorch版yolov3程式碼中文註釋詳解（一）

有了上面這些教程，我這個教程自然不會重複之前的工作，而是給出每個程式每行程式碼最詳細全面的小白入門註釋，不論基礎多差都能看懂，註釋到每個語句每個變數是什麼意思，只有把工作做細到這個程度，才是真正對我們這些小白有利（大神們請忽略，這只是給我們小白們看的。）本

yolov3 pytorch實現1

yolo不多做介紹，請參相關部落格和論文本文主要是使用pytorch來對yolo中每一步進行實現參考：https://blog.paperspace.com/tag/series-yolo/ 需要了解：卷積神經網路原理及pytorch實現 yol

yolov3 pytorch錯誤集合

File "D:\tmp\pytorch-yolo3\cfg.py", line 134, in print_cfg assert(prev_width == out_widths[layers[1]])是因為cfg中有除法，python3中除法自動轉為float型別

pytorch實現yolov3(3) 實現forward

之前的文章裡https://www.cnblogs.com/sdu20112013/p/11099244.html實現了網路的各個layer. 本篇來實現網路的forward的過程. 定義網路 class Darknet(nn.Module): def __init__(self, cfgfile):

pytorch實現yolov3(4) 非極大值抑制nms

在上一篇裡我們實現了forward函式.得到了prediction.此時預測出了特別多的box以及各種class probability,現在我們要從中過濾出我們最終的預測box. 理解了yolov3的輸出的格式及每一個位置的含義,並不難理解原始碼.我在閱讀原始碼的過程中主要的困難在於對pytorch不熟悉,

pytorch實現yolov3(5) 實現端到端的目標檢測

torch實現yolov3(1) torch實現yolov3(2) torch實現yolov3(3) torch實現yolov3(4) 前面4篇已經實現了network的forward,並且將network的output已經轉換成了易於操作的detection prediction格式. 本篇把前面四篇實現的

『PyTorch』第二彈_張量

ref play spl rip 出錯 margin logs 互轉演示參考：http://www.jianshu.com/p/5ae644748f21# 幾個數學概念：標量（Scalar）是只有大小，沒有方向的量，如1，2，3等向量（Vector）是有大小和方向的

pytorch教程[2] Tensor的使用

pan 使用 resp .mm tensor comment dimen edi imp [1]中的程序可以改成如下對應的Tensor形式： import torch dtype = torch.FloatTensor # dtype = torch.cuda.Flo

torch教程[3] 使用pytorch自帶的反向傳播

sin ces resp utf using esc data puts rate # -*- coding: utf-8 -*- import torch from torch.autograd import Variable dtype = torch.FloatT

Ubutnu16.04安裝pytorch

code 4.4 nbsp 錯誤 detail cond edit family 3.6 1、下載Anaconda3 首先需要去Anaconda官網下載最新版本Anaconda3(https://www.continuum.io/downloads)，我下載是是帶有p

解決運行pytorch程序多線程問題

org int blank htm 使用大量 reads 服務器 exp 當我使用pycharm運行 (https://github.com/Joyce94/cnn-text-classification-pytorch ) pytorch程序的時候，在Linux服

Pytorch--yolov3

相關推薦