SSD演算法的MXNet實現

阿新 • • 發佈：2019-02-01

前段時間看到一個SSD（SSD：single shot multibox detector ）演算法的MXNet實現，程式碼風格不錯，特來分享。
SSD演算法的介紹可以參看部落格：SSD（single shot multibox detector）演算法及Caffe程式碼詳解

接下來結合親自實驗列一下如何跑這個模型，系統：Ubuntu 16.04

1、本地安裝好MXNet

2、跑demo
2.1 先拉取mxnet-ssd專案

git clone --recursive https://github.com/zhreshold/mxnet-ssd.git

拉取下來的專案預設名稱為mxnet-ssd

2.2 下載訓練好的ssd模型
下載地址
下載成功後，把.params檔案和.json檔案放在專案的model資料夾下，如下圖：

這裡寫圖片描述

2.3 執行demo

cd /path/to/mxnet-ssd
python demo.py --gpu 0

3、訓練模型
3.1、下載資料集
這裡以pascal VOC資料集為例，先在命令列進入到你要存放資料集的資料夾，然後命令列輸入：

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
wget http://host.robots.ox.ac.uk 
/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

解壓

tar -xvf VOCtrainval_11-May-2012.tar
tar -xvf VOCtrainval_06-Nov-2007.tar
tar -xvf VOCtest_06-Nov-2007.tar

這裡將用VOCtrainval2007和VOCtrainval2012作為訓練集（VOC2007的trainval一共有5011張影象，VOC2012的trainval一共有11540張影象，因此訓練的影象一共有16551張），將VOCtest2007作為測試集（VOC2007的test一共有4952張影象，也就是測試的影象一共有4952張）。因此最後資料的存放路徑大概是這樣：

~/VOCdevkit/VOC2007
~/VOCdevkit/VOC2012

然後用一個連結將你存放資料的地方連結到ssd專案的data資料夾下，命令列輸入：

ln -s /path/to/VOCdevkit /path/to/this_example/data/VOCdevkit

比如我將VOC資料集放在/home/data/VOCdevkit/下，ssd專案在/home/project/mxnet-ssd/下，那麼就要輸入：

ln -s /home/data/VOCdevkit /home/project/mxnet-ssd/data/VOCdevkit

這樣在mxnet-ssd/data/資料夾下就會有這個：

這裡寫圖片描述

最後我們要生成.lst和.rec檔案：
先在命令列進入mxnet-ssd的tools資料夾下，然後執行：

sh prepare_pascal.sh

生成的.lst和.rec檔案在mxnet-ssd/data/資料夾下：

這裡寫圖片描述

3.2、下載預訓練的vgg16_reduced模型
下載地址
解壓後將.params和.json檔案放在mxnet-ssd/model/資料夾下。

3.3、訓練模型
在mxnet-ssd目錄下執行：

python train.py

如果你需要修改一些引數，可以在後面加上，比如：

python train.py --gpus 0,1 --batch-size 32 --lr 0.001

具體引數可以看train.py這個指令碼。
貼一張正在訓練的模型的輸出：

這裡寫圖片描述

SSD演算法的MXNet實現

前段時間看到一個SSD（SSD：single shot multibox detector ）演算法的MXNet實現，程式碼風格不錯，特來分享。 SSD演算法的介紹可以參看部落格：SSD（single shot multibox detector）演算法及Ca

SSD 演算法詳解及其 keras 實現（上）

https://blog.csdn.net/remanented/article/details/79943418 (看原文吧，我就不進行截圖了) 看了幾天的SSD的論文和keras實現的程式碼，對SSD也有了一定的理解，把這幾天的學習成果記錄下來。可能是因為之前學習了Mask R-CNN

【目標檢測】SSD演算法--損失函式的詳解(tensorflow實現）

SSD的損失函式包含用於分類的log loss 和用於迴歸的smooth L1，並對正負樣本比例進行了控制，可以提高優化速度和訓練結果的穩定性。總的損失函式是分類和迴歸的誤差的帶權加和。α表示兩者的權重，N表示匹配到default box的數量 1 loc的損失函式

GIS資訊關聯規則挖掘——Apriori演算法的實現（下）

上篇說明了原理，這篇就直接上核心程式碼了~ 程式碼比較長，所以理解可能有點麻煩，核心思路就是計算選擇的維度後遍歷資料，逐步進行迴圈計算置信度，並淘汰每次迴圈後的最低值。這裡有一點要注意的，我一開始想用arraylist構造一個堆疊結構進行資料遍歷的儲存跟計算，因為這樣效率比較高。

GIS資訊關聯規則挖掘——Apriori演算法的實現（上）

最近閒著無聊沒啥課，幫讀master的朋友做了一個桌面端的GIS系統，主要功能是景區管理。其中有個核心功能挺有意思的，就是統計所有景區受損設施的所有致損型別和每個型別具體包含的致損因子後，計算致損因子之間的關聯規則，然後可以根據使用者選定的致損型別組合計算出其景區設施造成損害的概率。（有點

memcache通過hash取模演算法，實現多伺服器存取值

<?php //封裝一個hash演算法類 class Mem{ //儲存memcache的伺服器個數 private $hostCount=''; //多個伺服器 private $host=[]; //構造方法用來給接收值，給屬性賦值 publi

數獨問題的一種簡單演算法程式碼實現

五一期間無聊時想起去年考研複試有一道上機題目當時沒作出來，於是一時興起想重新拾起看看是當時太緊張，還是自己能力不足。然後發現這道題目還真稍微有些難度，相當於一道數獨問題(sudoku)的簡化版。自己想來想去也只能想到兩種演算法，一種是拿剩餘元素做全排列測試，一種是回溯法測試。最後只實現了一個全排

Java快速排序演算法的實現

高快省的排序演算法有沒有既不浪費空間又可以快一點的排序演算法呢？那就是“快速排序”啦！光聽這個名字是不是就覺得很高階呢。假設我們現在對“6 1 2 7 9 3 4 5 10 8”這

BP 演算法手動實現

github部落格傳送門 csdn部落格傳送門本章所需知識: numpy matplotlib 資料下載連結: 深度學習基礎網路模型(mnist手寫體識別資料集) 梯度下降 BP 演算法手動實現 import numpy as np import matplotlib.pyplot

基於內容的推薦演算法的實現程式碼例項

本次例項需要三個資料檔案分別為節目及其所屬標籤型別的01矩陣；使用者--節目評分矩陣；使用者收視了的節目--標籤01矩陣。可以直接下載下來使用https://download.csdn.net/download/qq_38281438/10757266 具體程式碼如下： #

谷歌開源整合學習工具AdaNet：2017年提出的演算法終於實現了

曉查編譯整理量子位報道 | 公眾號 QbitAI 最近，谷歌在GitHub上釋出了用TensorFlow實現的AutoML框架——AdaNet，它改進了整合學習的方法，能以最少的專家干預實現自動習得高質量模型。谷歌AI研究團曾在2017年的ICML上提出了AdaNet：人

基本排序演算法-java實現

最近重新學習了排序演算法，之前每次看完當時理解了，但是過一段時間就又忘了，尤其是程式碼，如果放一段時間有很多base case不知道怎麼寫了，所以還是應該詳細的解讀一下再不斷了敲程式碼才能理解比較深刻。 1.氣泡排序（bubble sort）氣泡排序是一種簡單的排序演算法。其基本思

機器學習實戰——k-近鄰演算法Python實現問題記錄

準備 kNN.py 的python模組 from numpy import * import operator def createDataSet(): group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])

十大排序演算法的實現十大經典排序演算法最強總結（含JAVA程式碼實現）

十大經典排序演算法最強總結（含JAVA程式碼實現）最近幾天在研究排序演算法，看了很多部落格，發現網上有的文章中對排序演算法解釋的並不是很透徹，而且有很多程式碼都是錯誤的，例如有的文章中在“桶排序”演算法中對每個桶進行排序直接使用了Collection.sort

Nakatsu演算法--C++實現

期末論文選的是最長公共子序列的其他解法，偶然發現Nakatsu演算法對於最長公共子序列求解速度很快。嘔心瀝血寫的程式碼=。=| 希望可以給以後想學習用Nakatsu演算法的朋友們一個參考。注：Nakatsu求的是最佳匹配度，子序列可能所含字元不正確，

python資料結構之KMP演算法的實現

我相信網上已經有很多關於KMP演算法的講解，大致都是關於部分匹配表的實現思路和作用，還有就是目標串的下標不變，僅改變模式串的下標來進行匹配，確實用KMP演算法，當目標串很大模式串很小時，其效率很高的，但都是相對而言。至於對於部分匹配表的作用以及實現思路，建議看一下這篇文章寫的是比較易懂的

Round-Robin負載均衡演算法及其實現原理

輪詢排程演算法(Round-Robin Scheduling) 輪詢排程演算法的原理是每一次把來自使用者的請求輪詢分配給內部中的伺服器，從1開始，直到N(內部伺服器個數),然後重新開始迴圈。演算法的優點是其間接性，它無需記錄當前所有連線的狀態，所以它是一種無狀態排程。輪詢排程演算法流

小白向Apriori演算法Python實現

　　參考部落格：http://www.cnblogs.com/llhthinker/p/6719779.html 　　　　學習的別人的程式碼，用Python實現的Apriori演算法，演算法介紹見https://www.cnblogs.com/1113127139aaa/p/9926507.html

寫一個遞迴演算法來實現字串逆序儲存，要求不另設串儲存空間。

遞迴演算法中需要使用一個靜態變數儲存陣列下標 #include <iostream> using namespace std; void invert(char A[]) { char ch; static int i=0;//利用靜態變數儲存陣列下標 ci

最新google演算法：實現中文TTS的測試結果

簡介本文主要是實現中文的TTS，沒有接入百度、阿里、騰訊和訊飛的API，僅僅依靠自己的訓練演算法和經過樣本處理和測試而成。樣本的製作方法：由於本人時間和金錢的限制，無法找專業的人員錄製大量樣本。本文的解決辦法為：藉助百度語音合成API 神經百度的語音合成API

SSD演算法的MXNet實現

相關推薦