YOLOv2如何fine-tuning？

阿新 • • 發佈：2019-01-04

在上一篇用YOLOv2模型訓練VOC資料集中，我們嘗試用YOLOv2來訓練voc資料集，但我想訓練自己的資料集，那麼YOLOv2如何做fine-tuning呢？我們一步一步來做～

1 準備資料

1.1 建立層次結構

首先在darknet/data資料夾下建立一個資料夾fddb2016，檔案層次如下

--fddb2016
    --Annotations
        2002_07_19_big_img_130.xml
        2002_07_25_big_img_84.xml
        2002_08_01_big_img_1445.xml
        2002_08_08_big_img_277.xml 

        2002_08_16_big_img_637.xml
        2002_08_25_big_img_199.xml
        2003_01_01_big_img_698.xml
        .
        .
        .
    --ImageSets
        --Main
            test.txt
            trainval.txt
    --JPEGImages
        2002_07_19_big_img_130.jpg
        2002_07_25_big_img_84.jpg
        2002_08_01_big_img_1445.jpg 

        2002_08_08_big_img_277.jpg
        2002_08_16_big_img_637.jpg
        2002_08_25_big_img_199.jpg
        2003_01_01_big_img_698.jpg
        .
        .
        .
    --labels

trainval.txt中存放的是圖片的名稱，我們來看一下

2002_08_11_big_img_591
2002_08_26_big_img_265
2002_07_19_big_img_423
2002_08_24_big_img_490
2002_08_31_big_img_17676
2002_ 
07_31_big_img_228
.
.
.

1.2 xml2txt

因為yolo讀取的是txt文件，所以我們要將xml的benchmark修改為txt格式，程式如下所示：

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
import cv2

#sets=[('fddb2016', 'train'), ('fddb2016', 'val')]
#classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]
classes = ["face"]

def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(w, h, image_id):
    in_file = open('fddb2016/Annotations/%s.xml' % image_id)
    out_file = open('fddb2016/labels/%s.txt'% image_id, 'w')
    print in_file
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

if not os.path.exists('fddb2016/labels/'):
    os.makedirs('fddb2016/labels/')
image_ids = open('fddb2016/ImageSets/Main/trainval.txt').read().strip().split()
list_file = open('fddb2016_train.txt', 'w')
for image_id in image_ids:
    list_file.write('%s/fddb2016/JPEGImages/%s.jpg\n'% (wd, image_id))
    image = cv2.imread('%s/fddb2016/JPEGImages/%s.jpg'%(wd, image_id))
    h, w, c = image.shape
    convert_annotation(w, h, image_id)
list_file.close()

2 Fine tuning

2.1 修改.cfg檔案

如果你想用22層模型的就修改cfg/yolo-voc.cfg，你想用9層的模型就修改cfg/tiny-yolo-voc.cfg，兩者修改方式一樣，我們以yolo-voc.cfg為例：
複製cfg檔案

$cp cfg/yolo-voc.cfg cfg/yolo-fddb.cfg

開啟yolo-fddb.cfg檔案，並作如下修改

a. 將learning_rate=0.0001改為learning_rate=0.00005
b. 將max_batches = 45000改為max_batches = 200000
c. 將classes=20改為classes=1
d. 將最後一層[convolutional]層的filters=125改為filters=30，filters的計算公式如下，請根據你自己資料的類別數量修改
filters=num∗(classes+coords+1)=5∗(1+4+1)=30

最後結果如下：

[net]
batch=64
subdivisions=8
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1

learning_rate=0.0005
max_batches = 200000
policy=steps
steps=100,25000,35000
scales=10,.1,.1
.
.
.

[convolutional]
size=1
stride=1
pad=1
filters=30
activation=linear
[region]
anchors = 1.08,1.19,  3.42,4.41,  6.63,11.38,  9.42,5.11,  16.62,10.52
bias_match=1
classes=1
coords=4
num=5
softmax=1
jitter=.2
rescore=1

object_scale=5
noobject_scale=1
class_scale=1
coord_scale=1

absolute=1
thresh = .6
random=0

2.2 修改voc.names檔案

複製voc.names檔案

$cp data/voc.names data/fddb.names

修改fddb.names檔案，結果如下

face

2.3 修改voc.data檔案

複製voc.data檔案

$cp cfg/voc.data cfg/fddb.data

修改voc.data檔案，結果如下

classes= 1
train  = /home/usrname/darknet-v2/data/fddb2016_train.txt
valid  = valid  = /home/pjreddie/data/voc/2007_test.txt
names = data/fddb.names
backup = /home/guoyana/my_files/local_install/darknet-v2/backup

3 開始訓練

YOLOv2已經支援多gpu了，利用voc資料集得到的權重來訓練，執行以下命令即可開始

./darknet detector train ./cfg/fddb.data ./cfg/yolo-fddb.cfg backup/yolo-voc_6000.weights -gpus 0,1,2,3

4 結果

3中有個問題：一般預訓練模型都用影象分類的模型，而不是用檢測模型訓練的。所以上面的方法還是有問題的，loss降到0.1之後就不再下降了。最後沒用預訓練模型來訓練網路，迭代了18000次後的效果如下所示（注：圖片來自百度圖片）

這裡寫圖片描述

(END)

SQL優化（SQL TUNING）之10分鐘完畢億級數據量性能優化（SQL調優）

font 一個進一步結束語句 pop 技術分享處理 fill 前幾天。一個用戶研發QQ找我，例如以下：自由的海豚。 16:12:01 島主，我的一條SQL查不出來結果，能幫我看看不？蘭花島主 16:12:10 多久不出結果？自由的海豚 16:12:17

Microsoft.SQL.Server2012.Performance.Tuning.Cookbook學習筆記(一)

str perm phi prev pid brush -c rpc enabled 一、Creating a trace or workload 註意點： In the Trace Properties dialog box, there is a checkbox op

Network subsystem Of Linux Performance and Tuning Guidelines

network subsystem linux網絡子系統本文出自 “庭前夜末空看雪” 博客，請務必保留此出處http://12550795.blog.51cto.com/12540795/1946086Network subsystem Of Linux Performance and Tuning Guid

Spark Performance Tuning （性能調優）

() man inter ber index data- key 兩種跟蹤在集群上的 Spark Streaming application 中獲得最佳性能需要一些調整.本節介紹了可調整的多個 parameters （參數）和 configurations （配置）提高

基於貝葉斯優化的超參數tuning

science tuning pos tps ted ati hyper targe div https://arimo.com/data-science/2016/bayesian-optimization-hyperparameter-tuning/ 貝葉斯優化

Performance Tuning

mysql- www. mar nosql tutorials chm tab cas -c MySQL Related Performance Tuning. https://www.askapache.com/mysql/mysql-performance-tunin

Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization - week1

圖片 .com arr neu regular img family nts radi Normalizing input Vanishing/Exploding gradients deep neural network suffer from t

Neural Network Tuning

sha trac been ali nim ttr batch pos time Q1: assuming that we train the neural network with the same amount of training examples, how to

SQL優化（SQL TUNING）之10分鐘完成億級數據量性能優化（SQL調優）

rom 分享分鐘 jsb tab tex sql調優 emf group 前幾天，一個用戶研發QQ找我，如下：自由的海豚。 16:12:01 島主，我的一條SQL查不出來結果，能幫我看看不？蘭花島主 16:12:10 多久不出結果？自由的海豚 16:

數據庫性能優化（database tuning）性能優化絕不僅僅只是索引

節點故障 XP 邏輯而已 postgresq 適用場景數據整體一畢業就接觸優化方面的問題，專業做優化也有至少5年之多的時間了，可現在還是經常聽到很多人認為優化很簡單，就是建索引的問題，這確實不能怪大家，做這行20多年的時間裏，在職業生涯的每個階段，幾乎都能聽到這樣

oracle11g中SQL優化（SQL TUNING）新特性之Adaptive Cursor Sharing (ACS)

ise cut info xtend 優化器指標語法 oracl 綁定 1. ACS簡介 Oracle Database 11g提供了Adaptive Cursor Sharing (ACS)功能，以克服以往不該共享的遊標被共享的可能性。ACS使用兩個新指標：se

Oracle12c中SQL性能優化（SQL TUNING）新特性之自動重優化（automatic reoptimization）

num sysdba number 並行執行 loop pdb state 周期性 align Oracle12c中的自適應查詢優化有一系列不同特點組成。像自適應計劃（AdaptivePlans）功能可以在運行時修改執行計劃，但並不允許計劃中連接順序的改變。自動重優化

一副美麗而龐大的SQL TUNING計劃美圖

小夥伴雜七雜八執行計劃 text 系統節點不能 none 分享最近因為很忙，一直忙著開發公司的產品和客戶的事情，雜七雜八，忙的不亦樂乎，所以，好久沒有來這裏寫東西，這兩天為客戶優化了一個系統，優化前CPU持續沖頂爆滿，導致系統卡死，應用系統不能正常

MSSQL優化（TUNING&OPTMIZATION&優化）之——計劃重用（plan reusing）

原來 har 完整 char 即使 name 超過 query tom Oracle中，為了減少系統內的硬解析，從而節省系統資源，有綁定變量、計劃共享（通過cursor_sharing參數）等一系列措施。那麽，SQL Server作為三大商業關系庫之一，是否也存在這樣的機制

ORACLE SQL TUNING ADVISOR

esc 執行 dbm lar task ash 快照 port sna sql tunning advisor 使用的主要步驟:1 建立tunning task2 執行task3 顯示tunning 結果4 根據建議來運行相應的調優方法 ----ADVISOR授權 1

如何fine tuning

為什麼要fine－tuning？### 我們有自己的影象識別任務，然而我們的資料集太小，直接進行訓練很容易出現過擬合現象所以比較好的解決方案是先在一個大資料集中訓練以提取比較準確的淺層特徵，然後再針對這個訓練過的網路利用我們的資料集進行訓練，那麼效果就會好很多。這個過程就是fine－t

Oboe: Auto-tuning Video ABR Algorithms to Network Conditions

1.摘要: BLOA,MPC的方法：引數對於網路條件比較敏感 Oboe:對於一個ABR演算法，預先計算可能的引數（對於不同的網路環境），實時的根據網路環境選擇最好的引數 ABR；(a) chop a video into chunks, each of which is encoded

sp2.3 Hyperparameter tuning, Batch Normalization and Programming Frameworks

1除錯引數重要性紅黃紫指導原則：alpha學習速率 β是動量裡那個 adam裡β1、2 Σ一般不用除錯以前引數少時候比如倆引數就網格一樣每個依次試一試現在深度學習引數太多也不知道哪個重要就隨機試比如左邊的兩個軸分別是α和Σ 在左圖

GlusterFS PERFORMANCE TUNING

眾所周知，glusterfs對小檔案而言，就是個雞肋，特別是在一個目錄下有過W的小檔案圖片時，ls簡單就是個坑，下面我對線上的glusterfs引數做一些優化調整，調整的命令： gluster volume set VOLNAME OPTION PARAMETER 引數如下： cluster.data-

18、Effect of Automatic Hyperparameter Tuning for Residential Load Forecasting via Deep Learning

亮點：自動超引數調整，數學很高深，不容易理解。自動超引數調整的有效性基於深度學習的住宅負荷預測短期住宅負荷預測在本文中，我們擴充套件了一個基於深度長期記憶體（LSTM）的負載，具有自動超引數調整的預測框架針對高度不穩定的住宅負荷解決STLF問題。基於樹結構的Pa