Pytorch_模型轉Caffe（三）pytorch轉caffemodel

阿新 • • 發佈：2020-12-21

Pytorch_模型轉Caffe（三）pytorch轉caffemodel

Pytorch_模型轉Caffe（三）pytorch轉caffemodel

模型轉換基於GitHub上xxradon的程式碼進行優化，在此對作者表示感謝。GitHub地址：https://github.com/xxradon/PytorchToCaffe
本文基於AlexNet網路對MNIST手寫字型分類生成的模型*.pth進行轉換

1. Pytorch下生成模型

呼叫torchvision.models.alexnet下的alexnet網路
修改網路輸入層數 1 ,輸出類別數量 10
classifier下的dropout位置需要調整

通過一下程式碼訓練手寫數字識別，最終生成模型mnist_alexnet_model.pth(這裡儲存了整個網路和權重)

import time
import torch
from torch import nn, optim
import torchvision
import pytorch_deep as pyd
from torchvision.models.alexnet import alexnet

net = alexnet(False)
device = torch.device('cuda' if torch.cuda.is_available() else'cpu')
def load_data_fashion_mnist(batch_size = 256,resize=None,num_workers = 0):
    trans = []
    if resize:
        trans.append(torchvision.transforms.Resize(size=resize))
    trans.append(torchvision.transforms.ToTensor())
    transform = torchvision.transforms.Compose(trans)
    mnist_train = torchvision.datasets.FashionMNIST(root='./MNIST', train=True, download=True,
                                                    transform=transform)
    mnist_test = torchvision.datasets.FashionMNIST(root='./MNIST', train=False, download=True,
                                                   transform=transform)
    train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
    test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)
    return train_iter,test_iter

batch_size = 128
# 如出現“out of memory”的報錯資訊，可減⼩batch_size或resize
train_iter, test_iter = load_data_fashion_mnist(batch_size,resize=224)
lr, num_epochs = 0.001, 5
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
pyd.train_ch5(net, train_iter, test_iter, batch_size, optimizer,device, num_epochs)

2. pth轉換成caffemodel和prototxt

git clone下載GitHub原始碼，進入example下的Alexnet例項
主要用到以下兩個檔案，一個是載入網路模型，一個是進行prototxt和caffemodel的轉換
先看alexnet_pytorch_to_caffe.py

import sys
sys.path.insert(0,'.')
import torch
from torch.autograd import Variable
from torchvision.models.alexnet import alexnet
import pytorch_to_caffe_alexNet
import cv2
if __name__=='__main__':
    name='alexnet'
    pth_path = '***/mnist_alexnet_model.pth'
    net  = torch.load(pth_path)
    net.eval()
    input=Variable(torch.FloatTensor(torch.ones([1,1,224,224])))
    input = input.cuda()
    pytorch_to_caffe_alexNet.save_prototxt('{}.prototxt'.format(name))
    pytorch_to_caffe_alexNet.save_caffemodel('{}.caffemodel'.format(name))

如果直接執行發現會報錯，我這裡的錯誤出現在dropout層轉化的位置，修改其bottom和top傳參
修改完dropout，執行正常，能夠生產caffemodel和prototxt，但prototxt網路結構有問題，還是前後層銜接不對
參照原版deploy.prototxt進行layer的修改，最終輸出了正確的結果

3. `pytorch_to_caffe_alexNet.py`剖析

該檔案就是對pth檔案進行解析，獲得layer的名稱和每層的權重偏差，並以caffe的格式進行儲存
修改了pytorch Function中的函式，讓其在前向傳播的時候自動將該層的引數儲存到caffe
很多層的前後銜接不對，都需要強制進行修改
下面是修改的部分函式

def _dropout(raw,input,p=0.5, training=False, inplace=False):
    x=raw(input,p, training, False)
    layer_name=log.add_layer(name='dropout')
    log.add_blobs([x],name='dropout_blob')
    bottom_top_name = 'fc_blob' + layer_name[-1]
    layer=caffe_net.Layer_param(name=layer_name,type='Dropout',
                                bottom=[bottom_top_name],top=[bottom_top_name])
    layer.param.dropout_param.dropout_ratio = p
    log.cnet.add_layer(layer)
    return x
def _linear(raw,input, weight, bias=None):
    x=raw(input,weight,bias)
    layer_name=log.add_layer(name='fc')
    top_blobs=log.add_blobs([x],name='fc_blob')
    bottom_name = 'ave_pool_blob1' if top_blobs[-1][-1] =='1' else 'fc_blob'+str(int(top_blobs[-1][-1])-1)
    layer=caffe_net.Layer_param(name=layer_name,type='InnerProduct',
                                bottom=[bottom_name],top=top_blobs)
    layer.fc_param(x.size()[1],has_bias=bias is not None)
    if bias is not None:
        layer.add_data(weight.cpu().data.numpy(),bias.cpu().data.numpy())
    else:
        layer.add_data(weight.cpu().data.numpy())
    log.cnet.add_layer(layer)
    return x

4. 用轉換後的模型進行推理

在caffe 下進行測試 test_alexnet.sh

#!/bin/bash
set -e
./build/examples/cpp_classification/classification.bin \
/home/****/alexnet.prototxt \
/home/****/alexnet.caffemodel \
examples/mnist/mnist_mean.binaryproto \
examples/mnist/mnist_label.txt \
data/mnist/1.png;

目前推理結果不太準，但整個過程都已經跑通

5. `prototxt`注意問題

推理過程發現每次的結果都不一樣，發現prototxt中每個卷積層下都有初始化權重的偏差，將其統統刪除
池化層下的 ceil_mode: false也是多餘項，刪除即可

至此已完成Pytorch到caffemodle的轉換
這只是初步嘗試通過，接下來要進行YOLOv4的轉換，應該會遇到更多的問題，加油！

Pytorch_模型轉Caffe（三）pytorch轉caffemodel

目錄Pytorch_模型轉Caffe（三）pytorch轉caffemodel1. Pytorch下生成模型2. pth轉換成caffemodel和prototxt3. pytorch_to_caffe_alexNet.py剖析4. 用轉換後的模型進行推理5. prototxt注意問題

Pytorch_模型轉Caffe（二）解析Pytorch模型*.pth

目錄Pytorch_模型轉Caffe（二）解析Pytorch模型*.pth1. Pytorch模型保存於讀取a. 儲存、載入權重b.儲存、載入網路和權重2. Pytorch模型結構1). summary檢視網路整體結構2). net.state_dict()解析權重值3). net.named

pytorch（三） PyTorch 1.1.0 原始碼解析--執行機制

原文來自知乎，現摘錄與此 https://zhuanlan.zhihu.com/p/67964081 首先這是一段mnist資料集的基本程式碼。

WPF使用MVVM（三）-事件轉命令

WPF使用MVVM（三）-事件轉命令上一節介紹了WPF中的命令，可是僅僅介紹的是WPF框架給我們提供的點選命令，也就是用Command屬性來繫結一個命令，用來響應按鈕的點選行為！顯然這是不夠的，介面中除了點選行為以外，還

圖片轉字元圖片（三）

序言這個是從抖音上學來的，一開始刷抖音，遇到不少字串跳舞的視訊，因此來實踐一下

（三）IO模型之多路複用IO與非同步IO

一、多路複用IO（IO multiplexing） IO multiplexing這個詞可能有點陌生，但是如果我說 select/epoll，大概就都能明白了。

《caffe 學習（三）caffe + centOS 7 + CUDA 7 配置》

caffe 學習（三）caffe + centOS 7 + CUDA 7 配置楊現的個人部落格這次全程記錄 centOS 7 的配置安裝過程開發環境雖然它這麼好用，安裝它可不是一個省心的事，最好的參考資料還是官網安裝資料 http://caffe.ber

伺服器和客戶端簡單的使用select網路模型（三）

在二的基礎上收發資料進行了改進（資料接收增加了二次快取），提供吞吐量。

信用卡模型（三）

我們前面已經有兩個版本了，都涉及到woe轉換之類的，現在我們嘗試一下xgboost版本的，不需要做woe轉換

【轉】前端筆記之Vue（三）生命週期&CSS預處理&全域性元件&自定義指令

BaikalDB技術實現內幕（三）--代價模型實現

此文轉載自：https://my.oschina.net/BaikalDB/blog/4715063 大咖揭祕Java人都栽在了哪？點選免費領取《大廠面試清單》，攻克面試難關~>>>

pytorch入門到專案（三）tensor的概念以及建立

二、張量的簡介與建立 2.1張量的概念張量的概念：Tensor 張量是一個多維陣列，它是標量、向量、矩陣的高維拓展

pytorch入門到專案（八）資料模型的讀取（2）

import numpy as np import torch import os import random from PIL import Image from torch.utils.data import Dataset

轉：ThreadLocal系列（三）-TransmittableThreadLocal的使用及原理解析

一、基本使用首先，TTL是用來解決ITL解決不了的問題而誕生的，所以TTL一定是支援父執行緒的本地變數傳遞給子執行緒這種基本操作的，ITL也可以做到，但是前面有講過，ITL線上程池的模式下，就沒辦法再正確傳遞了，所

[轉]微信小程式開發（三）小程式開發框架之WXML

WXML(WeiXin Markup Language) 1.介紹：WXML是框架設計的一套標籤語言，結合元件、WXS和事件系統，可以構建出頁面的結構

RabbitMQ學習（三）廣播模型（fanout）

技術標籤：佇列rabbitmq 一、訊息傳送流程廣播模式下，訊息的傳送流程：可以有多個消費者每個消費者有自己的queue(佇列)每個佇列都要繫結到Exchange(交換機)生產者傳送的訊息，只能傳送到交換機，交換機來決定要

ALINK(三十八)：模型評估（三）多分類評估 (EvalMultiClassBatchOp)

Java 類名：com.alibaba.alink.operator.batch.evaluation.EvalMultiClassBatchOp Python 類名：EvalMultiClassBatchOp

機器學習sklearn（二十三）：模型評估（三）交叉驗證：評估估算器的表現（三）交叉驗證迭代器

接下來的部分列出了一些用於生成索引標號，用於在不同的交叉驗證策略中生成資料劃分的工具。

SQL 基礎知識梳理（三） - 聚合和排序（轉）

目錄對錶進行聚合查詢對錶進行分組為聚合結果指定條件對查詢結果進行排序

機器學習sklearn（76）：演算法例項（三十三）迴歸（五）線性迴歸大家族（三）迴歸類的模型評估指標

0 簡介 1 是否預測了正確的數值 from sklearn.metrics import mean_squared_error as MSE MSE(yhat,Ytest) y.max()

Pytorch_模型轉Caffe（三）pytorch轉caffemodel

Pytorch_模型轉Caffe（三）pytorch轉caffemodel

1. Pytorch下生成模型

2. pth轉換成caffemodel和prototxt

3. pytorch_to_caffe_alexNet.py剖析

4. 用轉換後的模型進行推理

5. prototxt注意問題

相關推薦

3. `pytorch_to_caffe_alexNet.py`剖析

5. `prototxt`注意問題