onnx、openvino和mnn推理速度對比

阿新 • • 發佈：2021-01-22

onnx、openvino和mnn都可以作為cpu推理的框架，推理速度這裡進行對比一下

模型使用的python版openvino使用這篇文章onnx檔案

注意：這裡使用的mnn和onnx檔案均未量化等操作，是直接轉換而來的，都是直接進行讀取的

對比程式碼如下：

from openvino.inference_engine import IECore
import onnxruntime
import MNN
import numpy as np
import cv2
import time

model="ctdet_coco_dlav0_512.onnx"
mnnmodel="ctdet_coco_dlav0_512.mnn"

#openvino
ie = IECore()
net = ie.read_network(model=model)
input_blob = next(iter(net.input_info))
out_blob = next(iter(net.outputs))
net.batch_size=1#batchsize
n, c, h, w = net.input_info[input_blob].input_data.shape
print(n, c, h, w)
images = np.ndarray(shape=(n, c, h, w))
for i in range(n):
        image = cv2.imread("123.jpg")
        if image.shape[:-1] != (h, w):
            image = cv2.resize(image, (w, h))
        image = image.transpose((2, 0, 1))
        images[i] = image
images=images.astype(np.float32)
exec_net = ie.load_network(network=net, device_name="CPU")

#onnxruntime
session = onnxruntime.InferenceSession(model)
inputs = {session.get_inputs()[0].name: images.astype(np.float32)}

#mnn
interpreter = MNN.Interpreter(mnnmodel)
mnn_session = interpreter.createSession()
input_tensor = interpreter.getSessionInput(mnn_session)
tmp_input = MNN.Tensor((1, 3, 512, 512),\
MNN.Halide_Type_Float, images[0], MNN.Tensor_DimensionType_Tensorflow)  
input_tensor.copyFrom(tmp_input)

#onnxruntime infer
start=time.time()
out=session.run(None, inputs)
print('onnxruntime infer total time is %.4f s'%(time.time()-start))
#openvino infer
start=time.time()
res = exec_net.infer(inputs={input_blob: images})
#print(res)
print('openvino infer total time is %.4f s'%(time.time()-start))
#mnn infer
start=time.time()
interpreter.runSession(mnn_session)
print('mnn infer total time is %.4f s'%(time.time()-start))

執行結果：

結論：可以看到openvino確實優化速度很多，提升大於30%，mnn速度提升不明顯

onnx、openvino和mnn推理速度對比

技術標籤：深度學習mnnopenvinoonnxonnxruntime onnx、openvino和mnn都可以作為cpu推理的框架，推理速度這裡進行對比一下

MySQL三種InnoDB、MyISAM和MEMORY儲存引擎對比

什麼是儲存引擎？ MySQL中的資料用各種不同的技術儲存在檔案（或者記憶體）中。這些技術中的每一種技術都使用不同的儲存機制、索引技巧、鎖定水平並且最終提供廣泛的不同的功能和能力。通過選擇不同的技術，你能夠獲

E1000、E1000E和VMXNET3虛擬網絡卡對比測試

VMware管理員可以使用幾個不同的虛擬網路介面卡來附加到虛擬機器。虛擬介面卡屬於以下兩個組之一：

git工具:學習筆記一、git總結知識點、git和svn對比分析優劣

Git優點： 1、分散式，每個參與開發的人的電腦上都有一個完整的倉庫，不擔心硬碟出問題；

R9 5950X、R9 5900X和R7 5800X 引數對比

R9 5950X 最高可達 4.9GHz。R9 5900X 和 R7 5800X 也能達到 4.8GHz。選R9 5950X、R9 5900X還是R7 5800X這些點很重要!看完你就知道了https://list.jd.com/list.html?

pytorch訓練的模型在onnx和mnn中的使用

技術標籤：深度學習mnnonnxpytorch pytorch自身部署較麻煩，一般使用onnx和mnn較為實用

python、java、c、go執行速度對比

技術標籤：大資料 java、c、python、go的運算速度對比 python版本java版本c版本go版本結論

pandas讀取檔案和open讀取檔案對比速度

技術標籤：python pandas讀取檔案 starts=time.time() for file in files[:1]: print(file) file_paths = os.path.join(root, file)

Pytorch和Tensorflow在相同資料規模規模下的降維PCA(Principal Component Analysis)演算法中的運算速度對比

技術標籤：tensorflowpytorch機器學習深度學習 Pytorch和Tensorflow在相同資料規模規模下的降維PCA(Principal Component Analysis)演算法中的運算速度對比

Pytorch和Tensorflow在相同資料規模規模下的降維KNN(K-NearestNeighbor)演算法中的運算速度對比

技術標籤：機器學習深度學習tensorflowpytorch Pytorch和Tensorflow在相同資料規模規模下的降維KNN(K-NearestNeighbor)演算法中的運算速度對比

Sanic、Fastapi 和 Fiber 簡單壓測對比

測試程式碼 Sanic: from sanic import Sanic from sanic.response import json from sanic.request import Request

《地鐵：逃離》XSX、PS5和PC對比主機幀數穩PC載入快

數毛社近日放出了《地鐵：逃離》Xbox Series X與PS5、Windows版的對比視訊，相比之下Xbox Series X比PS5解析度更高，但是兩臺次世代主機幀數都很穩定，PC版得益於更強大的SSD載入更快。

NGINX、HAProxy和Traefik負載均衡能力對比

網上有很多討論Nginx和HAProxy的文章，很多文章基本都是說這樣子的內容：一、Nginx優點：1、工作在網路7層之上，可針對http應用做一些分流的策略，如針對域名、目錄結構，它的正規規則比HAProxy更為強大和靈活，所

ONNX、NCNN、OpenVINO、 TensorRT瞭解與簡介

https://oldpan.me/archives/talk-about-onnx Open Neural Network Exchange (ONNX)是開放生態系統的第一步，它使人工智慧開發人員可以在專案的發展過程中選擇合適的工具;ONNX為AI models提供了一種開源格式。它定義

華為胡厚崑：5G 發展速度遠超預期，技術、商業和能力一個都不能少

10 月 13 日訊息，華為輪值董事長鬍厚崑今日出席參加了 2021 全球移動寬頻論壇，期間發表了題為“立足當下，塑造未來”的主題演講。胡厚崑指出：“5G 預商用五年以來，帶來了消費者體驗的提升以及行業使能的破局，在

C++ Builder自帶的三種表格控制元件對比：TStringGrid、TDrawGrid和TListView

StringGrid表格最簡單，單元格按照[x][y]，不是按照二維陣列的行列。 StringGrid表格預設只能顯示字串，也可以自繪。

FastJSON、Gson和Jackson效能對比

JSON序列化(Object => JSON) 測試樣本數量為100000個，為了保證每個類庫在測試中都能處理同一個樣本，先把樣本Java物件儲存在檔案中。每個類庫測試3次，每次迴圈測試10遍，去掉最快速度和最慢速度，對剩下的8遍求

一款極致的檔案對比工具——Beyond Compare，適用於Windows、macOS和Linux的檔案和資料夾比較

不管是在辦公還是學習的過程中難免遇到一些相似度較高而又有區別的檔案如果需要分辨

基於SARIMA、XGBoost和CNN-LSTM的時間序列預測對比

利用統計測試和機器學習分析和預測太陽能發電的效能測試和對比本文將討論通過使用假設測試、特徵工程、時間序列建模方法等從資料集中獲得有形價值的技術。我還將解決不同時間序列模型的資料洩漏和資料準備等問題，並

基於Moya、RxSwift和ObjectMapper實現REST API請求

在Android開發中有非常強大的 Retrofit 請求，結合RxJava可以非常方便實現 RESTful API 網路請求。在 iOS開發中也有非常強大的網路請求庫 Moya ，Moya是一個基於 Alamofire 開發的,輕量級的Swift網路層。Moya的可擴充

onnx、openvino和mnn推理速度對比

相關推薦