ONNX Runtime 原始碼閱讀：各類 ml-Values 在記憶體管理上的分類

阿新 • • 發佈：2022-05-07

出處：程式碼的註釋內容 include/onnxruntime/core/framework/alloc_kind.h

ONNX Runtime 在推理流程中，存在以下幾類值(ml-Values)：

inference inputs：由呼叫者（caller）分配以及釋放記憶體空間，預設情況下執行時（runtime）對它只讀不寫（read-only）
inference outputs：由執行時分配記憶體，並將所有權（ownership）轉移給呼叫者
weights（constant tensors，常量型別的張量）：只分配一次，一個 InferenceSession 中的所有 Inference 可以複用該值

tensor values：這類張量值得生命週期是靜態確定的，用於記憶體複用、共享等優化。執行時將在正確的時間分配以及釋放記憶體空間。

以下是原文：

The ml-Values fall into the following categories with respect to their
memory management:

inference inputs: owned (allocated and freed) by caller, and is by
default read-only by the runtime.

inference outputs: allocated by runtime, ownership transferred to
caller. TODO: Make sure this semantics is clear in InferenceSession API.

weights (constant tensors): can be allocated once (statically), and
reused by all inference calls within an InferenceSession.

tensor values: The lifetimes of these tensor-values are statically
determined, which is used for memory reuse/sharing optimizations. The
runtime allocates/frees these values at the right time (as determined
by the static allocation plan). Note that this is simplified since we
do not try to optimize for "slice" like ops, where we may be able to
conditionally reuse memory/data in some cases but not others.
Generalizing this is future work.

ONNX Runtime 原始碼閱讀：各類 ml-Values 在記憶體管理上的分類

出處：程式碼的註釋內容 include/onnxruntime/core/framework/alloc_kind.h ONNX Runtime 在推理流程中，存在以下幾類值(ml-Values)：

HttpRunner3原始碼閱讀：5. 引數/函式呼叫及其值處理

parser 上一篇讀的loader.py，裡面提到的就是檔案路徑,檔案轉用例模型、套件模型、載入方法字典，變數寫入環境，這篇parser.py主要內容是在解析用例當中引用變數、自定義方法

HttpRunner3原始碼閱讀：6.請求客戶端client

client 上一篇讀了parser.py，處理語法$var,${func($var1)}變數、函式的檔案，這次來看client.py看名字就差不多明白了請求方法封裝

HttpRunner3原始碼閱讀：7.響應後處理 response.py

response 上一篇說的client.py來發送請求,這裡就來看另一個response.py,該檔案主要是完成測試斷言方法

HttpRunner3原始碼閱讀：8. 用例檔案生成並格式化make

make 這個檔案中主要實現了相關的檔案生成,目錄生成make.py,其實這個檔案應該在client.py前看的

HttpRunner3原始碼閱讀：10.測試執行的處理 runner

runner HttpRunner的執行函式存在的位置，程式內部執行執行入口了，檔名稱很明顯了 runner.py，其中最主要的為run_testcase(),__run_step_request(), __run_step_testcase(),方法

HttpRunner3原始碼閱讀：9. 測試用例中的類定義testcase

testcase testcase.py這裡主要寫了一個測試檔案裡的幾個組成類及其方法(Config/Step...)

mybatis原始碼解讀：transaction包（事務管理功能）

技術標籤：mybaits原始碼mybatis原始碼歡迎關注本人公眾號： mybatis的transaction包是負責進行事務管理的包，該包內包含2個子包：jdbc子包中包含基於jdbc進行事務管理的類，managed子包中包含基於容器進行事務

28. Python記憶體管理與垃圾回收(第一部分)：深度剖析Python記憶體管理架構、記憶體池的實現原理

楔子記憶體管理，對於Python這樣的動態語言來說是非常重要的一部分，它在很大程度上決定了Python的執行效率，因為Python在執行中會建立和銷燬大量的物件，這些都涉及記憶體的管理，因此精湛的記憶體管理技術是確保記

mybatis原始碼閱讀(一)：SqlSession和SqlSessionFactory

轉載自 mybatis原始碼閱讀(一)：SqlSession和SqlSessionFactory 一、介面定義聽名字就知道這裡使用了工廠方法模式，SqlSessionFactory負責建立SqlSession物件。其中開發人員最常用的就是DefaultSqlSes

vue-next/runtime-core 原始碼閱讀指南

寫在前面最近又抽時間把vue-next/runtime-core的原始碼陸陸續續地看完了，期間整理了很多筆記，但都是碎片化的。本來是想整理一下，寫成一篇文章分享出來的，但是感覺最終的成果物只能是一篇篇幅巨長的解析文，就算

Mybatis原始碼閱讀（二）：動態節點解析2.2 —— SqlSourceBuilder與三種SqlSource

*************************************優雅的分割線 ********************************** 如果以上內容對你覺得有用,並想獲取更多的賺錢方式和免費的技術教程

三個點在同一個半圓的概率_Cartographer原始碼閱讀之附 1—probability_values.h/c：佔據概率相關...

技術標籤：三個點在同一個半圓的概率說明：在閱讀cartographer原始碼過程中，我覺得有必要詳細介紹一下柵格地圖中一個pixel座標處的occupied probability以及如何根據新的感測器數值更新它。但又不想讓這部分

JDK原始碼閱讀(3)：AbstractStringBuilder、StringBuffer、StringBuilder類閱讀筆記

JDK原始碼閱讀：AbstractStringBuilder、StringBuffer、StringBuilder類閱讀筆記 AbstractStringBuilder

JDK原始碼閱讀(4)：HashMap類閱讀筆記

JDK原始碼閱讀：HashMap類閱讀筆記 HashMap public class HashMap<K, V> extends AbstractMap<K, V>

Tomcat學習2：一鍵啟動以及原始碼閱讀

一次請求在Tomcat中經過的元件 Tomcat處理一個HTTP請求，在各元件中的流轉過程如下圖紅色箭頭：

JDK原始碼閱讀(7)：ConcurrentHashMap類閱讀筆記

JDK原始碼閱讀(7)：ConcurrentHashMap類閱讀筆記 ConcurrentHashMap public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>

Redux 原始碼閱讀（一）：原始碼除錯

Redux 原始碼閱讀（一）：原始碼除錯版本資訊開發環境、npm包版本資訊：名稱

shiro 原始碼閱讀心得

有些圖片看不清，GitHub裡面有：github.com/nice01qc/sh… GitHub資源已經上傳 shiro介紹（個人理解）

原始碼剖析：探究 Repeat 中 GCD 的應用

這是小專欄《徹底搞定 GCD?併發程式設計》的一篇副產品文章簡介 Repeat 是 Daniele 開發的一個基於 GCD - Grand Central Dispatch 的輕量定時器，可用於替代 NSTimer，解決其多項不足。

ONNX Runtime 原始碼閱讀：各類 ml-Values 在記憶體管理上的分類

相關推薦