秒秒鐘揪出張量形狀錯誤，這個工具能防止 ML 模型訓練白忙一場

阿新 • • 發佈：2021-12-28

模型吭哧吭哧訓練了半天，結果發現張量形狀定義錯了，這一定沒少讓你抓狂吧。那麼針對這種情況，是否存在較好的解決方法呢？

這不最近，韓國首爾大學的研究者就開發出了一款“利器”—— PyTea。

據研究人員介紹，它在訓練模型前，能幾秒內幫助你靜態分析潛在的張量形狀錯誤。

那麼 PyTea 是如何做到的，到底靠不靠譜，讓我們一探究竟吧。

PyTea 的出場方式

為什麼張量形狀錯誤這麼重要？

神經網路涉及到一系列的矩陣計算，前面矩陣的列數必需匹配後面矩陣的行數，如果維度不匹配，那後面的運算就都無法運行了。

上圖程式碼就是一個典型的張量形狀錯誤，[B x 120] * [80 x 10] 無法進行矩陣運算。

無論是 PyTorch，TensorFlow 還是 Keras 在進行神經網路的訓練時，大多都遵循圖上的流程。

首先定義一系列神經網路層（也就是矩陣），然後合成神經網路模組……

那麼為什麼需要 PyTea 呢？

以往我們都是在模型讀取大量資料，開始訓練，程式碼執行到錯誤張量處，才可以發現張量形狀定義錯誤。

由於模型可能十分複雜，訓練資料非常龐大，所以發現錯誤的時間成本會很高，有時候程式碼放在後臺訓練，出了問題都不知道……

PyTea 就可以有效幫我們避免這個問題，因為它能在執行模型程式碼之前，就幫我們分析出形狀錯誤。

網友們已經在熱烈討論了。

PyTea 是如何運作的，它能否有效地檢查出錯誤呢？

受各種約束條件的影響，程式碼可能的執行路徑有很多，不同的資料會走向不同的路徑。

所以 PyTea 需要靜態掃描所有可能的執行路徑，跟蹤張量變化，推斷出每個張量形狀精確而保守的範圍。

上圖就是 PyTea 的整體架構，一共分為翻譯語言，收集約束條件，求解器判斷和給出反饋四步。

首先 PyTea 將原始的 Python 程式碼翻譯成一種核心語言。PyTea 內部表示法（PyTea IR）。

接著 PyTea 追蹤 PyTea IR 每個可能的執行路徑，並收集有關張量形狀的約束條件。

判斷約束條件是否被滿足，分為線上分析和離線分析兩步：

線上分析 node.js（TypeScript / JavaScript）：查詢張量形狀數值上的不匹配和誤用 API 函式的情況。如果 PyTea 發現問題，就會停止在當前位置，然後給使用者報錯。

離線分析 Z3 / Python：如果線上分析沒有問題，PyTea 將收集到的約束條件傳給 SMT（Satisfiability Modulo Theories）求解器 Z3，求解器負責檢視每條路徑的約束條件是否都能被滿足，如果不能，返回給使用者第一條出錯路徑的約束條件。

如果求解器過久沒有反應，PyTea 會返回不知道是否存在問題。

然而追蹤所有可能的路徑是指數級別的任務，對於複雜的神經網路來說，一定會發生路徑爆炸這個問題。

比如說在這個例子中，網路的最終結構是由 24 個相同模組塊構成的（第 17 行），那麼可能的路徑就有 16M 之多。

所以路徑爆炸是一定要處理的，PyTea 是怎麼做的？

PyTea 選擇保守的地對路徑剪枝和超時判斷來處理這種路徑爆炸。

什麼樣的路徑可以被剪枝？

PyTea 給出的答案是，如果該前饋函式不改變全域性值，並且它的輸出值不受分支條件影響，對於每條路徑都是相等的，我們就可以忽略許多完全一致的路徑，來節約計算資源。

如果路徑剪枝還是不行，那麼就只能按超時處理了。

原理就介紹這麼多了，感覺還是值得一試的，現在程式碼已經在 GitHub 上面開源了，快去看看吧！

使用方法

依賴庫：

安裝方法：

執行命令：

參考連結：

[1]https://github.com/ropas/pytea

[2]https://arxiv.org/abs/2112.09037

秒秒鐘揪出張量形狀錯誤，這個工具能防止 ML 模型訓練白忙一場

模型吭哧吭哧訓練了半天，結果發現張量形狀定義錯了，這一定沒少讓你抓狂吧。那麼針對這種情況，是否存在較好的解決方法呢？這不最近，韓國首爾大學的研究者就開發出了一款“利器”—— PyTea。據研究人員介紹，它在

關於張量的理解，以及其與向量的區別

n階張量可以理解為 n ∗ n n*n n∗n的矩陣，就像n維向量可以理解為 n ∗ 1 n*1 n∗1的矩陣一樣。因為

Canalys、Counterpoint：2020 年 Q4 全球手機出貨量蘋果第一，華為跌出前五

1 月 28 日訊息Canalys 釋出了 2020 年 Q4 全球智慧手機出貨量報告。資料顯示，蘋果出貨量第一，華為跌出前五。

小米電視：2020 年出貨量中國第一，連續 2 年穩居第一

2月22日訊息小米電視官方今日宣佈，小米電視 2020 年出貨量位列國內第一名，並連續 2 年穩居中國出貨第一名。

希捷：硬碟總出貨量達 3ZB，相當於 300 億部 4K 電影

3 月 31 日訊息希捷官方宣佈硬碟總出貨量達 3ZB，相當於 1500 萬億張自拍照、7.5 萬億首 MP3 歌曲、600 億個視訊遊戲或 300 億部 4K 電影。

SA：Q1 印度智慧手機出貨量飆升 26%，小米、三星、vivo 前三

4 月 29 日訊息今日上午，Strategy Analytics 釋出的最新報告顯示，2021 年 Q1 印度智慧手機出貨量同比飆升 26% 至 3900 萬部。這是印度六年來最高增長率。

SA：5G 手機 Q1 佔國內總出貨量 80% 份額，遙遙領先海外市場

5 月 6 日訊息今日上午，Strategy Analytics 釋出最新報告稱，估計 5G 手機佔據了本季度國內總出貨量的 80% 的份額，遙遙領先於海外市場。

SA：2021 年 Q1 全球智慧手機出貨量三星奪冠，OPPO 同比增長 69%

5 月 12 日訊息研究機構 Strategy Analytics 今日公佈了 2021 年第一季度全球智慧手機出貨量報告。同時，釋出了針對 OPPO 的研報。報告表明，2021 年 Q1 的出貨量三星奪冠，蘋果、小米位列第二、第三名，其次為 OPP

舜宇光學 6 月手機鏡頭模組出貨量 8580 萬，同比減少 27.1%

7 月 9 日訊息根據財聯社訊息，今日舜宇光學公佈了 6 月生產經營情況。該公司表示，6 月手機鏡頭模組出貨量 8580 萬，同比減少 27.1%。公司表示，減少的原因主要是受海外疫情以及國內智慧手機市場放緩的影響。

因數學家“液體張量實驗”留名，微軟計算機驗證打破偏見

德國著名數學家、菲爾茲獎得主皮特・舒爾茨遇到了一個難題。他和哥本哈根大學的數學家達斯汀・克勞森，多年來一直致力於一個名為“凝聚態數學”（Condensed Mathematics）的問題。

目標出貨量翻倍，谷歌 Pixel 6/Pro 即將釋出：搭載自研 Tensor 晶片

10 月 19 日訊息，據日經社報道，谷歌計劃在 Pixel 6/Pro 的基礎上將智慧手機出貨量翻一倍。谷歌已要求供應商生產超過 700 萬部 Pixel 6 和 Pixel 6 Pro，大約是去年其智慧手機出貨量的兩倍。除 Pixel 6/Pro 外，谷

Counterpoint：第三季度全球蜂窩物聯網模組出貨量增長 70%，紫光晶片佔比第二

12 月 10 日訊息，研究機構 Counterpoint 公佈了 2021 年第三季度全球 IoT 蜂窩移動網模組的市場報告。統計資料顯示，第三季這類產品出貨量同比增長 70%，其中 5G 模組增長幅度高達 700%。蜂窩物聯網模組主要用於智

Canalys：小米手機第三季度在拉美地區出貨量第三，營銷策略引發“小米效應”

12 月 13 日訊息，分析機構 Canalys 今日發表文章，表示小米手機在拉丁美洲增長迅速，2021 年第三季度已經成為該地區出貨量第三的手機品牌，市場份額 11%。小米目前是祕魯的第一大智慧手機廠商，在哥倫比亞排名第二

京東方總裁劉曉東：顯示屏總體出貨量全球第一，每四塊就有一塊來自京東方

12 月 25 日訊息，日前，京東方釋出了中國半導體顯示首個技術品牌，包括 ADS PRO、f-OLED 和 α-MLED。京東方表示，ADS PRO 子品牌代表京東方獨有的高階 LCD 技術解決方案，具有全視角、超高重新整理率等優勢；f-OL

DSCC：摺疊屏手機出貨量暴增，三星成大贏家

12 月 26 日訊息，智慧手機產業逐步回溫，其中摺疊智慧手機在龍頭大廠三星帶頭降價下，整體銷量暴增。研調機構 DSCC 預估，本季（第四季度）摺疊智慧手機出貨量將達 380 萬臺，較去年同期暴增超過 450%，三星市佔率

晶晨晶片出貨量顯著提升，預計 2021 年營收可突破 47 億元

1 月 17 日晚間，晶晨股份釋出公告稱，公司預計 2021 年實現營收 47.4 億元到 47.9 億元，同比增長 73.10% 至 74.93%；預計 2021 年度實現歸屬於母公司所有者的淨利潤 7.8 億元到 8.4 億元，同比增長 579.24% 到 631

東芝 2021 年硬碟出貨量增長 4%，總容量達 187.24EB

2 月 12 日訊息，東芝電子元件及儲存裝置株式會社（“東芝”）近日宣佈，2021 年硬碟出貨量及出貨容量分別增長 4% 和 61%，總出貨量達到 5,468 萬個單位，容量達 187.24EB。近線、企業級效能型硬碟、內建式硬碟／消

Counterpoint：中國智慧手機 Q4 出貨量跌 11%，蘋果狂砍 21% 份額繼續霸榜，榮耀拿下安卓第一

2 月 16 日訊息，Counterpoint 現公佈了最新的研究報告。2021 年第四季度中國智慧手機出貨量同比下降 11%。廠商之間競爭激烈，蘋果位列第一，並達到其有史以來最高的市場份額。資料顯示，2021 年第四季度，蘋果在中

SA 下調 2022 年全球智慧手機出貨量預測值，將僅同比增長 1%

隨著烏克蘭和俄羅斯之間的衝突日益加劇，3 月 2 日，Strategy Analytics 下調了 2022 年和 2023 年全球智慧手機出貨量的預測值。預測 2022 年全球智慧手機出貨量將僅同比增長 1%；到 2023 年，增長率將提高到 3%。SA

5G 智慧手機出貨量下滑之際，4G 手機逆勢反彈原因何在？

集微網報道自 2019 年工信部正式發放 5G 牌照以來，5G 商用程序便得以大幅提速，5G 手機也開始快速湧向市場，價格更是下探至千元。除了華為因晶片原因推出幾款 4G 手機之外，近幾年市場上釋出的新機幾乎都被 5G 手機

秒秒鐘揪出張量形狀錯誤，這個工具能防止 ML 模型訓練白忙一場

PyTea 的出場方式

使用方法

相關推薦