使用mmdetection訓練yolox出現卡著不動的問題

阿新 • • 發佈：2022-05-25

2022年05月24日14:04:43

具體報錯資訊由於在內網無法呈現到此，但是我在mmdet的github官方專案中找到了該問題：https://github.com/open-mmlab/mmdetection/issues/7298

截止到目前，該問題被定義為yolox的bug，目前很多評論多以訓練圖片對應的xml標註檔案中不存在標註框，但是我對自己的資料進行了檢查，不存在該描述問題，所以也不是空標註問題導致。

下面我仔細的描述一下我的問題：

2080ti單卡訓練，會報出錯誤提示：

RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one. This error indicates that your module has parameters that were not used in producing loss. You can enable unused parameter detection by passing the keyword argument `find_unused_parameters=True` to `torch.nn.parallel.DistributedDataParallel`, and by
making sure all `forward` function outputs participate in calculating loss.
If you already have done the above, then the distributed data parallel module wasn't able to locate the output tensors in the return value of your module's `forward` function. Please include the loss function and the structure of the return value of `forward` of your module when reporting this issue (e.g. list, dict, iterable).
Parameter indices which did not receive grad for rank 0: 228 229 230 231 232 233

2080ti多卡訓練，卡數大於等於2，沒有報錯提示，但是終端頁面會卡在某個iters就不動了，但是觀察顯示卡發現利用率仍然在浮動，說明gpu內部還在計算，可能陷入計算死迴圈，此時只能手動停止。

截止到目前依舊沒有找到有效的解決辦法，由於之前多次使用yolox完成訓練過且沒有出現上述問題，因此我的注意力還是關注此次訓練資料。

此次訓練的資料是使用檢測類別png圖片+貼圖的方式生成的訓練樣本。

目前檢查資料做了如下操作：檢查了每張圖片是否都有標註，檢查了標註的框是否都在影象尺寸之內

使用mmdetection訓練yolox出現卡著不動的問題

2022年05月24日14:04:43 具體報錯資訊由於在內網無法呈現到此，但是我在mmdet的github官方專案中找到了該問題：https://github.com/open-mmlab/mmdetection/issues/7298

win10安裝卡住怎麼辦_win10系統安裝卡主不動的解決方法

最近有使用win10純淨版系統的使用者在安裝系統時了卡住不動的情況。不知道怎麼回事。也不知道怎麼解決。可能很多網友都遇到過同樣的問題，那麼今天小編就來為大家分享關於win10系統安裝卡主不動的解決方法。

navicat操作mysql中某一張表後，卡死不動，無法操作

技術標籤：資料庫mysql 原由剛剛寫java程式然後對資料庫進行操作，然後用navicat去清空了表，結果卡死了，無論是刪除表還是清空表，連開啟表都打開不了了，我以為是網慢，然後開別的表沒有問題，其實這就是表鎖

win10版本1903系統更新卡在91%不動如何解決

有使用者給自己電腦安裝了win10版本1903系統後，在微軟又推出新版本的時候想要再升級更新，可是在更新過程中卻遇到了卡在91%不動的現象，導致更新失敗，這是怎麼回事呢，下文系統城小編就給大家帶來win10版本1903系統

win10 1909重置系統時卡在100%不動了如何解決

在使用win10 1909系統的時候，難免會遇到一些故障需要通過重置系統來解決，可是有不少使用者卻遇到了win10 1909重置系統時卡在100%不動了的情況，這要怎麼辦呢，今天小編就給大家帶來win10 1909重置系統時卡在100%不

win10更新卡在27%不動了怎麼辦_教你win10更新卡在27%不動的處理辦法

不知道大家在更新系統時有沒有遇到過這樣的情況，那就是更新時突然卡住不動，最近就有使用win10精簡版系統的使用者在跟小編反映說自己的電腦更新卡在27%不動了，不知道怎麼解決很是苦惱。對於這個問題下面小編就來教

升級Win10系統時卡在配置裝置不動如何解決

越來越多的使用者都喜歡升級win10系統，然而在升級win10系統的時候，可能會遇到一些問題，比如卡在配置裝置不動的情況，該怎麼辦呢，現在給大家分享一下升級Win10系統時卡在配置裝置不動的具體解決步驟。

win10用第三方瀏覽器開啟網頁出現卡頓或打不開問題怎麼辦

win10系統自帶有瀏覽器Edge，一些使用者使用不習慣，自己從網上下載第三方瀏覽器，比如：火狐、搜狗、百度等瀏覽器，下載後發現在win10系統執行會出現打網頁慢或者根本打不開網頁等問題，用自帶瀏覽器Edge開啟網頁都

關於idea一直卡在build不動的解決方案

就一直這樣，卡在這兒，不動，也不報錯，也沒有報錯日誌。以下是我嘗試的解決方案：

Python 用dlib來實現視訊人臉檢測（很卡，我電腦帶不動，卡死了。。）我的是輕薄本

電腦好的可以試試，比opencv效果好多了，畢竟訓練模型都有60mb，速度慢。程式碼：

RTMP推流元件EasyRTMP-Android同時推音訊流和視訊流時為什麼會出現畫面不動的情況？

EasyRTMP是一套呼叫簡單、功能完善、執行高效穩定的RTMP功能元件，經過多年實戰和線上執行打造，支援RTMP推送斷線重連、環形緩衝、智慧丟幀、網路事件回撥，能夠完美應用於各種行業的直播需求，手機直播、桌面直播、

pytorch 訓練時候不動了

技術標籤：deeplearning深度學習深度學習pytorch 因為用的執行緒太多，開啟檔案太多了導致的，如下步驟

【轉載】在PyTorch訓練一個epoch時，模型不能接著訓練，Dataloader卡死——在pytorch中儘量不要使用opencv而是使用PIL

版權宣告：本文為CSDN博主「時光碎了天」的原創文章，遵循CC 4.0 BY-SA版權協議，轉載請附上原文出處連結及本宣告。原文連結：https://blog.csdn.net/u013289254/article/details/103429257

Pytorch訓練過程出現nan的解決方式

今天使用shuffleNetV2+，使用自己的資料集，遇到了loss是nan的情況，而且top1精確率出現斷崖式上升，這顯示是不正常的。

教你win10系統一重新整理就卡重新整理不了的解決方法

在使用win10系統的過程中，我們經常會右鍵桌面空白位置選擇彈出選單中的重新整理來對電腦進行重新整理，但近日有win10純淨版的使用者卻翻譯說自己的電腦出現了一重新整理就卡重新整理不了的情況，那我們要怎麼處理這

win10電腦卡住不動如何安全關機？緊急重啟電腦的方法

我們使用win10官方版系統都曾遇到過宕機、卡機等問題，如果半天沒反應，這時候大家一般是都選擇按電腦的關機鍵進行強制關機,然後再重啟。這種操作對電腦的硬體特別是損傷的，有什麼其他安全的辦法呢？這裡小編為大家

win10系統更新卡住不動如何處理_解決win10系統更新卡住不動的辦法【圖文】

大家應該都知道電腦出現更新卡住不動這個問題，其實是我們在更新中經常都會碰到的一個情況。但很多網友不知道怎麼去解決，很是苦惱，所以今天小編就以win0純淨版系統為例，來教大家解決win10系統更新卡住不動的辦法。

Win10開啟QQ遠端控制後點不動任何東西怎麼辦

QQ遠端控制功能大家都熟悉了，能遠距離操控另外一臺電腦，就象直接在電腦上使用一樣，比如遠端安裝應用軟體、防毒、修復電腦等操作。有時候Win10系統下開啟QQ遠端控制後點不動任何東西，又或者是剛連線上還是可以控制

教你解決win10電腦出現感嘆號連不上網的辦法【圖文】

win10系統已經逐漸成為主流的作業系統，但我們在使用時難免會遇到一些問題。例如就有使用win1032位系統的使用者跟小編反映說自己的電腦出現感嘆號連不上網的情況不知道怎麼辦，沒關係，下面小編就來為大家分享關於解

win10玩求生之路2偶爾出現卡頓的多種解決方法

求生之路2是一款以殭屍大災難為背景的第一人稱FPS遊戲，電腦安裝win10作業系統玩求生之路經常遇到遊戲偶爾會出現卡頓的情況，影響遊戲體驗，這是什麼情況？對於這種問題小編覺得可能是因為系統相容性問題或者就是我們

使用mmdetection訓練yolox出現卡著不動的問題

相關推薦