“跨次元”目標檢測模型 hold 住各種畫風，還能識別漫畫中物品

阿新 • • 發佈：2022-01-16

1 月 16 日訊息，目標檢測種類多達 20000+ 種的 AI，你見過嗎？不僅準確“揪出”每個物體所在的位置，分類效果非常準確：

插畫版賽博恐龍也沒問題：

甚至還能檢測雜誌封面甚至漫畫中的物體！

這也是把目標檢測給玩出花來了，據作者表示模型在長尾問題等細節上的處理非常好，像獅子和狐狸這種少樣本也能準確識別：

這項研究來自 Meta AI 和得克薩斯大學奧斯汀分校，一作是著名目標檢測框架 CenterNet 的作者、復旦校友 Xingyi Zhou。

一起來看看。

可識別“跨次元”物體

這篇論文提出了一種新的名為 Detic 的方法，用來解決目標檢測無法用到影象級標籤（給一整張圖打標籤，標註裡面有什麼物體）的問題。

此前的目標檢測方法，通常是一個檢測框裡一個物體：

這種方法有一個問題，就是沒辦法利用整個影象級標籤，只能用單個物體的圖片進行訓練。

也有一些研究想出了一種新方法，搞個弱監督學習，試圖讓 AI 自己學會將影象級的標籤，去對應錨定框裡面有什麼物體，但實際上這種方法的效果也不太好。

Detic 的方法是採用目標檢測資料（a）和影象標籤資料（b）對 Detic 進行混合訓練。

其中，在用目標檢測資料訓練 Detic 時，同時對影象分類模組 W 和目標檢測模組 B 進行訓練，但只用標籤資料對影象分類模組 W 進行訓練。

訓練的資料集採用的是 ImageNet，事實證明模型在訓練後無需微調，就能很好地適應到 LVIS 等資料集，相對之前的一些模型都達到了不錯的效果：

論文表示，Detic 能分類的圖片型別也是多種多樣，從真實照片到賽博恐龍插畫這樣的“跨次元”作品都能識別：

這立刻吸引了不少網友來玩。

線上 Demo 可玩

有網友用梵高的世界名畫試了試。

放大一點來看，藝術加工後的椅子、人和桌子也能被識別：

還有用二次元的龍貓進行識別的，除了龍貓本身被錯認成貓頭鷹以外，其他的雨傘和靴子都認得不錯：

我們也隨便用一個鐘錶櫃的照片試了試，線上 Demo 的檢測時間稍微有點久，大約需要 6 分鐘左右，但效果還不錯：

細看的話還是能發現一些瑕疵，例如把部分手錶誤認成轉速計、以及懷錶和時鐘，以及也有一兩塊手錶沒有被檢測出來。

不過，即使在二次元和插畫中，這個 AI 能識別的物體，至少也需要在真實世界出現過

。

例如，超出 20000 個分類的物體，如噴火龍和皮卡丘，就不在 AI 的監測範圍內了，全部被認成了猴子（狗頭）：

將這些二次元角色也加入 AI 訓練資料集中，不知能否取得同樣的檢測效果。

作者介紹

▲這張照片是“女朋友拍的”

論文一作 Xingyi Zhou，目前在德克薩斯大學奧斯汀分校讀博，本科就讀於復旦大學計算機系，之前也是 CenterNet 論文的第一作者，專案在 GitHub 上目前已經收穫 6.1k Star。

Rohit Girdhar、Armand Joulin 和 Ishan Misra，Meta AI 的研究科學家，主要研究方向是機器學習和計算機視覺，此前 Armand Joulin 曾經在李飛飛的實驗室進行博士後工作。

Philipp Krähenbühl，得克薩斯大學奧斯汀分校助理教授，Xingyi Zhou 的導師，研究方向是計算機視覺、機器學習和計算機圖形學。

感興趣的小夥伴，趕緊試試你想玩的漫畫、或是雜誌插畫吧~

Demo 地址：點選開啟

論文地址：點選開啟

參考連結：一、二

“跨次元”目標檢測模型 hold 住各種畫風，還能識別漫畫中物品

1 月 16 日訊息，目標檢測種類多達 20000+ 種的 AI，你見過嗎？不僅準確“揪出”每個物體所在的位置，分類效果非常準確：插畫版賽博恐龍也沒問題：甚至還能檢測雜誌封面甚至漫畫中的物體！這也是把目標檢測給玩出花來

央視揭網遊賬號租賣亂象：33 元可打兩個小時網遊，還能代過“人臉驗證”

9 月 6 日訊息近日國家新聞出版署下發《關於進一步嚴格管理切實防止未成年人沉迷網路遊戲的通知》，針對未成年人過度使用甚至沉迷網路遊戲問題，進一步嚴格管理措施。

python:目標檢測模型預測準確度計算方式(基於IoU)

訓練完目標檢測模型之後，需要評價其效能，在不同的閾值下的準確度是多少，有沒有漏檢，在這裡基於IoU(Intersection over Union)來計算。

曠世提出類別正則化的域自適應目標檢測模型，緩解場景多樣的痛點 | CVPR 2020

論文基於DA Faster R-CNN系列提出類別正則化框架，充分利用多標籤分類的弱定位能力以及圖片級預測和例項級預測的類一致性，從實驗結果來看，類該方法能夠很好地提升DA Faster R-CNN系列的效能

小目標檢測模型總結+SNIP+SNIPER

小目標檢測在MS COCO資料集中，對於面積小於32*32的物體，MS COCO就認為它是小物體，在評測時，會對這個範圍內的物體計算APsmall。

NanoDet：這是個小於4M超輕量目標檢測模型

摘要：NanoDet 是一個速度超快和輕量級的移動端 Anchor-free 目標檢測模型。前言

《極限競速：地平線4》跨次元，春季賽攜手MG Live等你嗨爆現場

釋放年輕運動新活力!進入5月，《極限競速：地平線4》登入MG Live現場，為廣大車迷朋友在線上線下送上驚喜!在即將到來的春季賽期間，你只要完成對應任務，即可獲得保時捷928 GTS、2013豐田GT86、法拉利 512

跨次元互動電影《覺醒危機》公佈預告片

《覺醒危機》是一部融合了真人演出的互動電影與二次元解謎遊戲的跨次元企劃。近日官方公佈了首支預告片。

用小米 11 等安卓手機解鎖目標檢測模型 YOLOv5，識別速度不過幾十毫秒！

現在，目標檢測界明星模型 YOLO，最新 v5 版本也可以在手機上玩兒了！瞧～只需要區區幾十毫秒，桌上的東西就全被檢測出來了：這速度似乎不比電腦差？想要親手搭建一個？上教程。在安卓手機上部署 YOLOv5更確切的說是

[影象]用edge impulse訓練你的目標檢測模型並部署至Linux

從學長推薦這個到跑通大概也就一個下午，edge impulse把模型訓練做的非常方便，標註和訓練都是在網頁端即可完成。在部署到Linux方便也是做的非常便捷，幾乎沒有遇到過很嚴重的問題。

使用torchvision的目標檢測模型微調示例

在這篇演示中，我們將在資料集Penn-Fudan Database for Pedestrian Detection and Segmentation上微調一個預訓練模型Mask R-CNN。此資料集包含345個行人例項（instance）的170張影象，我們將使用它來闡述如何使用tor

目標檢測模型mAP計算

環境列表如下：Win10系統，tensorflow版本為1.13，python版本3.6，模型框架SSD。 1，模型訓練

黑科技DeepFake檢測方法：利用心跳做訊號，還能「揪出」造假模型

本文轉載自機器之心。選自arXiv 作者：Umur Aybars Ciftci等機器之心編譯編輯：陳萍

論 AI 能幹什麼：一鍵讓二次元老婆微笑，還能把貓臉瞬間變成狗臉

給一行二次元老婆的臉蛋；下一行就能讓她們全部微笑起來：或者對於鏟屎官們來說，把老虎貓變成？，把狗變成狼？，還可以把老虎變成貓：

Deepfake 新剋星：火眼金睛鑑假臉，還能推算造假模型的結構

6 月 18 日報道，看看下面這些人的照片，你能看出什麼問題嗎？這些或微笑或笑容滿面的人，都是假的，由一個名為 StyleGAN 的著名人工智慧（AI）模型生成，現實生活中並不存在。

不拆分單詞也可以做 NLP，哈工大最新模型在多項任務中打敗 BERT，還能直接訓練中文

眾所周知，BERT 在預訓練時會對某些單詞進行拆分（術語叫做“WordPiece”）。比如把“loved”、“loving”和“loves”拆分成“lov”、“ed”、“ing”和”es”。目的是縮減詞表、加快訓練速度，但這樣一來，在某些時

爐石傳說：德魯伊又搞“無限流”？每死一次+2+2，還能配合探底！

你們好，我是馬小跳。爐石傳說新版本又公佈了兩張新卡，一張是法師的海溝勘測機，一張是德魯伊的海底捕食者（暫譯）。它們的強度到底如何？又有哪些配合呢？一起來看看吧~

【目標檢測】 IterDet模型簡介、TIDE評價指標介紹

來源 | 極鏈AI雲（價效比最高的共享GPU算力平臺，雙十活動進行中 10.9-10.11，新人註冊可領取198元大禮包，價值100小時的免費使用時長，領取地址：https://cloud.videojj.com/）

使用TensorFlow Object Detection Api 進行環境搭建、訓練自定義的資料集、輸出模型、Android端使用模型目標檢測

技術標籤：機器學習計算機視覺移動端tensorflow神經網路機器學習深度學習一、環境搭建

快手：二次元觀眾中 Z 世代佔比超 85%，男性作者偏愛釋出模型手辦相關內容

2 月 8 日，快手大資料研究院聯合快手二次元、AcFun 釋出《2020 快手二次元內容盤點》，資料顯示，僅 2020 年 1 月 20 日至 2 月 10 日，疫情宅家期間的快手二次元作品播放量上漲 32%。同時，以 AcFun 為代表的垂直視

“跨次元”目標檢測模型 hold 住各種畫風，還能識別漫畫中物品

可識別“跨次元”物體

線上 Demo 可玩

作者介紹

相關推薦