可以裝在手機裡的 3D 姿態估計，模型尺寸僅同類 1/7，平均關節位置誤差卻只有 5 釐米

阿新 • • 發佈：2021-10-06

長久以來，三維姿態估計都在追求準確性上一路狂奔。

但精度提高的同時，也帶來了計算成本的上升。

而剛剛被 CPVR 2021 接受的論文中所提出的模型，MobileHumanPose 卻可以同時做到又小又好。

還是放在手機上都能 hold 得住的那種。來感受一下：

這種動作的健身操也沒問題：

據瞭解，這個模型的尺寸，只有基於 ResNet-50 的模型的 1/7，算力達到了 3.92GFLOPS。

而且平均每關節位置誤差（MPJPE），也只有大約 5 釐米。

那麼這一模型到底是如何在有限的算力下產生極佳效能的呢？

基於編碼器-解碼器結構的改進

這是一個從基本的編碼器-解碼器結構改良得來的模型。

在編碼器用於全域性特徵提取，而解碼器進行姿態估計的基礎架構上，研究團隊對其主幹網路、啟用函式，以及 Skip concatenation 功能都進行了修改。

先來看研究團隊選擇的主幹網路，MobileNetV2。

他們在 MobileNetV2 的前四個倒置殘差塊（Residual Block）處修改了通道大小，獲得了效能提升。

接下來，將 PReLU 函式用於實現啟用功能，其中 ai 為學習引數 yi 是輸入訊號。

這一函式中的可學習引數能夠在每一層網路都獲得額外的資訊，因此在人體姿勢估計任務中使用引數化 PReLU 時可提升效能。

▲修改了啟用函式後的 baseline

現在，模型的效率已經不低了，但考慮到推理速度，團隊使用 Skip concatenation 結構。這一結構能從編碼器到解碼器中匯出低級別特徵訊號（Lowlevel feature signal），不會降低效能。

引數量減少 5 倍，計算成本降到 1/3

團隊使用 Human3.6M 和 MuCo-3DHP 作為三維人體姿勢資料集，他們提出了 MobileNetV2 的大小兩個模型。

在 Human3.6M 上，MobileNetV2 大模型實現了 51.44 毫米的平均每關節位置誤差。

且其引數量為 4.07M，對比同類模型的 20.4M（chen）減少了 5 倍，計算成本為 5.49GFLOPS，是同類模型的 1/3 不到（14.1G）。

對於多人三維姿勢估計任務，研究者使用 RootNet 來估計每個人的絕對座標，在 MuPoTS 的 20 個場景中進行了實驗：

實驗結果證明，對比 Zerui Chen 等研究者提出的獲 ECCV 2020 的三維人體姿態估計方法，MobileNetV2 在一般場景中的效能都更好，且在少數場景中取得了最佳效能：

在模型效率上，MobileNetV2 的大模型效率為 2.24M/3.92GFLOPS，遠超同類模型的 13.0M/10.7GFLOPS（Zerui Chen）。

而小模型也能實現 56.94 毫米的平均每關節位置誤差，有 224 萬個引數，計算成本為 3.92GFLOPS。

作者介紹

論文的三位作者皆畢業於韓國高等技術研究院，一作 Sangbum Choi 為該校的電機及電子工程專業碩士。

論文：

https://openaccess.thecvf.com/content/CVPR2021W/MAI/html/Choi_MobileHumanPose_Toward_Real-Time_3D_Human_Pose_Estimation_in_Mobile_Devices_CVPRW_2021_paper.html

開源地址：

[1]https://github.com/SangbumChoi/MobileHumanPose

[2]https://github.com/ibaiGorordo/ONNX-Mobile-Human-Pose-3D

可以裝在手機裡的 3D 姿態估計，模型尺寸僅同類 1/7，平均關節位置誤差卻只有 5 釐米

長久以來，三維姿態估計都在追求準確性上一路狂奔。但精度提高的同時，也帶來了計算成本的上升。而剛剛被 CPVR 2021 接受的論文中所提出的模型，MobileHumanPose 卻可以同時做到又小又好。還是放在手機上都能 hold 得

效能媲美BERT，但引數量僅為1/300，這是谷歌最新的NLP模型

點選上方，選擇星標或置頂，不定期資源大放送！閱讀大概需要15分鐘 Follow小博主，每天更新前沿乾貨

iQOO Neo 6 系列遊戲旗艦手機上架京東預約：搭載驍龍 8 Gen 1 晶片，擁有橙色素皮材質

4 月 2 日訊息，iQOO 手機官方宣佈，iQOO Neo6將於 4 月 13 日正式釋出，配備80W充電器。官方今天公佈該機的“朋克”配色的部分外觀，採用橙色素皮材質。現在該手機已經上架京東商城開啟預約。從視訊中可以看到，iQ

約 5469 元起，小米 12 Pro 手機在印度上市：搭載驍龍 8 Gen 1 晶片，支援 120W 快充

5 月 3 日訊息，據 GSMArena 報道，小米 12 Pro 已經開始在印度市場開售，上架了 Mi.com、Mi Home 商店、Amazon.in 和其他零售合作伙伴。小米 12 Pro 在印度提供三種顏色和兩種記憶體選項 ——8GB+256GB 和 12GB+25

建立一個長度為6的int型陣列，要求取值為1-30，同時元素值各不相同

題目：建立一個長度為6的int型陣列，要求取值為1-30，同時元素值各不相同方法一：

Java經典程式設計習題100例：第15例：定義一個int型的一維陣列，包含10個元素，分別賦值為1~10，然後將陣列中的元素都向前移一個位置，即，a[0]=a[1],a[1]=a[2],…最後一個元

技術標籤：Java體系java演算法pythonC語言c++ 不要自卑，去提升實力網際網路行業誰技術牛誰是爹如果文章可以帶給你能量，那是最好的事！請相信自己加油o~

美股小幅上揚：理想汽車漲 1.5%，特斯拉漲 1.33%，B 站下跌 2.34%

北京時間 5 月 8 日訊息，美國 4 月非農就業資料遠遜於預期，使得投資者相信超級寬鬆貨幣政策會維持更長時間，美股今天收高。截至收盤，道指漲 229.23 點，漲幅為 0.66%，報收 34777.76 點；標普 500 指數漲 30.98 點

滴滴出行正式遞交招股書：創始人程維持股 7%，柳青持股 1.7%

北京時間 6 月 11 日下午訊息，美東時間 6 月 10 日，滴滴出行正式向美國證券交易委員會（SEC）遞交 IPO 申請，擬於紐交所掛牌上市，股票程式碼為“DIDI“。高盛、摩根士丹利、摩根大通、華興資本擔任承銷商。

被網路安全審查、App 全下架，滴滴股價開跌超 7% ，近四個交易日已累跌約 36%

7 月 8 日訊息滴滴美股開盤繼續下跌，跌超 7%，近四個交易日已累跌約 36%。截至發稿，該公司股價下跌 7.35%，報 11.04 美元每股，市值約 532.24 億美元。

聯想 828 服務優品狂歡，人工服務僅需 3 元，原廠配件限時優惠

9 月 3 日訊息，在兩個多月前，聯想曾經上線了 618 3 元電腦特色服務包，只需要 3 元，就可以在指定的服務點內享受以下四選一的服務了（新機安裝/拆機保養/整機體檢/部件加裝），除蘋果外不限品牌和機型，非常良心。

美股三大股指微跌：Meta 漲 1.96%，特斯拉跌 1.94%，蔚來跌 4.92%

北京時間 11 月 16 日訊息，投資者擔憂通脹對未來利潤的影響，以及美國企業利潤還能否像第三季度那樣輕鬆超過預期，星期一美股三大股指微跌。截至收盤，道指跌 12.86 點，跌幅為 0.04%，報收 36087.45 點；標普 500

【緊急】繼續折騰，Log4j再發2.1.6，強烈建議升級

背景繼前天正式釋出的2.15.0之後，Apache log4j 2 團隊宣佈 Log4j 2.16.0 釋出！由於SLF4J適配相容性的中斷，Log4j 現在釋出兩個版本的SLF4J to Log4j的介面卡。log4j-slf4j-impl對應 SLF4J 1.7.x 及更早版本；lo

美股收高，特斯拉漲逾 7%，嗶哩嗶哩、阿里巴巴跌逾 4%

北京時間 12 月 23 日訊息，12 月消費者信心持續上升、樂觀的經濟資料，以及有研究顯示奧密克戎毒株感染者住院和發展成重症的風險低於德爾塔毒株，提振美股全面上漲。截至收盤，道指漲 261.19 點，漲幅為 0.74%，報收

2022-1-7，今日炒股小結：如何安全地追熱點

2022-1-7，今日炒股小結近期觀察小結出一些炒股心得。 1、板塊之間在輪動：從一個板塊到另一個板塊，有時會並行幾個板塊成為熱點，有的持續時間長，有的持續時間短，長的幾個月，短的幾周，板塊之間輪動沒法預測

廣東老味道，亞洲沙示汽水 1.3 元 / 瓶探底（京東 2.5 元）

[天貓超市] 廣東老味道，亞洲沙示汽水 300mL×24 瓶報價 50 元，下單立減 10 元，限時限量 5 元券，實付 35 元包郵，領券併購買。下單返 3 元天貓超市卡（結算時可見，有效期 15 天），到手32 元。約合 1.33 元 / 瓶

美股收跌，百度上漲 6.84%，小鵬汽車跌近 7%，愛奇藝大漲 21%

北京時間 3 月 2 日訊息，受俄羅斯加大在烏克蘭特別軍事行動力度影響，今天美股收跌。截至收盤，道指跌 597.65 點，跌幅為 1.76%，報收 33294.95 點；標普 500 指數跌 67.68 點，跌幅為 1.55%，報收 4306.26 點；納指

Dynabook 釋出 14 英寸旗艦筆記本 Portégé X40L-K：僅重 1 千克，售價約 1.1 萬元起

感謝網友闊落貓的線索投遞！

對比學習（Contrastive Learning）綜述——無監督學習+特徵抽象，損失函式：同類儘可能近，不同類儘可能遠，思想和聚類類似

寫在前面由於最近開始在看對比學習的一些相關工作，想把學到的東西記錄一下。本文前半部分基於Ankesh Anand關於Contrastive Learning的blog中的內容，想看原文的可以移步下面連結：

致全體51CTO博主：洛陽親友如相問，就說你在手機裡

各位51CTO的博主們，在近期我們優化了部落格的H5移動站，可以支援在手機上便捷瀏覽部落格主頁、博文頁面，還可以支援使用者在文章下面評論互動。移動時代，我們的部落格也加快了移動化的步伐，“洛陽親友如

Python用dlib 識別了我手機裡所有出現人臉的照片（優點準確度高缺點速度慢，4500張圖片足足花了我3個半小時才識別玩效果滿意）

程式碼： import cv2 import os import dlib \'\'\' 用dlib 識別用opencv把手機拍的照片大小縮放不是就不變識別是否是圖片格式不是跳過

可以裝在手機裡的 3D 姿態估計，模型尺寸僅同類 1/7，平均關節位置誤差卻只有 5 釐米

基於編碼器-解碼器結構的改進

引數量減少 5 倍，計算成本降到 1/3

作者介紹

相關推薦