1. 程式人生 > 資訊 >MIT 機器狗再進化:碎石冰面上跑也不打滑,這次真的穩如狗了

MIT 機器狗再進化:碎石冰面上跑也不打滑,這次真的穩如狗了

那群曾經集體後空翻、踢足球的 MIT 機器狗迷你獵豹(Mini Cheetah),瘸了?但你別說,走得依舊挺歡快:

這可不是 MIT 科學家們在侵犯“機器狗權”,而是因為狗子們在新技術的加持下又進化了。不僅壞了一條腿也能走路,之前寸步難行的碎石路更是不在話下:

還能在結冰路面轉圈撒歡兒:

不瘸的時候,速度最快能到 3.9m / s,尥蹶子跑起來時,開發員只能抱著電腦在後面追得跌跌撞撞:

而上述所有的技能,最原版(也就是開源那版)的 MIT 機器狗僅用了 3 小時就完全掌握。如此強大的學習能力到底從何而來?

3 小時積累 100 多天奔跑經驗

首先,機器狗們的各種行為都依賴於身體裡的一個專門的控制器。

工程師們會通過分析運動的物理規律,制定有效的抽象概念,再去設計並實現專門的控制器層次結構,使機器狗能夠在執行時保持平衡。

但要提前人為分析、建立所有可能的地形分析,並使機器狗快速識別對環境的變化作出反應,並不簡單。例如,草地上的一小塊結冰面,碎石堆上突然出現的大塊凸起,都有可能使機器狗再起不能:

(所以說… 不要停下來啊!)

人為設計的控制器,出現問題自然也得人為分析原因,再手動調整,一來二去的時間成本就大大增加。怎麼辦呢?

MIT 的科學家們表示:

讓機器狗自己學!

研究團隊開發了一種模擬環境,其中包含了多個地形,再將狗子放在其中進行訓練。在訓練期間,他們加入了神經網路,讓機器狗從不同地形的跑步和失敗經驗中總結規律,進而自己找出適應新地形的最好方法。

僅僅 3 小時,模擬世界中的迷你獵豹就積累了 100 天的多樣化地形奔跑經驗。並且,團隊也為機器狗部署了一種基於端到端的感測運動策略的控制器。

這種控制器會將關節編碼器和 IMU(慣性測量單元)資料直接轉換為關節指令,沒有了額外的狀態估計或控制子系統,機器狗在進行敏捷或極限的動作時,便會更加得心應手。

這時的迷你獵豹,就變成了一隻經驗豐富的狗子。剛剛還被絆倒的路沿,現在已經能自信地邁過去了:

高速奔跑中也不會被地上的線絆倒:

室內轉圈的速度能達到 5.7rad / s(每秒 320°,近一圈):

研究來自 MIT CSAIL

這次的研究來自於 MIT 的電腦科學與人工智慧研究院(MIT CSAIL),論文和程式碼很快會公開。

一作 Gabriel Margolis 為 MIT 的一名博士生,主要研究領域是具身智慧(Embodied Intelligence),即開發能與真實世界進行多模態互動的具有身體的人工智慧。

共同一作 Ge Yang 本科畢業於耶魯大學,獲得了物理學和數學學士學位,後來在芝加哥大學獲得物理學博士學位。

現為美國國家科學基金會(NSF)的 AI 與基礎互動研究所(IAIFI)的一名博士後。

視訊:

https://www.youtube.com/watch?v=-BqNl3AtPVw

參考連結:

[1]https://sites.google.com/view/model-free-speed/

[2]https://news.mit.edu/2022/3-questions-how-mit-mini-cheetah-learns-run-fast-0317

[3]https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/