華人博士回收了虛擬版 SpaceX 火箭，專案現已開源

阿新 • • 發佈：2021-11-16

馬斯克旗下的 SpaceX 可以說帶火了“火箭回收”這一話題。

這不，連粉絲們都已經開始摩拳擦掌，用自己的方式挑戰起了這個技術難題。

例如一位來自密歇根大學的華人博士，就用強化學習試了一把回收火箭！

他根據現實中的星艦 10 號一同進行模擬，還真在虛擬環境中穩穩地完成了懸停和著陸！

這個專案迅速在 Reddit 上引發了大批網友們的關注：

那麼，他是如何實現的呢？

給火箭回收設立“獎勵機制”

要在模擬環境中回收火箭，那麼大一隻構造複雜的火箭肯定是不能直接抱來用的。

於是，這位 SpaceX 的鐵桿粉絲首先基於氣缸動力學，將火箭簡化為一個二維平面上的剛體：

這個火箭的底部安裝有推力向量發動機，能夠提供不同方向的可調的推力值（0.2g，1.0g 和 2.0g）；同時，火箭噴嘴上還增加了一個角速度約束，最大轉速為 30°/秒。

火箭模型所受到的空氣阻力則設定為與速度成正比。

現在，這個模型的一些基本屬性就能夠以下面兩個集合來表示：

動作空間：發動機離散控制訊號的集合，包括推力加速度和噴嘴角速度
狀態空間：由火箭位置、速度、角度、角速度、噴管角度和模擬時間組成的集合

而“火箭回收”這一流程，則被分為了懸停和著陸兩個任務。

在懸停任務中，火箭模型需要遵循這樣一種獎勵機制：

火箭與預定目標點的距離：距離越近，獎勵越大；
火箭體的角度：火箭應該儘可能保持豎直。

著陸任務則基於星艦 10 號的基本引數，將火箭模型的初始速度設定為-50 米/秒，方向設定為 90°（水平方向），著陸燃燒高度設定為離地面 500 米。

▲星艦 10 號發射和著陸的合成影象

火箭模型在著陸時同樣需要遵循這樣一種“獎勵機制”：

當著陸速度小於安全閾值，並且角度接近豎直 0° 時，就會受到最大的“獎勵”，也會被認為是一次成功的著陸。

總體而言，這是一個基於策略的參與者-評判者的模型。

接下來就是進行訓練：

最終，在經歷了 20000 次的訓練後，火箭模型在懸停和著陸兩個任務上都實現了較好的效果：

最終，模型得到了很好的收斂效果：

而這枚模擬環境中的偽・星艦 10 號，也就像開頭展示的那張動圖一樣，學會了腹部著陸，穩穩地落地了。

下一步：增加燃料變數

這一專案一經發出，就引來了紅迪眾多網友的圍觀和稱讚。

有人覺得用強化學習來解決傳統任務非常有趣，因為它具有更好的魯棒性（Robust 的音譯，也就是健壯和強壯的意思，指在異常和危險情況下系統生存的能力）。

作者也在下方回覆表示：現實中惡劣的環境條件可以成為環境制約因素，而強化學習則能在一個統一的框架內解決這些問題。

不過在稱讚之餘，也有網友提出了最直接的這樣一個問題：

既然我們已經可以使用經典控制方法找到這些任務的最優解，那為啥 SpaceX 之前沒人做？

下方有人解答到：這或許是因為之前的數字控制系統、感測器等技術並不成熟，採用新方法就意味著要重新設計火箭的關鍵部分。

這也就是控制系統層面之外的“工程類的問題”，而 SpaceX 正是在這些相關領域中做了改進。

而那些較為傳統保守的航天航空工業則會使用使用凸優化（Convexification）來解決火箭著陸問題。

也就是評論區有人貼出的這篇論文中提到的方法：

不少評論也為開發者提供了下一步開發的新思路，比如這條評論建議將“剩餘燃料”也作為一個變數，模型燃料的減少或耗盡也是現實中的一個重要影響因素。

作者欣然接受了這一建議：是很容易新增的有趣設定，安排！

密歇根大學華人博士

開發者已經為這一專案建立了一個網站，在主頁他這樣介紹到：

這是我的第一個強化學習專案，所以，我希望通過這些“低水平程式碼”儘可能地從頭實現包括環境、火箭動力學和強化學習 agent 在內的所有內容。

作者叫 Zhengxia Zou，是一位來自密歇根大學博士，主要研究計算機視覺、遙感、自動駕駛等領域。

他的論文曾被 ICCV 2021、CVPR 2021 等多個頂會收錄：

下載連結：

https://github.com/jiupinjia/rocket-recycling

專案主頁：

https://jiupinjia.github.io/rocket-recycling/

參考連結：

https://www.reddit.com/r/MachineLearning/comments/qt2tws/pr_rocketrecycling_with_reinforcement_learning/

華人博士回收了虛擬版 SpaceX 火箭，專案現已開源

馬斯克旗下的 SpaceX 可以說帶火了“火箭回收”這一話題。這不，連粉絲們都已經開始摩拳擦掌，用自己的方式挑戰起了這個技術難題。例如一位來自密歇根大學的華人博士，就用強化學習試了一把回收火箭！他根據現實中的

SpaceX 對手來了：美國小火箭公司 Rocket Lab 將開發大型可重複使用火箭

據外媒報道，美國小火箭公司 Rocket Lab 剛剛宣佈與 “特殊目的收購公司”（SPAC）Vector Acquisition 合併上市，並獲得 7.5 億美元資金，這將使得其可以研發大型可重複使用火箭，並與 SpaceX 展開直接競爭。

用去年的助推器發今年的火箭，美國防部首次允許 SpaceX 使用回收火箭發衛星

美國太空探索技術公司 SpaceX 又實現了新的里程碑，美國國防部首次允許該公司使用回收火箭發射軍事任務，將其國家安全衛星送入軌道。

愛了！華為工程師總結的PDF版Linux筆記，限時開放下載

前言：最近很多小夥伴找我要一些 Linux 基礎資料，於是我翻箱倒櫃，把這份華為大牛總結的 Linux 歸納筆記找出來，免費共享給大家！

Azure安裝不了虛擬機器加虛擬機器嗎？

技術標籤：自動化測試 sudo apt-get install docker.io Reading package lists... Done Building dependency tree

centos7啟動時報VMware Tools 啟動指令碼未能在虛擬機器中成功執行。如果您在此虛擬機器中配置了自定義啟動指令碼，請確保該指令碼沒有錯誤。您也可以提交支援請求，報告此問題

centos7報錯誤的頁面如下：解決途徑： #先執行下面的命令 sudo yum autoremove open-vm-tools

引領電動汽車發明可回收火箭，馬斯克又要顛覆電信行業

北京時間 1 月 22 日晚間訊息，據報道，特斯拉 CEO 埃隆 · 馬斯克（Elon Musk）不僅顛覆了全球汽車業，還通過可重複使用的火箭顛覆了航空航天業，並一舉成為世界首富。但他並未滿足於此，如今又將目光瞄向了另一個

美國社交巨頭盯上了印度版 “TikTok”

美國社交巨頭們共同瞄上了印度市場。美國時間 2 月 22 日，有知情人士透露，Twitter 近日一直就收購成立 5 年的印度社交媒體初創公司 ShareChat 進行談判。據悉，Twitter 已是 ShareChat 的投資者，Twitter 曾提出以

小愛同學推出了 PC 版，教你如何體驗

3月6日訊息Win10 的御用語音助理——小娜，相信大家都不陌生，作為一款專職的語音助理軟體，它的表現卻實在難令人滿意，現在更是被微軟打入了冷宮。相反很多手機上的語音助理，卻發展得如火如荼。比如著名的蘋果 Sir

SpaceX 擬第九次發射獵鷹火箭，一週內發射兩批星鏈衛星

3 月 14 日訊息，美國太空探索技術公司 SpaceX 正準備於美國東部時間週日 (北京時間 3 月 15 日)發射第 22 批星鏈衛星。這將是其首次在一週內發射兩批星鏈衛星，同時對獵鷹 9 號火箭助推器進行第九次創紀錄的發射嘗試

微軟 Win10 Dev 預覽版 21337 釋出：1000+ 遊戲自動 HDR ，虛擬桌面大改進，新增兩款內建應用

3月18日訊息據微軟部落格釋出，微軟釋出了針對 Dev 頻道的 Windows Insider build 21337 系統更新，本次帶來了全新的 PC 遊戲的自動 HDR 功能，Windows 虛擬桌面的一些改進，甚至檔案資源管理器都有新佈局。

馬斯克造火箭，李書福搞衛星，造車滿足不了吉利躁動的心

根據路透社在 3 月 19 日的訊息顯示，吉利計劃推出新的高階汽車品牌 “ZEEKR”，新品牌將採用不同的銷售政策與特斯拉展開競爭。儘管目前關於 “ZEEKR” 的訊息並不多，但是小雷大致可以推斷該品牌是一個由 SEA 浩瀚

一個「線上虛擬 POS 機」，怎麼做出了千億美元市值

Stripe 成為了美國最大的獨角獸企業。 3 月 14 日，Stripe 宣佈獲得一筆 6 億美元的最新融資，估值 950 億美元。投資機構包括愛爾蘭國家財政管理機構、安聯、富達、AXA 和紅杉資本。

覆盤完近兩年3479個版號後，我們發現了上海被遊戲圈寄以厚望的原因

對於遊戲行業而言，版號無疑是把控絕大部分遊戲公司命脈的糧草。所謂兵馬未動糧草先行，遊戲日報研究院推出版號專題系列，每期一個主題，蠡測版號發放規律，記錄行業發展，助各位從業者全方位瞭解版號動態，提供最具

AI 換臉後又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

6 月 17 日訊息，據 Facebook 官網顯示，他們剛剛公佈了一個新的 AI 專案 —— 文字樣式筆刷（TextStyleBrush）。只需要提交某一個單詞的影象，文字樣式筆刷就可以複製照片中文字的字跡，然後將其他文字統一替換成該

只有 50 萬用戶，卻估值 4 億美元：這個 App 做成了社交版“美團”

外賣平臺做社交還有戲嗎？美團早在 2016 年就往 App 裡新增過偷好友紅包等社交玩法，今年四月又開始內測「群聊」功能，社交夢做了這麼些年沒見起色。

下載cnki碩博士論文的pdf版

每找到一篇心儀的碩博士論文時，總是迫不及待下載到本地吧。可是接下來你只能選擇caj格式。

為進太空拼了：揭祕 SpaceX 純商業載人發射任務骨癌倖存者高強度訓練內幕

8 月 23 日訊息，據外媒報道，美國太空探索技術公司 SpaceX 的首次純商業載人太空飛行任務 Inspiration4 將於 9 月 15 日發射。在此之前，參加此次任務的四名成員正接受高強度訓練，包括雪地跋涉、失重測試以及水中生

IDEA2021.2.2版啟用碼，免費送給各位Java程式設計師們，明天開始上班了

一、IDEA2021.2.2版啟用碼下面這個 idea 啟用碼失效了的話，請關注微信公眾號：Java團長，然後傳送“ 啟用碼 ”即可獲取最新免費有效的。

別再用老版雲效Projex專案協作了，該升級了

別再用老版雲效Projex專案協作了，該升級了。雲效Projex支援老版企業升級至新版。目前遷移方式主要採用工單方式承接，你可以通過雲效的工單系統提交升級訴求，我們會在1-3工作日內響應處理。為了能夠更好確保企業在

華人博士回收了虛擬版 SpaceX 火箭，專案現已開源

給火箭回收設立“獎勵機制”

下一步：增加燃料變數

密歇根大學華人博士

相關推薦