1. 程式人生 > >人體運動軌跡的人工智慧動畫模擬

人體運動軌跡的人工智慧動畫模擬

作為部落格文章的處女秀,我將簡要介紹一下我的研究領域。從現在起,我將之命名為“人體運動軌跡的人工智慧動畫模擬”(Physically-Based Animation ,下文簡稱PBA)。

 

譯註:

這篇文章最早是在Media看到的,文中,作者將這一方法命名為Physically-Based Animation,但稍後卻不知為何刪除了Media上的文章,於是我們找到了作者的部落格,在上面找到了這篇文章,但在部落格中,這一方法被描述為Procedural Animation,即程式性動畫。我個人較願意以最新的名稱來命名這一動畫,因為Physically,既可以理解為物理反饋式的,也可以理解為人體的,因此更符合目前的研究方向和案例。

 

一、關於我的一點介紹

76fd277631d38d167d3529fdfa9055684a7a453c

 

我是芬蘭Aalto University計算機科學系的博士生。我目前的研究重點是為物理模擬角色在多智慧體條件下的表現開發高效的,創造性的運動人工智慧模擬技術。我的研究的最終目標是填補深度強化學習和線上最優化求解之間的空白。譯註:多智慧體(multi-agent),是多個Agent組成的集合,其多個Agent成員之間相互協調,相互服務,共同完成一個任務,鳥群、魚群、獸群和菌落都可以被看成是多智慧體系統。(http://t.cn/E2oDTFg)線上最優化求解:利用已有的樣本資料訓練的過程往往轉換成一個最優化求解的過程。當我們面對高維高資料量的時候,批量處理的方式就顯得笨重和不夠高效,因此需要有線上處理的方法(Online)來解決相同的問題。(http://t.cn/E2oDuZf)

累積獎勵:強化學習作為一種機器學習方法,是通過Agent與環境互動和獲得反饋來形成學習過程,當Agent做出了正確的步驟,積累獎勵增加,錯誤則扣減。最著名的例子就是AlphaGo,以往的學習方法依賴大量的棋譜,而強化學習是通過對弈中的成敗來形成獎懲來讓機器變得更“聰明”。二、強化學習與PBA