1. 程式人生 > >強化學習 CartPole實驗的一些啟發 有沒有可能設計一個新的實驗呢?(杆子可以向360度方向傾倒,可行嗎?)

強化學習 CartPole實驗的一些啟發 有沒有可能設計一個新的實驗呢?(杆子可以向360度方向傾倒,可行嗎?)

最近在看強化學習方面的東西,突然想到了這麼一個事情,那就是經典的CartPole遊戲我們改變一下,或者說升級一下,那麼使用強化學習是否能得到不錯的效果呢?

 

原始遊戲如圖:

 

 

 

 一點個人的想法:

 

 

 

 

 

=================================================