1. 程式人生 > 其它 >用強化學習玩《超級馬里奧》

用強化學習玩《超級馬里奧》

Pytorch的一個強化的學習教程( Train a Mario-playing RL Agent)使用超級瑪麗遊戲來學習雙Q網路(強化學習的一種型別),官網的文章只有程式碼, 所以本文將配合官網網站的教程詳細介紹它是如何工作的,以及如何將它們應用到這個例子中。

強化學習是如何起作用的

機器學習可以分為三類:監督學習、非監督學習和強化學習。

在監督學習中,模型被賦予一個訓練資料集,該資料集包含輸入和輸出(標籤)。它從這些資料中學習,瞭解如何從輸入中獲得輸出。訓練完成後使用測試資料集(包含模型從未見過的輸入),模型必須嘗試預測每個資料點應該被賦予的標籤。

在無監督學習中,模型被賦予一個數據集,但資料點都沒有標籤。它被提供資料點和一些簇來將它們分組。隨著簇數量的變化,演算法的輸出也隨之變化。這種型別的學習用於發現給定資料中的模式。

完整文章:

https://avoid.overfit.cn/post/a625743c337e48a6839ffe2121f90369