1. 程式人生 > >強化學習基礎介紹

強化學習基礎介紹

type color ffffff learning reward https 改進 img 動作

概念

強化學習,主要是主體agent根據處境state,做出行為action,並且最大化獎勵reward的過程。
技術分享圖片
開始進行強化學習時,神經網絡的系數可隨機初始化。依據環境給予的反饋,神經網絡可以用預測的獎勵和實際獎勵之差來調整權重,改進其對狀態-動作對的解析。


參考:
強化學習DeepLearning4j

強化學習基礎介紹