Visualizing and Understanding Atari Agents
阿新 • • 發佈:2021-10-17
發表時間:2018(ICML2018)
文章要點:這篇文章用saliency map的方式來做RL agent的視覺化,目的就是想分析一下agent做某個動作的時候到底關注的是輸入的哪個部分,這樣可以對RL的agent有一定的可解釋性。比如下圖這個效果
其中藍色是policy關注的點,紅色是value關注的點,可以看出來關注的點還挺正確的,效果還不錯。方法的思路就是通過給畫素新增擾動,來看哪個部分的影響最大,比如breakout這個遊戲,我們新增擾動把小球蓋住,結果導致policy發生了變換,那就說明小球很重要,policy在關注小球這個位置。具體的,擾動的新增方式為
這裡\(i,j\)表示新增噪聲的位置,大寫的\(I_t\)
接下來就是如何評估對policy和value的影響。對policy,作者取policy前面那層logits的輸出然後和真實值做差的平方,value就直接對value做差的平方。式子如下
然後就可以畫出來之前那個saliency map了。
總結:
疑問:不知道這個新增擾動的方式通不通用,會不會換個環境就需要調參了,比如裡面兩個標準差的選擇之類的。