Explainable Reinforcement Learning Through a Causal Lens
阿新 • • 發佈:2021-10-26
發表時間:2019(AAAI 2020)
文章要點:這篇文章通過構建一個圖結構,來解釋為啥agent要做/不做某個動作。具體來說就是先把某個問題給抽象成一個圖結構,定義狀態動作回報等關鍵資訊的節點和邊,然後在訓練RL的時候也順便用資料來訓練這個圖。訓練完了之後,就根據圖用深度優先搜尋去找,做某個動作或者不做某個動作最後導致的結果是啥,然後就說一定程度上對RL的策略做了解釋。
總結:這個文章也太晦澀了,不知道在說什麼,裡面太多心理學的詞彙,比如Causal Lens,minimally complete,structural equations,task prediction,5-point Likert Explanation Satisfaction Scale,其實方法和RL關係不大。
疑問:
5-point Likert Explanation Satisfaction Scale是啥?文章還說如果圖太大,找不到complete的解釋,所以就去找minimal explanations,不知道這兩的定義是啥,也不知道具體咋找的。