1. 程式人生 > 其它 >Explainable Reinforcement Learning Through a Causal Lens

Explainable Reinforcement Learning Through a Causal Lens


發表時間:2019(AAAI 2020)
文章要點:這篇文章通過構建一個圖結構,來解釋為啥agent要做/不做某個動作。具體來說就是先把某個問題給抽象成一個圖結構,定義狀態動作回報等關鍵資訊的節點和邊,然後在訓練RL的時候也順便用資料來訓練這個圖。訓練完了之後,就根據圖用深度優先搜尋去找,做某個動作或者不做某個動作最後導致的結果是啥,然後就說一定程度上對RL的策略做了解釋。
總結:這個文章也太晦澀了,不知道在說什麼,裡面太多心理學的詞彙,比如Causal Lens,minimally complete,structural equations,task prediction,5-point Likert Explanation Satisfaction Scale,其實方法和RL關係不大。
疑問:

只知道個大概意思,其實不是很懂怎麼去構造圖的,也不懂怎麼去訓練的。structural causal model需要人為構造嗎,那如果問題太複雜或者我們對問題並不完全瞭解,該怎麼去構造?structural equations具體指的是什麼,怎麼去學的?DAG是啥?
5-point Likert Explanation Satisfaction Scale是啥?文章還說如果圖太大,找不到complete的解釋,所以就去找minimal explanations,不知道這兩的定義是啥,也不知道具體咋找的。