1. 程式人生 > >Graying the black box: Understanding DQNs

Graying the black box: Understanding DQNs

state mac skill ann action con black mark ati

Zahavy, Tom, Nir Ben-Zrihem, and Shie Mannor. "Graying the black box: Understanding DQNs." International Conference on Machine Learning. 2016.

這篇論文想要做QDN的可解釋性。主要是用了t-SNE的可視化和Saliency maps。

然後他們提出了SAMDP(Semi Aggregated Markov Decision Process)模型。就是說類似的state的作為一個集合,有關的action組成一個skill。

他們希望在未來的工作中,能用他們的模型找出sub-goal。

Graying the black box: Understanding DQNs