1. 程式人生 > >【備忘】深度學習實戰決勝AI-強化學習實戰系列視訊課程

【備忘】深度學習實戰決勝AI-強化學習實戰系列視訊課程

第1章強化學習基本原理1小時42分鐘10節; 
1-1強化學習簡介09:34 
1-2強化學習基本概念 09:55 
1-3馬爾科夫決策過程 09:06
1-4Bellman方程 12:22
1-5值迭代求解 08:12 
1-6程式碼實戰求解過程 11:14
1-7QLearning基本原理 10:00
1-8QLearning迭代計算例項 11:07 
1-9QLearning迭代效果 08:59
1-10求解流程詳解 11:42

第2章強化學習專案實戰-DQN讓AI自己玩遊戲1小時38分鐘11節
2-1DeepQnetwork原理 06:38 
2-2DQN網路細節 11:00
2-3DQN網路引數配置 08:23 
2-4搭建DQN網路模型 11:31 

2-5DQN卷積操作定義 10:07 
2-6資料預處理 11:42 
2-7實驗階段資料儲存 08:18 
2-8實現訓練模組 10:50 
2-9Debug解讀訓練程式碼 05:05 
2-10完整程式碼流程分析 11:33 

2-11DQN效果演示 03:11