1. 程式人生 > 其它 >【人工智慧導論:模型與演算法】讀書筆記1 目錄

【人工智慧導論:模型與演算法】讀書筆記1 目錄

第1章 緒論

第2章 邏輯與推理

第3章 搜尋求解

第4章 機器學習:監督學習

第5章 統計機器學習:無監督學習

第6章 深度學習

第7章 強化學習

第8章 人工智慧博弈

第9章 人工智慧未來發展和趨勢

附錄A 設計實驗

實驗一 邏輯推理實驗

實驗二 黑白棋AI演算法

實驗三 線性迴歸模型

實驗四 人臉識別

實驗五 深度學習

實驗六 強化學習

實驗七 對抗樣本

附錄B 人工智慧演算法實訓平臺


第1章 緒論

1.1 人工智慧的起源

1.2 可計算載體:形式化與機械化

1.3 智慧計算方法

1.3.1 符號主義為核心的邏輯推理

1.3.2 問題求解為核心的探尋搜尋

1.3.3 資料驅動為核心的機器學習

1.3.4 行為主義為核心的強化學習

1.3.5 博弈對抗為核心的決策智慧

1.4 本書內容介紹

1.5 小結

習題

參考文獻

第2章 邏輯與推理

2.1 命題邏輯

2.2 謂詞邏輯

2.3 知識圖譜推理

2.3.1 FOIL歸納推理

2.3.2 路徑排序推理

2.3.3 其他知識推理演算法

2.4 因果推理

2.4.1 辛普森悖論

2.4.2 因果圖的基本概念

2.4.3 干預的因果效應

2.4.4 反事實模型

2.4.5 因果分析的層次化

2.5 小結

習題

參考文獻

第3章 搜尋求解

3.1 搜尋演算法基礎

3.1.1 搜尋基本問題和求解

3.1.2 搜尋演算法的評價指標

3.1.3 搜尋演算法框架

3.1.4 樹搜尋和圖搜尋

3.2 啟發式搜尋

3.2.1 啟發函式與評價函式

3.2.2 貪婪最佳優先搜尋

3.2.3 A*搜尋

*3.2.4 A*演算法效能分析

3.3 對抗搜尋

3.3.1 最小最大搜索

3.3.2 Alpha-Beta剪枝演算法

*3.3.3 Alpha-Beta剪枝演算法效能分析

3.4 蒙特卡洛樹搜尋

3.4.1 探索與利用機制的平衡

3.4.2 上限置信區間演算法

3.4.3 蒙特卡洛樹搜尋

3.5 小結

習題

參考文獻

第4章 機器學習:監督學習

4.1 機器學習基本概念

4.1.1 機器學習的種類

4.1.2 監督學習的基本概念

4.2 迴歸分析

4.2.1 一元線性迴歸

4.2.2 多元線性迴歸

4.2.3 邏輯斯蒂迴歸/對數機率迴歸

4.3 決策樹

4.3.1 決策樹分類案例

4.3.2 構建決策樹

4.4 線性判別分析

4.5 Ada Boosting

4.5.1 可計算學習理論

4.5.2 Ada Boosting演算法

4.5.3 從霍夫丁不等式解釋Ada Boosting演算法

4.5.4 Ada Boosting分類例子

4.6 支援向量機

4.6.1 VC維與結構風險最小化

4.6.2 線性可分支援向量機

4.6.3 鬆弛變數,軟間隔與hinge損失函式

4.6.4 核函式解決線性不可分的情況

4.7 生成學習模型

4.8 小結

習題

參考文獻

第5章 統計機器學習:無監督學習

5.1 K均值聚類

5.2 主成分分析

5.2.1 方差、協方差和相關係數

5.2.2 主成分分析

5.2.3 其他常用降維方法

5.3 特徵人臉方法

5.3.1 奇異值分解

5.3.2 特徵人臉方法

5.4 潛在語義分析

5.4.1 潛在語義分析思想

5.4.2 潛在語義分析例子

5.5 期望最大化演算法

5.5.1 二硬幣投擲例子

5.5.2 三硬幣投擲例子

5.5.3 EM演算法一般形式

5.6 小結

習題

參考文獻

第6章 深度學習

6.1 深度學習的歷史發展

6.2 前饋神經網路

6.2.1 若干概念

6.2.2 感知機模型

6.2.3 引數優化與學習

6.3 卷積神經網路

6.3.1 卷積計算

6.3.2 池化

6.3.3 神經網路正則化

6.4 迴圈神經網路

6.4.1 迴圈神經網路模型

6.4.2 長短時記憶網路

6.4.3 門控迴圈單元

6.5 深度生成學習

6.5.1 生成對抗網路

6.5.2 生成對抗網路演算法

6.5.3 條件生成對抗網路

6.5.4 用生成對抗網路抵禦對抗樣本攻擊

6.6 深度學習在自然語言和計算機視覺上的應用

6.6.1 詞向量模型

6.6.2 影象分類與目標定位

6.7 小結

習題

參考文獻

第7章 強化學習

7.1 強化學習問題定義

7.1.1 強化學習基本概念

7.1.2 馬爾可夫決策過程

7.1.3 強化學習問題定義

7.1.4 貝爾曼方程(Bellman equation)

7.2 基於價值的強化學習

7.2.1 策略迭代的基本模式

7.2.2 策略優化定理

7.2.3 策略評估方法

7.2.4 基於價值的強化學習演算法

7.2.5 探索與利用

7.2.6 引數化與深度強化學習

7.3 基於策略的強化學習

7.3.1 策略梯度定理

7.3.2 基於蒙特卡洛取樣的策略梯度法

7.3.3 Actor-Critic演算法

7.4 深度強化學習的應用

7.4.1 深度強化學習在圍棋遊戲中的應用

7.4.2 深度強化學習在實際應用中的問題

7.5 小結

習題

參考文獻

第8章 人工智慧博弈

8.1 博弈論的相關概念

8.1.1 博弈論的誕生

8.1.2 博弈論術語與囚徒困境

8.1.3 博弈的分類

8.1.4 納什均衡

8.1.5 人工智慧與博弈論

8.2 博弈策略求解

8.2.1 研究問題

8.2.2 虛擬遺憾最小化演算法

8.2.3 安全子博弈

8.3 博弈規則設計

8.3.1 研究問題

8.3.2 雙邊匹配演算法

8.3.3 單邊匹配演算法

8.4 非完全資訊博弈的實際應用

8.5 小結

習題

參考文獻

第9章 人工智慧未來發展和趨勢

9.1 類腦計算

9.2 非馮·諾依曼計算架構

9.3 人工智慧晶片與機器學習系統

9.4 量子機器學習

9.5 深度學習程式設計框架與人工智慧生態

9.6 人工智慧倫理與治理

9.7 小結

參考文獻

附錄A 設計實驗

實驗一 邏輯推理實驗

實驗二 黑白棋AI演算法

實驗三 線性迴歸模型

實驗四 人臉識別

實驗五 深度學習

實驗六 強化學習

實驗七 對抗樣本

附錄B 人工智慧演算法實訓平臺