貝葉斯決策論（二）

上一節中，我們使用了鮭魚和鱸魚的例子直觀的感受了貝葉斯決策的過程。這一節中，我們更一般化的討論這個問題。
引入以下四個條件來一般化這個問題：

允許使用多於一個的特徵
允許多於兩種類別的模型
允許有其他行為而不僅僅是判定類別
通過引入一個更一般的損失函式來替代誤差概率

多於一個的特徵

在上一節使用單個特徵時，我們使用 $x$ 來表示這個特徵，現在當我們使用多於一個特徵時，只需要將特徵標量 $x$ 轉化為特徵向量 $\vec{x}$ ，其中 $\vec{x}$ 處於 $d$ 維的歐式空間 $R^{d}$ ,稱為特徵空間。

多於兩種類別的模型

在上一節只有兩種類別時，我們使用 $w_{1}, w_{2}$ 來表示兩種類別，自然的，推廣到多種類別時，我們使用 ${w_{1}, w_{2}, . . . w_{c}}$

{w_{1}, w_{2}, . . . w_{c}}

來表示有限的c種類別。

有其他行為而不僅僅是判定類別

我們使用 ${α_{1}, α_{2}, . . . α_{α}}$ 來表示有限的 $α$ 種行為。 $λ (α_{i} | w_{j})$ 來表示類別為 $w_{j}$ 時採用行為 $α_{j}$ 的風險。

此時的後驗概率 $P (w_{j} | \vec{x})$ 依然通過貝葉斯公式求得：

P (w_{j} | \vec{x}) = \frac{P (\vec{x} | w_{j}) P (w_{j})}{P (\vec{x})}

更一般的損失函式

假定我們觀測到特徵向量 $\vec{x}$ 並將採用行為 $α_{i}$ ，定義與 $α_{i}$ 相關聯的損失函式為

R (α_{i} | \vec{x}) = \sum_{j = 1}^{c} λ ((α_{i} | w_{j}) P (w_{j} | \vec{x})

用決策理論中的術語來表達，一個預期的損失被稱為一次風險，

R (α_{i} | \vec{x})

被稱為條件風險。當我們跟觀測到一個特徵向量

\vec{x}

時，我們總可以選擇最小化條件風險來使預期風險最小化。

判決規則和總風險

一般來講，我們希望有一個判決函式 $α (\vec{x})$ ，對於每一個給定的 $\vec{x}$ ，判決函式都會給出一個對應的 $α$ 值，來決定對應於 $\vec{x}$ 的行為。總風險R是對於這個判決規則的預期損失。

R = \int R (α (x) | \vec{x}) p (\vec{x}) d x

貝葉斯決策論（二）

多於一個的特徵

多於兩種類別的模型

有其他行為而不僅僅是判定類別

更一般的損失函式

判決規則和總風險

貝葉斯決策論（二）

貝葉斯思想（二）

全概率公式、貝葉斯公式（二）

機器學習(5)——貝葉斯學習（二）

第3章樸素貝葉斯演算法（二演算法實戰）

貝葉斯網（2）Netica：從數據中學習CPT

機器學習之貝葉斯網路（三）

機器學習實戰（Machine Learning in Action）學習筆記————04.樸素貝葉斯分類（bayes）

貝葉斯思想（四）

貝葉斯思想（三）

貝葉斯網路（筆記）

全概率公式和貝葉斯公式（轉載）

機器學習----貝葉斯分類器（貝葉斯決策論和極大似然估計）

邏輯迴歸和樸素貝葉斯演算法實現二值分類（matlab程式碼）

機器學習實戰（三）樸素貝葉斯NB（Naive Bayes）

貝葉斯網路（belief network）及相關知識整理

樸素貝葉斯分類（Naive Bayes,NB）

貝葉斯網路（機器學習系列，持續更新中~）

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

資料探勘領域十大經典演算法之—樸素貝葉斯演算法（超詳細附程式碼）

貝葉斯決策論（二）

多於一個的特徵

多於兩種類別的模型

有其他行為而不僅僅是判定類別

更一般的損失函式

判決規則和總風險

相關推薦