1. 程式人生 > >7.3 樸素貝葉斯分類器

7.3 樸素貝葉斯分類器

樸素:屬性條件獨立性假設。即假設每個屬性獨立地對分類結果發生影響。

樸素貝葉斯分類器重寫了書中的式(7.8)為:
P ( c x ) =

P ( c ) P ( x
c )
P ( x )
=
P ( c ) P ( x ) i = 1 d P ( x i c ) P(c|x) = \frac{P(c)P(x|c)}{P(x)} = \frac{P(c)}{P(x)}\prod_{i=1}^d P(x_i|c)
其中, i = 1 d P ( x i c ) = P ( x 1 c ) P ( x 2 c ) P ( x n c ) \prod_{i=1}^d P(x_i|c) = P(x_1|c)* P(x_2|c)*\dots * P(x_n|c)
d為屬性數目, x i x_i x x 在第i個屬性上的取值。

基於書中式(7.6),即 h ( x ) = arg max c ϵ y P ( c x ) h^*(x) = \underset{c\epsilon{y}}{\arg\max} P(c|x) ,基於該式,將式(7.8)代入,(由於P(x)對所有類別來說是相同的,可以省略),可以得到下面:
h n b ( x ) = arg max c ϵ y P ( c ) i = 1 d P ( x i c ) h_{nb}(x) = \underset{c\epsilon{y}}{\arg\max} P(c)\prod_{i=1}^d P(x_i|c)
這就是樸素貝葉斯分類器的表示式。
即給定x的情況下,貝葉斯分類器最可能出現的情況c,P(x)省略。

  • D c D_c 表示訓練集D中第c類樣本組成的集合,若有充足的獨立同分布樣本,則可容易地估計出類先驗概率:
    P ( c ) = D c D P(c) = \frac{|D_c|}{|D|}
    (1)對離散屬性而言,令 D c , x i D_{c,x_i} 表示 D c D_c 中在第i 個屬性上取值為 x i x_i 的樣本組成的集合,則條件概率 P ( x i c ) P(x_i | c) 可估計為: ( ) \red{(這裡不是絕對值,而表示集合大小)}
    P ( x i c ) = D c , x i D c P(x_i|c) = \frac{|D_{c,x_i}|}{|D_c|}
    (2)對連續屬性可考慮概率密度函式,假定 p ( x i c )   N ( μ c , i , σ c , i 2 ) p(x_i|c)~N(\mu_{c,i},\sigma^2_{c,i}) ,其中 μ c , i σ c , i 2 \mu_{c,i}和\sigma^2_{c,i} 分別是第c類樣本在第i個屬性上取值的均值和方差,則有:
    P ( x i c ) = 1 2 π σ c , i e x p ( ( x i μ c , i ) 2 2 σ c , i 2 ) P(x_i|c) = \frac{1}{\sqrt{2\pi}\sigma_{c,i}} exp(- \frac{(x_i-\mu_{c,i})^2}{2\sigma^2_{c,i}})

以下針對西瓜書P151中的例子進行驗算:

可參考這篇文章
在這裡插入圖片描述
利用樸素貝葉斯演算法訓練出一個分類器,以判斷一個具有特徵{色澤=青綠,根蒂=蜷縮,敲聲=濁響,紋理=清晰,臍部=凹陷,觸感=硬滑,密度=0.697,含糖率=0.460}的測試樣例(“測1”)瓜( x t e s t x_{test}

相關推薦

7.3 樸素分類

樸素:屬性條件獨立性假設。即假設每個屬性獨立地對分類結果發生影響。 樸素貝葉斯分類器重寫了書中的式(7.8)為: P(c∣x)=P(c)P(x∣c)P(x)=P(c)P(x)∏i=1dP(xi∣c)P(

7.3 樸素分類

樸素:屬性條件獨立性假設。即假設每個屬性獨立地對分類結果發生影響。 樸素貝葉斯分類器重寫了書中的式(7.8)為: P (

機器學習系列——樸素分類(二)

表示 -h line log ima 條件 code 樸素貝葉斯 spa 貝葉斯定理: 其中: 表示事件B已經發生的前提下,事件A發生的概率,叫做事件B發生下事件A的條件概率。其基本求解公式為:。 機器學習系列——樸素貝葉斯分類器(二)

樸素分類的應用 Naive Bayes classifier

upload dia get 等號 分布 eat 實現 維基 5.5 一、病人分類的例子 讓我從一個例子開始講起,你會看到貝葉斯分類器很好懂,一點都不難。 某個醫院早上收了六個門診病人,如下表。   癥狀  職業   疾病   打噴嚏 護士   感冒   打噴嚏

機器學習之路: python 樸素分類 預測新聞類別

groups group news ckey put epo test electron final 使用python3 學習樸素貝葉斯分類api 設計到字符串提取特征向量 歡迎來到我的git下載源代碼: https://github.com/linyi0604/kag

機器學習:分類(二)——高樸素分類代碼實現

mod ces 數據 大於等於 即使 平均值 方差 很多 mode 一 高斯樸素貝葉斯分類器代碼實現 網上搜索不調用sklearn實現的樸素貝葉斯分類器基本很少,即使有也是結合文本分類的多項式或伯努利類型,因此自己寫了一遍能直接封裝的高斯類型NB分類器,當然與真正的源碼相

機器學習---樸素分類(Machine Learning Naive Bayes Classifier)

垃圾郵件 垃圾 bubuko 自己 整理 href 極值 multi 帶來 樸素貝葉斯分類器是一組簡單快速的分類算法。網上已經有很多文章介紹,比如這篇寫得比較好:https://blog.csdn.net/sinat_36246371/article/details/601

sklearn庫學習之樸素分類

樸素貝葉斯模型 樸素貝葉斯模型的泛化能力比線性模型稍差,但它的訓練速度更快。它通過單獨檢視每個特徵來學習引數,並從每個特徵中收集簡單的類別統計資料。想要作出預測,需要將資料點與每個類別的統計資料進行比較,並將最匹配的類別作為預測結果。 GaussianNB應用於任意連續資料,

基於樸素分類的 20-news-group分類及結果對比(Python3)

之前看了很多CSDN文章,很多都是根據stack overflow 或者一些英文網站的照搬。導致我看了一整天最後一點收穫都沒有。 這個作業也借鑑了很多外文網站的幫助 但是是基於自己理解寫的,算是一個學習筆記吧。環境是python3(海外留學原因作業是英文的,渣英語見諒吧)程式碼最後附上。 M

機器學習筆記(五):樸素分類

一、概述 1.1 簡介 樸素貝葉斯(Naive Bayesian)是基於貝葉斯定理和特徵條件獨立假設的分類方法,它通過特徵計算分類的概率,選取概率大的情況進行分類,因此它是基於概率論的一種機器學習分類方法。因為分類的目標是確定的,所以也是屬於監督學習。 Q1:什麼是基於概率論的方

《機器學習西瓜書》學習筆記——第七章_分類_樸素分類

樸素:特徵條件獨立;貝葉斯:基於貝葉斯定理。 樸素貝葉斯是經典的機器學習演算法之一,也基於概率論的分類演算法,屬於監督學習的生成模型。樸素貝葉斯原理簡單,也很容易實現,多用於文字分類,比如垃圾郵件過濾。 1.演算法思想——基於概率的預測 貝葉斯決策論是概率框架下

樸素分類(Naive Bayes Classifiers)

本文討論的是樸素貝葉斯分類器( Naive Bayes classifiers)背後的理論以及其的實現。 樸素貝葉斯分類器是分類演算法集合中基於貝葉斯理論的一種演算法。它不是單一存在的,而是一個演算法家族,在這個演算法家族中它們都有共同的規則。例如每個被分類的

kaggle | 基於樸素分類的語音性別識別

概要: 本實驗基於kaggle上的一個資料集,採用樸素貝葉斯分類器,實現了通過語音識別說話人性別的功能。本文將簡要介紹這一方法的原理、程式碼實現以及在程式設計過程中需要注意的若干問題,程式碼仍然是用MATLAB寫成的。 關鍵字: MATLAB; 語音性別識別

MINIST | 基於樸素分類的0-9數字手寫體識別

概要: 本實驗基於MINIST資料集,採用樸素貝葉斯分類器,實現了0-9數字手寫體的識別。本文將簡要介紹這一方法的原理、程式碼實現以及在程式設計過程中需要注意的若干問題,程式碼仍然是用MATLAB寫成的。 關鍵字: MATLAB; 影象處理; 數字手寫體識別

【機器學習實踐】用Python實現樸素分類

       閱讀學習了《機器學習》第7章的貝葉斯分類器後,為了加深理解和加強python的程式碼能力,因此嘗試使用Python實現樸素貝葉斯分類器,由於初學Python的緣故,程式碼的一些實現方法可能比較繁瑣,可閱讀性有待提高。程式碼如下: #import numpy a

樸素分類演算法通俗講解

        首先會用到貝葉斯決策理論,說一下。貝葉斯決策理論的核心思想是:選擇具有最高概率的決策。例如一個點(x, y),屬於類別1的概率是p1(x, y),屬於類別2的概率是p2(x, y),用貝葉斯決策理論來判斷它的類別:         如果p1(x, y) &g

樸素分類原理與應用、EM演算法原理及例項

文章目錄 貝葉斯定理與概率論中相關概念 屬性條件獨立性假設 樸素貝葉斯分類器 樸素貝葉斯分類器公式 離散屬性與連續屬性值的分別處理 樸素貝葉斯分類器例項 拉普拉斯修正 樸素貝葉斯分類器的應用:貝葉斯垃圾郵件

分類——樸素分類以及Python實現

核心思想: 根據訓練資料獲取模型的後驗概率,對應後驗概率越大的類即預測類。 演算法簡介: 模型: 先驗概率:p(y=Ck)p(y=Ck) 條件概率:p(X=x|y=Ck)p(X=x|y=Ck) 後驗概率:p(y=Ck|X=x)p(y=Ck|X=

機器學習實戰——python實現簡單的樸素分類

基礎公式 貝葉斯定理:P(A|B) = P(B|A)*P(A)/P(B) 假設B1,B2…Bn彼此獨立,則有:P(B1xB2x…xBn|A) = P(B1|A)xP(B2|A)x…xP(Bn|A) 資料(虛構) A1 A2 A3 A4 A5 B

機器學習:樸素分類,決策函式向量化處理,mask使用技巧

文章目錄 前面實現的樸素貝葉斯分類器,決策函式是非向量化的: 藉助於numpy向量化處理,相當於平行計算,注意mask使用技巧,用途較廣: 前面實現的樸素貝葉斯分類器,決策函式是非向量化的: 前面提到過大資料處理,儘量避免個人的遍歷等一些函式