機器學習之概率分佈1
阿新 • • 發佈:2019-01-06
機器學習-概率分佈-伯努利分佈
概率論在機器學習領域發揮了重要的作用。目前機器學習的很多方法本質上是統計學習,而統計學習的本質則是概率論。在概率論中概率分佈是一個非常重要的工具。概率分佈
首先介紹最簡單的一種分佈-伯努利分佈。變數
同理,反面朝上的概率為:
因此,變數
假設我們拋硬幣拋了
我們可以通過最大似然來估計概率分佈的引數
最大化上面的對數似然就可以得到引數
我們用python來實現上述的引數估計過程,用scipy包中的bernoulli分佈來生成樣本,再根據這些樣本估計bernoulli分佈的引數。下面的程式碼表示bernoulli分佈的引數為0.32,我們用這個分佈生成了10000個樣本。再用這10000個樣本估計該分佈的引數。看看估計出來的引數是多少。減少生成樣本的個數(size),重新估計引數,看有什麼變化。
程式碼
估計伯努利分佈的引數:
from scipy.stats import bernoulli,poisson,norm,expon
import numpy
X=bernoulli.rvs(0.32,size=10000) #根據伯努利分佈來生成樣本#
mu=numpy.mean(X)#用樣本來估計引數#
print(mu)