PyMC3中常見連續概率分佈

阿新 • • 發佈：2019-02-13

連續分佈

1.均勻分佈

class pymc3.distributions.continuous.Uniform（lower = 0，upper = 1，* args，** kwargs ）

均勻分佈的概率密度函式為：

import numpy as np
import matplotlib.pyplot as plt
plt.style.use('seaborn-darkgrid')
x = np.linspace(-3, 3, 500)
ls = [0., -2]
us = [2., 1]
for l, u in zip(ls, us):
    y = np.zeros(500)
    y[(x<u) & (x>l)] = 1.0/(u-l)
    plt.plot(x, y, label='lower = {}, upper = {}'.format(l, u))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.ylim(0, 1)
plt.legend(loc=1,fontsize=14)
plt.show()

2.正態分佈

class pymc3.distributions.continuous.Normal(mu=0, sd=None, tau=None, **kwargs)
'''
mu:均值
sd：標準差(>0),僅在未指定tau時才需要。
tau:精度(>0),僅在未指定sd時才需要。
'''

正態分佈的概率密度函式為：

正態分佈可以在精度或標準偏差方面進行引數化。兩個引數之間的關係由下式給出：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(-5, 5, 1000)
mus = [0., 0., 0., -2.]
sds = [0.4, 1., 2., 0.4]
for mu, sd in zip(mus, sds):
    pdf = st.norm.pdf(x, mu, sd)
    plt.plot(x, pdf, label=r'$\mu$ = {}, $\sigma$ = {}'.format(mu, sd))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1,fontsize=12)
plt.show()

logp(value)
'''
計算正態分佈在指定值的對數概率。
引數:value (numeric) – 計算對數概率的值。如果需要多個值的對數概率，則必須以numpy陣列或theano張量值提供值
Returns:TensorVariable
'''

3.截斷正態分佈

class pymc3.distributions.continuous.TruncatedNormal（mu = 0，sd = None，tau = None，lower = None，upper = None，transform ='auto'，* args，** kwargs ）
'''
引數：	
mu - 均值。
sd（float） - 標準偏差（sd> 0）。
lower（float （可選）） - 左邊界。
upper（float （可選）） - 右邊界。
'''

概率密度函式為：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(-10, 10, 1000)
mus = [0.,  0., 0.]
sds = [3.,5.,7.]
a1 = [-3, -5, -5]
b1 = [7, 5, 4]
for mu, sd, a, b in zip(mus, sds,a1,b1):
    an, bn = (a - mu) / sd, (b - mu) / sd
    pdf = st.truncnorm.pdf(x, an,bn, loc=mu, scale=sd)
    plt.plot(x, pdf, label=r'$\mu$ = {}, $\sigma$ = {}, a={}, b={}'.format(mu, sd, a, b))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1,fontsize=12)
plt.show()

4.Beta分佈

class pymc3.distributions.continuous.Beta(alpha=None, beta=None, mu=None, sd=None, *args, **kwargs)
'''
引數：	
alpha - alpha> 0。
beta - beta> 0。
mu- 均值（0 <mu <1）。
sd - 標準差（0 <sd <sqrt（mu *（1-mu）））。

'''

概率密度函式為：

均值，方差：

注：Beta分佈是二項分佈的共軛先驗

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(0, 1, 200)
alphas = [.5, 5., 1., 2., 2.]
betas = [.5, 1., 3., 2., 5.]
for a, b in zip(alphas, betas):
    pdf = st.beta.pdf(x, a, b)
    plt.plot(x, pdf, label=r'$\alpha$ = {}, $\beta$ = {}'.format(a, b))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.ylim(0, 4.5)
plt.legend(loc=9)
plt.show()

5.指數分佈

class pymc3.distributions.continuous.Exponential(lam, *args, **kwargs)

概率密度函式：

均值，方差：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(0, 3, 100)
for lam in [0.5, 1., 2.]:
    pdf = st.expon.pdf(x, scale=1.0/lam)
    plt.plot(x, pdf, label=r'$\lambda$ = {}'.format(lam))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1)
plt.show()

6.拉普拉斯分佈：

class pymc3.distributions.continuous.Laplace(mu, b, *args, **kwargs)
'''
引數：	
mu（float） - 位置引數。
b（float） - 比例引數（b> 0）。
'''

概率密度函式：

均值和方差為：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(-10, 10, 1000)
mus = [0., 0., 0., -5.]
bs = [1., 2., 4., 4.]
for mu, b in zip(mus, bs):
    pdf = st.laplace.pdf(x, loc=mu, scale=b)
    plt.plot(x, pdf, label=r'$\mu$ = {}, $b$ = {}'.format(mu, b))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1)
plt.show()

7.t分佈

class pymc3.distributions.continuous.StudentT(nu, mu=0, lam=None, sd=None, *args, **kwargs)
'''
引數：	
nu（float） - 自由度，也稱為正態引數（nu> 0）。
mu（float） - 位置引數。
sd（float） - 比例引數（sd> 0）。當nu增加時，收斂於標準偏差。（僅在未指定lam時才需要）
lam（float） - 比例引數（lam> 0）。隨著nu的增加，精度趨於一致。（僅在未指定sd時才需要）
'''

概率密度函式：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(-8, 8, 200)
mus = [0., 0., -2., -2.]
sds = [1., 1., 1., 2.]
dfs = [1., 5., 5., 5.]
for mu, sd, df in zip(mus, sds, dfs):
    pdf = st.t.pdf(x, df, loc=mu, scale=sd)
    plt.plot(x, pdf, label=r'$\mu$ = {}, $\sigma$ = {}, $\nu$ = {}'.format(mu, sd, df))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1)
plt.show()

8.Gamma分佈

class pymc3.distributions.continuous.Gamma(alpha=None, beta=None, mu=None, sd=None, *args, **kwargs)
'''
引數：	
alpha（float） - 形狀引數（alpha> 0）。
beta（float） - 速率引數（beta> 0）。
mu（float） - 可選形狀引數（mu> 0）。
sd（float） - 可選比例引數（sd> 0）。
'''

概率密度函式：

均值和方差為：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(0, 20, 200)
alphas = [1., 2., 3., 7.5]
betas = [.5, .5, 1., 1.]
for a, b in zip(alphas, betas):
    pdf = st.gamma.pdf(x, a, scale=1.0/b)
    plt.plot(x, pdf, label=r'$\alpha$ = {}, $\beta$ = {}'.format(a, b))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1)
plt.show()

9.卡方分佈

class pymc3.distributions.continuous.ChiSquared(nu, *args, **kwargs)
'''
引數：	nu（int） - 自由度（nu> 0）
'''

概率密度函式為：

均值和方差：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(0, 15, 200)
for df in [1, 2, 3, 6, 9]:
    pdf = st.chi2.pdf(x, df)
    plt.plot(x, pdf, label=r'$\nu$ = {}'.format(df))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.ylim(0, 0.6)
plt.legend(loc=1)
plt.show()

10.半正太分佈

class pymc3.distributions.continuous.HalfNormal(sd=None, tau=None, *args, **kwargs)
'''
引數：	
sd（float） - 比例引數sigma（sd> 0）（僅在tau未指定時才需要）。
tau（float） - 精度tau（tau> 0）（僅在未指定sd時才需要）。

'''

概率密度函式：

均值和方差：

import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
plt.style.use('seaborn-darkgrid')
x = np.linspace(0, 5, 200)
for sd in [0.4, 1., 2.]:
    pdf = st.halfnorm.pdf(x, scale=sd)
    plt.plot(x, pdf, label=r'$\sigma$ = {}'.format(sd))
plt.xlabel('x', fontsize=12)
plt.ylabel('f(x)', fontsize=12)
plt.legend(loc=1)
plt.show()

參考：

PyMC3中常見連續概率分佈

連續分佈 1.均勻分佈 class pymc3.distributions.continuous.Uniform（lower = 0，upper = 1，* args，** kwargs ）均勻分佈的概率密度函式為： import numpy as np imp

常見的概率分佈模型

這一陣子一直在做自己第一個真正意義的app專案，獨立完成，感覺壓力還是挺大的，很多知識點都不清晰，軟體的架構也很有問題，有很多東西都需要整理和記憶，所以決定做一下記錄。其次，最近的科研專案壓力也比較大，很多之前學過的東西都忘記了，需要在部落格中記錄，所以下決

常見的離散型和連續型隨機變數的概率分佈

目錄 1 基本概念 4 參考文獻 1 基本概念在之前的博文中，已經明白了概率分佈函式和概率密度函式。下面來講解一下常見的離散型和連續型隨機變數概率分佈。在此之前，介紹幾個基本概念：均值（期望值exp

資料科學中的常見的6種概率分佈（Python實現）

作者：Pier Paolo Ippolito@南安普敦大學編譯：機器學習演算法與Python實戰（微信公眾號：tjxj666）原文：https://towardsdatascience.com/probability-distributions-in-data-science-cce6e64873a7

如何在Python中實現這五類強大的概率分佈

如何在Python中實現這五類強大的概率分佈中文譯文原連結,侵刪。英文出處|How to implement these 5 powerful probability distributions in Python R程式語言已經成為統計分析中的事實標準。但在這篇文

第3章概率第4章常見概率分佈

一個樣本點是試驗中最基本的結果組合法則(Nn)=N!/(n!(N-n)!) 事件的補集是指事件所有的不發生樣本點Ac 概率的加法：p(AUB)=p(A)+p(B)-p(AnB) 互斥事件：p(AUB)=p(A)+p(B) 條件概率：p(A|

常見概率分佈總結

Discrete Bernoulli distribution pmf fX(x)=P(X=x)={(1−p)1−xpxfor x = 0 or 10otherwisef_X(x) = P(X=

Matlab統計工具箱中各類概率分佈函式使用方法介紹

1. Matlab Statistics Toolbox 中概率分佈函式介紹 Matlab Statistics Toolbox 提供了對幾乎所有概率分佈的支援，可以方便產生服從各類分佈的隨機數及其PDF/CDF 函式。

深度學習中常見分佈-正態分佈和伽瑪分佈

正態分佈（Normal distribution）又名高斯分佈（Gaussian distribution），是一個在數學、物理及工程等領域都非常重要的概率分佈，在統計學的許多方面有著重大的影響力。若隨機變數X服從一個數學期望為μ、標準方差為σ2的高斯分佈，記為：

常見的幾種概率分佈

文章來源：http://blog.csdn.net/pipisorry/article/details/39076957 常見離散概率分佈 Bernoulli、Binomial、Poisson Note: 一般的二項分佈是n次獨立的伯努利試驗的和。它的期望值和方

連續型概率分佈——正態分佈（一維）

今天想總結一下正太分佈，但是如果按照維基百科上面的講法，就太過複雜了，所以這裡著重講正態分佈在實際生活中的作用以及簡單的計算方法，也就是高中所學過的關於正態分佈的知識。在正式開始之前，還是把維基百科上面的科普拎出來過一遍正態分佈又名高斯分佈，是一個在數學、物理及工程等領域都非

常見概率分佈的特徵函式推導

特徵函式定義是：設X是實值隨機變數，則對任意實數t，有稱為隨機變數X的特徵函式，其中。一、離散概率分佈 1.單點分佈單點分佈的分佈列為。其特徵函式計算方法如下： 2.二項分佈二項分佈的分佈列為。其特徵函式的計算方法如下： 3.泊松分佈泊松分佈的

概率論：常見概率分佈

常見離散概率分佈Bernoulli、Binomial、Poisson伯努利分佈對單次拋硬幣的建模，X~Bernoulli(p)的PDF為隨機變數X只能取{0, 1}。對於所有的pdf，都要歸一化！而對於伯努利分佈，已經天然歸一化了，因此歸一化引數就是1。現在我們假設我們有一個

Matlab中的正態分佈概率函式

normcdf函式用來獲得正態分佈的概率分佈函式；也就是 normcdf(x)=Pr{Z≤x}，這裡Z是均值為0，方差為1的標準正態隨機變數. 若想獲得均值為 μ，方差為 σ的概率分佈函式： normcdf(x,mu,sigma) 即可. no

Excel在統計分析中的應用—第六章—概率分佈及概率分佈圖-Part5-泊松分佈函式POISSON.DIST()的應用

泊松分佈這種概率分佈型別經常看到，比較重要，必須掌握。 “當一個隨機事件，例如某電話交換臺收到的呼叫、來到某公共汽車站的乘客、某放射性物質發射出的粒子、顯微鏡下某區域中的白血球等等，以固定的平均瞬時速率λ（或稱密度）隨機且獨立地出現時，那麼這個事件在單位時間（面積或體積）內

隨機變數概率分佈函式彙總-離散型分佈+連續型分佈

2018.08.18-更新概率分佈用以表達隨機變數取值的概率規律，根據隨機變數所屬型別的不同，概率分佈取不同的表現形式離散型分佈：二項分佈、多項分佈、伯努利分佈、泊松分佈連續型分佈：均勻分佈、正態分佈、指數分佈、伽瑪分佈、偏態分佈、貝塔分佈、威布林分佈、卡方分佈、

在資料處理中常用的5種概率分佈的python實現

1.二項分佈 from scipy.stats import binom, norm, beta, expon import numpy as np import matplotlib.pyplot

在統計學中概率分佈中的概率密度函式PDF，概率質量PMF，累積分佈CDF

一. 概念解釋 PDF：概率密度函式（probability density function）, 在數學中，連續型隨機變數的概率密度函式（在不至於混淆時可以簡稱為密度函式）是一個描述這個隨機變數的輸出值，在某個確定的取值點附近的可能性的函式。 PMF :

資料科學家應知必會的6種常見概率分佈

前言假設你是個大學老師。在檢查了一週的作業後，對學生進行了打分。讓錄分員建立一個包含所有學生成績的電子表格，要求是隻含分數不含學生姓名等資訊。於是乎，錄分員一個大粗心，漏錄了好幾個分數，介個時候不知道把誰給漏錄了。來看看怎麼解決這個

機器學習中貝葉斯判決、概率分佈、樣本等概念間的關係

以下是在看模型識別，機器學習及數理統計時，對貝葉斯決策、概率分佈、樣本關係的總結，每想到一點就寫下來，比較亂，這塊需要反覆學習、慢慢理解。 1. 機器學習的一些概念：什麼是機器學習？機器學習包含哪些基本要素？機器學習，就是由已知資料，訓練出一個模型，形成一個假設的

PyMC3中常見連續概率分佈

連續分佈

相關推薦