第3章 概率 第4章 常見概率分佈
阿新 • • 發佈:2018-11-26
- 一個樣本點是試驗中最基本的結果
- 組合法則(Nn)=N!/(n!(N-n)!)
- 事件的補集是指事件所有的不發生樣本點Ac
- 概率的加法:p(AUB)=p(A)+p(B)-p(AnB)
- 互斥事件:p(AUB)=p(A)+p(B)
- 條件概率:p(A|B)=p(AnB)/p(B)
- 乘法法則:p(AnB)=p(A)*p(B|A)=p(B)*p(A|B)
- A和B互為獨立事件:p(A|B)=p(A)
- 貝葉斯定理:如果有k個互斥且有窮的事件B1,B2...Bk,即B1+B2...+Bk=1和1個可以觀測到的A
- p(Bi|A)=p(BinA)/p(A)=p(Bi)*p(A|Bi)/(p(B1)*p(A|B1)+p(B2)*p(A|B2)+...p(Bk)*p(A|Bk))
- *互斥是同一事件下必然不同的結果;獨立是事件結果之間互不影響
- 隨機變數是一個與試驗隨機結果有關的數值變數,每個樣本點有且僅有一個數值
- 無論窮盡與否,只要為可數個數的值即離散型隨機變數;取值為取件則為連續型變數
- 離散型隨機變數的概率分佈是每一個可能值的出現概率
- u=E(x)=Σxp(x)
- σ^2=E[(x-u)^2]=Σ(x-u)^2*p(x)
- 離散型隨機變數的概率規則符合切比雪夫法則和經驗法則
- 二項分佈的概率分佈,隨機有放回
- p(x)=(nx)p^x*q^(n-x)
- p=1-q
- 均值u=n*p
- 方差σ^2=npq
- p(x)=(nx)p^x*q^(n-x)
- 泊松分佈
- p(x)=λ^x*e^(-x)/x!
- u and σ^2 equal λ
- 超幾何分佈:隨機無放回的抽取n個元素
- p(x)=(rx)((N-r)(n-x))/(Nn)
- N總數;r總體成功個數;n抽樣數;x抽樣成功數
- u=n*r/N
- σ^2=r(N-r)n(N-n)/N^2(N-1)
- p(x)=(rx)((N-r)(n-x))/(Nn)
- 連續型隨機變數的概率分佈可用一條平滑的曲線來表示,曲線也稱為密度函式或頻率函式
- 正態分佈:鐘形曲線
-
- 標準正態分佈即u=0和σ=1的正態分佈
- 當離散型二項分佈的n足夠大時,正態分佈是對其很好的近似;而二項分佈是在x軸右側為有意義的取值,即u±3*σ>0,才是良好的近似;
- 連續校正中,z=[(a-0.5)-u]/σ
- 確定是否來自正態分佈
- 作圖,是否像鍾型
- 計算取件是否為值個數特徵比例:68%,95%,99.5%
- 求IQR和S,IQR/S≈1.3,則近似正態分佈
- 作正態概率圖normal Q~Q plot,正態分佈的點近似落在y=x上
- 即資料的z分數和理論正態分佈的資料點所在z分數
- 指數分佈
- 概率分佈1/θ*e^(-x/θ)
- u=θ
- σ=θ