1. 程式人生 > >第3章 概率 第4章 常見概率分佈

第3章 概率 第4章 常見概率分佈

  1. 一個樣本點是試驗中最基本的結果
  2. 組合法則(Nn)=N!/(n!(N-n)!)
  3. 事件的補集是指事件所有的不發生樣本點Ac
  4. 概率的加法:p(AUB)=p(A)+p(B)-p(AnB)
    1. 互斥事件:p(AUB)=p(A)+p(B)
  5. 條件概率:p(A|B)=p(AnB)/p(B)
  6. 乘法法則:p(AnB)=p(A)*p(B|A)=p(B)*p(A|B)
  7. A和B互為獨立事件:p(A|B)=p(A)
  8. 貝葉斯定理:如果有k個互斥且有窮的事件B1,B2...Bk,即B1+B2...+Bk=1和1個可以觀測到的A
    1. p(Bi|A)=p(BinA)/p(A)=p(Bi)*p(A|Bi)/(p(B1)*p(A|B1)+p(B2)*p(A|B2)+...p(Bk)*p(A|Bk))
  9. *互斥是同一事件下必然不同的結果;獨立是事件結果之間互不影響
  1. 隨機變數是一個與試驗隨機結果有關的數值變數,每個樣本點有且僅有一個數值
  2. 無論窮盡與否,只要為可數個數的值即離散型隨機變數;取值為取件則為連續型變數
  3. 離散型隨機變數的概率分佈是每一個可能值的出現概率
    1. u=E(x)=Σxp(x)
    2. σ^2=E[(x-u)^2]=Σ(x-u)^2*p(x)
    3. 離散型隨機變數的概率規則符合切比雪夫法則和經驗法則
  4. 二項分佈的概率分佈,隨機有放回
    1. p(x)=(nx)p^x*q^(n-x)
      1. p=1-q
    2. 均值u=n*p
    3. 方差σ^2=npq
  5. 泊松分佈
    1. p(x)=λ^x*e^(-x)/x!
    2. u and σ^2 equal λ
  6. 超幾何分佈:隨機無放回的抽取n個元素
    1. p(x)=(rx)((N-r)(n-x))/(Nn)
      1. N總數;r總體成功個數;n抽樣數;x抽樣成功數
    2. u=n*r/N
    3. σ^2=r(N-r)n(N-n)/N^2(N-1)
  7. 連續型隨機變數的概率分佈可用一條平滑的曲線來表示,曲線也稱為密度函式或頻率函式
  8. 正態分佈:鐘形曲線

    1. 標準正態分佈即u=0和σ=1的正態分佈
  • 當離散型二項分佈的n足夠大時,正態分佈是對其很好的近似;而二項分佈是在x軸右側為有意義的取值,即u±3*σ>0,才是良好的近似;
    1. 連續校正中,z=[(a-0.5)-u]/σ
  • 確定是否來自正態分佈
    1. 作圖,是否像鍾型
    2. 計算取件是否為值個數特徵比例:68%,95%,99.5%
    3. 求IQR和S,IQR/S≈1.3,則近似正態分佈
    4. 作正態概率圖normal Q~Q plot,正態分佈的點近似落在y=x上
      1. 即資料的z分數和理論正態分佈的資料點所在z分數
  • 指數分佈
    1. 概率分佈1/θ*e^(-x/θ)
    2. u=θ
    3. σ=θ