1. 程式人生 > >基本統計方法的選擇與應用

基本統計方法的選擇與應用

sample bsp 應用 描述 推斷 post 趨勢 相關分析 賦值

一、確定資料的類型:分類資料、定量資料;
 選擇適當的統計方法,資料不同,設計不同,采用的分析方法不同;
1、計量資料的比較(比較集中趨勢是否不同):
(1)兩組:t檢驗、Wilcoxon秩和檢驗 …

  如:醫保患者與自費患者住院天數是否不同?
資料與設計:兩組獨立的計量資料比較
統計方法:兩獨立樣本 t 檢驗(independent samples t-test)
分析結果:t=2.17,P=0.033

參數統計方法(t檢驗、ANOVA)有應用前提條件:
A:資料滿足正態性;
B:比較的各組資料之間方差相等(滿足方差齊性)。


(2) 三組(及以上):方差分析、Kruskal-Wallis檢驗 …

如:醫生、護士、醫護人員的期望收入指數是否有差別?
資料與設計:三組獨立的計量資料比較
統計方法:完全隨機設計的方差分析(one-way ANOVA)
分析結果:F=20.89,P<0.0001
結論:有差別。

技術分享圖片

兩變量之間關系的分析:
相關分析、回歸分析、秩相關 …
如研究門急診量與收入的關系、床位數與護士人數的關系

變化趨勢分析:
Cochran-Armitage趨勢檢驗、卡方檢驗 …
如分析兩周患病率隨年齡變化的趨勢

綜合評價:
層次分析法、TOPSIS法、秩和比法 …
如評價三甲醫院醫療質量、綜合績效

示例:

研究醫院床位數與護士人數之間是否有相關性。
研究目的:床位數(X)與護士人數(Y)之間是否有關?關系如何(線性、非線性)?關系大小?
(由樣本推斷總體)
資料與設計:來自於同一醫院的兩個指標
統計方法:
相關分析(correlaion analysis)衡量兩指標之間是否有線性關系,及關系的強度和方向。
回歸分析(regression analysis)定量進行X到Y的量化估計或預測。
變量關系的描述:散點圖(scatter plot)
相關分析的結果:r=0.83,P<0.0001

95%CI:(0.61,0.93)
回歸分析的結果:Y=-4.84 + 0.36X R平方=0.69
結論:
1. 可認為床位數與護士人數之間有關,護士人數隨床位數的增加而增加。
2. 實有床位數的信息可以解釋註冊護士數信息量的69%,還有剩余的31%的信息需通過實有床位數以外的其他因素來解釋。

2、分類資料

  (1)無序分類資料的比較(比較率或構成是否不同):
   卡方檢驗、Fisher精確概率法 …

  如:

兩樣本率的比較(卡方檢驗)
用抗凝劑和不用抗凝劑治療急性心肌梗塞患者的生存率是否不同?
P<0.01,按α=0.05水準拒絕H0 ,接受H1 ,可認為用與不用抗凝劑治療急性心肌梗塞的效果不同,用抗凝劑後的生存率較高。

  (2)有序等級資料的比較(比較平均程度、等級是否不同):
   Wilcoxon秩和檢驗、Kruskal-Wallis檢驗 …

  如:

比較三家醫院門診候診時間是否有差別。統計很長,較長,一般,較短,很短有多少例。
資料與設計:三組獨立的等級資料比較
統計方法:Kruskal-Wallis秩和檢驗(Kruskal-Wallis H test)

----------------------------------------------------------------------------------

多元統計方法的選擇與應用
探索影響因素:
多重線性回歸、logistic回歸 …
如探索影響肺炎患者住院總費用的因素

綜合多個指標進行事物的分類或判別:
聚類分析、判別分析 …

多指標的降維及潛在因素的探索:
主成分分析、因子分析 …

預測事物的發展趨勢:
指數平滑法、ARIMA預測方法 …

示例:研究目的:住院總費用的影響因素分析(年齡、性別(0-男;1-女)、住院天數、費別(0-自費;1-醫保)、入院情況(0-一般;1-急癥;2-危重)、所在醫院(1-醫院1;1-醫院2;2-醫院3;)、住院總費用)

技術分享圖片


資料與設計:目標指標(應變量)為計量資料
統計方法:多重線性回歸(multiple linear regression)
篩選自變量的方法:
逐步法(stepwise)
前進法(forward)
後退法(backward)
註意:自變量的量化與賦值

技術分享圖片

基本統計方法的選擇與應用