1. 程式人生 > >SPSS教程之生存分析的Cox迴歸模型(比例風險模型)

SPSS教程之生存分析的Cox迴歸模型(比例風險模型)

最近有同學問師兄,“最近我要做生存分析,可是我不太會,也不太懂,師兄能不能教教我”,好吧,今天開一貼,講講這個。有同樣的問題的同學可以一起來看看,畢竟在臨床、科研上,這方面知識還是很受用的。有什麼想跟師兄討論的,可以關注微訊號公眾號:金融小圈子,就這樣吧。讓我們開始征程。

一、生存分析基本概念


1、事件(Event)

指研究中規定的生存研究的終點,在研究開始之前就已經制定好。根據研究性質的不同,事件可以是患者的死亡、疾病的復發、儀器的故障,也可以是下崗工人的再就業等等。

2、生存時間(Survival time)

指從某一起點到事件發生所經過的時間。生存是一個廣義的概念,不僅僅指醫學中的存活,也可以是機器出故障前的正常執行時間,或者下崗工人再就業前的待業時間等等。有的時候甚至不是通用意義上的時間,比如汽車在出故障前的行駛里程,也可以作為生存時間來考慮。


3、刪失(Sensoring)

指由於所關心的事件沒有被觀測到或者無法觀測到,以至於生存時間無法記錄的情況。常由兩種情況導致:(1)失訪;(2)在研究終止時,所關心的事件還未發生。

4、生存函式(Survival distribution function)又叫累積生存率,表示式為S(t)=P(T>t),其中T為生存時間,該函式的意義是生存時間大於時間點t的概率。t=0時S(t)=1,隨著t的增加S(t)遞減(嚴格的說是不增),1-S(t)為累積分佈函式,表示生存時間T不超過t的概率。

二、生存分析的方法

1、生存分析的主要目的是估計生存函式,常用的方法有Kaplan-Meier法和壽命表法。對於分組資料,在不考慮其他混雜因素的情況下,可以用這兩種方法對生存函式進行組間比較。


2、如果考慮其他影響生存時間分佈的因素,可以使用Cox迴歸模型(也叫比例風險模型),利用數學模型擬合生存分佈與影響因子之間的關係,評價影響因子對生存函式分佈的影響程度。這裡的前提是影響因素的作用不隨時間改變,如果不滿足這個條件,則應使用含有時間依存協變數的Cox迴歸模型。

下面用一個例子來說明SPSS中Cox迴歸模型的操作方法。

例題

要研究胰腺癌術中放療對患者生存時間的影響,收集了下面所示的資料:

操作步驟:

SPSS變數檢視

選單選擇:

點選進入Cox主對話方塊,如下,將time選入“時間”框,將代表刪失的censor變數選入“狀態”框,其餘分析變數選入“協變數”框。其餘預設就行。

點選“狀態”框下方的“定義事件”,將事件發生的標誌設為值0,即0代表事件發生。

在主對話方塊中點選“分類”按鈕,進入如下的對話方塊,將所有分類變數選入右邊框中。

在主對話方塊中點選“繪圖”按鈕,進入如下的對話方塊,選擇繪圖的型別,這裡只選擇“生存函式”。由於我們關心的主要變數是trt(是否放療),所以將trt選入“單線”框中,繪製生存曲線。

在主對話方塊中點選“選項”按鈕,進入如下的對話方塊,設定如下,輸出RR的95%置信區間。回到主介面,點選“確定”輸出結果。

結果輸出

這是案例處理摘要,有一個刪失資料。

這是分類變數的編碼方式。


這是對擬合模型的檢驗,原假設是“所有影響因素的偏回歸係數均為0”,這裡可以看出P=0.032<0.05拒絕原假設,認為有偏回歸係數不為零的因素,值得進一步分析。

這是多元迴歸結果,第二列B為偏回歸係數,最後三列為OR值及其置信區間。由P值可以看出,在0.5的顯著水平下,只有 trt 有統計學差異,OR為2.265。

這是協變數的平均值。

這是總體的生存函式,即累積生存率函式。

這是在控制了其他變數後,有無放療組的生存函式對比,可以看出,術中放療患者的生存情況優於不放療的患者。