生存曲線_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、生存分析Survival Analysis,To be or not to be is only a part of the question. The question also includes how long to be.,生存分析(survival analysis)是將事件的結(jié)果(終點事件)和出現(xiàn)這一結(jié)果所經(jīng)歷的時間結(jié)合起來分析的一種統(tǒng)計分析方法。生存分析不同于其它多因素分析的主要區(qū)別點就是生存分析考慮了每個觀測出現(xiàn)某

2、一結(jié)局的時間長短。,前 言,第一節(jié) 生存分析基本概念,一、生存時間( survival time,failure time )終點事件與起始事件之間的時間間隔。終點事件指研究者所關心的特定結(jié)局。起始事件是反映研究對象生存過程的起 始特征的事件。,生存時間舉例,起始事件 終點事件 服藥 痊愈 手術(shù)切除

3、 死亡 染毒 死亡 化療 緩解 緩解 復發(fā),,,終點事件和起始事件是相對而言的,它們都由研究目的決定,須在設計時明確規(guī)定,并在研究期間嚴格遵守,不能隨意改變。,生存時間的類型,1. 完全數(shù)據(jù)(complete data)從起點

4、至死亡(死于所研究疾?。┧?jīng)歷的時間。2. 截尾數(shù)據(jù)(刪失數(shù)據(jù),censored data)從起點至截尾點所經(jīng)歷的時間。截尾原因:失訪、死于其它疾病、觀察結(jié)束時病人尚存活等。,例如,某腫瘤醫(yī)院調(diào)查了1991-1995年間經(jīng)手術(shù)治療的大腸癌患者150例,對可能影響大腸癌術(shù)后生存時間的因素進行了調(diào)查,如性別、年齡、組織學分類、腫瘤大小、Dure’S分期等。隨訪截止日期為2000年12月30日,隨訪記錄見下表。,大腸癌患

5、者的隨訪記錄 編號 性別 年齡 … 手術(shù)日期 隨訪終止日期 隨訪結(jié)局 生存時間(天)1 男 45 …1991.05.20 1995.06.04 死亡 1476 2 男 50 …1992.01.12 1998.08.25 死亡 2417 3 女 36 …1991.10.24 1994.03.18

6、 失訪 876+ 4 男 52 …1994.11.02 2000.12.30 存活 2250+ 5 女 56 …1994.06.25 1995.03.17 死亡 265 6 女 60 …1993.12.05 1996.08.16 死于其它 985+ …,,,,生存時間,生存時間的度量單位可以是年

7、、月、日、小時等。常用符號t表示,截尾數(shù)據(jù)在其右上角標記“+”。生存資料的主要特點:含有截尾數(shù)據(jù)。截尾數(shù)據(jù)的特點:真實的生存時間未知,只知道比觀察到的截尾生存時間要長。生存時間的分布一般不呈正態(tài)分布。,二、條件生存概率、生存率、生存曲線,條件生存概率:(conditional probability of survival)表示某單位時段開始時存活的個體,到該時段結(jié)束時仍存活的可能性。年條件生存概率表示年初尚存人口存

8、活滿1年的可能性。,,生存率:(survival rate, survival function )指觀察對象經(jīng)歷t個單位時段后仍存活的可能性。,,,條件生存概率和生存率的計算,例:手術(shù)治療100例食管癌患者,術(shù)后1、2、3年的死亡數(shù)分別為10、20、30,若無截尾數(shù)據(jù),試求各年條件生存概率及逐年生存率。生存率計算方法:直接法概率乘法定理,由例子可看出,生存率與條件生存概率不同。條件生存概率是單個時段的結(jié)果,而生

9、存率實質(zhì)上是累積條件生存概率(cumulative probability of survival),是多個時段的累積結(jié)果。例如,3年生存率是第1年存活,第2年也存活,第3年還存活的可能性。,生存曲線(survival curve)以觀察(隨訪)時間為橫軸,以生存率為縱軸,將各個時間點所對應的生存率連接在一起的曲線圖。生存曲線是一條下降的曲線,分析時應注意曲線的高度和下降的坡度。平緩的生存曲線表示高生存率或較長生存

10、期,陡峭的生存曲線表示低生存率或較短生存期。,某醫(yī)師收集20例腦瘤患者甲、乙兩療法治療的生存時間(周)如下:甲療法組 1 3 3 7 10 15 15 23 30乙療法組 5 7+ 13 13 23 30 30+ 38 42 42 45+,三、中位生存期,中位生存期(median survival time)又稱半數(shù)生存期,表示恰

11、好有50%的個體尚存活的時間。中位生存期越長,表示疾病的預后越好;中位生存期越短,預后越差。估計中位生存期常用圖解法或線性內(nèi)插法。,生存資料統(tǒng)計學處理方法,(一)設計目的:專業(yè)目的:據(jù)專業(yè)知識確定。 統(tǒng)計學目的:估計:根據(jù)樣本生存資料估計總體生存率及其它有關指標(如中位生存期等),如根據(jù)腦瘤患者治療后的生存時間資料,估計不同時間的生存率、生存曲線以及中位生存期等。比較:對不同處理組生存率進行比較,如比較不同療法治療腦瘤的

12、生存率,以了解哪種治療方案較優(yōu)。,,影響因素分析:目的是為了探索和了解影響生存時間長短的因素,或平衡某些因素影響后,研究某個或某些因素對生存率的影響。如為改善腦瘤病人的預后,應了解影響病人預后的主要因素,包括病人的年齡、性別、病程、腫瘤分期、治療方案等。預測:具有不同因素水平的個體生存預測,如根據(jù)腦瘤病人的年齡、性別、病程、腫瘤分期、治療方案等預測該病人t年(月)生存率。,,方法:前瞻性隊列研究 回顧

13、性隊列研究確定起始事件、終點事件、隨訪終止日期、生存時間、截尾。確定可能的影響因素、水平以及量化方法。,大腸癌影響因素量化表,變量名 因素 量化值 病例數(shù) 構(gòu)成比(%) X1 性別 女=0 32 48.5

14、 男=1 34 51.5 X2 年齡(歲) <40=1 10 15.1 40-60=2 37 56.1 ≥60=3

15、 19 28.8 X3 組織學分類 乳頭狀腺癌=0 20 30.3 管狀腺癌=1 46 69.7 X4 腫瘤大?。╟m)≤6=0 29 43

16、.9 >6=1 37 56.1,,,,,X5 細胞增殖抗原(PCNA) <55%=0 27 40.9 ≥5

17、5%=1 39 59.1 X6 淋巴管浸潤 無=0 44 66.7 有=1 22 33.3 X7 血管浸潤 無=0

18、 58 87.9 有=1 8 12.1Time 手術(shù)到觀察結(jié)束 實際天數(shù)Event 結(jié)束時是否死亡 未死=0 22 33.3 死亡=1

19、 44 66.7,,,,設計調(diào)查表:一覽表:因素較少時。 單一表:因素較多時。 調(diào)查表中應包括可能的影響因素觀察起點和終點(年、月、日) 生存時間生存結(jié)局樣本含量:非截尾例數(shù)至少是可能影響因素的10倍。,三聯(lián)體數(shù)據(jù),,(二)搜集資料可能的影響因素: 從病歷獲得。生存時間及結(jié)局:短期可觀察到的結(jié)局可從

20、病歷獲得;長期結(jié)局一般不能從病歷直接獲得,通過信訪、電話等得到。,(三)整理資料認真檢查、核對原始數(shù)據(jù),包括影響因素、生存時間和生存結(jié)局。盡量避免缺失值。建立數(shù)據(jù)庫FoxBase、Foxpro、Virual Foxpro等專業(yè)數(shù)據(jù)庫統(tǒng)計軟件數(shù)據(jù)庫(SAS、SPSS等)Office辦公軟件中的Excel、Access,大腸癌生存資料序號 X1 X2 X3 X4 X5 X6 X7

21、 Time Event 1 0 2 1 0 0 1 0 2896 0 2 0 2 1 0 0 1 0 992 1 3 1 2 1

22、 1 0 0 0 2811 0 4 0 3 1 1 0 1 0 2052 1 5 1 2 0 1 0 0 0 2975 0

23、 6 1 2 1 1 1 1 1 856 1… 65 0 1 1 1 1 0 0 584 1,,,,生存資料基本要求,樣本由隨機抽樣方法獲得,要有一定的數(shù)量。死亡例數(shù)不能太少。截尾比例不能

24、太大。生存時間盡可能準確。因為常用的生存分析方法都在生存時間排序的基礎上作統(tǒng)計處理,即使是小小的舍入誤差,也可能改變生存時間順序而影響結(jié)果。缺項應盡量補齊。,(四)分析資料估計: Kaplan- Meier法,壽命表法比較: log-rank檢驗影響因素分析:Cox比例風險回歸模型(Cox回歸模型),是生存分析中最重要的模型之一。預測: Cox回歸模型預測生存率。,第二節(jié) 生存率的估計與生存曲線,一、小樣本資料生存率及其標

25、準誤的計算生存率的計算:Kaplan-Meier法(K-M法、乘積極限法)Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limit method),是一種非參數(shù)法,適用于小樣本和大樣本。生存率的標準誤的計算生存曲線,二、大樣本資料的生存分析生存率的計算 壽命表法生存曲線,第三節(jié) 生存曲線的log-rank檢驗,log-ran

26、k檢驗(對數(shù)秩檢驗、時序檢驗)該檢驗屬非參數(shù)檢驗,用于比較兩組或多組生存曲線或生存時間是否相同。檢驗統(tǒng)計量為卡方。自由度=組數(shù)-1。P≤0.05,兩組或多組生存曲線不同。 P>0.05,兩組或多組生存曲線差別無統(tǒng)計學意義。,注意,以上介紹的是log-rank檢驗的近似法,計算簡便,但其結(jié)果較精確法(一般統(tǒng)計軟件中輸出精確法計算結(jié)果)保守。 近似法:(手工)精確法:(軟件),,,,此檢驗比較兩組或多組生存曲線,

27、實為一單因素分析。要求各組生存曲線不能交叉,如交叉提示存在混雜因素,應采用分層分析方法或多因素方法來校正混雜因素。當假設檢驗有統(tǒng)計意義時,可從以下幾方面來評價各組效應大?。荷媲€圖目測判斷、中位生存期比較等。,log-rank檢驗用于整條生存曲線的比較,若比較兩組某時間點處的生存率,則按下式計算: 如比較多個時間點處生存率,檢驗水準應取Bonferroni校正,即 ,其中k為比較的次數(shù),

28、以保證總的I型錯誤概率不超過 。,,,,第四節(jié) Cox比例風險回歸模型,Cox比例風險回歸模型(Cox’s proportional hazards regression model),簡稱Cox回歸模型。 該模型由英國統(tǒng)計學家D.R.Cox于1972年提出,主要用于腫瘤和其它慢性病的預后分析,也可用于隊列研究的病因探索。其優(yōu)點:多因素分析方法不考慮生存時間分布利用截尾數(shù)據(jù),一、Cox模型的基本形式,h(t,X)—t時刻風險

29、函數(shù)、風險率或瞬時死亡 率(hazard function)。h0(t)—基準風險函數(shù),即所有變量都取0時t 時刻風險函數(shù)。X1、X2、…、Xp—協(xié)變量、影響因素、預后 因素。β1、 β2、…、 βp—回歸系數(shù)。,β>0,RR>1,說明變量X增加時,危險率增加,即X是危險因素。β<0,RR<1,說明變量X增加時,危險率下降

30、,即X是保護因素。β=0,RR=1,說明變量X增加時,危險率不變,即X是危險無關因素。,,,二、參數(shù)估計與假設檢驗,(一)參數(shù)估計 最大似然法(二)假設檢驗似然比檢驗(likelihood ratio test)得分檢驗( score test)Wald檢驗(Wald test),三、因素篩選與最優(yōu)模型的建立,變量篩選方法向前引入法(前進法)Forward向后剔除法(后退法)Backward逐步引入-剔除法(逐步

31、法)Stepwise,,檢驗水準初步的、探索性的研究,或變量數(shù)較少時,可取0.10。設計嚴謹?shù)?、證實性的研究,或變量數(shù)較多時,可取0.05或0.01 。檢驗水準包括引入的檢驗水準和剔除的檢驗水準。一般地,剔除α≥引入α。,分析結(jié)果(結(jié)果解釋),與生存相關的因素因素作用大小及方向:保護因素還是危險因素、相對危險度的大小。因素作用大小排序:標準化回歸系數(shù)的絕對值。,分析結(jié)果(結(jié)果解釋),個體的預后指數(shù)及預后分組: 預后指

32、數(shù)(prognostic index,PI) = 預后指數(shù)越小,預后越好; 預后指數(shù)越大,預后越差。,分析結(jié)果(結(jié)果解釋),例如: 傳統(tǒng)治療方式,淋巴結(jié)轉(zhuǎn)移,PI=2.6929 傳統(tǒng)治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=1.7616 新治療方式,淋巴結(jié)轉(zhuǎn)移,PI=0.9313 新治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=0據(jù)PI的大小可將病人分為不同的危險組,常見分三組(即低危組、中危組

33、、高危組)或五組。繪制分組的生存曲線,直觀比較各危險組的生存情況,如中位生存期、t年生存率等。,,六、Cox模型的注意事項及應用范圍,(一)注意事項設計階段應注意的問題模型配合時應注意的問題應用條件:除生存資料的基本要求外,還要求因素對生存時間的作用不隨時間變化(比例風險假定)。如觀察年限超過10年時,癌癥手術(shù)后放療的治療作用可能逐漸消失,從而不滿足這一要求。,因素分析時應注意的問題篩選變量時,考慮該指標是否容易收集、是否費用

34、較高等臨床因素。對連續(xù)變量,看其分布,如服從偏態(tài)分布,一般進行對數(shù)變換后參與計算。,,選入模型的變量是統(tǒng)計學上的有關變量,不一定都與生存時間有因果關系。其中某些變量可能只是伴隨關系而已,未選入模型的變量不一定全是無關變量,要考慮是否模型內(nèi)的某些變量代替了它的作用,或因例數(shù)不夠,或試驗中對該變量進行了控制而引起。,檢查可能的交互作用項是否顯著(方法:一次引入一個交互作用項,看其對應的回歸系數(shù)是否為0)。模型擬合優(yōu)度考察:據(jù)預后指數(shù)PI

35、分組,比較各組基于Cox模型的生存曲線與基于kaplan-Meier法估計的生存曲線,如兩組曲線吻合較好,表明Cox模型擬合較好。生存率分析:生存曲線不能隨意延長,也不能輕易用于預測預報,經(jīng)過大量研究所得的生存曲線才有可能推廣應用。,(二)適用范圍,因素分析logistic回歸模型可以作多因素分析,并可進行相對危險度估計,但不考慮生存時間的長短,不能處理隨訪中常見的截尾數(shù)據(jù)。Cox比例風險回歸模型具有l(wèi)ogistic回歸模型的

36、所有優(yōu)點;同時考慮生存結(jié)局和生存時間的長短,可處理截尾數(shù)據(jù);且不考慮基準風險的分布。生存預測,強調(diào)設計的重要性專業(yè)知識角度:選擇疾病種類、終點事件、影響因素及結(jié)果的專業(yè)解釋等。統(tǒng)計學角度:樣本例數(shù)、因素的賦值、生存時間準確到天數(shù)、因素篩選方法、結(jié)果的統(tǒng)計學解釋等。,小結(jié)(論文報告中應寫明),1.材料與方法病例來源、起始事件、終點事件、觀察終止時間、截尾情況、隨訪結(jié)果的獲得方法,樣本含量、截尾例數(shù)及百分比(%)。建立數(shù)據(jù)庫方

37、法統(tǒng)計學處理方法 Kaplan-Meier法估計生存率 log-rank檢驗進行組間生存率比較 Cox模型進行多因素分析,2.結(jié)果估計:Kaplan-Meier生存率及生存曲線。比較:log-rank檢驗卡方值及其P值。因素分析及預測:變量賦值(數(shù)量化方法)表變量統(tǒng)計描述: 各組病例數(shù)和構(gòu)成比(分類變量) 均數(shù)和標準差(數(shù)值變量)變量篩選方法及檢驗水準Cox回歸結(jié)果

38、及統(tǒng)計解釋,Cox回歸與多元線性回歸、logistic回歸的比較,案例分析,某研究者觀察了確診后采取同樣方案進行化療的26例急性混合型白血病患者,欲了解某種不良染色體是否會影響患者病情的緩解,將治療后120天內(nèi)癥狀是否緩解作為結(jié)果變量(緩解=0;未緩解=1),有無不良染色體作為研究因素。整理資料見下表。,有無不良染色體與緩解的關系不良染色體 緩解 未緩解 合計 緩解率(%) 有 5

39、 13 18 27.8 無 3 5 8 37.5 合 計 8 18 26 30.8考慮到例數(shù)較小,采用Fisher確切概率法,得到P=0.667,尚不能認為不良染色體影響病情的緩解。,,,,,這種情況下的結(jié)果并不可靠,原因是兩個

40、比較組之間其它影響患者病情緩解的因素不一定均衡,因而需要考慮平衡其它可能的影響因素如年齡(歲)、骨髓原幼細胞分組(≥50%=1;<50%=0)、CD34表達(陽性=1;陰性=0)、性別(男=1;女=0)的作用。,多因素logistic回歸分析結(jié)果 因素 回歸系數(shù) Wald卡方 P OR染色體 1.457 1.161 0.281 4.29骨髓原幼

41、 2.961 4.778 0.029 19.2細胞分組采用多因素logistic回歸分析,經(jīng)逐步法按0.10水準,平衡骨髓原幼細胞分組后,有無不良染色體不影響患者的緩解(P=0.281)。,,,,有一位臨床醫(yī)生指出,僅考慮是否緩解還不夠,如果進一步利用緩解時間的長短來進行分析,信息利用得更充分。費了很大辛苦,幸好查到了所有患者的緩解時間,于是采用log-rank檢驗比較有無不良染色體兩組病人的

42、生存曲線,得卡方1.28,P=0.2579,仍然顯示患者的緩解時間與不良染色體無關。,生存時間的比較仍然需要考慮組間的可比性,經(jīng)多因素Cox回歸分析,當檢驗水準0.10時的結(jié)果如下。因素 回歸系數(shù) 卡方 P RR染色體 1.838 3.709 0.054 6.29CD34 1.877 8.904 0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論