2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、生存分析Survival Analysis,第四軍醫(yī)大學(xué)西京醫(yī)院神經(jīng)內(nèi)科 劉學(xué)東,,第一節(jié) 概述第二節(jié) 生存時間資料的特點(diǎn)第三節(jié) 小樣本生存率的Kaplan-Meier估計(jì)第四節(jié) 大樣本生存率的壽命表法估計(jì)第五節(jié) 生存曲線比較的假設(shè)檢驗(yàn)第六節(jié) Cox比例風(fēng)險(xiǎn)回歸模型第七節(jié) 實(shí)例分析,,第一節(jié) 概述,,一 基本概念 生存分析:是將事件的結(jié)果(終點(diǎn)事件)和出現(xiàn)這一結(jié)果所經(jīng)歷的時

2、間結(jié)合起來分析的一種統(tǒng)計(jì)分析方法。二 特點(diǎn) 含有截尾數(shù)據(jù) 生存時間一般不呈正態(tài)分布,,三 歷史最早可上溯至十九世紀(jì)的死亡壽命表現(xiàn)代的生存分析則開始于二十世紀(jì)三十年代工業(yè)科學(xué)中的相關(guān)應(yīng)用二次世界大戰(zhàn):武器裝備的可靠性研究,這一研究興趣延續(xù)到戰(zhàn)后。此時生存分析都集中在參數(shù)模型。,,二十世紀(jì)六七十年代:醫(yī)學(xué)研究中大量臨床試驗(yàn)的出 現(xiàn),要求方法學(xué)有新的突破,生存分析研究開始轉(zhuǎn)向非參數(shù)方法。 D.R.

3、Cox在72年提出的比例風(fēng)險(xiǎn)模型為此做出了劃時代的貢獻(xiàn)。 現(xiàn)在,生存分析方法的在醫(yī)學(xué)領(lǐng)域得到了廣泛的應(yīng) 用,而通過醫(yī)學(xué)研究要求的不斷提高。,四 主要研究內(nèi)容 描述生存過程 比較生存時間 分析影響生存時間的因素,,五 基本方法1 非參數(shù)法:不考慮資料的分布形式,只根據(jù)樣本提供的 順序統(tǒng)計(jì)量對生存率進(jìn)行估計(jì),常用有K-M 法、Life tabl

4、e法2 參數(shù)法: 假定生存時間服從特定的參數(shù)分布,根據(jù)已 知分布特點(diǎn)對影響生存時間的因素進(jìn)行分析, 常用有:指數(shù)分布法、對數(shù)正態(tài)回歸分析法3 半?yún)?shù)法:兼有參數(shù)法和非參數(shù)法的特點(diǎn),分析影響生 存時間和生存率的因素,常用有Cox比例風(fēng)險(xiǎn) 回歸模型,,第二節(jié) 生存時間資料的特點(diǎn)及描述,,一、起始事件與失效事件 起始事件:研究對

5、象生存過程的起始特征事件 失效事件(終點(diǎn)事件、死亡事件):研究者關(guān)心的特定結(jié)局 相對而言的,都由研究目的決定,失效事件并非一定死 亡,死亡也并非一定發(fā)生了失效事件。 分析的基石,,二、生存時間( survival time) 任何兩個有聯(lián)系事件之間的時間間隔,用t表示 狹義:發(fā)病至死亡的時間跨度 廣義:起始事件到終點(diǎn)事件

6、的時間間隔 起始事件 終點(diǎn)事件 服藥 痊愈 手術(shù)切除 死亡 出院 復(fù)發(fā),,,三、 完全數(shù)據(jù)與刪失數(shù)據(jù) 完全數(shù)據(jù):可獲得準(zhǔn)確的生存時間,所提供信息完全 刪失數(shù)據(jù)(截尾值):

7、隨訪中未能觀察到病人的 終點(diǎn)事件,右上角加“+” 原因:失訪 死于其它疾病 觀察結(jié)束時病人尚存活,,,,,,,四、數(shù)據(jù)結(jié)構(gòu) 生存信息 起始時間 終點(diǎn)時間 結(jié)局

8、及原因 失訪 存活 死亡,,預(yù)后信息 一般信息 個人史及既往史 臨床資料 檢驗(yàn)結(jié)果 組織病理

9、 分子生物學(xué) 影像學(xué),,,,,與 亞飯店,五、資料特點(diǎn) 1 含截尾數(shù)據(jù) 2 分布類型復(fù)雜六、資料的基本要求 1. 終點(diǎn)事件例數(shù)不宜太少 2.  截尾原因無偏性 3.  生存時間盡可能記錄精確,,七、統(tǒng)計(jì)描述指標(biāo) 1. 死亡率、死亡概率、生存概率 2. 生

10、存率及其標(biāo)準(zhǔn)誤 3. 生存曲線 4. 中位生存時間及四分位數(shù)間距,,1 . 死亡率、死亡概率、生存概率(1) 死亡率 (mortality rate,death rate) 表示某單位時間內(nèi)的死亡強(qiáng)度。 年平均人口數(shù)=(年初人口數(shù)+年末人口數(shù))/2,,(2) 死亡概率 ( mortality probability ) 指死于某時段內(nèi)的

11、可能性大小。         ?。?d/n0 年內(nèi)有刪失,分母用校正人口數(shù): 校正人口數(shù)= 年初人口數(shù)—刪失例數(shù) / 2 =n0-c/2,,(3) 生存概率 ( survival probability ) 指某單位時段開始時存活的個體到該時段結(jié)束時仍存活的可能性的大小。          

12、 ?。?(n0-d)/n0 分子為年末尚存人數(shù), 若年內(nèi)有刪失,分母用校正人口數(shù)。,60例肺癌病人,術(shù)后每年死亡10例,無刪失。N=60,術(shù)后 年內(nèi) 年內(nèi) 年初 年 死亡 死亡 生存 (t+1)年 年 死亡 截尾 觀察 平均 率 概率 概率 生存率 數(shù) 例數(shù)

13、 例數(shù) 例數(shù) 例數(shù) p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6)

14、 (7) (8) (9) 0~ 10 0 60 55 . 185 . 167 . 833 . 833 1~ 10 0 50 45 . 222 .

15、 200 . 800 . 667 2~ 10 0 40 35 . 286 . 250 . 750 . 500 3~ 10 0 30 25 . 400 . 333

16、 . 667 . 333 4~ 10 0 20 15 . 667 . 500 . 500 . 167注意:死亡率與死亡概率的分子相同,但分母不同; 生存概率與生存率的分子相同,但分母不同,,,,2. 生存率生存率 (survival rate)

17、 ( 累積生存概率 cumulative probability of survival ) 指病人經(jīng)歷t個單位時間后仍存活的概率。 生存概率指單個時段的概率, 生存率指從0~t多個時段的積累概率。反映了病人的疾病嚴(yán)重程度、進(jìn)展快慢或兇險(xiǎn)程度等。,,公式1 用于完全數(shù)據(jù)                 公式2  用于刪失數(shù)據(jù)以及完全數(shù)據(jù)   S ( t ) = P (T ≥

18、 tk ) = p1 p2 … pk,,,3 生存曲線(survival curve) 以觀察(隨訪)時間為橫軸,以生存率為縱軸,將各個時間點(diǎn)所對應(yīng)的生存率連接在一起的曲線圖。 描述生存過程 比較生存過程 中位生存期,,,,,,,,(月),,4 中位生存時間(median survival time) 即生存時間中位數(shù),表示50

19、%的個體可存活的時間 (集中趨勢) 計(jì)算:圖解法 線性內(nèi)插法 :找出兩個生存率S(ti-1)和S(ti), 使 S(ti-1) >0.5, S(ti) <0.5。,,例: t=8, P(X>8)=0.565, t=10, P(X>10)=0.478 (8-10):(8

20、-t)=(0.565-0.478):(0.565-0.5), t=9.494(月) 生存率的計(jì)算方法,,第三節(jié) 小樣本生存率的 Kaplan-Meier估計(jì),,Kaplan-Meier法(K-M法、乘積極限法) Kaplan-Meier法由Kaplan和Meier于1958年提 出,直接用概率乘法定理估計(jì)生存率,故稱乘 積極

21、限法(product-limit method),是一種 非參數(shù)法,適用于小樣本和大樣本。,,基本思想:將生存時間由小到大依次排列,在每個死亡點(diǎn)上,計(jì)算其期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。 本法只估計(jì)死亡時點(diǎn)的生存率,,,,(a)研究終止在475天 (b) 研究終止在474天圖12-3 乘積極限法生存曲線(階梯形)及其半數(shù)生存期(Md=158天),,第四節(jié) 大樣本生存率

22、的 壽命表法估計(jì),,壽命表法 (Life Tables)基本原理:是先求出病人在治療后活過n年后再活過下一年的可能性,統(tǒng)計(jì)學(xué)上稱為生存概率,根據(jù)概率論的乘法定律將逐年生存概率相乘即可得出一定年限的生存率。 適用于大樣本資料,,,K-M法和Life table法比較,,第五節(jié) 生存曲線比較的 假設(shè)檢驗(yàn),,log-rank檢驗(yàn)(對數(shù)秩檢驗(yàn)、時序檢驗(yàn))基本原理:對每組生存數(shù)據(jù)根據(jù)其在各個

23、時刻中尚存活的對象數(shù)計(jì)算期望死亡數(shù),然后將期望死亡總數(shù)與實(shí)際死亡數(shù)進(jìn)行比較 將生存曲線作為整體對曲線與曲線間的差異進(jìn)行比較,偏重于遠(yuǎn)期療效評價,屬非參數(shù)檢驗(yàn),,,,比較兩組或多組生存曲線,實(shí)為一單因素分析 要求各組生存曲線不能交叉,如交叉提示存在混雜因 素,應(yīng)采用分層分析方法或多因素方法來校正 當(dāng)假設(shè)檢驗(yàn)有統(tǒng)計(jì)意義時,可從以下幾方面來評價各 組效應(yīng)大?。荷媲€圖目

24、測判斷、中位生存期比較,,,,,第六節(jié) Cox比例風(fēng)險(xiǎn) 回歸模型,,一 概述 簡稱Cox回歸模型,是一種允許資料有“刪失(或截 尾)”數(shù)據(jù)存在的,可以同時分析眾多因素對生存 時間影響的多變量生存分析方法,是一種半?yún)?shù)方法。,,該模型由英國統(tǒng)計(jì)學(xué)家D.R.Cox于1972年提出,主要用于腫瘤和其它慢性病的預(yù)后分析,也可用于隊(duì)列研究的病因探索。 優(yōu)點(diǎn): 多因素分析方

25、法 不考慮生存時間分布 利用截尾數(shù)據(jù),,,,,二 基本形式 h(t,X)—t時刻風(fēng)險(xiǎn)函數(shù)、風(fēng)險(xiǎn)率或瞬時死亡率 h0(t)—基準(zhǔn)風(fēng)險(xiǎn)函數(shù),即所有協(xié)變量都取0時t時刻風(fēng)險(xiǎn)函數(shù)。 X1、X2、…、Xp—協(xié)變量、影響因素、預(yù)后因素。 β1、 β2、…、 βp—回歸系數(shù)。,,,,βp : 在其它協(xié)變量不變的情況下,協(xié)變量Xp每改變一個測 定單位所引起相當(dāng)

26、危險(xiǎn)度的自然對數(shù)的改變量 RR: 相當(dāng)危險(xiǎn)度,兩個分別具有協(xié)變量Xi與Xj的病人其風(fēng) 險(xiǎn)函數(shù)(危險(xiǎn)度)之比 RR=exp[βj(xi-xj)],,如協(xié)變量treat的β = -1.617,RRtreat=0.199,表示treat變量水平2與1比較,treat=2的危險(xiǎn)度是treat=1的0.199倍,提示治療方案2優(yōu)于治療方案1。而age的β =0.119,RRage=1.127,表明年齡每增加一歲

27、,死亡的可能性增加1.127倍。,,β>0,RR>1,說明變量X增加時,危險(xiǎn)率增加,即X是危險(xiǎn)因素。β<0,RR<1,說明變量X增加時,危險(xiǎn)率下降,即X是保護(hù)因素。β=0,RR=1,說明變量X增加時,危險(xiǎn)率不變,即X是危險(xiǎn)無關(guān)因素。,,三 參數(shù)估計(jì)與假設(shè)檢驗(yàn) ① 參數(shù)估計(jì) 最大似然法 ② 假設(shè)檢驗(yàn)(模型中變量的剔除和引入) 似然比檢驗(yàn)

28、 得分檢驗(yàn) Wald檢驗(yàn),,四 因素篩選與最優(yōu)模型的建立 因素初步篩選 ?2 檢驗(yàn) 、log-rank檢驗(yàn)等 單變量Cox模型分析(P=0.10) 直接進(jìn)行逐步Cox模型分析,,最佳模型建立 1、Enter2、Forward: Conditional3、Forward: LR4、Forward: Wald5、Back

29、ward: Conditional6、Backward: LR7、Backward: Wald,,五 檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)包括引入的檢驗(yàn)水準(zhǔn)和剔除的檢驗(yàn)水準(zhǔn)。一般地,剔除α≥引入α初步的、探索性的研究,或變量數(shù)較少時,可取0.10或0.15。 設(shè)計(jì)嚴(yán)謹(jǐn)?shù)?、證實(shí)性的研究,或變量數(shù)較多時,可取0.05。,,六 統(tǒng)計(jì)描述 1 回歸系數(shù)和標(biāo)準(zhǔn)回歸系數(shù) 標(biāo)準(zhǔn)回歸系數(shù):觀察值經(jīng)過標(biāo)準(zhǔn)化變換后所求得。

30、 相對值,比較自變量對模型貢獻(xiàn),反映因素對生存時間 影響強(qiáng)度2 相對危險(xiǎn)度及可信區(qū)間 無序分類變量,轉(zhuǎn)換亞變量分析,,3 個體預(yù)后指數(shù)(PI) PI= 預(yù)后指數(shù)越小,預(yù)后越好; 預(yù)后指數(shù)越大,預(yù)后越差。 據(jù)PI的大小可將病人分為不同的危險(xiǎn)組,繪制分組 的生存曲線,直觀比較各危險(xiǎn)組的生存情況。,,例如: 傳統(tǒng)治療方式,淋巴

31、結(jié)轉(zhuǎn)移,PI=2.6929 傳統(tǒng)治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=1.7616 新治療方式,淋巴結(jié)轉(zhuǎn)移,PI=0.9313 新治療方式,淋巴結(jié)無轉(zhuǎn)移,PI=0,,七 分析結(jié)果(結(jié)果解釋) 與生存相關(guān)的因素 因素作用大小及方向:保護(hù)因素還是危險(xiǎn)因素、相對危險(xiǎn)度的大小。 因素作用大小排序:標(biāo)準(zhǔn)化回歸系數(shù)的絕對值。,,八 結(jié)果報(bào)告 1 起始時間與終止時間 2 結(jié)局事件

32、 3 刪失數(shù)據(jù)的種類與原因 4 生存率估計(jì)值、置信區(qū)間及其統(tǒng)計(jì)學(xué)方法,,5 生存率比較的統(tǒng)計(jì)學(xué)方法 (如log rank法)及其p 值 6 給出Cox回歸模型,呈現(xiàn)解釋變量與風(fēng)險(xiǎn)之間的聯(lián)系風(fēng)險(xiǎn)比(hazard ratio)及其置信區(qū)間,,九 應(yīng)用范圍 因素分析 具有l(wèi)ogistic回歸模型的所有優(yōu)點(diǎn) 同時考慮生存結(jié)局和生存時間,可處理截尾數(shù)據(jù) 不考慮基準(zhǔn)風(fēng)險(xiǎn)的分布,,

33、,生存預(yù)測 強(qiáng)調(diào)設(shè)計(jì)的重要性 專業(yè)知識角度:選擇疾病種類、終點(diǎn)事件、影響因素及結(jié)果的專業(yè)解釋等。 統(tǒng)計(jì)學(xué)角度:樣本例數(shù)、因素的賦值、生存時間準(zhǔn)確 、因素篩選方法、結(jié)果的統(tǒng)計(jì)學(xué)解釋等。,,,十 注意事項(xiàng) ① 應(yīng)用條件 除生存資料的基本要求外,還要求因素對生存時間的 作用不隨時間變化(比例風(fēng)險(xiǎn)假定)。 ② 設(shè)計(jì)階段 資料的代表性和可靠性 將盡可能

34、的因素都包括在調(diào)查分析中,,篩選變量 容易收集 費(fèi)用 明確規(guī)定生存時間 樣本量為觀察協(xié)變量的5~20倍③ 模型擬合 多元共線性:自變量間不獨(dú)立,相互間有一定線性依 存關(guān)系,,④ 選入模型的變量是統(tǒng)計(jì)學(xué)上的有關(guān)變量,不一定都與生存時間有因果關(guān)系。其中某些變量可能只是伴隨關(guān)系而已,未選入模型的變量不一定全是無關(guān)變量,要考慮

35、是否模型內(nèi)的某些變量代替了它的作用,或因例數(shù)不夠,或試驗(yàn)中對該變量進(jìn)行了控制而引起。,,⑤ 模型擬合優(yōu)度考察:據(jù)預(yù)后指數(shù)PI分組,比較各組 基于Cox模型的生存曲線與基于kaplan-Meier法估計(jì)的生存曲線,如兩組曲線吻合較好,表明Cox模型擬合較好。⑥ 生存率分析:生存曲線不能隨意延長,也不能輕易用于預(yù)測預(yù)報(bào),經(jīng)過大量研究所得的生存曲線才有可能推廣應(yīng)用。,,十一 常見問題 1 生存時間的計(jì)算和選

36、擇 2 生存率計(jì)算方法使用不當(dāng) 3 忽略結(jié)局,采用t檢驗(yàn)、線性回歸分析生存時間 4 忽略生存時間,采用Logistic回歸分析死亡率,,5 采用平均生存時間表示生存時間的平均水平 6 采用常規(guī)t檢驗(yàn)或方差分析進(jìn)行組間生存時間比較 7 丟棄截尾數(shù)據(jù),只考慮確切數(shù)據(jù) 8 將截尾數(shù)據(jù)當(dāng)作確切數(shù)據(jù)處理,,例 某研究者追蹤100名癌癥患者,經(jīng)治療后的生存情況,

37、 隨訪第1年有30人死亡,隨訪第2年時,有20人死亡, 有40人無法聯(lián)系失訪。 方法一:去掉截尾數(shù)據(jù) 方法二:不去掉截尾數(shù)據(jù) 總例數(shù)N=60 N=100 生存數(shù) 生存率 生存數(shù) 生存率 1年 30

38、 30/60=50% 70 70/100=70%,,第七節(jié) 實(shí)例分析,,1 研究設(shè)計(jì) ① 目的 專業(yè):描述缺血性腦卒中患者病后生存狀況,并分析 影響死亡的危險(xiǎn)因素 統(tǒng)計(jì)學(xué): 估計(jì):如根據(jù)缺血性腦卒中患者治療后的生存時間 資料,估計(jì)不同時間的生存率、生存曲線以

39、 及中位生存期等。,,比較:對不同因素對生存率的影響進(jìn)行比較 影響因素分析:目的是為了探索和了解影響生存時間 的因素,如病人的年齡、性別、病程、 嚴(yán)重程度等。 預(yù)測:具有不同因素水平的個體生存預(yù)測,,② 方法:回顧性研究 ③ 確定起始事件、終點(diǎn)事件、生存時間 起始事件

40、:患者發(fā)病 終點(diǎn)事件:因缺血性腦卒中死亡 生存時間:患者發(fā)病至死亡、失訪或最后一 次隨訪 ④ 確定可能的影響因素、水平以及量化方法,,⑤ 設(shè)計(jì)調(diào)查表 調(diào)查表中應(yīng)包括 可能的影響因素 觀察起點(diǎn)和終點(diǎn)(年、月、日) 生存時間 生存結(jié)局,,2 搜集資料 可能的影響因素:病歷 生存時間及結(jié)局:

41、隨訪3 整理資料 檢查、核對原始數(shù)據(jù),包括影響因素、生存時間和生存 結(jié)局,盡量避免缺失值 建立數(shù)據(jù)庫,,4 資料分析 估計(jì): Kaplan- Meier法 比較: log-rank檢驗(yàn) 影響因素分析:單因素分析采用單變量 Cox回歸模型,采用P<0.1作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論