多重填補處理有缺失數(shù)據(jù)的2×2交叉設計資料的計算機模擬_第1頁
已閱讀1頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p>  多重填補處理有缺失數(shù)據(jù)的2×2交叉設計資料的計算機模擬</p><p>  者:李清華 夏結來 薛富波 </p><p>  【關鍵詞】 缺失數(shù)據(jù) </p><p>  【Abstract】 AIM: To handle 2×2 crossover data set with missing data by using

2、Multiple Imputation method provided by Rubin and to avoid the difficulties in statistical analysis owing to missing data in medical research. METHODS: We used MI to fill in missing data and analyzed the multiply imputed

3、 data sets with standard statistical procedure, then combined the statistical inferences with MIANALYZE procedure. RESULTS: The multiple imputation method imputed missing values of the crossover design a</p><

4、p>  【Keywords】 multiple imputation analyze; missing data;cross over design </p><p>  【摘要】 目的: 探討利用Rubin提出的多重填補的方法處理有缺失數(shù)據(jù)的2×2交叉設計的資料,以避免醫(yī)學科研中常常發(fā)生觀測數(shù)據(jù)的缺失而造成統(tǒng)計分析的困難. 方法: 用MI對缺失數(shù)據(jù)進行填補,用標準的統(tǒng)計程序對填補后的數(shù)據(jù)集分析,

5、最后用MIANALYZE綜合各個數(shù)據(jù)集的統(tǒng)計分析結果. 結果: 多重填補的方法可用于交叉設計中缺失數(shù)據(jù)的填補并得出正確的統(tǒng)計推斷. 結論: MI與MIANALYZE為處理存在缺失數(shù)據(jù)的2×2交叉設計的資料提供了有效的策略. </p><p>  【關鍵詞】 多重填補分析; 缺失數(shù)據(jù);交叉設計 </p><p><b>  0引言 </b></p>

6、<p>  交叉設計是臨床試驗中比較兩種處理A,B效應的常用方法. 其優(yōu)點是減少個體差異對試驗結果的影響,減小樣本量. 但長期以來如何處理交叉設計的缺失數(shù)據(jù)是一個棘手的問題,臨床試驗中最常用的處理缺失數(shù)據(jù)的LOCF(Last Observation Carried Forward)原則并不適合于交叉設計. 通常,當受試者有一階段的數(shù)據(jù)缺失時,則把受試者的信息全部剔除. 這造成了資源的極大浪費,特別是在樣本量較小的情況下.

7、</p><p>  1976年,Rubin[1]提出了處理缺失數(shù)據(jù)的多重填補(multiple imputation,MI)的方法[2]. 多重填補用一系列可能的值來替換每一個缺失值,以反映被替換的缺失數(shù)據(jù)的不確定性. 然后,用常規(guī)的方法對多次替換后產生的若干個數(shù)據(jù)集進行分析,最后用多重填補分析(multiple imputation analyze, MIANALYZE)把來自于各個數(shù)據(jù)集的統(tǒng)計結果進行綜合.

8、 這種方法反映出了由于數(shù)據(jù)缺失而導致的不確定性,能夠產生更加有效的統(tǒng)計推斷[3]. 在近二、三十年來,隨著計算方法的不斷成熟和相應統(tǒng)計軟件的出現(xiàn),這一方法被認為是解決缺失值問題的首選方法. </p><p>  根據(jù)多重填補與多重填補分析的方法及其統(tǒng)計推斷原理,可以利用SAS程序處理有缺失數(shù)據(jù)的2×2交叉設計的資料. 由于多重填補只處理包含兩個變量以上的資料,在SAS程序中先按處理重復資料的方式排列2&

9、#215;2交叉設計的資料,用PROC MI進行填補,然后利用SAS程序對填補后的m個數(shù)據(jù)集進行轉換,對轉換后的數(shù)據(jù)集用GLM分析,最后用PROC MIANALYZE的ods output語句讀取對m個數(shù)據(jù)集分析后得到的參數(shù)估計和協(xié)方差矩陣,得出綜合的統(tǒng)計推斷結果. 多重填補與多重填補分析的整個過程可以用Fig 1表示. </p><p>  1計算機模擬與分析 </p><p>  為了

10、驗證多重填補方法處理有缺失數(shù)據(jù)的2×2交叉設計資料的有效性,建立線性模型如下[4]: </p><p>  yij=β0+β1x1ij+β2x2ij+μ0j+eij </p><p>  以yij表示第j個患者的第i次測量值,以x1ij表示A, B兩種處理的啞變量,x2ij表示兩個試驗階段的啞變量,它們均為0, 1變量. j=1,2,…,100,…表示患者,i=1,2,表示重復測

11、量值. β0為固定效應估計值. 殘差μ0j為隨機變量,μ0j~N(0,σμ02),反映了患者間變異,殘差eij即通常的殘差項,eij~N(0,σe02). </p><p>  交叉試驗主要關心A,B處理間的差別,所以在計算機模擬時,重點考慮β1的取值并且在模擬結果中只分析處理效應的檢驗效能. 先根據(jù)建立的模型,利用Monte Carlo模擬創(chuàng)建一個完全數(shù)據(jù)集,然后用SAS程序把這個完全數(shù)據(jù)集隨機去掉幾個測量值,

12、變成缺失數(shù)據(jù)集,再對有缺失值的數(shù)據(jù)集進行填補. 用常規(guī)的統(tǒng)計方法分別對完全數(shù)據(jù)集、有缺失值的數(shù)據(jù)集以及多重填補后的數(shù)據(jù)集進行統(tǒng)計分析,并比較它們的檢驗效能. 現(xiàn)用下面幾個圖表述主要研究結果: </p><p>  Fig 2是樣本量為24,兩總體均數(shù)之差為0.1,完全數(shù)據(jù)集、有不同缺失值的數(shù)據(jù)集以及對缺失數(shù)據(jù)集各填補5次后的檢驗效能的比較. 從Fig 2可以看出,完全數(shù)據(jù)集的檢驗效能最高,隨著缺失值的增加,檢驗效

13、能越來越低,對缺失數(shù)據(jù)集進行多重填補處理后,檢驗效能明顯提高,其中,對缺失3個值的數(shù)據(jù)集填補5次后,檢驗效能基本上接近于完全數(shù)據(jù)集的檢驗效能. </p><p>  Fig 3是樣本量為24,兩總體均數(shù)之差為0.1,完全數(shù)據(jù)集、有5個缺失值的數(shù)據(jù)集以及對缺失數(shù)據(jù)集填補3次、5次和10次后得到的檢驗效能的比較. 從Fig 3可以看出,對缺失數(shù)據(jù)集不做任何處理時,檢驗效能最低,隨著對缺失數(shù)據(jù)集填補次數(shù)的增加,檢驗效能

14、越來越高. 對缺失數(shù)據(jù)集填補10次后的檢驗效能基本上接近完全數(shù)據(jù)集的檢驗效能. </p><p>  Fig 4是兩總體均數(shù)之差為0.1,樣本量從10增加到60,完全數(shù)據(jù)集、缺失3個值、缺失5個值的數(shù)據(jù)集以及分別對它們填補5次后得到的檢驗效能的比較. 從Fig 4可以看出,當樣本量很小時,完全數(shù)據(jù)集、缺失數(shù)據(jù)集以及對缺失數(shù)據(jù)集進行填補分析后得到的檢驗效能都非常低,隨著樣本量的增加,檢驗效能都顯著上升,對缺失3個值

15、的數(shù)據(jù)集填補5次后得到的檢驗效能基本上接近于完全數(shù)據(jù)集的檢驗效能. </p><p>  Fig 5是樣本量為24,兩總體均數(shù)之差從0.01增加到0.2,完全數(shù)據(jù)集、缺失3個值、缺失5個值的數(shù)據(jù)集和分別對它們填補5次后的檢驗效能的比較. 從Fig 5可以看出,隨著兩總體均數(shù)相差的絕對值越來越大,完全數(shù)據(jù)集、缺失數(shù)據(jù)集以及對缺失數(shù)據(jù)集進行填補分析后得到的檢驗效能都明顯上升. 比較5種數(shù)據(jù)集的檢驗效能,隨著缺失值的增

16、加,檢驗效能明顯下降,對缺失數(shù)據(jù)集進行多重填補處理后得到的檢驗效能優(yōu)于不對缺失數(shù)據(jù)集做任何處理. </p><p>  Fig 6是兩總體均數(shù)之差為0.1,樣本量從10增加到60,完全數(shù)據(jù)集、缺失5個值的數(shù)據(jù)集以及對缺失數(shù)據(jù)集分別填補3次、5次和10次后的檢驗效能. 從Fig 6可以看出,隨著樣本量的增加,5種數(shù)據(jù)集的檢驗效能都明顯提高,對缺失數(shù)據(jù)集進行多重填補處理后,檢驗效能顯著提高,隨著填補次數(shù)的增加,檢驗效

17、能基本上接近于完全數(shù)據(jù)集的檢驗效能. </p><p>  Fig 7是樣本量為24,兩總體均數(shù)之差從0.01增加到0.2,完全數(shù)據(jù)集、缺失5個值的數(shù)據(jù)集以及對缺失數(shù)據(jù)集分別填補3次、5次和10次后得到的檢驗效能的比較. 從Fig 7可以看出,隨著兩總體均數(shù)之差增加,5個數(shù)據(jù)集的檢驗效能都明顯提高,對缺失數(shù)據(jù)集進行多重填補處理后的檢驗效能高于不對缺失數(shù)據(jù)集做任何處理. 并且,隨著填補次數(shù)的增加,檢驗效能越來越接近

18、于完全數(shù)據(jù)集得出的檢驗效能. </p><p><b>  2討論 </b></p><p>  Fig 2~7顯示了相同參數(shù)組合下以及不同參數(shù)組合下,完全數(shù)據(jù)集、缺失數(shù)據(jù)集以及對缺失數(shù)據(jù)集多重填補處理后得到的檢驗效能. 通過對檢驗效能的比較,可以看出隨著填補次數(shù)的增加檢驗效能基本上接近于完全數(shù)據(jù)集的檢驗效能. </p><p>  MI與MI

19、ANALYZE是SAS 9 STAT模塊中處理包含多個變量的不完全數(shù)據(jù)集資料的過程. 用這兩個程序處理2×2交叉設計的資料,可以用SAS程序對數(shù)據(jù)集轉換,滿足MI要求的數(shù)據(jù)集包含多個變量這一條件,再做統(tǒng)計分析. 用多重填補的方法處理有缺失數(shù)據(jù)的2×2交叉設計的資料,改進了以往剔除在任一階段退出治療的受試者的全部信息的方法,避免了資源的浪費,尤其在樣本量較小的情況下. 經過計算機幾十萬次的模擬結果可以驗證它反映了由于數(shù)

20、據(jù)的缺失而導致的不確定性,通過對填補后的多個數(shù)據(jù)集的綜合統(tǒng)計推斷,能夠得出有效的統(tǒng)計分析結果. </p><p><b>  【參考文獻】 </b></p><p> ?。?] Rubin DB. Multiple imputation: A primer [J]. Stat Methods Med Res, 1999; 8(1):3-15. </p>

21、<p>  [2] 曹陽, 謝萬軍, 張羅曼. 多重填補的方法及其統(tǒng)計推斷原理[J]. 中國醫(yī)院統(tǒng)計,2003; 10(2):77-81. </p><p>  Cao Y, Xie WJ, Zhang LM. Multiple imputation and associated statistical inferencial principle[J]. Chin J Hosp Stat, 2003;

22、10(2):77-81. </p><p> ?。?] James MR. Inference for imputation estimators [J]. Biometrika, 2000; 87(1):113-124. </p><p> ?。?] 李曉松, 張文彤, 倪宗瓚. 多水平模型在交叉設計資料分析中的應用[J]. 中國衛(wèi)生統(tǒng)計, 1999;16(5):273-274. <

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論