版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,隨著我國醫(yī)療信息化技術(shù)不斷發(fā)展,大量的醫(yī)學(xué)信息原始數(shù)據(jù)得以記錄和保存下來,如流行病學(xué)的調(diào)查數(shù)據(jù)、醫(yī)院的信息化數(shù)據(jù)等。這些醫(yī)學(xué)數(shù)據(jù)在數(shù)量迅速增加的同時,其質(zhì)量和準確度也在不斷提高。如何借助恰當?shù)慕y(tǒng)計分析方法,來挖掘這些海量的數(shù)據(jù)信息,以更好的為醫(yī)療衛(wèi)生行業(yè)的管理、醫(yī)院的診療、科研和教學(xué)服務(wù),從而進一步為醫(yī)療決策提供支撐,已經(jīng)成為國內(nèi)外統(tǒng)計學(xué)界較為關(guān)注的熱點問題。然而,在實際研究中,此類計數(shù)數(shù)據(jù)常常會出現(xiàn)零過多的現(xiàn)象,這種現(xiàn)象在流行
2、病學(xué)調(diào)查數(shù)據(jù)中尤為常見。所謂零過多現(xiàn)象是指在計數(shù)數(shù)據(jù)中零的個數(shù)明顯多于按照泊松分布、二項分布或負二項分布等標準離散分布隨機產(chǎn)生的零的個數(shù)的現(xiàn)象。計數(shù)數(shù)據(jù)中取值為零的數(shù)量過多,會導(dǎo)致數(shù)據(jù)過度離散。對于該類零過多的計數(shù)數(shù)據(jù),如果仍使用普通的計數(shù)模型去擬合,將會導(dǎo)致參數(shù)估計的偏差過大,甚至做出錯誤的推斷。為了解決零過多計數(shù)數(shù)據(jù)的過離散問題,針對該類數(shù)據(jù)的特點,分成零計數(shù)(零點的退化分布)和非零計數(shù)(取值為泊松分布)兩個部分建立混合回歸模型,即
3、零膨脹泊松回歸模型(Zero-inflated model,ZIP)。
研究目的:
本研究針對醫(yī)學(xué)研究中普遍存在的零過多的計數(shù)數(shù)據(jù)的問題,構(gòu)建零膨脹模型,對于小樣本資料,引進貝葉斯的方法,構(gòu)建貝葉斯零膨脹模型并與傳統(tǒng)模型比較,模擬不同樣本量和不同零過多比例等多種數(shù)據(jù)情境,從準確性、精確性和模型的擬合優(yōu)度等多個方面對構(gòu)建的模型進行評價,探索不同的數(shù)據(jù)情境下最優(yōu)的參數(shù)估計模型。同時,為了增加模型估計的可靠性,引入Boot
4、strap統(tǒng)計技術(shù)。本研究可以為今后流行病學(xué)調(diào)查數(shù)據(jù)中零過多數(shù)據(jù)的統(tǒng)計分析提供方法學(xué)支持。
研究方法:
首先進行原始數(shù)據(jù)的模擬,數(shù)據(jù)模擬設(shè)置不同的樣本量,分別為1000、500、100,同時考慮不同的離散程度,設(shè)置不同的零比例,分別為0.9、0.8、0.7、0.6,模擬不同的數(shù)據(jù)情境下的最優(yōu)模型。
1.模型構(gòu)建
基于大樣本的情況下,構(gòu)建零膨脹泊松回歸模型(ZIP)、零膨脹負二項泊松回歸模型(Zer
5、o-inflated negative binomial,ZINB)并與傳統(tǒng)的泊松回歸和負二項回歸進行比較;基于小樣本的情況下,構(gòu)建貝葉斯零膨脹泊松回歸模型(Bayesianzeroinflated Poisson)、零膨脹負二項泊松回歸模型(Bayesianzero-inflated negativebinomial model)并與貝葉斯泊松回歸模型、貝葉斯負二項回歸模型進行比較。同時,模型構(gòu)建的過程中引進Bootstrap統(tǒng)計技術(shù)
6、,根據(jù)原始樣本量大小進行有放回等樣本重復(fù)抽樣,每次抽樣200次,然后對這200個復(fù)樣本進行統(tǒng)計分析。
2.模型評價
分別從準確性、精確性和和模型擬合度三個方面,使用絕對偏倚、置信區(qū)間覆蓋率、標準誤、置信區(qū)間寬度和模型擬合度五個指標對模擬的結(jié)果進行全面、客觀科學(xué)的評價。綜合以上五個指標可全面評價模型模擬的結(jié)果,為今后醫(yī)學(xué)數(shù)據(jù)不同模型評價提供了方法學(xué)參考。
3.實例分析
將構(gòu)建的零膨脹模型應(yīng)用于衛(wèi)生服
7、務(wù)調(diào)查實例研究中,大樣本的實例分析選擇對上海市居民患慢性病數(shù)的影響因素進行分析;小樣本的實例分析選擇對上海市浦東新區(qū)農(nóng)業(yè)戶口居民年住院次數(shù)的影響因素進行分析。實例分析中構(gòu)建不同的模型進行統(tǒng)計分析,并對模擬研究的結(jié)果進行實例驗證。
研究結(jié)果:
本研究的結(jié)果分成兩個部分,分別是基于大樣本和小樣本兩個不同的部分。基于大樣本構(gòu)建四個模型。先從準確度和精確度方面進行比較,然后比較所有模型的擬合優(yōu)度指標AIC值。當樣本量為100
8、0、500時,我們發(fā)現(xiàn)這兩個傳統(tǒng)計數(shù)模型隨著零比例的增加,在準確度方面,其絕對偏倚的值是不斷增加的,置信區(qū)間的覆蓋率也越來越低;在精確度方面,標準誤也是增大的趨勢,其置信區(qū)間的寬度不斷增加。由此可見,傳統(tǒng)計數(shù)模型模擬結(jié)果的準確性和精確性并不高,傳統(tǒng)計數(shù)模型對于零過多數(shù)據(jù)的模擬結(jié)果并不是很理想。然而,相同條件下零膨脹模型的模擬結(jié)果比傳統(tǒng)計數(shù)模型要好很多?;A(chǔ)零膨脹模型的AIC值,普遍比基礎(chǔ)計數(shù)模型的AIC值小,即基礎(chǔ)零膨脹模型的擬合度比基
9、礎(chǔ)計數(shù)模型要好,而負二項回歸擬合度優(yōu)于泊松回歸。在零比例為0.6、0.7時,模型擬合度比較分別為:零膨脹泊松回歸模型優(yōu)于零膨脹負二項回歸優(yōu)于負二項回歸優(yōu)于泊松回歸;零比例在0.8、0.9時,零膨脹泊松回歸與零膨脹負二項回歸的擬合度基本一致,均優(yōu)于負二項回歸,負二項回歸又優(yōu)于泊松回歸。
基于小樣本構(gòu)建四個模型。在樣本量為100,零比例為0.8、0.7、0.6時,貝葉斯泊松回歸和貝葉斯負二項回歸這兩種模型的準確度和精確度。我們發(fā)現(xiàn)
10、這兩個模型在隨著零所占的比例增加,在準確度方面和精確度方面以及模型的擬合度方面均不是很理想。在比例為0.9時,貝葉斯泊松模型和貝葉斯負二項模型無法擬合,可見貝葉斯傳統(tǒng)計數(shù)模型對于小樣本零過多計數(shù)數(shù)據(jù)的模擬結(jié)果并不是很理想。在零比例為0.6、0.7、0.8時,從模型準確度、精確度和擬合度方面比較分別為:零膨脹泊松回歸模型與零膨脹負二項回歸模型模擬結(jié)果相差不大,貝葉斯負二項回歸模型優(yōu)于貝葉斯零膨脹模型優(yōu)于貝葉斯泊松回歸模型;零比例在0.9時
11、,貝葉斯零膨脹泊松回歸與貝葉斯零膨脹負二項回歸的模擬結(jié)果基本一致,均優(yōu)于貝葉斯傳統(tǒng)計數(shù)回歸模型。
實例分析中基于大樣本的統(tǒng)計分析結(jié)果與模型數(shù)據(jù)模擬的結(jié)果較一致,驗證了對于零過多數(shù)據(jù)零膨脹模型優(yōu)于傳統(tǒng)計數(shù)模型,并得到了影響上海市居民患慢性病數(shù)的一系列危險因素?;谛颖镜慕y(tǒng)計分析結(jié)果與模型數(shù)據(jù)模擬的結(jié)果也比較一致。
研究結(jié)論:
根據(jù)衛(wèi)生服務(wù)調(diào)查數(shù)據(jù)不同的零過多計數(shù)數(shù)據(jù)特點,選擇合適的零膨脹模型分析方法優(yōu)于傳統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 嵌套logit模型及其在衛(wèi)生服務(wù)利用分析中的應(yīng)用.pdf
- 改進的零膨脹二項分布模型及其應(yīng)用.pdf
- 零膨脹數(shù)據(jù)的幾種模型及應(yīng)用.pdf
- 零膨脹模型在車險理賠次數(shù)中的應(yīng)用與研究.pdf
- 匯率波動模型構(gòu)建及其在風險價值測度應(yīng)用中的研究.pdf
- 復(fù)雜網(wǎng)絡(luò)模型構(gòu)建及其在知識系統(tǒng)中的應(yīng)用.pdf
- 服務(wù)劇場模型的改進及其在飯店管理中的應(yīng)用.pdf
- 社區(qū)衛(wèi)生服務(wù)建設(shè)進程中的居民滿意度調(diào)查研究.pdf
- 領(lǐng)域本體構(gòu)建及其在專利信息服務(wù)中的研究與應(yīng)用.pdf
- 微信在中學(xué)班級管理中應(yīng)用的調(diào)查研究.pdf
- 個性化健康信息服務(wù)在移動客戶端中應(yīng)用的調(diào)查研究
- 聚類分析算法的研究及其在社區(qū)衛(wèi)生服務(wù)系統(tǒng)中的應(yīng)用.pdf
- 淺談?wù){(diào)查研究方法在保險專業(yè)研究中的應(yīng)用
- 淺談?wù){(diào)查研究方法在保險專業(yè)研究中的應(yīng)用
- 混合潛變量模型的構(gòu)建及其在基因關(guān)聯(lián)分析中的應(yīng)用.pdf
- 轉(zhuǎn)基因細胞模型的構(gòu)建及其在致癌活性檢測中的應(yīng)用.pdf
- 不同統(tǒng)計模型在公共衛(wèi)生研究中的應(yīng)用.pdf
- 個性化健康信息服務(wù)在移動客戶端中應(yīng)用的調(diào)查研究.pdf
- 物聯(lián)網(wǎng)技術(shù)在設(shè)施農(nóng)業(yè)中應(yīng)用的調(diào)查研究.pdf
- 關(guān)于加速膨脹宇宙中f_引力模型構(gòu)建的研究.pdf
評論
0/150
提交評論