多水平模型和關(guān)聯(lián)規(guī)則聯(lián)合研究胃食管反流病影響因素.pdf_第1頁
已閱讀1頁,還剩134頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、研究背景: 胃食管反流病(Gastroesophageal reflux disease,GERD)以燒心和反酸為主要的特征性癥狀,在西方國家人群中是一種常見的胃腸疾病。已有研究結(jié)果表明,亞洲人群的GERD發(fā)病率較西方人群低,但目前西方及亞洲人群的GERD發(fā)病率都呈現(xiàn)增長的趨勢。GERD患者不僅容易合并其他食管合并癥,而且患食管腺癌的危險也大大增加。GERD不僅使患者的生活質(zhì)量受到顯著影響,還給患者造成了較大的經(jīng)濟負擔(dān)。因此,西

2、方多個國家的研究者對于GERD發(fā)病情況及其影響因素進行了流行病學(xué)調(diào)查研究。然而,在中國,人們對于GERD的認知程度還比較低,對其危害還沒有足夠的認識;而針對GERD的基于中國一般人群采用國際標(biāo)準(zhǔn)化量表進行的高質(zhì)量流行病學(xué)調(diào)查也非常有限。為了調(diào)查GERD在中國一般人群的癥狀患病情況,研究其影響因素的相關(guān)信息,我們在中國大陸進行了一項大規(guī)模的GERD流行病學(xué)調(diào)查。本調(diào)查采用多階段分層隨機抽樣的方法和自填式的問卷調(diào)查方式,共在上海、北京、武漢

3、、西安和廣州五個城市獲得有效調(diào)查問卷16078份。本調(diào)查收集的資料豐富,且數(shù)據(jù)存在明顯的層次結(jié)構(gòu)特征,并包含一定的缺失值。而傳統(tǒng)統(tǒng)計方法對于此類數(shù)據(jù)的處理存在明顯的局限性,如要求各觀察值相互獨立、無缺失值等。 研究目的: 為了克服傳統(tǒng)統(tǒng)計方法的局限性,本研究探討了聯(lián)合應(yīng)用關(guān)聯(lián)規(guī)則和多水平模型,以更加科學(xué)、合理的分析和挖掘中國大陸GERD流行病學(xué)調(diào)查資料,研究和篩選GERD的影響因素,以提高人們對GERD的認知程度,為GE

4、RD的早期預(yù)防和治療提供一定的理論依據(jù)。 研究方法: 關(guān)聯(lián)規(guī)則挖掘算法作為數(shù)據(jù)挖掘中的一種經(jīng)典算法,具有較強的處理不完整數(shù)據(jù)的能力,可以充分發(fā)現(xiàn)隱藏在數(shù)據(jù)中的未知的、新穎的模式,對數(shù)據(jù)的整體理解和進一步分析提供參考。采用關(guān)聯(lián)規(guī)則挖掘算法不僅可以減少缺失值的影響,而且還可以發(fā)現(xiàn)那些潛在的影響因素,及其相互之間的關(guān)系和對GERD的聯(lián)合作用,并為隨后的多水平模型建模時解釋變量的選擇提供依據(jù)。 多水平模型是國外近些年發(fā)展

5、起來的處理多水平數(shù)據(jù)的一種多元統(tǒng)計方法,已廣泛應(yīng)用于多個領(lǐng)域。多水平數(shù)據(jù)的組群間具有一定的組間異質(zhì)性,即存在一定的組內(nèi)同質(zhì)性,不符合多元線性回歸等傳統(tǒng)統(tǒng)計方法要求各觀察單位相互獨立的假設(shè),而多水平模型則克服了傳統(tǒng)統(tǒng)計方法的局限性,減少了估計偏倚。因此,本研究在關(guān)聯(lián)規(guī)則初步挖掘出的GERD影響因素的基礎(chǔ)上,采用多水平模型建模,以解決傳統(tǒng)統(tǒng)計方法因忽略數(shù)據(jù)的層次結(jié)構(gòu)所帶來的問題,更科學(xué)的揭示GERD的影響因素。 研究結(jié)果:

6、本研究系統(tǒng)總結(jié)了關(guān)聯(lián)規(guī)則挖掘的基本理論和主要算法,以及規(guī)則有趣性的度量方法。然后,利用SAS/EM中經(jīng)典的Apriori算法進行了關(guān)聯(lián)規(guī)則挖掘。規(guī)則產(chǎn)生后,首先采用模板匹配的方式進行規(guī)則的初步篩選,再通過將可信度的提高倍數(shù)定為0.05的方法進行多項規(guī)則的剪除,最后根據(jù)常用的客觀度量指標(biāo)的相關(guān)性分析結(jié)果,選擇了Lift值、PS值、Interest值、Fitness函數(shù)、列聯(lián)系數(shù)、Fisher確切概率6個度量指標(biāo)進行規(guī)則有趣性的度量。

7、 根據(jù)最終選取的規(guī)則,本研究發(fā)現(xiàn)調(diào)查點、調(diào)查區(qū)域(城市、農(nóng)村)、性別、年齡、吸煙、飲酒、婚姻狀況、家庭月收入、職業(yè)、健康狀況、文化程度、精神狀況、體力活動或體育鍛煉、胃腸疾病或腫瘤家族史等被調(diào)查者基本信息,部分既往患病史(如消化不良、慢性胃炎、風(fēng)濕性關(guān)節(jié)炎、慢性咽喉炎、腹部手術(shù)史等),以及腸易激綜合征、吞氣癥、非特異性腸功能紊亂等現(xiàn)患疾病對胃食管反流癥狀有影響??傊狙芯坷藐P(guān)聯(lián)規(guī)則挖掘算法,不僅對GERD的影響因素有了初步的了解,

8、而且為后續(xù)的多水平模型建模時解釋變量的選擇提供了參考。 然后,本研究系統(tǒng)回顧了多水平模型的基本理論和建模步驟,以及殘差自助法多水平模型的建模方法。通過對GERD流行病學(xué)調(diào)查數(shù)據(jù)結(jié)構(gòu)特征的分析,最終確定以街道(鄉(xiāng)鎮(zhèn))為水平2單位,以居民為水平1單位,擬合兩水平的多水平模型。本研究通過“擬合空模型→將水平2解釋變量“調(diào)查點”納入空模型→采用前進法篩選納入水平1解釋變量→檢驗水平1解釋變量的隨機斜率→檢驗跨層交互作用”這五個步驟,建立

9、了本研究的最終模型。另考慮到本研究水平2組群數(shù)相對較少,且水平1殘差eii不服從正態(tài)分布,不符合最大似然法的應(yīng)用假設(shè),故本研究又基于最終模型分別采用非參數(shù)和參數(shù)殘差自助法進行模型擬合,以減少模型擬合造成的偏倚。研究結(jié)果表明,非參數(shù)法和參數(shù)法的擬合結(jié)果多數(shù)與原始樣本比較接近,只是參數(shù)法的標(biāo)準(zhǔn)誤相對較非參數(shù)法稍大,尤其是水平1殘差方差(σ)2的標(biāo)準(zhǔn)誤遠遠大于非參數(shù)法和原始樣本,與我們的理論假設(shè)是一致的。原因在于,原始樣本的水平1殘差eii不

10、服從正態(tài)分布,非參數(shù)法考慮了這一點,而參數(shù)法則假設(shè)其服從正態(tài)分布。 總之,多水平模型分析結(jié)果顯示,與廣州相比,上海、北京和西安居民的GERD總評分沒有明顯的差異,而武漢居民的GERD總評分則相對較高,即表示武漢的GERD發(fā)病率在5個調(diào)查城市中相對較高;居民的總體健康狀況越差,其GERD總評分越高,且其對GERD總評分的影響受到武漢與廣州之間地域差異的影響:農(nóng)村居民、文化程度越低、精神狀況越差者更容易患GERD;另外,那些有胃腸道

11、疾病或腫瘤家族史,既往患有胃炎、消化不良、風(fēng)濕性關(guān)節(jié)炎,現(xiàn)患有腸易激綜合征、吞氣癥的人,患GERD的可能性更大,而性別、年齡等因素,本研究未發(fā)現(xiàn)其與GERD有顯著的關(guān)系。而上述結(jié)論中,除了未發(fā)現(xiàn)城市居民和農(nóng)村居民在GERD發(fā)病方面有顯著差異之外,非參數(shù)法和參數(shù)法的其他結(jié)論與原始樣本基本一致。 研究結(jié)論: 本研究采用國際規(guī)范的標(biāo)準(zhǔn)化量表,在中國大陸進行了截至目前為止規(guī)模最大的一次GERD流行病學(xué)調(diào)查,建立了中國大陸GERD

12、流行病學(xué)調(diào)查數(shù)據(jù)庫,并深入分析了GERD的影響因素。結(jié)果表明,在調(diào)查的五個城市中武漢的GERD發(fā)病情況最重:農(nóng)村居民、文化程度越低、健康狀況和精神狀況越差者,以及有胃腸道疾病或腫瘤家族史的人更可能患GEKD;而那些既往患有慢性胃炎、消化不良、風(fēng)濕性關(guān)節(jié)炎,現(xiàn)患有腸易激綜合征、吞氣癥的人,同樣也更可能患GERD。而性別、年齡、吸煙、飲酒、家庭收入、婚姻狀況、職業(yè)、體力活動或體育鍛煉等因素,以及慢性咽喉炎、腹部手術(shù)史和非特異性腸功能紊亂等疾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論