版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、,,預防醫(yī)學,第十章 人群健康研究的 統(tǒng)計學方法,目錄,第一節(jié) 統(tǒng)計學概述一、統(tǒng)計學的意義二、統(tǒng)計學中的幾個基本概念三、統(tǒng)計資料的類型四、統(tǒng)計工作的基本步驟第二節(jié) 統(tǒng)計表和統(tǒng)計圖一、統(tǒng)計表二、統(tǒng)計圖,目錄,第三節(jié) 數(shù)值變量資料的統(tǒng)計分析一、數(shù)值變量資料的統(tǒng)計描述二、數(shù)值變量資料的統(tǒng)計推斷第四節(jié) 分類變量資料的統(tǒng)計分析一、分類變量資料的統(tǒng)計描述二、分類變量資料的統(tǒng)計推斷,學習
2、目標,1. 掌握:總體、樣本等統(tǒng)計學基本概念;統(tǒng)計資料的類型;統(tǒng)計表及統(tǒng)計圖的制作;數(shù)值變量資料和分類變量資料統(tǒng)計描述的指標、計算及適用條件;數(shù)值變量資料和分類變量資料區(qū)間估計的方法,常用的假設(shè)檢驗方法及應(yīng)用條件。2. 熟悉:醫(yī)學統(tǒng)計工作的基本步驟;頻數(shù)表的編制方法;正態(tài)分布曲線下的面積分布規(guī)律及參考值范圍的制訂。3. 了解:t分布的特征;統(tǒng)計中兩型錯誤。,重點及難點,重點:總體和樣本的概念;統(tǒng)計資料的類型;統(tǒng)計表及統(tǒng)計圖的制作要求
3、;數(shù)值變量資料和分類變量資料統(tǒng)計描述的指標、計算及適用條件;抽樣誤差與標準誤;數(shù)值變量資料和分類變量資料區(qū)間估計的方法;常用假設(shè)檢驗方法及應(yīng)用條件。難點:抽樣誤差與標準誤;t分布與t界值;假設(shè)檢驗的基本思想;P值的含義;假設(shè)檢驗中的兩型錯誤;分布與 檢驗。,第十章 第一節(jié),丁可 南陽醫(yī)學高等??茖W校,第一節(jié) 統(tǒng)計學概述,統(tǒng)計學(statistics)是研究數(shù)據(jù)的收集、整理、分析的一門科學,是認識社會和自然現(xiàn)象客觀規(guī)律數(shù)量
4、特征的重要工具。統(tǒng)計學方法就是幫助人們透過偶然現(xiàn)象認識其內(nèi)在的規(guī)律性,揭示疾病或現(xiàn)象發(fā)生、發(fā)展規(guī)律,為預防疾病、促進健康提供客觀依據(jù)。,第十章 第一節(jié),(一)同質(zhì)與變異同質(zhì)(homogeneity)是指被研究指標的影響因素相同變異(variable)是同質(zhì)基礎(chǔ)上的各觀察單位(亦稱為個體)之間的差異,第十章 第一節(jié),(二)總體與樣本總體(population)是指根據(jù)研究目的確定的同質(zhì)觀察單位的全體樣本(sample)從總體
5、中隨機抽取的部分觀察單位,其測量值(或變量值)的集合,第十章 第一節(jié),(三)變量與變量值總體(population)是指根據(jù)研究目的確定的同質(zhì)觀察單位的全體樣本(sample)從總體中隨機抽取的部分觀察單位,其測量值(或變量值)的集合,第十章 第一節(jié),(四)參數(shù)與統(tǒng)計量參數(shù)(parameter)是指總體的統(tǒng)計指標。習慣上用希臘字母表示總體參數(shù)統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標。習慣上用拉丁字母表示統(tǒng)計量,第十章
6、 第一節(jié),(五)誤差1. 系統(tǒng)誤差(systematic error):測量結(jié)果又傾向性。查明原因,可以避免。2.隨機測量誤差(random error of measurement):測量結(jié)果沒有傾向性。不可避免。3. 抽樣誤差(sampling error):由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及各樣本統(tǒng)計量之間的差異稱為抽樣誤差。變異是絕對的,抽樣誤差不可避免。,第十章 第一節(jié),(六)概率概率(proba
7、bility)是描述某隨機事件發(fā)生可能性大小的量值,常用符號P表示。隨機事件的概率在0~1之間,即0≤P≤1。小概率事件:P≤0.05或P≤0.01的事件。統(tǒng)計學上,認為小概率事件在一次抽樣中幾乎不可能發(fā)生。,第十章 第一節(jié),(一)數(shù)值變量資料數(shù)值變量資料(measurement data)亦稱定量資料(quantitative data)或計量資料(numerical variable data)(二)分類變量資料分類變量資
8、料(categorical variable data)又稱定性資料(qualitative data)1.無序分類(unordered categories)2.有序分類(ordered categories),第十章 第一節(jié),資料類型的劃分是根據(jù)研究目的確定的,而統(tǒng)計分析方法的選用,則與資料類型密切相關(guān)。在資料的分析過程中,根據(jù)有關(guān)專業(yè)理論和實際需要,各類資料間可以互相轉(zhuǎn)化,以滿足不同統(tǒng)計分析方法的要求。,第十章 第一節(jié),(
9、一)統(tǒng)計設(shè)計:第一步,最關(guān)鍵的環(huán)節(jié)(二)收集資料:經(jīng)常性資料和一時性資料(三)整理資料:查漏補缺,系統(tǒng)化、條理化(四)分析資料 1. 統(tǒng)計描述 2. 統(tǒng)計推斷,第十章 第一節(jié),第十章 第二節(jié),丁可 南陽醫(yī)學高等??茖W校,(一)統(tǒng)計表的結(jié)構(gòu)和制表要求 1. 統(tǒng)計表主要有標題、標目(包括橫標目、縱標目)、線條、數(shù)字和備注五部分構(gòu)成。 2. 編制統(tǒng)計表主要的要求是表的中心內(nèi)容要
10、突出,一張表表達一個中心問題為宜。,第十章 第二節(jié),第十章 第二節(jié),(一)統(tǒng)計表的種類 1. 簡單表,第十章 第二節(jié),(一)統(tǒng)計表的種類 2.復合表,第十章 第二節(jié),(一)統(tǒng)計表的類型與選擇 1. 資料是連續(xù)性的,其目的是用線段升降表達事物的動態(tài)變化趨勢,選擇普通線圖; 2. 表示變量分布的頻數(shù)表資料,其目的是用直方的面積表達各組段的頻數(shù)或頻率分布情況,宜選擇直方圖; 3. 資料是相互獨立的,其目的是
11、用直條的長短比較數(shù)值的大小,選擇直條圖;,第十章 第二節(jié),(一)統(tǒng)計表的類型與選擇4. 事物內(nèi)部各部分的百分構(gòu)成比資料,其目的是用面積大小表達各部分所占的比重大小,則應(yīng)選擇圓圖;5. 雙變量連續(xù)性資料,其目的是用點的密集程度和趨勢表達兩個變量的相互關(guān)系,選擇散點圖;6. 資料是連續(xù)性的,其目的是比較兩組或多組資料的集中趨勢和離散趨勢,宜選擇箱式圖。,第十章 第二節(jié),(二)制圖通則1. 根據(jù)資料性質(zhì)和分析目的正確選用適當?shù)?/p>
12、統(tǒng)計圖。2. 要有標題,簡明扼要地說明統(tǒng)計圖資料的時間、地點和主要內(nèi)容,一般放在圖下方。3. 繪制有坐標軸的圖形時,縱橫兩軸應(yīng)有標目并注明單位。一般將兩軸的相交點即原點初定為0??v橫軸比例一般以5∶7或7∶5為宜。4. 在同一張圖內(nèi)比較不同事物時,須用不同線條或顏色來表示,并附圖例加以說明。,第十章 第二節(jié),(三)常用統(tǒng)計圖及其繪制方法1. 直條圖(bar graph) 直條圖是以等寬直條(柱)的長短來表示各指標數(shù)值的大小。
13、適用于指標為各自獨立的分類資料。,第十章 第二節(jié),第十章 第二節(jié),第十章 第二節(jié),(三)常用統(tǒng)計圖及其繪制方法2.構(gòu)成圖(constituent ratio chart) 它是以圖形的面積大小表示事物內(nèi)部各組成部分所占比重或比例。適用于按性質(zhì)分類、能計算構(gòu)成比的資料。構(gòu)成圖可分為圓形圖和百分條圖。,第十章 第二節(jié),第十章 第二節(jié),圖10-3 復方豬膽囊治療單純型老年氣管炎近期療效比較,第十章 第二節(jié),圖10-4 復方豬膽
14、囊治療老年性氣管炎近期療效比較,(三)常用統(tǒng)計圖及其繪制方法3.線圖(line graph):用線段的升降來表示某事物(某現(xiàn)象)隨時間或條件而變化的趨勢。適用于連續(xù)性資料。,第十章 第二節(jié),第十章 第二節(jié),(三)常用統(tǒng)計圖及其繪制方法4.直方圖(histogram) 直方圖又稱頻數(shù)分布圖,是以各矩形的面積表示各組段的頻數(shù),各矩形面積的總和為總頻數(shù),適用于表示連續(xù)性資料的頻數(shù)分布。,第十章 第二節(jié),第十章 第二節(jié),圖10-
15、6 某市某年150名3歲女孩身高頻數(shù)分布,(三)常用統(tǒng)計圖及其繪制方法 5. 散點圖(scatter diagram) 散點圖是用點的密集程度和變化趨勢來表示兩種現(xiàn)象間的相關(guān)關(guān)系。適用于雙變量資料,均具有連續(xù)性變化的特征。,第十章 第二節(jié),第十章 第二節(jié),圖10-7 15名8歲男孩身高與坐高散點圖,(三)常用統(tǒng)計圖及其繪制方法 6.箱式圖(box plot) 用于比較兩組或多組資料的集中趨勢和離散趨勢,箱式圖
16、的中間橫線表示中位數(shù),箱子的長度表示四分位數(shù)間距,兩端分別是P75和P25,箱式圖最外面兩端連線表示最大值和最小值。,第十章 第二節(jié),第十章 第二節(jié),圖10-8 抑腫瘤藥不同劑量與對照組用藥后小白鼠腫瘤重量的比較,第三節(jié) 數(shù)值變量資料的統(tǒng)計分析,劉琥 濟寧醫(yī)學院,1. 頻數(shù)表的編制,編制頻數(shù)表步驟流程圖,(一)頻數(shù)分布,2.頻數(shù)分布表的用途,(1)揭示數(shù)值變量頻數(shù)分布的類型和特征 (2)作為陳述資料的形式(3)便于發(fā)現(xiàn)一
17、些特大或特小的可疑值(4)便于進一步的統(tǒng)計分析,3.數(shù)值變量資料頻數(shù)分布的類型和特征,44,1.算術(shù)均數(shù)(mean) 樣本均數(shù): 總體均數(shù):(1)應(yīng)用:對稱分布資料,尤其是正態(tài)分布資料。(2 )計算直接法加權(quán)法,(二)集中趨勢指標,45,2.幾何均數(shù)(geometric mean):(1)應(yīng)用:等比數(shù)列資料;對數(shù)正態(tài)分布資料(2) 計算:直接法 加權(quán)法,46,3.中位數(shù)(median)(
18、1)概念:將一組觀察值從小到大按順序排列,位次具中的觀察值就是中位數(shù)。(2)應(yīng)用:偏態(tài)分布;分布一端或兩端無確定數(shù)據(jù);資料的分布情況不清楚。(3)計算:直接法 頻數(shù)表法,離散趨勢即個體值之間的變異程度,數(shù)據(jù)越分散,變異程度越高。極差四分位數(shù)間距方差標準差變異系數(shù),47,(三)離散趨勢指標,48,1.全距(R) 全距也稱極差,是一組觀察值中最大值與最小值之差。反映個體變異的
19、范圍。全距大,說明離散程度大;反之,說明離散程度小。缺點:(1)除了最大值和最小值外,不能反映組內(nèi)其他數(shù)據(jù)的離散程度。(2)樣本含量懸殊時不宜比較其全距。(3)即使樣本含量不變,全距的抽樣誤差亦較大,即不夠穩(wěn)定。,49,2.四分位數(shù)間距(Q) 上四分位數(shù)(P75)與下四分位數(shù)(P25)之差 Q= P75- P25 四分位數(shù)間距可看成中間一半變量值的全距。它與全距類似,數(shù)值越大,說明變異程度越
20、大;反之,說明變異度越小。 用四分位數(shù)間距作為說明個體差異的指標,比全距穩(wěn)定,但仍然未考慮到每個觀察值的離散程度。 應(yīng)用:與中位數(shù)結(jié)合用于說明偏態(tài)分布資料的特征。,50,3.方差全面地考慮每個變量值的離散程度。離均差:總和為零離均差平方和:除了與變異度有關(guān)外,還與變量值的個數(shù)有關(guān)。取其均數(shù),即為方差。,,51,,,4.標準差(standard deviation)總體方差開平方,就是總體標準差。標準差越大,說明個體
21、的變異就越大,則平均數(shù)的代表性就越差。計算: 直接法: 加權(quán)法:,52,,標準差的應(yīng)用(1)用于描述正態(tài)分布數(shù)值變量資料的離散程度。(2)結(jié)合均數(shù)描述正態(tài)分布的特征,估計參考值范圍。(3)用于計算變異系數(shù)。(4)用于計算標準誤。,53,5.變異系數(shù)(coefficient of variation)即標準差與均數(shù)之比用百分數(shù)表示。變異系數(shù)是相對數(shù),沒有單位。變異系數(shù)愈小 ,說明一組變量值的變異程度愈小 ;反之,變
22、異系數(shù)愈大,說明變異程度大。應(yīng)用:(1) 比較度量衡單位不同的多組資料的變異度。(2) 比較均數(shù)相差較大的幾組資料的變異度。,變異指標小結(jié),54,1.極差較粗,適合于任何分布。2.標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布。3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標和變異指標分別反映資料的不同特征, 常配套使用如 正態(tài)分布:均數(shù)、標準差; 偏態(tài)分布:中位數(shù)、四分位數(shù)間
23、距,55,1.正態(tài)分布的特征(1)正態(tài)曲線在橫軸上方均數(shù)處最高。(2)正態(tài)分布以均數(shù)為中心,左右對稱。(3)正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。均數(shù)是位置參數(shù),標準差是變異度參數(shù)。(4)正態(tài)曲線下的面積分布有一定規(guī)律。,(四)正態(tài)分布與醫(yī)學參考值范圍,曲線下面積分布規(guī)律,2.參考值范圍的估計,醫(yī)學參考值:大多數(shù)正常人某指標的波動范圍?!罢H恕辈皇侵竿耆】档娜耍菦]有患有影響研究指標疾病或有關(guān)因素的同質(zhì)人群。,57,制訂參
24、考值范圍的步驟,(1)明確研究總體,從“正常人”總體中抽樣(2)統(tǒng)一測定方法以控制測量誤差。(3)判斷是否需要分組(如性別、年齡)確定。(4)根據(jù)專業(yè)知識決定單側(cè)還是雙側(cè)。(5)確定適當?shù)陌俜址秶?。?)根據(jù)資料的分布類型選定適當?shù)姆椒ㄟM行范圍估計。,58,59,兩種方法計算95%參考值范圍,,(一)均數(shù)的抽樣誤差與標準誤,概念:樣本統(tǒng)計量的標準差叫做標準誤。意義:是描述均數(shù)抽樣誤差大小的統(tǒng)計指標。是樣本均數(shù)的標準差,反映含
25、量相同的樣本均數(shù)的離散趨勢或變異程度。同類性質(zhì)的資料,均數(shù)的標準誤越大,說明樣本均數(shù)的變異程度越大,樣本均數(shù)圍繞總體均數(shù)分布越分散,樣本均數(shù)與總體均數(shù)越遠離,因此,用樣本均數(shù)推論總體均數(shù)的可靠性越小,抽樣誤差越大。,二、數(shù)值變量資料的統(tǒng)計推斷,抽樣誤差,數(shù)值變量資料,標準誤,,均數(shù)標準誤的用途1.可用來衡量樣本均數(shù)的可靠性,反映抽樣誤差的大小。標準誤越小,說明樣本均數(shù)間的離散程度越小,用樣本均數(shù)估計總體均數(shù)越可靠,反之亦然。2.可
26、用來估計總體均數(shù)的可信區(qū)間。3.可用于均數(shù)的假設(shè)檢驗。,(二)t分布,t 分布特征:1. 單峰分布,以0為中心左右對稱。2. t 分布是一簇曲線,其形狀受自由度ν的影響。,t 界值,統(tǒng)計學家已將各種自由度對應(yīng)的t分布曲線下的尾部面積(概率)的百分界值編制成t界值表。 由于t分布是以0為中心的對稱分布,故表中只列出正值,所以查表時,不管t 值正負只用絕對值。 表右上角插圖中陰影部分,表示tα
27、/2,ν以外尾部面積占總面積的百分數(shù),即概率P。 隨著自由度?的增大,t界值逐漸減小,當自由度無窮大時,雙側(cè)t0.05=1.96,單側(cè)t0.05,=1.645,即為u分布的界值。,64,(三)總體均數(shù)的估計,點估計數(shù)值變量資料: →區(qū)間估計,參數(shù)估計的方法(數(shù)值變量資料),總體均數(shù)95%可信區(qū)間σ已知 σ未知,且樣本量較小 σ未知,且樣本量較大,(四)假設(shè)檢驗的意義和基本步驟,基本步驟1.建立假
28、設(shè):注意單側(cè)還是雙側(cè)2.確定檢驗水準3.選定檢驗方法,計算統(tǒng)計量4.確定概率P值,作出推斷結(jié)論,對資料性質(zhì)的要求(數(shù)值變量資料),各樣本是相互獨立的隨機樣本各樣本都來自正態(tài)分布的總體各個總體方差齊,1.樣本均數(shù)與總體均數(shù)比較,(1)小樣本均數(shù)與總體均數(shù)比較,(2)大樣本均數(shù)與總體均數(shù)比較,(3)已知總體標準差時,,2.配對數(shù)值變量資料的比較,3.兩樣本均數(shù)的比較,(1)兩小樣本均數(shù)的比較,,(2)兩大樣本均數(shù)的比較,72,假設(shè)
29、檢驗應(yīng)注意的問題1.資料必須合乎隨機化抽樣的原則2.選用的假設(shè)檢驗方法應(yīng)符合其應(yīng)用條件3.實際差別大小與統(tǒng)計意義的區(qū)別4.判斷不能絕對化5.單雙側(cè)檢驗的選擇,73,假設(shè)檢驗中的兩類錯誤 Ⅰ型錯誤(第Ⅰ 類錯誤):拒絕了實際上成立的H0,這類“棄真”的錯誤稱為Ⅰ型錯誤,其大小用α表示。 Ⅱ型錯誤(第Ⅱ 類錯誤):不拒絕實際上不成立的H0,這類“取偽”的錯誤稱為Ⅱ型錯誤,其概率大小用β表示。
30、β值的大小在進行假設(shè)檢驗時一般并不知道。,假設(shè)檢驗中的兩類錯誤,第四節(jié) 分類變量資料的統(tǒng)計分析,劉琥 濟寧醫(yī)學院,一、分類變量資料的統(tǒng)計描述(一)常用的相對數(shù)指標率構(gòu)成比相對比,77,1、率,率(rate)稱為頻率指標或強度指標,它說明某現(xiàn)象發(fā)生的頻率程度或強度。,78,2、構(gòu)成比,構(gòu)成比(constituent ratio)稱為構(gòu)成指標,它反映事物內(nèi)部各組成部分所占整體的比重或分布。,79,3、相對比,相對比(relat
31、ive ratio)也稱比,是A、B兩個有關(guān)聯(lián)的指標之比。說明A是B的若干倍或百分之幾。,(二)應(yīng)用相對數(shù)的注意事項,1.計算相對數(shù)時分母不宜過小,2.資料分析時不能以構(gòu)成比代替率,3.注意資料的可比性,4.正確計算平均率,5.樣本率或構(gòu)成比的比較應(yīng)做假設(shè)檢驗,二、分類變量資料的統(tǒng)計推斷,(一)率的抽樣誤差和標準誤,82,,率的抽樣誤差與標準誤,,(理論值),(估計值),83,(二)總體率可信區(qū)間,1.正態(tài)近似法:當樣本含量n足夠大,樣
32、本率P或1-P均不太小時,樣本率的分布近似正態(tài)分布??傮w率95%的可信區(qū)間: 2.查表法:當n較小,如〈50,特別是P接近于0或1時,按二項分布原理估計總體率的可信區(qū)間。,(三)卡方檢驗,基本思想:檢驗實際頻數(shù)和理論頻數(shù)的吻合程度。,T≥5,且n≥40:直接使用基本公式或?qū)S霉?≤T<5,且n≥40:用連續(xù)性校正 檢驗T<1或n<40:用精確概率法,1.四格表資料的卡方檢驗,基本公式,專用公式,,,,,2. 配對四格表資料的卡
33、方檢驗,要求:不能有1/5以上的格子理論頻數(shù)小于5,或者不能有任意一個格子的理論頻數(shù)小于1。,,3.行列表資料的卡方檢驗,本章小結(jié),本章重點講述了醫(yī)學統(tǒng)計學基本概念、統(tǒng)計資料的類型、統(tǒng)計圖表的制作及具體的統(tǒng)計分析方法。統(tǒng)計分析時,首先要明確資料類型,確定設(shè)計類型,然后選擇不同的方法進行統(tǒng)計分析。數(shù)值變量資料的統(tǒng)計描述重點講述了集中趨勢、離散趨勢指標及其應(yīng)用條件。數(shù)值變量資料的統(tǒng)計推斷講述了區(qū)間估計和假設(shè)檢驗兩個方面。應(yīng)用中要注意各公式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 預防醫(yī)學緒論
- 預防醫(yī)學實驗
- 預防醫(yī)學肺炎
- 預防醫(yī)學串講
- 《預防醫(yī)學》試題
- 預防醫(yī)學4
- 明清道教醫(yī)學研究.pdf
- 《預防醫(yī)學》試
- 預防醫(yī)學輻射
- 預防醫(yī)學答案
- 預防醫(yī)學作業(yè)
- 預防醫(yī)學]醫(yī)學科研設(shè)計
- 劉立新圍產(chǎn)醫(yī)學
- 新編預防醫(yī)學預防醫(yī)學生產(chǎn)環(huán)境與健康
- 明清時期的徽州醫(yī)學.pdf
- 社區(qū)預防醫(yī)學輔導
- 預防醫(yī)學pbl水俁病
- 預防醫(yī)學的心得
- 口腔預防醫(yī)學-緒論
- 預防醫(yī)學自考重點
評論
0/150
提交評論