版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第1章緒論,第1頁 共666頁,醫(yī)學本科生用醫(yī) 學 統(tǒng) 計 學,主講 程 琮,泰山醫(yī)學院預防醫(yī)學教研室zcheng@tsmc.edu.cn,第1章緒論,第2頁 共666頁,The teaching planfor medical students,Professor Cheng Cong,Dept. of Preventive Medicine Taishan Medical C
2、ollege,第1章緒論,第3頁 共666頁,預防醫(yī)學教授,碩士生導師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫(yī)學院公共衛(wèi)生專業(yè)五年本科畢業(yè),獲醫(yī)學學士學位。1994年7月,上海醫(yī)科大學公共衛(wèi)生學院研究生畢業(yè),獲醫(yī)學碩士學位。2003年12月晉升教授?,F(xiàn)任預防醫(yī)學教研室副主任。主要從事《醫(yī)學統(tǒng)計學》、《預防醫(yī)學》,《醫(yī)學人口統(tǒng)計學》等課程的教學及科研工作,每年聽課學生500-800人。自2000年
3、起連續(xù)六年,為碩士研究生開設《醫(yī)學統(tǒng)計學》、《SPSS統(tǒng)計分析簡明教程》、《衛(wèi)生經(jīng)濟學》等課程,同時指導研究生的科研設計、開題報告及科研資料的統(tǒng)計處理與分析。發(fā)表醫(yī)學統(tǒng)計學及預防醫(yī)學的科研論文30多篇。代表作有“鋅對乳癌細胞生長、增殖與基因表達的影響”,,“行列相關的測度” 等。主編、副主編各類教材及專著8部,代表作有《醫(yī)學統(tǒng)計學》、《SPSS統(tǒng)計分析簡明教程》獲得院級科研論文及科技進步獎8項,院第四屆教學能手比賽二等獎一項,院教學評建
4、先進工作者一項。獲2004年泰山醫(yī)學院首屆十大教學名師獎。,第1章緒論,第4頁 共666頁,醫(yī)學統(tǒng)計學總目錄,第1章緒論,第2章定量資料統(tǒng)計描述,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第4章方差分析,第5章定性資料的統(tǒng)計描述,第6章總體率的區(qū)間估計和假設檢驗,第7章二項分布與泊松分布,第8章秩和檢驗,第9章直線相關與回歸,第10章實驗設計,第11章調(diào)查設計,第12章統(tǒng)計表與統(tǒng)計圖,第1章緒論,第5頁 共
5、666頁,第1章緒論 目錄,第五節(jié) 學習統(tǒng)計學應注意的幾個問題,第二節(jié) 統(tǒng)計工作的基本步驟,第三節(jié) 統(tǒng)計資料的類型,第四節(jié) 統(tǒng)計學中的幾個基本概念,第一節(jié) 醫(yī)學統(tǒng)計學的定義和內(nèi)容,第1章緒論,第6頁 共666頁,第一章 緒論第一節(jié) 醫(yī)學統(tǒng)計學的定義和內(nèi)容,醫(yī)學統(tǒng)計學(medical statistics) ---是以醫(yī)學理論為指導,運用數(shù)理統(tǒng)計學的原理和方法研究醫(yī)學資料的搜集、整理與分析,從而掌握事
6、物內(nèi)在客觀規(guī)律的一門學科。,第1章緒論,第7頁 共666頁,醫(yī)學研究的對象----主要是人以及與其健康有關的各種影響因素。醫(yī)學統(tǒng)計學的主要內(nèi)容 :1.統(tǒng)計設計 包括實驗設計和調(diào)查設計,它可以合理地、科學地安排實驗和調(diào)查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結(jié)果。2.資料的統(tǒng)計描述和總體指標的估計 通過計算各種統(tǒng)計指標和統(tǒng)計圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態(tài)分布或偏態(tài)分
7、布);利用樣本指標來估計總體指標的大小。,第1章緒論,第8頁 共666頁,3.假設檢驗 是通過統(tǒng)計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統(tǒng)計指標的差異是抽樣誤差造成的還是有本質(zhì)的差別。4.相關與回歸 醫(yī)學中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關與回歸來分析。,第1章緒論,第9頁 共666頁,5.多因素分
8、析 如多元回歸、判別分析、聚類分析、正交設計分析、主成分分析、因子分析、logistic回歸、Cox比例風險回歸等,都是分析醫(yī)學中多因素有效的方法(本書不涉及,請參考有關統(tǒng)計書籍)。這些方法計算復雜,大部分需借助計算機來完成。 6.健康統(tǒng)計 研究人群健康的指標與統(tǒng)計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預測等方法,第1章緒論,第10頁 共666頁,醫(yī)學統(tǒng)計工作可分為
9、四個步驟:統(tǒng)計設計、搜集資料、整理資料和分析資料。這四個步驟密切聯(lián)系,缺一不可,任何一個步驟的缺陷和失誤,都會影響統(tǒng)計結(jié)果的正確性。,第二節(jié) 統(tǒng)計工作的基本步驟,第1章緒論,第11頁 共666頁,設計(design)是統(tǒng)計工作的第一步,也是關鍵的一步,是對統(tǒng)計工作全過程的設想和計劃安排。 統(tǒng)計設計---就是根據(jù)研究目的確定試驗因素、受試對象和觀察指標,并在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對
10、原始資料如何進行整理,以及整理后的資料應該計算什么統(tǒng)計指標和統(tǒng)計分析的預期結(jié)果如何等。,一、統(tǒng)計設計,第1章緒論,第12頁 共666頁,搜集資料(collection of date) —— 是根據(jù)設計的要求,獲取準確可靠的原始資料,是統(tǒng)計分析結(jié)果可靠的重要保證。醫(yī)學統(tǒng)計資料的來源主要有以下三個方面:1.統(tǒng)計報表 統(tǒng)計報表是醫(yī)療衛(wèi)生機構(gòu)根據(jù)國家規(guī)定的報告制度,定期逐級上報的有關報表。如法定傳染病報表、出生死亡
11、報表、醫(yī)院工作報表等,報表要完整、準確、及時。,二、搜集資料,第1章緒論,第13頁 共666頁,2.醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學檢查記錄、衛(wèi)生監(jiān)測記錄等。 3.專題調(diào)查或?qū)嶒炑芯?它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒炑芯?,搜集資料有明確的目的與針對性。它是醫(yī)學科研資料的主要來源。,第1章緒論,第14頁 共666頁,整理資料(sorting data)的目的就是將搜集到的原始資料進行反復核對和認
12、真檢查,糾正錯誤,分類匯總,使其系統(tǒng)化、條理化,便于進一步的計算和分析。整理資料的過程如下:1.審核:認真檢查核對,保證資料的準確性和完整性。 2.分組:歸納分組,分組方法有兩種: ①質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。②數(shù)量分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組。,三、整理資料,第1章緒論,第15頁 共666頁,3.匯總: 分組后
13、的資料要按照設計的要求進行匯總,整理成統(tǒng)計表。原始資料較少時用手工匯總,當原始資料較多時,可使用計算機匯總。四、分析資料 分析資料(analysis of data) —— 是根據(jù)設計的要求,對整理后的數(shù)據(jù)進行統(tǒng)計學分析,結(jié)合專業(yè)知識,作出科學合理的解釋。,第1章緒論,第16頁 共666頁,1.統(tǒng)計描述(descriptive statistics) 將計算出的統(tǒng)計指標與統(tǒng)計表、統(tǒng)計圖相結(jié)合,全面描述資料
14、的數(shù)量特征及分布規(guī)律。 2.統(tǒng)計推斷(inferential statistics) 使用樣本信息推斷總體特征。通過樣本統(tǒng)計量進行總體參數(shù)的估計和假設檢驗,以達到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。,統(tǒng)計分析包括以下兩大內(nèi)容:,第1章緒論,第17頁 共666頁,醫(yī)學統(tǒng)計資料按研究指標的性質(zhì)一般分為定量資料、定性資料和等級資料三大類。一、定量資料定量資料(quantitative da
15、ta) 亦稱計量資料(measurement data),是用定量的方法測定觀察單位(個體)某項指標數(shù)值的大小,所得的資料稱定量資料。如身高(㎝)、體重(㎏)、脈搏(次/分)、血壓(kPa)等為數(shù)值變量,其組成的資料為定量資料。,第三節(jié) 統(tǒng)計資料的類型,第1章緒論,第18頁 共666頁,定性資料(qualitative data) 亦稱計數(shù)資料(enumeration data)或分類資料(categor
16、ical data),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標為分類變量(categorical variable)。如人的性別按男、女分組;化驗結(jié)果按陽性、陰性分組;動物實驗按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。,二、定性資料,第1章緒論,第19頁
17、 共666頁,定性資料(qualitative data) 亦稱計數(shù)資料(enumeration data)或分類資料(categorical data),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標為分類變量(categorical variable)。如人的性別按男、女分組;化驗結(jié)果按陽性、陰性分組;動物實驗按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,
18、觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。,二、定性資料,第1章緒論,第20頁 共666頁,三、等級資料,,等級資料(ranked data)亦稱有序分類資料(ordinal categorical data),是將觀察單位按屬性的等級分組,清點各組的觀察單位數(shù),所得的資料為等級資料。如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個等級。,第1章緒論,第21頁
19、 共666頁,根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標準將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數(shù)量化,如將等級資料的治療結(jié)果賦以分值,分別用0、1、2…等表示,則可按定量資料處理。 如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分—、±、+、++、+++五個等級。,第1章緒論,第22頁 共666頁,同質(zhì)(homogeneity)
20、 是指觀察單位或研究個體間被研究指標的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。變異(variation) 由于生物個體的各種指標所受影響因素極為復雜,同質(zhì)的個體間各種指標存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標會有一定的差別。,第四節(jié) 統(tǒng)計學中的幾個基本概念一、同質(zhì)與變異,第1章緒論,第23頁 共666頁,二、總體與樣
21、本,樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。注意:1??傮w是相對的,總體的大小是根據(jù)研究目的而確定的。2。樣本應有代表性,即應該隨機抽樣并有足夠的樣本含量。,第1章緒論,第24頁 共666頁,二、總體與樣本,樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。注意:1
22、??傮w是相對的,總體的大小是根據(jù)研究目的而確定的。2。樣本應有代表性,即應該隨機抽樣并有足夠的樣本含量。,第1章緒論,第25頁 共666頁,圖示:總體與樣本,population,sample2,sample1,sample3,sample4,sample5,,,,,,第1章緒論,第26頁 共666頁,三、參數(shù)與統(tǒng)計量,參數(shù)(parameter):由總體計算或得到的統(tǒng)計指標稱為參數(shù)??傮w參數(shù)具有很重
23、要的參考價值。如總體均數(shù)μ,總體標準差σ等。統(tǒng)計量(statistic):由樣本計算的指標稱為統(tǒng)計量。如樣本均數(shù),樣本標準差s等。注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計量。,第1章緒論,第27頁 共666頁,四、抽樣誤差,抽樣誤差(sample error): 由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及樣本統(tǒng)計量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。
24、注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會存在抽樣誤差。,第1章緒論,第28頁 共666頁,五、概率,概率(probability):是描述隨機事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在0~1之間。當P=0時,稱為不可能事件;當P=1時,稱為必然事件。小概率事件:統(tǒng)計學上一般把P≤0.05或P≤0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發(fā)生。利用該原
25、理可對科研資料進行假設檢驗。,第1章緒論,第29頁 共666頁,五、概率,概率(probability):是描述隨機事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在0~1之間。當P=0時,稱為不可能事件;當P=1時,稱為必然事件。小概率事件:統(tǒng)計學上一般把P≤0.05或P≤0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發(fā)生。利用該原理可對科研資料進行假設檢驗。,第1章緒
26、論,第30頁 共666頁,第五節(jié) 學習醫(yī)學統(tǒng)計學應注意的問題,1.重點掌握醫(yī)學統(tǒng)計學的基本知識、基本技能、基本概念和基本方法,掌握使用范圍和注意事項。2.要培養(yǎng)科學的統(tǒng)計思維方法,提高分析問題、解決問題的能力。 3.掌握調(diào)查設計和實驗設計的原則,培養(yǎng)搜集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。,第1章緒論,第31頁 共666頁,課后作業(yè),列舉出計量資料、分類資料、等級資料各10個實例。 列舉出可
27、能事件、必然事件、不可能事件及小概率事件各10個。 認真復習本章已學過的基本概念2-3遍。,第1章緒論,第32頁 共666頁,Best Wishes to All of You! Thank You for Listening!,THE END,第1章緒論,第33頁 共666頁,Best Wishes to All of You! Thank You
28、for Listening!,THE END,第2章定量資料統(tǒng)計描述,第34頁,醫(yī)學本科生用,主講 程 琮,泰山醫(yī)學院預防醫(yī)學教研室zcheng@tsmc.edu.cn,醫(yī)學統(tǒng)計學,第2章定量資料統(tǒng)計描述,第35頁,醫(yī)學本科生用,主講 程 琮,泰山醫(yī)學院預防醫(yī)學教研室zcheng@tsmc.edu.cn,醫(yī)學統(tǒng)計學,第2章定量資料統(tǒng)計描述,第36頁,The teaching planfor medical stude
29、nts,Professor Cheng Cong,Dept. of Preventive Medicine Taishan Medical College,第2章定量資料統(tǒng)計描述,第37頁,第2章定量資料的統(tǒng)計描述 目錄,第二節(jié) 集中趨勢的描述,第三節(jié) 離散趨勢的描述,第四節(jié) 正態(tài)分布,第一節(jié) 頻數(shù)分布表,第2章定量資料統(tǒng)計描述,第38頁,第2章定量資料的統(tǒng)計描述 目錄,第二節(jié) 集中趨勢的描述,第三節(jié) 離散趨勢的描述
30、,第四節(jié) 正態(tài)分布,第一節(jié) 頻數(shù)分布表,第2章定量資料統(tǒng)計描述,第39頁,統(tǒng)計描述:是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征。頻數(shù)分布表(frequency distribution table):主要由組段和頻數(shù)兩部分組成表格。,第一節(jié) 頻數(shù)分布表,第二章 定量資料的統(tǒng)計描述,第2章定量資料統(tǒng)計描述,第40頁,二、頻數(shù)分布表的編制,編制步驟 :1. 計算全距 (range): 一組變量值最大值和最小值之差稱
31、為全距(range),亦稱極差,常用R表示。 2. 確定組距(class interval): 組距用i表示; 3. 劃分組段: 每個組段的起點稱組下限,終點稱組上限。一般分為8~15組。 ;4. 統(tǒng)計頻數(shù): 將所有變量值通過劃記逐個歸入相應組段 ;5.頻率與累計頻率: 將各組的頻數(shù)除以n所得的比值被稱為頻率。累計頻率等于累計頻數(shù)除以總例數(shù)。,第2章定量資料統(tǒng)計描述,第41頁,表2-2 某年某市120名12歲健康男孩身高(
32、cm)的頻數(shù)分布,第2章定量資料統(tǒng)計描述,第42頁,第2章定量資料統(tǒng)計描述,第43頁,二、頻數(shù)分布表的用途,1.揭示資料的分布類型 2.觀察資料的集中趨勢和離散趨勢 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進一步計算統(tǒng)計指標和作統(tǒng)計處理,第2章定量資料統(tǒng)計描述,第44頁,第2章定量資料統(tǒng)計描述,第45頁,第二節(jié) 集中趨勢的描述,集中趨勢 :代表一組同質(zhì)變量值的集中趨勢 或平均水平。 常用的平均數(shù)有算術均數(shù)、幾
33、何均數(shù)和中位數(shù)。另外不常用的有:眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等。,第2章定量資料統(tǒng)計描述,第46頁,一、算術均數(shù),算術均數(shù) (arithmetic mean): 簡稱均數(shù)。適用條件:對稱分布或近似對稱分布的資料。 習慣上以希臘字母μ表示總體均數(shù)(population mean),以英文字母表示樣本均數(shù)(sample mean),第2章定量資料統(tǒng)計描述,第47頁,1. 直接法:用于觀察值個數(shù)不多時,,,計算方法,第2章
34、定量資料統(tǒng)計描述,第48頁,2.加權法(weighting method):用于變量值個數(shù) 較多時。,,注意:權數(shù)即頻數(shù)f,為權重權衡之意。,第2章定量資料統(tǒng)計描述,第49頁,2.加權法(weighting method):用于變量值個數(shù) 較多時。,,注意:權數(shù)即頻數(shù)f,為權重權衡之意。,第2章定量資料統(tǒng)計描述,第50頁,,,,表2-4 120名12歲健康男孩身高(cm)均數(shù)和標準差加權法計算表,第2章定量資料
35、統(tǒng)計描述,第51頁,,,,表2-4 120名12歲健康男孩身高(cm)均數(shù)和標準差加權法計算表,第2章定量資料統(tǒng)計描述,第52頁,第2章定量資料統(tǒng)計描述,第53頁,120名12歲健康男孩身高均數(shù)為143.07cm。,,計算結(jié)果,第2章定量資料統(tǒng)計描述,第54頁,120名12歲健康男孩身高均數(shù)為143.07cm。,,計算結(jié)果,第2章定量資料統(tǒng)計描述,第55頁,幾何均數(shù)(geometric mean,簡記為G):表示其平均水平。 適用條
36、件:對于變量值呈倍數(shù)關系或呈對數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數(shù)等。計算公式:有直接法和加權法。,二、幾何均數(shù),第2章定量資料統(tǒng)計描述,第56頁,1.直接法: 用于變量值的個數(shù)n較少時,,,第2章定量資料統(tǒng)計描述,第57頁,,,直接法計算實例,第2章定量資料統(tǒng)計描述,第58頁,2.加權法 : 用于資料中相同變量值的個數(shù)f(即頻數(shù))較多時。,,第2章定量資料統(tǒng)計描述,第59頁,,,,表2-5
37、 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表,第2章定量資料統(tǒng)計描述,第60頁,第2章定量資料統(tǒng)計描述,第61頁,,50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為1:60.55。,計算結(jié)果:將有關已知數(shù)據(jù)代入公式有,第2章定量資料統(tǒng)計描述,第62頁,①變量值中不能有0;②不能同時有正值和負值;③若全是負值,計算時可先把負號去掉,得出結(jié)果后再加上負號。,計算幾何均數(shù)注意事項:,第2章定量資料統(tǒng)計描述,第63頁,㈠中位數(shù)
38、定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。適用條件:①變量值中出現(xiàn)個別特小或特大的數(shù)值;②資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);③變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;④資料的分布不清。,三、中位數(shù)及百分位數(shù),第2章定量資料統(tǒng)計描述,第64頁,定義:百分位數(shù)(percentile)是一種位置指標,以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小
39、到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M 。,㈡ 百分位數(shù),第2章定量資料統(tǒng)計描述,第65頁,①描述一組資料在某百分位置上的水平;②用于確定正常值范圍;③計算四分位數(shù)間距。,百分位數(shù)的應用條件:,第2章定量資料統(tǒng)計描述,第66頁,計算方法:有直接法和加權法,1.直接法:用于例數(shù)較少時,,,n為奇數(shù)時,n為偶數(shù)時,第2章定量資料統(tǒng)計描述,第67頁,2.
40、頻數(shù)表法: 用于例數(shù)較多時,,,中位數(shù),百分位數(shù),第2章定量資料統(tǒng)計描述,第68頁,,,,表2-6 145例食物中毒病人潛伏期分布表,第2章定量資料統(tǒng)計描述,第69頁,第2章定量資料統(tǒng)計描述,第70頁,先找到包含Px的最小累計頻率;該累計頻率同行左邊的組段值為L;L同行右邊的頻數(shù)為fx(或fm);L前一行的累計頻數(shù)為∑fL;將上述已知條件代入公式計算Px或P50 。,計算中位數(shù)及百分位數(shù)的步驟:,第2章定量資料統(tǒng)計描述,第7
41、1頁,計算結(jié)果:,,,第2章定量資料統(tǒng)計描述,第72頁,定義:用來說明變量值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。常用離散指標有:極差、四分位數(shù)間距、標準差、方差、變異系數(shù)。,第三節(jié) 離散趨勢的描述,第2章定量資料統(tǒng)計描述,第73頁,甲組: 184 186 188 190 192乙組: 180 184 188 192 1
42、96兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。,實例分析,第2章定量資料統(tǒng)計描述,第74頁,二、方差和標準差,㈠方差(variance),,,總體方差,樣本方差,第2章定量資料統(tǒng)計描述,第75頁,甲組: 184 186 188 190 192乙組: 180 184 188 192 196兩組球員的平均身高都是188cm,但甲組球員身高比較集
43、中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。,實例分析,第2章定量資料統(tǒng)計描述,第76頁,㈠極差 極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差 。特點:計算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。,一、極差和四分位數(shù)間距,第2章定量資料統(tǒng)計描述,第77頁,㈡四分位數(shù)間距,公式: Q= P75-P25 特點:比極差穩(wěn)定,只反映中間兩端值的差異。
44、 計算不太方便??捎糜诟鞣N分布的資料。,第2章定量資料統(tǒng)計描述,第78頁,二、方差和標準差,㈠方差(variance),,,總體方差,樣本方差,第2章定量資料統(tǒng)計描述,第79頁,自由度(degree of freedom)的概念,n-1是自由度,用希臘小寫字母ν表示,讀作[nju:]。定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例:A+B=C,共有n=3個元素,其中只能任選2個元素的值,故自由度ν=n-1=3-1=2
45、。,第2章定量資料統(tǒng)計描述,第80頁,自由度(degree of freedom)的概念,n-1是自由度,用希臘小寫字母ν表示,讀作[nju:]。定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例:A+B=C,共有n=3個元素,其中只能任選2個元素的值,故自由度ν=n-1=3-1=2。,第2章定量資料統(tǒng)計描述,第81頁,方差的特點,充分反映每個數(shù)據(jù)間的離散狀況,意義深刻;指標穩(wěn)定,應用廣泛,但計算較為復雜,不易理解;方差的單位
46、與原數(shù)據(jù)不同,有時使用時不太方便;在方差分析中應用甚廣而極為重要。,第2章定量資料統(tǒng)計描述,第82頁,(二)標準差(standard deviation),,,總體標準差,樣本標準差,第2章定量資料統(tǒng)計描述,第83頁,牢記:離均差平方和展開式:,,第2章定量資料統(tǒng)計描述,第84頁,標準差的特點:,意義同方差,是方差的開平方;標準差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應用廣泛;故一般已作為醫(yī)學生物學領域中反映變異的標準,故稱標準
47、差。,第2章定量資料統(tǒng)計描述,第85頁,標準差的計算方法:可分為直接法和加權法。,1.直接法,,2.加權法,,第2章定量資料統(tǒng)計描述,第86頁,直接法:標準差計算實例:,例2.12 例2.2中7名正常男子紅細胞數(shù)(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,計算其標準差。 ∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 ∑x2=4.67
48、2+4.742+4.772+4.882+4.762+4.722+4.922=159.99,第2章定量資料統(tǒng)計描述,第87頁,計算結(jié)果:,,第2章定量資料統(tǒng)計描述,第88頁,例2.13 對表2-4資料用加權法計算120名12歲健康男孩身高值的標準差。,加權法:標準差計算實例:,,在表2-4中已算得∑fx=17168,∑fx2 =2460040, 代入公式,第2章定量資料統(tǒng)計描述,第89頁,變異系數(shù)(coefficient of vari
49、ation): 簡記為CV ;特征:①變異系數(shù)為無量綱單位,可以比較不同單位指標間的變異度;②變異系數(shù)消除了均數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差較大時指標間的變異度。,三、變異系數(shù),,第2章定量資料統(tǒng)計描述,第90頁,例2.14 某地20歲男子160人,身高均數(shù)為166.06cm,標準差為4.95cm; 體重均數(shù)為53.72kg, 標準差為4.96kg。試比較身高與體重的變異程度。,變異系數(shù) 計算實例,第2章定量
50、資料統(tǒng)計描述,第91頁,身高,,體重,,變異系數(shù) 計算結(jié)果,第2章定量資料統(tǒng)計描述,第92頁,第四節(jié) 正態(tài)分布,一、正態(tài)分布的概念和特征,正態(tài)分布(normal distribution):也稱高斯分布,是醫(yī)學和生物學最常見的連續(xù)性分布。如身高、體重、紅細胞數(shù)、血紅蛋白等。,第2章定量資料統(tǒng)計描述,第93頁,圖2-1 120名12歲健康男孩身高的頻數(shù)分布,第2章定量資料統(tǒng)計描述,第94頁,㈠ 正態(tài)分布的函數(shù)和圖形,,正態(tài)分布的
51、密度函數(shù),即正態(tài)曲線的方程為:,第2章定量資料統(tǒng)計描述,第95頁,圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意,,第2章定量資料統(tǒng)計描述,第96頁,為了應用方便,常按公式(2.19)作變量變換,,u值稱為標準正態(tài)變量或標準正態(tài)離差,有的參考書也將u值稱為z值。,第2章定量資料統(tǒng)計描述,第97頁,這樣將正態(tài)分布變換為標準正態(tài)分布(standard normal distribution),,第2章定量資料統(tǒng)計描述,第98頁,圖2-3 正態(tài)
52、分布的面積與縱高,,第2章定量資料統(tǒng)計描述,第99頁,㈡正態(tài)分布的特征,1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。對稱性 正態(tài)曲線以均數(shù)為中心,左右對稱, 3. 正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律,第2章定量資料統(tǒng)計描述,第100頁,㈡正態(tài)分布的特征,1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。對稱性 正態(tài)曲線以均數(shù)為中
53、心,左右對稱, 3. 正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律,第2章定量資料統(tǒng)計描述,第101頁,圖2-4 不同標準差的正態(tài)分布示意,,第2章定量資料統(tǒng)計描述,第102頁,二、正態(tài)曲線下面積的分布規(guī)律,,第2章定量資料統(tǒng)計描述,第103頁,標準正態(tài)分布表(u值表),標準正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時應注意:①表中曲線下面積為-∞到u 的下側(cè)累計面積;②當已知
54、μ、σ、和X時,先按公式(2.19)求得u值,再查表;當和未知時,并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標準差S分別代替μ和σ ,按公式(2.19)求得u值;③曲線下橫軸上的總面積為100%或1,第2章定量資料統(tǒng)計描述,第104頁,例2.16 前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標準差S=5.70cm,①估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分數(shù);②估
55、計身高界于135cm~150cm范圍內(nèi)12歲男孩的比例;③分別求出均數(shù)±1S、均數(shù)±1.96S、均數(shù)±2.58S范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實際百分數(shù),說明與理論百分數(shù)是否接近。,第2章定量資料統(tǒng)計描述,第105頁,根據(jù)題意,按公式(2.19)作u變換,,,第2章定量資料統(tǒng)計描述,第106頁,,,身高范圍所占面積,,故估計該地12男孩身高在135cm以下者約占7.78%; 身高界于1
56、35cm~150cm范圍內(nèi)者約占81.10%。,第2章定量資料統(tǒng)計描述,第107頁,,,三、正態(tài)分布的應用,㈠制定醫(yī)學參考值范圍 參考值范圍也稱為正常值范圍。醫(yī)學上常把絕大數(shù)正常人的某指標范圍稱為該指標的正常值范圍。這里的“絕大多數(shù)”可以是90%、95%、99%,最常用的是95%。㈡質(zhì)量控制 常以均數(shù)±2S作為上、下警戒值,以均數(shù)±3S作為上、下控制值。 ㈢正態(tài)分布是很多統(tǒng)計
57、方法的理論基礎,,第2章定量資料統(tǒng)計描述,第108頁,THE END,THANK YOU FOR LISTENING,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第109頁,本科生用醫(yī)學統(tǒng)計學教案,主講 程 琮,泰山醫(yī)學院預防醫(yī)學教研室Zcheng@tsmc.edu.cn,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第110頁,本科生用醫(yī)學統(tǒng)計學教案,主講 程 琮,泰山醫(yī)學院預防醫(yī)學教研室Zcheng@tsmc.edu
58、.cn,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第111頁,The teaching planfor medical students,Professor Cheng Cong,Dept. of Preventive Medicine Taishan Medical College,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第112頁,第3章總體均數(shù)的區(qū)間估計和假設檢驗 目錄,第五節(jié) 均數(shù)的 u 檢驗,第二節(jié) t 分布,第三節(jié)
59、總體均數(shù)的區(qū)間估計,第四節(jié) 假設檢驗的意義和基本步驟,第一節(jié) 均數(shù)的抽樣誤差與標準誤,第六節(jié) 均數(shù)的 t 檢驗,第七節(jié)兩個方差的齊性檢驗和t’檢驗,第八節(jié) Ⅰ型錯誤和Ⅱ型錯誤,第九節(jié) 應用假設檢驗應注意的問題,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第113頁,圖示:總體與樣本,Populationμ,sample2,sample1,sample3,sample4,sample5,,,,,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第114
60、頁,一、標準誤的意義及其計算統(tǒng)計推斷(statistical inference) :根據(jù)樣本信息來推論總體特征。均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標準誤(standard error):反映均數(shù)抽樣誤差大小的指標。,第一節(jié) 均數(shù)的抽樣誤差與標準誤,,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第115頁,一、標準誤的意義及其計算統(tǒng)計推斷(statistical inference) :根據(jù)
61、樣本信息來推論總體特征。均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標準誤(standard error):反映均數(shù)抽樣誤差大小的指標。,第一節(jié) 均數(shù)的抽樣誤差與標準誤,,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第116頁,σ已知:,標準誤計算公式,σ未知:,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第117頁,實例:如某年某市120名12歲健康男孩,已求得 均數(shù)為143.07cm,標準差為5.70cm,
62、按公式計算,則標準誤為:,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第118頁,1.表示抽樣誤差的大小 ;2.進行總體均數(shù)的區(qū)間估計; 3.進行均數(shù)的假設檢驗等 。,二、標準誤的應用,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第119頁,正態(tài)變量X采用u=(X-μ)/σ變換,則一般的正態(tài)分布N (μ,σ)即變換為標準正態(tài)分布N (0,1)。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 N(μ, ),同樣可作正態(tài)變量的u變換,即,
63、第二節(jié) t 分布 一、t 分布的概念,,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第120頁,實際工作中由于理論的標準誤往往未知,而用樣本的標準誤作為的估計值, 此時就不是u變換而是t變換了,即下式:,,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第121頁,t分布于1908年由英國統(tǒng)計學家W.S.Gosset以“Student”筆名發(fā)表,故又稱Student t 分布(Students’ t-distribution)。,第3章總體均數(shù)的區(qū)
64、間估計和假設檢驗,第122頁,二、t分布曲線的特征,t分布曲線是單峰分布,以0為中心,左右兩側(cè)對稱,曲線的中間比標準正態(tài)曲線(u分布曲線)低,兩側(cè)翹得比標準正態(tài)曲線略高。t分布曲線隨自由度υ而變化,當樣本含量越小(嚴格地說是自由度υ =n-1越?。?,t分布與u分布差別越大;當逐漸增大時,t分布逐漸逼近于u分布,當υ =∞時,t分布就完全成正態(tài)分布 。t分布曲線是一簇曲線,而不是一條曲線。t分布下面積分布規(guī)律:查t分布表。,第3章
65、總體均數(shù)的區(qū)間估計和假設檢驗,第123頁,,t 分布示意圖,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第124頁,t分布曲線下雙側(cè)或單側(cè)尾部合計面積,我們常把自由度為υ的t分布曲線下雙側(cè)尾部合計面積或單側(cè)尾部面積為指定值α時,則橫軸上相應的t界值記為tα,υ。如當υ =20, α=0.05時,記為t0.05, 20;當υ =22, α =0.01時,記為t0.01, 22。對于tα, υ值,可根據(jù)α和υ值,查附表2,t界值表。,第3章總體均數(shù)
66、的區(qū)間估計和假設檢驗,第125頁,t分布曲線下雙側(cè)或單側(cè)尾部合計面積,我們常把自由度為υ的t分布曲線下雙側(cè)尾部合計面積或單側(cè)尾部面積為指定值α時,則橫軸上相應的t界值記為tα,υ。如當υ =20, α=0.05時,記為t0.05, 20;當υ =22, α =0.01時,記為t0.01, 22。對于tα, υ值,可根據(jù)α和υ值,查附表2,t界值表。,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第126頁,t分布是t檢驗的理論基礎。由公式(3.4
67、)可知,│t│值與樣本均數(shù)和總體均數(shù)之差成正比,與標準誤成反比 。在t分布中│t│值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小 ,說明在抽樣中獲得此│t│值以及更大│t│值的機會就越小,這種機會的大小是用概率P來表示的。│t│值越大,則P值越??;反之,│t│值越小,P值越大。根據(jù)上述的意義,在同一自由度下,│t│≥ tα ,則P≤ α ; 反之,│t│<tα,則P>α。,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第127頁,
68、第三節(jié) 總體均數(shù)的區(qū)間估計,參數(shù)估計:用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))稱為參數(shù)估計。估計總體均數(shù)的方法有兩種,即:點值估計(point estimation )區(qū)間估計(interval estimation)。,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第128頁,一、點值估計,點值估計:是直接用樣本均數(shù)作為總體均數(shù)的估計值。此法計算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準確地估計出總體均數(shù)大小,也無法確知總體均數(shù)的
69、可靠程度 。,第3章總體均數(shù)的區(qū)間估計和假設檢驗,第129頁,二、區(qū)間估計,區(qū)間估計是按一定的概率(1-α)估計包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidence interval,縮寫為CI)。1-α稱為可信度,常取1-α為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。1-α(如95%)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-α,即(95%),沒有被包含的可能性為α,即(5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學統(tǒng)計學全部課程程琮
- 《醫(yī)學統(tǒng)計學》最新版ch08秩和檢驗72h
- 2013電大統(tǒng)計學原理(電大最新版)
- kk【總】--程琮獲得院一等獎課件《醫(yī)學統(tǒng)計學》好用060810
- 醫(yī)學影像學復習重點最新版
- 2018年公衛(wèi)執(zhí)業(yè)醫(yī)師衛(wèi)生統(tǒng)計學考試大綱最新版
- 醫(yī)學影像學復習預習重點最新版
- 醫(yī)學 統(tǒng)計學
- 醫(yī)學統(tǒng)計學
- 衛(wèi)生統(tǒng)計學 醫(yī)學統(tǒng)計學 習題
- 醫(yī)學 統(tǒng)計學
- 醫(yī)學細胞生物學最新版1緒論
- 醫(yī)學統(tǒng)計學復習
- 醫(yī)學統(tǒng)計學13
- 診斷醫(yī)學統(tǒng)計學
- 醫(yī)學統(tǒng)計學任
- 醫(yī)學統(tǒng)計學研
- 醫(yī)學統(tǒng)計學題庫
- 醫(yī)學統(tǒng)計學方法
- 醫(yī)學統(tǒng)計學2
評論
0/150
提交評論