概率分布正態(tài)分布教程_第1頁
已閱讀1頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第五講 概率分布—正態(tài)分布,1.1 正態(tài)分布的概念和函數1.2 正態(tài)分布曲線的特征1.3 正態(tài)曲線的標化1.4 曲線下面積的分布規(guī)律1.5 正態(tài)分布在醫(yī)學中的應用,【典型案例分析】,舉例: 隨機調查某醫(yī)院1402例待分娩孕婦,測得她們的體重,試述其體重頻數分布的特征。,引子:,表5-1 某醫(yī)院1402例分娩孕婦體重頻數分布,① ② ③ ④

2、 ⑤,作圖:以體重測量值為橫軸,以頻率與組距的比值為縱軸作出直方圖。,1. 由于該直方圖的縱軸表示在每個組段內單位長度所占有的頻率,相當于頻率密度,因此將此圖稱為頻率密度圖。,圖5-1 體重頻率密度圖,2. 面積=頻率由于頻率的總和為1,所以該曲線下橫軸上的面積為1 。 .,若將各直條頂端的中點順次連接起來,得一條折線。當樣本量n越來越大時,折線就越來越接近一條光滑的曲線。,圖5-1

3、 體重頻率密度圖,圖5-2 概率密度曲線示意圖,,,推 斷:測得一個孕婦體重在54-68kg的概率有多大?孕婦體重在哪個范圍內算是正常的呢?,故對連續(xù)性隨機變量而言:變量某區(qū)間取值的概率 = 正態(tài)曲線該變量區(qū)間的面積,,一、正態(tài)分布的概念和密度函數,正態(tài)分布( normal distribution):是描述連續(xù)型隨機變量最重要的分布。其分布曲線叫正態(tài)分布曲線,呈中間高,兩邊低,左右基本對稱的“鐘型”曲線,近似于數學上的正態(tài)分布,

4、又稱高斯分布(Gauss distribution)。,正態(tài)分布(normal distribution),德莫佛最早發(fā)現了二項概率的一個近似公式,這一公式被認為是正態(tài)分布的首次露面。,正態(tài)分布在十九世紀前葉由高斯加以推廣,所以通常稱為高斯分布(Gauss distribution)。,德莫佛,高 斯,10馬克的錢幣,醫(yī)學研究中許多正常人的生理,生化指標、測量誤差等多呈正態(tài)分布或近似正態(tài)分布。許多非正態(tài)分布資料,當樣本含量足夠大時

5、,也可以用正態(tài)分布作為它的極限分布形式。有時也可將非正態(tài)分布資料轉化為正態(tài)分布來處理。,正態(tài)分布在醫(yī)學研究中的重要作用:,醫(yī)學研究中:,,正態(tài)分布的密度函數,即正態(tài)曲線的函數表達式:,式中,μ為總體均數,σ為總體標準差,π為圓周率,e為自然對數的底,僅x為變量。 當x確定后, f(x)為X相應的縱坐標高度,則X服從參數為μ和σ2的正態(tài)分布( normal distribution),記作X~N( μ,σ2 )。,二、正態(tài)分布

6、曲線的特征,,(一)正態(tài)分布的兩個參數:,μ和σ 是正態(tài)分布的兩個參數, μ和σ決定了x的概率分布;習慣上用 N (μ, σ2)表示均數為μ ,標準差為σ的正態(tài)分布。,當給定不同的 x 值后,就可以根據此方程求得相應的縱坐標高度(頻數),并可繪制出正態(tài)曲線的圖形,記作X~N(μ,σ2) :,正態(tài)分布曲線:高峰位于中間,兩側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的“鐘型”曲線。,當σ固定不變時,μ越大,曲線沿橫軸越向右移動;反之,

7、 μ越小,則曲線沿橫軸越向左移動,所以μ叫正態(tài)曲線N(μ, σ2)的位置參數, 。,1. 位置參數: μ,圖5-4 正態(tài)分布位置隨參數μ變換示意圖,2. 形狀參數:σ,圖5-6 正態(tài)分布形態(tài)隨參數σ變換示意圖,當μ固定不變時,σ越大,曲線越平闊; σ越小,曲線越尖峭,σ 叫正態(tài)曲線N(μ, σ2)的形狀參數。,(二)正態(tài)分布圖形的特征:,1. 對稱性:關于x=μ對稱,2. 集中性: 正態(tài)曲線在橫軸上方, 當x=μ時, f (

8、x)取最大值,即均數位于曲線的最高處。,3. 對頻率密度正態(tài)分布圖,橫軸上曲線下的面積為1。,4. μ是正態(tài)曲線的位置參數,決定曲線在橫軸上的位置;μ 增大曲線沿橫軸向右移, μ 減小曲線沿橫軸向左移。,5.σ是正態(tài)曲線的形狀參數,σ越大數據越分散,曲線越“矮胖”,σ越小數據越集中,曲線越“瘦高” 。,三、正態(tài)曲線的標準化,為了應用方便,常將正態(tài)概率函數中的 x 作如下變量代換,令: Z稱為標準正態(tài)變量。把u代入概

9、率密度函數 ,得標準正態(tài)分布的概率密度函數: 相對于正態(tài)變量 x,Z 沒有度量單位。根據 u 的不同取值,可繪出標準正態(tài)分布的圖形。,任意正態(tài)分布曲線 X~N(μ,σ2),,標準正態(tài)分布曲線X~N(0,1),將一般正態(tài)分布曲線的 μ 的位置平移到原點,再以標準差σ為橫軸單位,這樣就把原來個別的正態(tài)分布轉換為一般的標準正態(tài)分布 N(0,1),亦稱為Z分布(或 u分布)。,四、正態(tài)曲

10、線下面積的分布規(guī)律,,正態(tài)曲線下的面積分布有一定的規(guī)律性:,因正態(tài)曲線下累計頻數的總和等于 100% 或 1,則:橫軸上曲線下的面積(概率)就等于 100% 或 1;均數兩側的面積(概率)各占 50%。,實際工作中常需了解橫軸上某一區(qū)間曲線下面積占總面積的百分比,以便估計該區(qū)間的頻數占總頻數的百分比(即頻數分布情況)。這就需要采用定積分的辦法,對函數式 (1) 或 (2) 定積分,算得從 -∞ 到 x,或從 -∞ 到 Z 的累計

11、面積(概率)。 .,圖 6 正態(tài)分布(左)及標準正態(tài)曲線下(右)的累計面積,,,,由于引入了標準正態(tài)變量 Z 值,只需對標準正態(tài)公式求定積分,求其曲線下從 -∞到任意Z 值的累計面積,并制成專用的 Z 值表(見附表);這樣對于其它任意的正態(tài)分布N(μ, σ2) ,都可以通過變量代換轉化為標準正態(tài)分布,通過查表就完成其概率計算問題。,,,,,,1. 左半側 Z

12、 值對應面積的查法:,,1. 標準正態(tài)分布區(qū)間(-1, 1 )的面積占總面積的68.26% 2. 標準正態(tài)分布區(qū)間(-1.96,1.96)的面積占總面積的95% 3. 標準正態(tài)分布區(qū)間(-2.58,2.58)的面積占總面積的99%,標準正態(tài)分布曲線下面積規(guī)律,舉例: 當 Z = -1.96時,左側的累計面積= 0.025(該區(qū)間累計頻數占總例數的 2.5%),記作 P(Z≤-1.96) = 0.025

13、。 當 Z = 1.96時, 左側累計面積為 0.975,可記作 P(Z≤1.96)=0.975, 此時P(Z≥1.96)=0.025 。,2.左半側Z 值對應面積的查法:標準正態(tài)分布是以 0 為中心左右對稱,所以該表只計算曲線下一半的面積即可 。,舉例:求 Z = - 0.5 ~-1.5之間的面積。 查表找出 Z = -0.5 時的對應面積為 0.3085,再查出 Z = -1.5

14、 時的對應面積 0.0668,相減即可。 即:P(Z = - 0.5 ~-1.5)= P(Z = - 0.5) - P(Z = -1.5) = 0.3085- 0.0668 = 0.2417,3. 查任意兩個 Z 值間的面積:,(1)曲線下橫軸上的總面積為100%(2)表中曲線下面積為(-¥,Z)(3)標準正態(tài)曲線下的面積以0為對稱,即,如區(qū)間(-¥,-1

15、.96)與區(qū)間(1.96,+¥) 的面積相等。,小結:,F(Z)=1-F(-Z),對標準正態(tài)分布曲線,4. 求一般正態(tài)分布N(μ,σ2)曲線下的面積:,⑴ 先求 u 值:,⑵ 根據 Z 值在表中查出相應的面積值,當總體均數和總體標準差未知時,就用樣本均數和樣本標準差來代替計算。,所以對正態(tài)分布或近似正態(tài)分布資料,只要求出均數和標準差,便可就其頻數分布作出概略估計了。,舉例:已知 120 名 12 歲男孩身高均數為 143 cm

16、,標準差為 5.8 cm,試估計該地 12 歲男孩身高在 135 cm 以下者有多少人?,答:1. 首先計算 Z 值:,3. 據概率計算人數:身高在 135 cm 以下者有:120×8.38% =10人,2. 查 Z 值表: 當 u = -1.38 時,左側尾部面積 0.0838,即身高在 135cm 以下者占總人數的 8.38%。,常用的正態(tài)分布、標準正態(tài)分布曲線下面積規(guī)律,,,四、正態(tài)分布在醫(yī)學中的應

17、用,,(一) 制定醫(yī)學參考值范圍,參考值范圍(reference range):指所謂“正常人”的解剖、生理、生化等指標的波動范圍。,制定方法:制定參考值范圍時,首先要確定一批樣本含量足夠大的“正常人”。所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標的疾病和有關因素的同質人群,必須是隨機選擇的大樣本。而后根據指標的實際用途確定單側或雙側界值,根據研究目的和使用要求選定適當的百分界值,常用95%。

18、 .,單側臨界值:標準正態(tài)分布單側尾部面積等于α時所對應的正側變量值,記作Zα。,雙側臨界值:標準正態(tài)分布雙側尾部面積之和等于α時所對應的正側變量值,記作Zα/2。,以不同的方法計算參考值范圍:,(1)正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料,表5-2  常用參考值范圍的制定,舉例1:調查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài)

19、,試估計該地健康女性血紅蛋白的95%參考值范圍。,解析:,1. 分布近似正態(tài),2. 過高過低均為異常,3. 求上、下界值,上界:,下界:,所以,該地健康女性血紅蛋白的95%參考值范圍是(97.41,137.39)g/l。,,舉例2: 某地調查120名健康成年男性的第一秒肺通氣量得均數 X =4.2(L), 標準差S =0.7(L),試據此估計其第一秒肺通氣量的95%參考值范圍。,解析:,1. 分布近似正態(tài),2. 僅過低為異常,3. 求

20、下界值,下界:,所以,該地健康成年男子第一秒肺通氣量的95%參考值范圍為不低于3.05(L)。,,(2)百分位法:特別適用于偏態(tài)分布資料以及資料 中一端或兩端無確切數值的資料。,如95%參考值范圍:,計算公式:,舉例:定出生體重低于2500g的嬰兒為低體重兒,若由某項研究得某地嬰兒出生體重均數為3200g ,標準差為350g,估計當年出生低體重兒所占的比例。,(二)估計頻數分布,解析:,2. 轉化為標準正態(tài)分布,求u

21、 值,,查u值表,說明標準正態(tài)曲線下 (-∞,-2)的面積為2.28%,故本題正態(tài)曲線(-∞,2500g)的比例為2.28% ,即X<2500g的為2.28%,故估計當年出生低體重兒的比例為2.28%。,估計頻數分布:,a b,即:估計變量在(a , b)區(qū)間出現的比例或者說頻率,(三)進行質量控制,基本原理:許多臨床檢驗指標,當影響某一指標的隨機因素很多,而每個因素所起的作用均不太大時,這個指標的隨機波動屬于隨機誤

22、差,則往往服從正態(tài)分布。,控制方法:常以 作為上下警戒值,以 作為上下控制值。這里的2s和3s可視為1.96s和2.58s的約數。,作為質量控制的上下警戒值:,(四)正態(tài)分布是許多統(tǒng)計方法的理論基礎,t 分布、F 分布、 分布都是在正態(tài)分布的基礎上推導出來的,u 檢驗也是以正態(tài)分布為基礎的。二項分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來

23、處理。,[選擇題]1.正態(tài)分布的兩個參數μ與σ, 對應的正態(tài)曲線平行右移。增大μ B. 減小μ C. 增大σ D. 減小σ E. 增大μ同時增大σ,2.正態(tài)分布曲線下右側5%對應的分位點為 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ,[是非題] 對稱分布與正態(tài)分布等價。,[計算題]

24、 1.某地抽查120份黃連中小蘗堿含量(mg/100g)得平均數為4.38,標準差為0.18,假設數據服從正態(tài)分布,問:(1)95%黃連樣品中小蘗堿含量在什么范圍?(2)有一份黃連樣品,小蘗堿含量為4.80,怎樣評價?,答案:,根據公式,另(4.8-4.38)/0.18=2.33>1.96,所以可認為小蘗堿含量不正常。,某地1998年抽樣調查了100名18歲男大學生身高,其均數=172.70cm,標準差=4.01 cm。

25、(1)估計該地18歲男大學生身高在168 cm以下者占該地18歲男大學生總數的百分數; (2)估計該地18歲男大學生身高在177 cm以下者占該地18歲男大學生總數的百分數。,答案:,查附表得, φ (u)=0.1210,即該地18歲男大學生身高在168 cm以下者占該地18歲男大學生總數的12.10%。,查附表得, φ(-1.07)=0.1423, 則 φ(u)=1- φ (-1.07)=1-0.1423=

26、0.8577 即該地18歲男大學生身高在177 cm以下者占該地18歲男大學生總數的85.77%。,[計算題],2. 已知某地正常成年女子的血清總蛋白數服從正態(tài)分布,調查了該地110名正常成年女子,得樣本血清總蛋白均數為72.8g/L,標準差為3.8g/L,試估計該地正常成年女子血清總蛋白介于66.0~75.0 g/L之間的比例,以及110名正常成年女子中血清總蛋白介于66.0~75.0 g/L之間的人數。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論