版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、4-1,第四章 抽樣分布與參數(shù)估計,第一節(jié) 頻率、概率與概率分布第二節(jié) 抽樣分布第三節(jié) 總體參數(shù)估計第四節(jié) 抽樣設計,4-2,第一節(jié) 頻率、概率與概率分布,一、隨機事件與概率(一)隨機試驗與事件隨機現(xiàn)象的特點是:在條件不變的情況下,一系列的試驗或觀測會得到不同的結果,并且在試驗或觀測前不能預見何種結果將出現(xiàn)。對隨機現(xiàn)象的試驗或觀測稱為隨機試驗,它必須滿足以下的性質(zhì):(1)每次試驗的可能結果不是唯一的;(2)每次
2、試驗之前不能確定何種結果會出現(xiàn);(3)試驗可在相同條件下重復進行。,4-3,,在隨機試驗中,可能出現(xiàn)也可能不出現(xiàn)的結果,稱之為隨機事件,簡稱事件。試驗的結果可能是一個簡單事件,也可能是一個復雜事件。簡單事件就是不可以再分解的事件,又稱為基本事件。復雜事件是由簡單事件組合而成的事件?;臼录€可稱為樣本點,設試驗有n個基本事件,分別記為 (i=1,2,…,n)。集合Ω={ω1 ,ω2 , … ,ωn}稱為樣本空間,Ω
3、中的元素就是樣本點。,4-4,,例:投擲一粒均勻的六面體骰子,出現(xiàn)的點數(shù)有可能是1、2、3、4、5、6共六種。這六種結果是基本結果,不可以再分解成更簡單的結果了,所以Ω={1,2,3,4,5,6}為該試驗的樣本空間?!俺霈F(xiàn)點數(shù)是奇數(shù)”這一事件就不是簡單事件,它是由基本事件{1},{3}和{5}組合而成的。我們通常用大寫字母A,B,C,…來表示隨機事件,例如,設A表示“出現(xiàn)點數(shù)是奇數(shù)”,則A={1,3,5};設B表示“出現(xiàn)點數(shù)是偶數(shù)”,則
4、B={2,4,6}。,4-5,,(二)概率1. 概率的定義概率就是指隨機事件發(fā)生的可能性,或稱為機率,是對隨機事件發(fā)生可能性的度量。 進行n次重復試驗,隨機事件A發(fā)生的次數(shù)是m次,發(fā)生的頻率是m/n,當試驗的次數(shù)n很大時,如果頻率在某一數(shù)值p附近擺動,而且隨著試驗次數(shù)n的不斷增加,頻率的擺動幅度越來越小,則稱p為事件A發(fā)生的概率,記為:P(A)=p。在古典概型場合, 即基本事件發(fā)生的概率都一樣的場合:,,,4-6,,例:設一個袋子
5、中裝有白球2個,黑球3個。(1) 從中隨機摸出1只球,問剛好是白球的概率有多大? (2) 從中隨機摸出2只球,一問2只球都是白球的概率有多大? 二問2只球一白一黑的概率有多大? 三問2只球都是黑球的概率有多大? 解:(1) 由于摸出的任何1只球都形成一個基本事件,所以樣本點總數(shù)為n=5。用A表示摸出的是白球事件,則A由兩個基本點組成,即A={白球,白球},有利場合數(shù)m=2。因此,剛好摸出白球的概率為P(A)=m/n=2/5
6、=0.4,4-7,,(2) 由于摸出2只球才成一個基本事件,所以樣本點總數(shù)為 故P(A)=P(2只球都是白球)=1/ =1/10P(B)=P(2只球一白一黑)=2×3/10=6/10P(C)=P(2只球都是黑球)=3/10NOTE: P(A+B+C)=1,4-8,,2. 概率的基本性質(zhì)性質(zhì)1 1≥P(A)≥0。性質(zhì)2 P(Ω)=1。性質(zhì)3 若事件A與事件B互不
7、相容,即AB=Ф,則P(A∪B)=P(A)+P(B)。 推論1 不可能事件的概率為0,即:P(Ф)=0。推論2 P( )=1-P(A), 表示A的對立事件,即它們二者必有一事件發(fā)生但又不能同時發(fā)生。,,,4-9,,例:袋中裝有4只黑球和1只白球,每次從袋中隨機地摸出1只球,并換入1只黑球。連續(xù)進行,問第三次摸到黑球的概率是多少? 解: 記A為“第三次摸到黑球”,則 為“第三次摸到
8、白球”。先計算P( )。由于袋中只有1只白球,如果某一次摸到了白球,換入了黑球,則袋中只有黑球了。所以相當于第一、第二次都是摸到黑球,第三次摸到白球。注意這是一種有放回的摸球,樣本點總數(shù)為53,有利場合數(shù)是42×1。故: P( )= , 所以,,,,,4-10,,3. 事件的獨立性定義 對事件A與B,若p(AB)=p(B)p(A),
9、則稱它們是統(tǒng)計獨立的,簡稱相互獨立。例:已知袋中有6只紅球, 4只白球。從袋中有放回地取兩次球,每次都取1球。設 表示第i次取到紅球。那么,因此, ,也就是說,B1,B2相互獨立。從題目條件看,這一結論是顯然的。,,,,,,4-11,二、隨機變量,隨機變量X是定義在樣本空間 Ω={ω1,ω2,…,ωn}上的一個函數(shù),
10、這個函數(shù)的取值隨試驗的結果不同而變化。這個函數(shù)還要求滿足條件:對任意的實數(shù)x,X<x是隨機事件。如果隨機變量所有可能的取值是有限的,或可排成一列的,這種隨機變量稱為離散型隨機變量;另一種情況是隨機變量的取值范圍是一個區(qū)間或整個數(shù)軸,這種隨機變量稱為連續(xù)型隨機變量。1. 離散型隨機變量的概率分布 設離散型隨機變量X的所有可能取值為x1, x2,…, xn, …,相應的概率為p(x1),p(x2),…,p(xn),…。用表
11、格統(tǒng)一表示出來是:,4-12,,X x1 x2 … xn …P p(x1) p(x2) … p(xn) …這稱為離散型隨機變量X的概率分布。性質(zhì):(1) 0≤p(xi)≤1 (i=1,2, …);(2) 定義: 離散型隨機變量X的期望值為 性質(zhì):其中X1,X2都是隨機變量,α,β是任意常數(shù)。,,,,4-13,,定義: 離散型隨機
12、變量X的方差為方差的平方根σ稱為標準差。方差σ2或標準差σ反映隨機變量X相對其期望值的離散程度,σ2或σ越小, 說明期望值的代表性越好;σ2或σ越大,說明期望值的代表性越差。性質(zhì):對于任意的α,D(αX)=α2 D(X) 成立,,4-14,,貝努里試驗 與二項分布有時我們只對試驗中某事件A是否出現(xiàn)感興趣,如果A發(fā)生,我們稱“成功”,否則稱“失敗”。像這樣只有兩種結果的試驗稱為貝努里試驗。設A出現(xiàn)的概率為p,我們獨立地重復進行
13、n次貝努里試驗,稱為n重貝努里試驗.以Bk表示n重貝努里試驗中事件A正好出現(xiàn)k次這一事件,則 (k=0,1,2,…,n) 該分布稱為二項分布( q= 1- p ).NOTE:,,4-15,,2. 連續(xù)型隨機變量的概率分布 設X是R.V., x 是一實數(shù). 記F(x)=P(X<x)。該函數(shù)就是隨機變量X的分布函
14、數(shù)。分布函數(shù)的導數(shù)稱為密度函數(shù),記作p(x )。 性質(zhì) (1) p(x)≥0(2) (3),,,4-16,,定義: 連續(xù)型隨機變量X的期望值為 方差為
15、 性質(zhì): D(αX)=α2 D(X),,,,4-17,,正態(tài)分布 如果連續(xù)型隨機變量X的密度函數(shù)為 則稱隨機變量X服從均值為μ,方差為σ2的正態(tài)分布,記為X~N(μ,σ2)。 如果一個正態(tài)分布的μ=0,σ=1,則稱該正態(tài)布為標準正態(tài)分布,相應
16、的隨機變量稱為標準正態(tài)隨機變量,用Z表示,即Z~N(0,1),相應的分布密度函數(shù)為,,,4-18,,一般正態(tài)分布 與標準正態(tài)分布 的關系:若隨機變量X服從正態(tài)分布N (μ,σ2),則隨機變量 Z = 服從標準正態(tài)分布,即Z~N(0,1)。,,,,4-19,,例:某大學英語考試成績服從正態(tài)分布,已知平均成績?yōu)?0分,標準差為10分。求該大學英語成績在60—75分的概率。,4-20,第二節(jié) 抽樣分布,一、抽
17、樣的基本概念二、抽樣分布(一)重復抽樣分布(二)不重復抽樣分布三、大數(shù)定理與中心極限定理,4-21,一、抽樣的基本概念,抽樣涉及的基本概念有:總體與樣本(見第一章)樣本容量與樣本個數(shù)總體參數(shù)與樣本統(tǒng)計量重復抽樣與不重復抽樣這些概念是統(tǒng)計學特有的,體現(xiàn)了統(tǒng)計學的基本思想與方法。,4-22,總體和樣本(參見第1章),1.總體:又稱全及總體、母體,指所要研究對象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構成??傮w單位數(shù)用
18、 N 表示。2.樣本:又稱子樣,來自總體,是從總體中按隨機原則抽選出來的部分,由抽選的單位構成。樣本單位數(shù)用 n 表示。3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機的。,4-23,樣本容量與樣本個數(shù),樣本容量:一個樣本中所包含的單位數(shù),用n表示。樣本個數(shù):又稱樣本可能數(shù)目,指從一個總體中所可能抽取的樣本的個數(shù)。對于有限總體,樣本個數(shù)可以計算出來。樣本個數(shù)的多少與抽樣方法有關。(這個概念只是對有限總體有意義,對無限總體沒
19、有意義!),4-24,總體參數(shù)和樣本統(tǒng)計量,總體參數(shù):反映總體數(shù)量特征的指標。其數(shù)值是唯一的、確定的。樣本統(tǒng)計量:根據(jù)樣本分布計算的指標。是隨機變量。,4-25,重復(置)抽樣與不重復(置)抽樣,重置抽樣與不重置抽樣(各有3個特點P90)重復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數(shù)=Nn=52=25不考慮順序時:樣本個數(shù)=,,,,,,4-26,重復(置)抽樣與不重復(
20、置)抽樣,,,,,,,,,,,不重復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數(shù)不考慮順序時:樣本個數(shù),4-27,二、抽樣分布,抽樣分布的概念:由樣本統(tǒng)計量的全部可能取值和與之相應的概率(頻率)組成的分配數(shù)列。(主要求出樣本平均數(shù)的期望與方差)包括以下內(nèi)容重置抽樣分布樣本平均數(shù)的分布樣本成數(shù)的分布不重置抽樣分布樣本平均數(shù)的分布樣本成數(shù)的分布,4-
21、28,重置抽樣分布--樣本平均數(shù)的分布,某班組5個工人的日工資為34、38、42、46、50元。? = 42?2 = 32現(xiàn)用重置抽樣的方法從5人中隨機抽2個構成樣本。共有52=25個樣本。如右圖。,,,,,,4-29,驗證了以下兩個結論:抽樣平均數(shù)的標準差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用 表示。,重置抽樣分布--樣本平均數(shù)的分布,4-30,重置抽樣分布--樣本平均數(shù)的分布,由概率論知
22、,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布這是一個非常重要的結論,有廣泛的應用。(請參見中心極限定理。),4-31,重置抽樣分布--樣本成數(shù)的分布,總體成數(shù)p是指具有某種特征的單位在總體中的比重。成數(shù)是一個特殊平均數(shù),設總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現(xiàn)從總體中抽出n個單位,如果其中有相應特征的單位數(shù)是n1,則樣本成數(shù)是:
23、 P也是一個隨機變量,利用樣本平均數(shù)的分布性質(zhì)結論,即有:,4-32,不重置抽樣分布,樣本均值的分布性質(zhì):樣本成數(shù)的分布性質(zhì),4-33,抽樣分布總結,4-34,三、大數(shù)定理與中心極限定理,大數(shù)定理,,當樣本容量n 充分大時,可以用樣本平均估計總體平均。,當試驗次數(shù)n充分大時,可以用頻率代替概率。,大數(shù)定理的意義:個別現(xiàn)象受偶然因素影響,但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,從而使總體平均數(shù)穩(wěn)定下
24、來,反映出事物變化的一般規(guī)律,這就是大數(shù)定理的意義。,4-35,中心極限定理,正態(tài)分布的再生定理 :相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布。中心極限定理:大樣本的平均數(shù)近似服從正態(tài)分布。,4-36,,例1:求樣本平均數(shù)的概率分布,設某公司1000名職工的人均年獎金為2000元,標準差500元,隨機抽取36人作為樣本進行調(diào)查,問樣本的人均年獎金在1900~2200元之間的概率有多大?,,,,,4-37,例2,某地區(qū)職工
25、家庭的人均年收入平均為12000元,標準差為2000元。若知該地區(qū)家庭的人均年收入服從正態(tài)分布,現(xiàn)采用重復抽樣從總體中隨機抽取25戶進行調(diào)查,問出現(xiàn)樣本平均數(shù)等于或超過12500元的可能性有多大?,4-38,例3,某商場推銷一種洗發(fā)水。據(jù)統(tǒng)計,本年度購買此種洗發(fā)水的有10萬人,其中6萬是女性。如果按不重復隨機抽樣方法,從購買者中抽出100人進行調(diào)查,問樣本中女性比例超過50%的可能性有多大?,4-39,第三節(jié) 總體參數(shù)估計,本節(jié)主要
26、內(nèi)容:總體參數(shù)估計概述總體參數(shù)的點估計參數(shù)區(qū)間估計樣本容量的確定,4-40,一、總體參數(shù)估計概述,設待估計的總體參數(shù)是θ,用以估計該參數(shù)的統(tǒng)計量是 ,抽樣估計的極限誤差是Δ,即:極限誤差是根據(jù)研究對象的變異程度和分析任務的性質(zhì)來確定的在一定概率下的允許誤差范圍。參數(shù)估計的兩個要求:精度:估計誤差的最大范圍,通過極限誤差來反映。顯然,Δ越小,估計的精度要求越高,Δ越大,估計的精度要求越低。極限誤差的確定要以實際需要
27、為基本標準??煽啃裕汗烙嬚_性的一個概率保證,通常稱為估計的置信度。,4-41,二、總體參數(shù)的點估計,點估計的含義:直接以樣本統(tǒng)計量作為相應總體參數(shù)的估計量。,,4-42,優(yōu)良估計量標準,優(yōu)良估計標準:無偏性:要求樣本統(tǒng)計量的平均數(shù)等于被估計的總體參數(shù)本身。一致性:當樣本容量充分大時,樣本統(tǒng)計量充分靠近總體參數(shù)本身。有效性:,總體方差的無偏估計量為樣本方差,點估計完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計量
28、去估計總體參數(shù)的范圍 ? 區(qū)間估計。,4-43,三、參數(shù)區(qū)間估計,參數(shù)區(qū)間估計的含義:估計總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計成立的概率值。其中: 1-α(0<α<1)稱為置信度;α是區(qū)間估計的顯著性水平,其取值大小由實際問題確定,經(jīng)常取1%、5%和10%。,注間對上式的理解:例如抽取了1000個樣本,根據(jù)每一個樣本均構造了一個置信區(qū)間,,這樣,由1000個樣本構造的總體參數(shù)的1000個置信區(qū)間中,有95%的區(qū)間包含了
29、總體參數(shù)的真值,而5%的置信區(qū)間則沒有包含。這里,95%這個值被稱為置信水平(或置信度)。一般地,將構造置區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。,4-44,,我們用95%的置信水平得到某班學生考試成績的置信區(qū)間為60-80分,如何理解?錯誤的理解:60-80區(qū)間以95%的概率包含全班同學平均成績的真值;或以95%的概率保證全班同學平均成績的真值落在60-80分之間。正確的理解:如果做了多次抽
30、樣(如100次),大概有95次找到的區(qū)間包含真值,有5次找到的區(qū)間不包括真值。真值只有一個,一個特定的區(qū)間“總是包含”或“絕對不包含”該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值。如果大家還是不能理解,那你們最好這樣回答有關區(qū)間估計的結果:該班同學平均成績的置信區(qū)間是60-80分,置信度為95%。,4-45,區(qū)間估計的基本要素,包括:樣本點估計值、抽樣極限誤差、估計的可靠程度樣本點估計值
31、抽樣極限誤差:可允許的誤差范圍。抽樣估計的可靠程度(置信度、概率保證程度)及概率度注意:本教材所進行的區(qū)間估計僅指對總體平均數(shù)或成數(shù)的區(qū)間估計,并且在際計算過程中使用下面的式子。式中Δ是極限誤差。,4-46,區(qū)間估計的內(nèi)容,4-47,平均數(shù)的區(qū)間估計,對總體平均數(shù)或成數(shù)的區(qū)間估計時,使用下面的式子 (式中Δ是極限誤差)有兩種模式:1、根據(jù)置信度1-α,求出極限誤差Δ,并指出總體平均數(shù)的估計區(qū)間。2、給定極限誤差
32、,求置信度。,4-48,當σ已知時,根據(jù)相關的抽樣分布定理, 服從標準正態(tài)分布N(0,1)。查正態(tài)分布概率表,可得 (一般記為 ),則 ,根據(jù)重復抽樣與不重復抽樣的 求法的不同,進一步可得總體平均數(shù)的估計區(qū)間:重復抽樣時,區(qū)間的上下限為:不重復抽樣時,區(qū)間的上下限為:,平均數(shù)區(qū)間估計—第1種模式(
33、求置信區(qū)間),4-49,,,,,,4-50,平均數(shù)區(qū)間估計—第1種模式(求置信區(qū)間),若總體方差未知,則在計算 時,使用樣本方差代替總體方差,此時 服從自由度為n-1的t分布。查t分布表可得 ,并記為于是:重復抽樣時,區(qū)間的上下限為:不重復抽樣時,區(qū)間的上下限為:,,大樣本時,t分布與標準正態(tài)分布非常接近,可直接從標準正態(tài)分布表查臨界值,4-51,例:總體平均數(shù)的區(qū)間估計1,對某型號
34、的電子元件進行耐用性能檢查,抽查資料分組如下表,要求估計該批電子元件的平均耐用時數(shù)的置信區(qū)間(置信度95%)。,4-52,,,,68.27%的樣本,,表示樣本均值落在…區(qū)間的概率是1-α,例,對總體均值區(qū)間估計的進一步理解,,4-53,平均數(shù)區(qū)間估計—第2種模式(求置信度),給定極限誤差,求置信度,4-54,例:總體平均數(shù)的區(qū)間估計2,例:經(jīng)抽樣調(diào)查計算樣本畝產(chǎn)糧食600公斤,并求得抽樣平均誤差為3公斤,現(xiàn)給定允許極限誤差為6公斤,求置
35、信區(qū)間包含總體平均畝產(chǎn)的概率,即求置信水平。,結果表明,如果多次反復抽樣,每次都可以由樣本值確定一個估計區(qū)間,每個區(qū)間或者包含總體參數(shù)的真值,或者不包含總體參數(shù)的真值,包含真值的區(qū)間占F(z),即每一萬次抽樣,就有9545個樣本區(qū)間包括總體畝產(chǎn),其余455個樣本區(qū)間不包括總體平均數(shù),即若接受估計區(qū)間的判斷要冒4.55%的機會犯錯誤的風險。,4-55,成數(shù)的區(qū)間估計,由于總體的分布是(0,1)分布,只有在大樣本的情況下,才服從正態(tài)分布???/p>
36、體成數(shù)可以看成是一種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計,總體成數(shù)的區(qū)間估計的上下限是:注意:在實踐中,由于總體成數(shù)常常未知,這時,抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。 大樣本的條件:np≥5且n(1-p) ≥5,由于總體成數(shù)p通常未知,可以用樣本成數(shù)來近似判斷。,4-56,例:總體平均數(shù)的區(qū)間估計3,對某型號的電子元件進行耐用性能檢查,抽查資料分組如下表, 設該廠的產(chǎn)品質(zhì)量檢驗標準規(guī)定,元件耐用時數(shù)達到1000小時
37、以上為合格品。要求估計該批電子元件的合格率,置信水平95%。,4-57,總體均值區(qū)間估計總結,如果是正態(tài)總體,4-58,,如果不是正態(tài)總體,或分布未知,此時不考慮小樣本情況,因此,大樣本情況下,直接用標準正態(tài)分布求置信區(qū)間即可。,4-59,總體成數(shù)估計區(qū)間估計總結,總體成數(shù)估計區(qū)間的上下限只考慮大樣本情況(請記住大樣本條件),4-60,對總量指標的區(qū)間估計,在對總體平均數(shù)進行區(qū)間估計的基礎上,可進一步推斷相應的總量指標,即用總體
38、單位總數(shù)N分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間上限,便得到相應總量(Nμ)的區(qū)間范圍。,4-61,例1,某廠對一批產(chǎn)品的質(zhì)量進行抽樣檢驗,采用重復抽樣抽取樣品200只,樣本優(yōu)質(zhì)率為85%,試計算當把握程度為90%時優(yōu)質(zhì)品率的區(qū)間范圍。,,4-62,例2,某商場從一批食品(共800袋)中隨機抽取40袋(假設用重復抽樣),測得每袋平均重量為791.1克,標準差為17.136克,要求以95%的把握程度,估計這批食品的平均每袋重量以及這批食品總重
39、量的區(qū)間范圍。,[800*778.84,800*803.36],即[623072,642688],4-63,三、樣本容量確定,什么是樣本容量確定問題?,4-64,確定樣本容量,在設計抽樣時,先確定允許的誤差范圍和必要的概率保證程度,然后根據(jù)歷史資料或試點資料確定總體的標準差,最后來確定樣本容量。,4-65,確定樣本容量應注意的問題,計算樣本容量時,一般總體的方差與成數(shù)都是未知的,可用有關資料替代:一是用歷史資料已有的方差與成數(shù)代替;
40、二是在進行正式抽樣調(diào)查前進行幾次試驗性調(diào)查,用試驗中方差的最大值代替總體方差;三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替。如果進行一次抽樣調(diào)查,同時估計總體均值與成數(shù),用上面的公式同時計算出兩個樣本容量,可取一個最大的結果,同時滿足兩方面的需要。上面的公式計算結果如果帶小數(shù),這時樣本容量不按四舍五入法則取整數(shù),取比這個數(shù)大的最小整數(shù)代替。例如計算得到:n=56.03,那么,樣本容量取57,而不是56。,4
41、-66,例:確定樣本容量1,對某批木材進行檢驗,根據(jù)以往經(jīng)驗,木材長度的標準差為0.4米,而合格率為90%?,F(xiàn)采用重復抽樣方式,要求在95.45%的概率保證程度下,木材平均長度的極限誤差不超過0.08米,抽樣合格率的極限誤差不超過5%,問必要的樣本單位數(shù)應該是多少?,,4-67,例:確定樣本容量2,對某批木材進行檢驗,根據(jù)以往經(jīng)驗,木材的合格率為90%、92%、95%?,F(xiàn)采用重復抽樣方式,要求在95.45%的概率保證程度下,抽樣合格率的
42、極限誤差不超過5%,問必要的樣本單位數(shù)應該是多少?,4-68,第四節(jié) 抽樣的組織形式,本節(jié)主要內(nèi)容:抽樣估計效果的衡量與抽樣組織形式簡單隨機抽樣類型抽樣整群抽樣等距抽樣階段抽樣不同抽樣組織設計的比較,4-69,一、抽樣估計效果的衡量與抽樣組織形式,抽樣估計效果好壞,關鍵是抽樣平均誤差的控制。抽樣平均誤差小,抽樣效果從整體上看就是好的;否則,抽樣效果就不理想。抽樣平均誤差受以下幾方面的因素影響:一是總體的變異性,即與總
43、體的標準差大小有關二是樣本容量三是抽樣方法。四是抽樣的組織形式抽樣的組織形式有如下幾種:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、階段抽樣,4-70,二、簡單隨機抽樣,4-71,三、類型抽樣,含義:又稱分層抽樣。對總體各單位按一定標志加以分組,然后從每一組中按隨機原則抽取一定單位構成樣本。,,,,得到樣本如下:,4-72,類型抽樣—求樣本平均數(shù),4-73,類型抽樣—求抽樣平均誤差,4-74,類型抽樣—求抽樣平均誤差,4-75
44、,類型抽樣—兩點結論,從類型抽樣的抽樣平均誤差公式來看,類型抽樣的抽樣平均誤差與組間方差無關,它決定于組內(nèi)方差的平均水平。而方差的加法定理: ,因此有如下結論:抽樣效果一般來說好于簡單隨機抽樣。因此在分組時應盡量擴大組間方差(組間差異),縮小組內(nèi)方差(組內(nèi)差異),從而減少抽樣誤差,提高抽樣效果。,4-76,類型抽樣—例,假設某農(nóng)場種植小麥1 200畝,根據(jù)其地理條件劃分為甲、乙、丙三類,按5%的比例
45、總共抽取60畝進行調(diào)查,結果如下表所示。試以95%的概率估計農(nóng)場平均畝產(chǎn)量的區(qū)間范圍。,4-77,四、整群抽樣,定義:又稱集團抽樣。將總體各單位分為若干群,然后從中抽取部分群,對中選群的所有單位進行全面調(diào)查。,,,4-78,整群抽樣—抽樣平均誤差的計算,在計算抽樣平均誤差時假定每群單位數(shù)是相同的,但實際工作中,通常是“自然群”,其單位數(shù)一般是不等的。,4-79,整群抽樣—抽樣效果評價,好處是操作方便、省時、省力。確定一群便可以調(diào)查許多單
46、位,但正是由于抽樣單位比較集中,限制了樣本單位在總體中分配的均勻性,所以有時代表性較代,抽樣誤差較大??梢栽黾訕颖締挝粊頊p少誤差 。抽樣平均誤差只取決于群間方差(與類型抽樣相反),因此分群時,應盡量擴大群內(nèi)方差(群內(nèi)差異),縮小群間方差(群間差異)來提高抽樣效果。,4-80,整群抽樣—例1,從某縣的100個村莊中抽出10村,進行調(diào)查得平均每戶飼養(yǎng)家禽35頭,各村的平均數(shù)的方差為16頭,請計算平均抽樣誤差。,4-81,整群抽樣—例2,假
47、設某水泥廠大量連續(xù)生產(chǎn)100公斤裝水泥,一晝夜產(chǎn)量為14 400袋,平均每分鐘產(chǎn)量10袋?,F(xiàn)每隔144分鐘抽取一分鐘的產(chǎn)量(10袋為一群),一晝夜共抽取100袋水泥,觀察結果如下表,試計算樣本平均數(shù)的抽樣平均誤差,并以95%的概率估計每包水泥重量的區(qū)間范圍。,4-82,五、等距抽樣,含義:又稱機械抽樣或系統(tǒng)抽樣。先按某個標志對總體單位進行排序,然后依固定的間隔來抽取樣本單位。這樣可以保證樣本單位均勻地分布在總體的各個部分,有較高的代表性
48、??傮w的單位數(shù)N,需要抽取的樣本單位數(shù)n,則等距抽樣的間隔大?。簁=N/n,總體排序標志是由總體的有關輔助信息確定的,與調(diào)查標志兩者間可以有關也可以無關。1、無關標志排隊:如家計調(diào)查,按門牌號碼排序。2、有關標志排隊:如農(nóng)產(chǎn)量調(diào)查按平均畝產(chǎn)量高低排序。一般來講,有關標志排序要比無關標志排序的機械抽樣更為優(yōu)越。,在排隊時,要注意避免抽樣間隔與現(xiàn)象本身的周期性節(jié)奏相重合。以減少系統(tǒng)偏差的影響,提高樣本的代表性。,,,4-83,等
49、距抽樣—抽樣平均誤差的計算,無關標志排隊時,為了方便起見,可以采用簡單隨機抽樣的平均誤差代替等距抽樣平均誤差 :,,4-84,六、階段抽樣,含義:所謂階段抽樣,就是先從總體中抽出較大的范圍的單位,再從中選的大單位中抽較小范圍的單位,依次類推,最后從更小的范圍抽出樣本基本單位。階段抽樣一般應用于總體范圍很大的情況。如在我國的農(nóng)產(chǎn)量調(diào)查、職工家計調(diào)查中都很適用:先從全國抽出各個省,再從抽中的省中抽出縣、市,最后抽出樣本的基本單位等等。,4
50、-85,階段抽樣—兩階段抽樣,兩階段抽樣較為簡單。本書主要分析兩階段抽樣平均誤差的控制問題。兩階段抽樣在組織技術上可以看成是整群抽樣和類型抽樣的結合。設總體分成R組,每組M個單位。兩階段抽樣就是:第一階段用整群抽樣方式從總體的全部R組(群)中,隨機抽取r組(群);第二階段用類型抽樣方式從每個中選組中抽出m樣本單位。,4-86,兩階段抽樣—樣本平均數(shù),4-87,兩階段抽樣—抽樣平均誤碼,兩階段抽樣的平均誤差是由兩部分構成的,第一部分是
51、第一階段從總體全部組抽部分組所引起的組間誤差,第二部分是由第二階段在中選組中抽部分單位所引起的組內(nèi)平均誤差。,4-88,七、不同抽樣組織設計的比較,進行抽樣設計時需要考慮的兩個問題:提高樣本的代表性,增加抽樣的效果。抽樣要滿足隨機性要求。抽樣設計時,要充分考慮如何降低抽樣的成本費用。,4-89,簡單隨機抽樣是基本抽樣組織方式,抽樣推斷效果如何,依賴于所抽出樣本的質(zhì)量;樣本的質(zhì)量好壞,就看樣本對總體的代表性如何,而這又依賴于抽取樣本時
52、的 “隨機性”。 如果不滿足隨機性,則樣本的代表性就值得懷疑,抽樣推斷就無從進行。,4-90,類型抽樣與整群抽樣比較,1、抽樣平均誤差的決定因素不同。類型抽樣的平均誤差與組間方差無關,決定于組內(nèi)方差的平均水平整群抽樣的平均誤差與組內(nèi)方差無關,決定于組間方差大小2、減小類型抽樣與整群抽樣平均誤差的方法不同。因為總體方差等于組間方差加上組內(nèi)方差平均數(shù)。所以提高組間方差,降低組內(nèi)方差可減小類型抽樣平均誤差 對于整群抽樣則相反3、
53、適應范圍不同。類型抽樣充分利用總體的已有信息,其前提就是對總體的結構事先有一定的認識,然后通過分類把總體中調(diào)查標志差異比較接近的單位歸為一組,減少組內(nèi)差異,再從各組中抽出樣本,這樣的樣本就對總體有更大的代表性。整群抽樣適用于無原始資料可利用的總體單位。是一種較為方便有效的抽樣組織方式,有利于提高抽樣的效率。但要注意整群抽樣有時代表性不是很理想,抽樣誤差較大。在實際抽樣中,通常要適當增加一些樣本單位,以利于縮小抽樣誤差,提高抽樣推斷的
54、準確度。,4-91,階段抽樣平均誤差的控制,階段抽樣誤差的控制必須落實到抽樣的各個階段。兩階段抽樣誤差控制,要落實為第一階段的整群抽樣的誤差控制與第二階段的類型抽樣的誤差控制兩方面。兩階段抽樣平均誤差,既取決于組間方差也取決于組內(nèi)平均方差,但組間方差是主要的因素。所以在組織兩階段抽樣時在相同樣本容量要求下,適當增加第一階段的組數(shù),比增加第二階段的單位數(shù),能更顯著地提高抽樣效果。,4-92,選擇題,1.假定樣本容量增加50%。則重復抽樣
55、平均誤差:(甲)為原來的一半;(乙)為原來的81.6%。在重復抽樣時,為使誤差減少50%,則樣本容量:(丙)應增加三倍;(丁)應增加四倍。 A.甲丙 B.甲丁 C.乙丙 D.乙丁2.抽樣估計中的抽樣誤差( ) A.是不可避免的 B.可以通過改進調(diào)查方法避免的 C.是可以運用數(shù)學公式計算的 D.誤差大小是可以加以控制的 E. 包含了登記性誤差3.抽樣平均誤差指標說明( ) A
56、.樣本平均數(shù)的代表性 B.抽樣指標的代表性 C.估計值與實際值的平均誤差 D.樣本指標相對于總體指標離差的平均水平 E.抽樣誤差的大小,4-93,,4.從一個全及總體中可以抽取一系列樣本,所以( ) A.樣本指標的數(shù)值不是唯一確定的 B.樣本指標是樣本變量的函數(shù) C.總體指標是隨機變量 D.樣本指標是隨機變量 E.樣本指標數(shù)值隨著樣本的不同而不同5.影響抽樣數(shù)目(樣本容量)的因素有
57、( ) A.允許誤差范圍 B.抽樣指標的大小 C.抽樣方法 D.總體標志變異程度 E.概率保證程度,4-94,,6. 是非標志不存在變異時,意味著:( ) A.各標志值(1或0)遇到同樣的成數(shù)(0.5) B.總體所有單位都只具有某屬性——只運用變量值“1” C.總體所有單位都只具有某屬性——只運用變量值“0” D.所計算
58、的方差為0 E.所計算的方差為0.257.抽樣推斷的置信度、概率度和精確度關系表現(xiàn)在( )A.概率度增大,估計的可靠性也增大B.概率度增大,估計的精確度下降C.概率度縮小,估計的精確度也縮小D.概率度縮小,估計的可靠性也增大E.估計的可靠性增大,估計的精確度也增大8.標準差、抽樣平均誤差的聯(lián)系和區(qū)別?,4-95,計算題1,從某大公司的10000女工中隨機抽取100名,調(diào)查她們每天家務勞動時間,
59、資料如下:,試計算:(1) 計算每天家務勞動2—5小時女工的比重、比重方差、均方差系數(shù)。(2)在重復抽樣條件下,以95.45%的置信度來估計公司女工平均每天家務勞動時間的區(qū)間估計。(3)在不重復抽樣條件下,以z=1的概率度估計該公司女工每天家務勞動時間2—5小時的比重區(qū)間,指出這種區(qū)間的可信程度。,4-96,計算題2,一家公司隨機抽取了100個壞帳,經(jīng)計算,其平均余額為5570元,樣本標準差為725元,試以90%的概率保證程度估計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 參數(shù)估計與非參數(shù)估計
- 動態(tài)排序集抽樣下刻度分布族刻度參數(shù)的參數(shù)估計.pdf
- 多元Logistic分布及其參數(shù)估計.pdf
- [學習]多元正態(tài)分布及參數(shù)估計
- 23755.kumaraswamy分布的參數(shù)估計
- 分布式目標參數(shù)估計.pdf
- 26176.lomax分布的參數(shù)估計與均值比較
- 極值分布參數(shù)估計方法的研究.pdf
- 36794.三參數(shù)weibull分布參數(shù)估計方法研究
- 威布爾分布參數(shù)估計的研究.pdf
- NOMMLE分布的參數(shù)估計與MCMC模擬研究.pdf
- 有序抽樣方法及此方法下的參數(shù)估計.pdf
- 22817.廣義gamma分布的參數(shù)估計
- 參數(shù)估計理論
- 參數(shù)估計方法
- 混合指數(shù)分布的參數(shù)估計.pdf
- Weibull分布壽命數(shù)據(jù)的參數(shù)估計.pdf
- 多元Logistic分布的構造及其參數(shù)估計.pdf
- 刪失數(shù)據(jù)幾何分布的參數(shù)估計.pdf
- 參數(shù)估計與假設檢驗
評論
0/150
提交評論