版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、總體屬性的分布?分布的參數(shù)?,總體,樣本數(shù)據(jù),,樣本,問題1:如何用樣本數(shù)據(jù)估計總體?,問題2:用樣本數(shù)據(jù)估計總體變化范圍 以及該估計的可靠性,問題3:如何檢驗關(guān)于總體的統(tǒng)計判斷的真?zhèn)危?第三部分:參數(shù)估計與假設(shè)檢驗,一、參數(shù)的點估計,1、參數(shù)的點估計的一般提法設(shè)總體 X 的分布函數(shù)F=(x ,? )的形式已知,? 是待估參數(shù),X1, X2, …., Xn 是 X 的一個樣本,x1, x2, ….,
2、xn 是 相應的樣本觀測值。點估計就是要構(gòu)造一個適當?shù)慕y(tǒng)計量? (X1, X2, …., Xn) ,用它的觀測值? (x1, x2, …., xn )來估計未知參數(shù)?。,2、參數(shù)點估計的求法(1)矩估計法(estimation by moments) 用樣本各階原點矩的函數(shù)來估計總體各階原點矩的同一個函數(shù)的方法稱為矩估計法。相應的估計量稱為矩估計量。,例1 從某燈泡廠生產(chǎn)的一批燈泡中,隨機地抽取了10只,測得壽命如
3、下1050,1100, 1080, 1120, 1200, 1250, 1040, 1130, 1300, 1200。,用矩估計法估計該批燈泡的平均壽命與標準差。 用樣本均值和樣本2階中心矩估計總體均值與方差。即取估計量為,估計值分別為,(2)順序統(tǒng)計量方法設(shè)樣本X1, X2, …., Xn 的一組觀測值 x1, x2, …., xn 已按照升序排列,
4、 x1 ? x2 ? …. ? xn稱 xk 是為樣本第 k 個順序統(tǒng)計量的觀察值。,樣本極差 R = xn - x1 , 樣本中位數(shù)均為順序統(tǒng)計量。,順序統(tǒng)計量計算簡單,不受極端值的影響。在總體為連續(xù)型且概率密度為對稱的情形,常用中位數(shù)估計總體均值,用極差的函數(shù)估計總體標準差。,一般情況下,dn可由下式近似計算,3、點估計量的評價標準 對同一個待估參數(shù),可以構(gòu)造不同的點估計量,
5、孰好孰劣?從統(tǒng)計的原理角度,應如何構(gòu)造,如何評價優(yōu)劣?(1)無偏性,例2 樣本k階原點矩均值是總體k階原點矩均值的無偏估計量。例3 樣本2階中心矩B2是總體方差的有偏估計量。,的含義是:在樣本容量相同的情況下,前者的方差比后者小,即其觀察值更集中在真值? 的附近。由于估計量密集在真值附近的程度是用 衡量的。當 是無偏的,有,例4 樣本方差是總體方差的無偏估計量。,例5 當總體分
6、布有偏倚時,樣本中位數(shù)是總體均值的有偏估計量。,(2)有效性,故,方差小者為好。,是? 的一致估計量。,例6 對于正態(tài)總體,樣本均值與樣本中位數(shù)均是總體均值的無偏估計量。,,樣本均值優(yōu)于樣本中位數(shù),(3)一致性,依概率收斂與?,則稱,若估計量,對于任意的,,當n??時,,樣本的k階原點矩Ak是總體k階原點矩的一致性估計量。進一步,若g 是連續(xù)函數(shù),,則,是? 的一致估計量。,例7 設(shè)有一批產(chǎn)品,為估計其廢品率p ,隨機取一樣本,若
7、取 ,則 , 所以是 p 的無偏估計量。,由切比雪夫不等式,有,是 p 的一致無偏估計量。,二、參數(shù)的區(qū)間估計,1、參數(shù)的區(qū)間估計的一般提法 設(shè)總體 X 的分布函數(shù)F=(x ,? )的形式已知,的兩個統(tǒng)計量,,滿足,則稱隨機區(qū)間,是? 的置信度為100(1-?)%,的置信區(qū)間。,分別稱為置信度為1-?的雙
8、側(cè)置信區(qū)間的置信下限與置信上限。,例7 設(shè)總體~N( ? , 0.09),隨機抽得4個獨立觀察值x1, x2, x3, x4 ,求總體均值?的95%置信區(qū)間。,服從N(0, 1), 與?無關(guān)。對給定的置信度? ,應有,由不等式推得,查表得 z0.025=1.96, 0.15z0.025=0.294,故?的95%置信區(qū)間為,區(qū)間估計的含義是:當我們對X進行多次抽樣(M次)每一次抽樣提供了一個區(qū)間,共M個,根據(jù)大數(shù)定理,
9、這M個區(qū)間中大約有100(1 - ?)%個包含真值 。,注:置信區(qū)間不唯一,習慣上取最窄的,及關(guān)于?對稱的。 上述置信區(qū)間為雙側(cè)置信區(qū)間,但對于某些實際問題。如產(chǎn)品的壽命、服務時間等,只關(guān)心下限。而對于產(chǎn)品的次品率、成本等只管心上限。,給定 0 < ? <1,若統(tǒng)計量 滿足,稱 是? 的置信度為100(1-?)%,的
10、單側(cè)置信區(qū)間。 為置信下限,給定 0 < ? <1,若統(tǒng)計量 滿足,稱 是? 的置信度為100(1-?)%,的單側(cè)置信區(qū)間。 為置信上限,例8 若N( ? , 0.09)為產(chǎn)品壽命分布,隨機地抽取了9只,求置信度為99%的置信下限,查表得 z0。01=2.33, 0.1z0.01= 0.233,故?的9
11、9%置信區(qū)間為,1、總體均值的區(qū)間估計方法,(1)樣本取自總體方差已知的正態(tài)分布置信度為1-?的雙側(cè)置信區(qū)間為單側(cè)置信區(qū)間分別為,(2)樣本取自總體方差已知的非正態(tài)分布(大樣本)置信度為1-?的雙側(cè)置信區(qū)間為,(3)樣本取自總體方差未知的正態(tài)分布,查t分布表得到t?/2,置信度為1-?的雙側(cè)置信區(qū)間為,例9 對某型號的汽車的最大速度進行了30次實驗,測得樣本的平均速度為220公里/小時,樣本方差S2為16公里。根據(jù)長期經(jīng)驗知,
12、最大速度服從正態(tài)分布,求平均最大速度的95%的置信區(qū)間。解:正態(tài)總體,方差未知,求?的置信區(qū)間,查表得 t0.025(29)=2.045,,置信度為95%的雙側(cè)置信區(qū)間為,置信度為95%的單側(cè)置信區(qū)間為,查表得 t0.05(29)=1.699,,置信度為95%的單側(cè)置信區(qū)間為,在大樣本情況下,用正態(tài)分布代替t分布, z0.025 = 1.96, z0.05=1.65對應的置信區(qū)間分別為:
13、 與,(4)樣本取自總體方差未知的非正態(tài)分布(大樣本) 用正態(tài)分布代替t分布,2、兩個總體均值之差的區(qū)間估計,(1) 兩個正態(tài)總體,方差已知,,,置信區(qū)間為,設(shè)n1 和n2分別為來自兩個正態(tài)總體的樣本容量,樣本均值之差服從,(2) 兩個正態(tài)總體,方差未知但相等,其中,,,置信區(qū)間,(3) 兩個非正態(tài)總體,方差未知(大樣本),置信區(qū)間,3、正態(tài)總體方差的區(qū)間估計,對于正態(tài)總體,,,有,方差的置信區(qū)間,標準差的置信
14、區(qū)間,設(shè)X服從兩點分布,分布律為 f(x, p) = px (1 - p)1-x x = 0, 1X1, X2, …., Xn 為取自X的一個樣本,4、總體比率p的區(qū)間估計,統(tǒng)計量 按照中心極限定理近似服從N( 0, 1)當n充分大時,樣本均值總體比率的置信度為1-?的近似置信區(qū)間由下式確定,要求
15、60;當 接近 1 或 0 時,n 須很大。,5、兩個總體比率之差的區(qū)間估計,設(shè)兩個總體比率分別為p1 和p2, n1 和n2分別為來自兩個總體的樣本容量,當n1 p1 、n1(1- p1)和n2p2 、n2(1- p2) 均大于5時, 樣本比率之差( p1- p2),近似服從,置信度為1-?的近似置信區(qū)間為,例1 某工廠采購了一批設(shè)備備件,歷史經(jīng)驗表明該種備件的平均使用壽命為1100小時。備件供應商稱所提供的備件為
16、改進型號。工廠希望通過抽樣,做出這批改進型號備件的平均使用壽命是否超過原型號的平均壽命1100小時的判斷。,二、假設(shè)檢驗1、假設(shè)檢驗的一般原理,回答有兩個:,這種根據(jù)樣本數(shù)值判斷一個有關(guān)總體的假設(shè)是否成立稱為假設(shè)檢驗。 首先對某一總體的參數(shù)作出假設(shè),然后隨機抽樣,求得樣本統(tǒng)計值,并據(jù)此分析這個假設(shè)是否成立,得出否定或不否定的結(jié)論,并作出決策。 關(guān)于總體參數(shù)的假設(shè)由兩部分組成,即原假設(shè)H0與替代假設(shè)H1。前者是接受檢
17、驗的假設(shè),后者是當原假設(shè)被否定時,另一種可成立的假設(shè)。兩者相互對立。,關(guān)于總體均值的假設(shè)有三種情況:H0:? = ?0 ;H1:? ? ?0 ;雙邊檢驗H0:? ? ?0 ;H1:? ? ?0 ;單邊檢驗H0:? ? ?0 ;H1:? ? ?0 ;單邊檢驗 分析思路:依據(jù)樣本,構(gòu)造合理的統(tǒng)計量,分析參數(shù)的樣本統(tǒng)計值與假設(shè)值的差距:差距越小,則說明假設(shè)值成立的可能性越大;差距越大,則說明假設(shè)值成立的可能性越小
18、。故如果分析結(jié)果表明差距是顯著的,則否定原假設(shè)。而所謂顯著是指小概率事件發(fā)生了這一個事實。稱小概率 ? 為顯著性水平,常取?=0.01,0.05,0.1等值。,依據(jù)分析結(jié)果,最后作出決策。決策的正誤有四種情況:,假設(shè)狀態(tài):,決策:,正確,取偽,拒真,正確,原則上,希望?與?均很小,但在一定的樣本容量下,減小?會導致?上升;減小?會導致?增大。在?相同的情況下,構(gòu)造不同的統(tǒng)計量會得到不同的?。?的確定可采用成本效益分析方法
19、60; Min{總成本C} = ? ??導致的成本 + ???導致的成本 稱在1-?下,拒絕H0的統(tǒng)計值的值域為否定域,其他區(qū)域為接受域。,統(tǒng)計決策規(guī)則 在假設(shè)檢驗中對風險的控制規(guī)則 在例1中, H0:? ? 1100 ;H1:? ?1100,如果樣本的均值遠遠小于1100,則會接受? ? 1100 ;相反,如果樣本的均值遠遠大于1100,則會拒絕接受? ?1100。因此采用如下
20、形式的規(guī)則對H0和H1:進行選擇:,其中,A是1100附近的某個數(shù)。上述規(guī)則稱為統(tǒng)計決策規(guī)則。A稱為決策界限。假設(shè)工廠規(guī)定A=1125小時,則決策規(guī)則為,統(tǒng)計決策規(guī)則中風險的計算例1中,假設(shè)n=36, ? = 300,H0:? ? 1100 ;H1:? ?1100,為確定風險,首先需要計算選擇H0和H1的概率為多少。用P(H1, ?)表示接受H1的概率,依據(jù)決策規(guī)則有,決策規(guī)則為,?的值未知,需要對?的不同的可能值計算P(H1,
21、?)。由于在大樣本情況下,有,?=1050,?=1125,?=1200,P(H1,1125)= )=P(z>0)= 0.5,P(H1,1050)=P(z>1.5)=0.0668,P(H1,1200)= )=P(z>-1.5)= 0.9332,0.5,1.0,,0.0,,?風險,?風險,,,決策界限與樣本容量對風險的影響,決策界限A對風險的影響,0.5,1.0,,0.0,,,,,H0正確
22、 H1正確 錯誤為第1類 錯誤為第2類,1000 1050 1100 1175 1200,錯誤概率,,,圖中,實線為A=1125對應的錯誤曲線,虛線為A=1150對應的錯誤曲線。對于給定的樣本容量,
23、只有以增大一種類型錯誤的概率為代價,才能減少另一種錯誤的概率。,樣本容量對風險的影響,圖中,實線為n=36對應的錯誤曲線,虛線為n=100對應的錯誤曲線。當n增加時,除了1100到1125之間外,兩種風險同時減少。在給定的統(tǒng)計檢驗問題中,只有增加樣本容量才能使兩類錯誤的概率同時減小。,假設(shè)檢驗的一般步驟:l 依據(jù)研究目的,提出原假設(shè)H0與替代假設(shè)H1;
24、l 選擇?;l 選定檢驗統(tǒng)計量及其分布l 依據(jù)?,確定統(tǒng)計量的否定域l 計算統(tǒng)計量值,作出決策:
25、統(tǒng)計值落在否定域,說明H0與樣本有顯著差異,拒絕H0;統(tǒng)計值落在接受域,說明H0與樣本無顯著差異。2、常用參數(shù)的假設(shè)檢驗(1) 總體均值的假設(shè)檢驗l 正態(tài)總體,且方差已知例 某廠購買一批鋁板,供貨商稱鋁板的平均厚度0.1cm,標準差為0.002?,F(xiàn)抽檢100張,測得平均厚度為0.1004cm,問該批鋁板的厚度是否為0.1
26、cm。解:X~ N( ? ,0.0022) 取 ? = 0.05,由于 事件 為小概率事件(? = 0.05),查表z?/2=1.96而由樣本觀察值計算,故拒絕假設(shè):H0: ?=0.1cm,,,解:X~ N( ? ,0.0022) 取 ? = 0.05假設(shè):H0: ?=0.1cm
27、;H1: ? ? 0.1cm,在上述假設(shè)下,相當于取決策規(guī)則為,如果,則接受H0,反之,則接受H1。計算得到A1=0.1 -1.96?0.002/10=0.099608; A2=0.1 +1.96?0.002/10=0.100392 所以,拒絕H0。,,,例 某產(chǎn)品月產(chǎn)量X~ N( 75 ,14),設(shè)備更新后,為考核產(chǎn)量是否有顯著提高,抽查了6個月的產(chǎn)量,得樣本均值為78,假定方差不變,問在?為 0.05下,月產(chǎn)量是否
28、有顯著提高?解: 假設(shè):H0: ? ? 75 ;H1: ? > 75,取檢驗統(tǒng)計量為,為小概率(? = 0.05),查表z0.05=1.645而由樣本觀察值計算,故否定H0,即月產(chǎn)量有顯著提高。,決策規(guī)則為:如果,則接受H0,反之拒絕H0。現(xiàn)在樣本均值為78,所以,拒絕H0。,為小概率(? = 0.05),查表z0.05=1.645而由樣本觀察值計算,故否定H0,即月產(chǎn)量有顯著提高。,,l
29、 正態(tài)總體,且方差未知,取檢驗統(tǒng)計量為,l 非正態(tài)總體,大樣本且方差已知,取檢驗統(tǒng)計量為,(2)兩個總體均值之差的假設(shè)檢驗,兩個正態(tài)總體,方差已知,,,設(shè)n1 和n2分別為來自兩個正態(tài)總體的樣本容量,樣本均值之差服從,雙邊檢驗:H0:?1 = ?2 ;H1: ?1 ? ?2 ;單邊檢驗
30、:H0:?1 ? ?2 ;H1: ?1 ? ?2 ; 或 H0:? 1? ?2 ;H1:? 1? ?2,統(tǒng)計量為,決策規(guī)則為,其中,,,兩個非正態(tài)總體,方差未知(大樣本),兩個正態(tài)總體,方差未知但相等,統(tǒng)計量為,統(tǒng)計量為,決策規(guī)則為,(2)總體比率p 的假設(shè)檢驗,統(tǒng)計量,樣本比率,決策規(guī)則為,例:一家英國食品公司用鱈魚制作“油煎魚和土豆片”。由于白鱈魚是一種價格更低、產(chǎn)量更大的魚類。如果至少有
31、50%的顧客喜歡白鱈魚甚于鱈魚,管理者就決定改用白鱈魚做菜。設(shè) p 表示更喜歡白鱈魚的消費者的比率,因此管理者希望得到調(diào)查結(jié)果支持?,F(xiàn)以同樣的方式制作兩種魚類菜肴,隨機抽取n =265 名消費者為隨機樣本,對每人進行不看樣品的品嘗試驗。得到的樣本比率為144/265。取顯著水平為0.05。,雙邊檢驗,單邊下尾檢驗,單邊上尾檢驗,解: 假設(shè):H0: p ? 0.5 ;H1 :p < 0.5 查表 z?= 1.6
32、45,決策界限為,現(xiàn),所以,接受H0,即至少有一半的消費者喜歡白鱈魚。,要求 當 p 接近 1 或 0 時,n 須很大。,(3) 兩個總體比率之差的假設(shè)檢驗,設(shè)兩個總體比率分別為p1 和p2, n1 和n2分別為來自兩個獨立總體的樣本容量,當n1 p1 、n1(1- p1)和n2p2 、n2(1- p2) 均大于5時, 樣本比率之差( p1- p2),近似服從,統(tǒng)計量,決策規(guī)則為,?,例:在市場分析中,欲驗證上海市居
33、民喜歡高蛋白早點的比率西安市居民喜歡高蛋白早點的比率有明顯差別?,F(xiàn)分別從兩個城市抽取了容量為200的隨機樣本。數(shù)據(jù)表明西安居民喜歡高蛋白早點的樣本比率為36%,而上海居民喜歡高蛋白早點的樣本比率為40%。問調(diào)查數(shù)據(jù)是否支持上述結(jié)論。取顯著水平為0.05。,假設(shè): H0: p 1 - p 2 = 0 ;H1 : p 1 - p 2 ? 0,決策界限為,查表 z?/2= 1.96,現(xiàn),所以,接受H0 。,通過確定樣本容量控制兩類風險,如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 應用統(tǒng)計3-1
- 應用統(tǒng)計學3
- 3-應用統(tǒng)計學((教案)-統(tǒng)計整理
- 應用統(tǒng)計學3 (1)
- 大工19春《應用統(tǒng)計》在線作業(yè)3【答案】
- 大工19秋《應用統(tǒng)計》在線作業(yè)3(100分)
- 必修3統(tǒng)計
- 第3課時 統(tǒng)計圖應用題練習(3).doc
- 統(tǒng)計應用數(shù)學
- 應用統(tǒng)計論文
- 大工18春應用統(tǒng)計在線作業(yè)3輔導資料
- 統(tǒng)計A3.dwg
- 統(tǒng)計A3.dwg
- 醫(yī)學統(tǒng)計教案3
- 概率統(tǒng)計教案3
- 考點3 統(tǒng)計與統(tǒng)計案例 題型3 變量間的相關(guān)關(guān)系統(tǒng)計案例
- 大工18春《應用統(tǒng)計》在線作業(yè)1、2、3答案全
- 第3章excel在數(shù)學規(guī)劃和統(tǒng)計中的應用
- 考點3 統(tǒng)計與統(tǒng)計案例 題型3 變量間的相關(guān)關(guān)系統(tǒng)計案例
- 統(tǒng)計頻數(shù)-excel在統(tǒng)計中的應用
評論
0/150
提交評論