第6章 假設檢驗_第1頁
已閱讀1頁,還剩77頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第6章 假設檢驗,假設檢驗在統(tǒng)計方法中的地位,推斷統(tǒng)計,參數(shù)估計的主要任務是找參數(shù)值等于幾。點估計:估計在一條生產(chǎn)線上平均每個包裝箱的毛重。區(qū)間估計:基于數(shù)據(jù)找到一個區(qū)間[L,U],使之按給定的概率包含包裝箱的毛重的均值。假設檢驗的興趣主要是看參數(shù)的值是否等于某個特別感興趣的值。,參數(shù)估計和假設檢驗,引例,【例1】消費者協(xié)會接到消費者投訴,指控某糧食加工廠的每袋糧食的重量不足,有欺騙消費者之嫌。包裝上標明的重量為16公斤。于是消

2、費者協(xié)會從市場上隨機抽取20袋作為樣本,樣本的平均重量為15.43公斤,顯然小于16公斤。消費者協(xié)會能否根據(jù)樣本數(shù)據(jù)判定該糧食加工廠欺騙了消費者呢?,6.1 假設檢驗的一般問題 6.2 假設檢驗的方法 6.3 總體均值的假設檢驗6.4 總體比例的假設檢驗,,學習目標,,了解假設檢驗的含義和假設的形式 。掌握假設檢驗的基本思想,區(qū)分假設檢驗中的兩類錯誤 。掌握假設檢驗的步驟和假設檢驗的方法。重點掌握一個總體均值的檢驗

3、及一個總體成數(shù)的檢驗。,6.1 假設檢驗的一般問題,6.1.1 假設檢驗的基本思想6.1.2 假設檢驗的步驟6.1.3 假設檢驗的兩類錯誤,什么是假設?,? 對總體參數(shù)的具體數(shù)值所作的陳述。總體參數(shù)包括總體均值、比例、方差等。分析之前必須陳述。,我認為這種新藥的療效比原有的藥物更有效!,,6.1.1 假設檢驗的基本思想,什么是假設檢驗?,先對總體的參數(shù)(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的過程。

4、有參數(shù)檢驗和非參數(shù)檢驗。邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理。,,,,小概率事件:發(fā)生概率很小的事件。小概率原理:小概率事件在一次試驗中是幾乎不可能發(fā)生的。小概率的標準由研究者事先確定,一般用α表示,稱為顯著性水平。常用的α 值有0.01, 0.05, 0.10。,基本思想,,,,首先假定需要考察的假設是成立的,然后基于此進行推導,來計算從該假設所在的總體中進行抽樣研究,得到當前樣本的概率是多少。如果結果顯示這是一個小概率事件,

5、則意味著如果假設是成立的,則在一次抽樣研究中竟然發(fā)生了小概率事件!這顯然違反了小概率原理,因此可以按照反證法的思路推翻所給出的假設,認為原假設上是不成立的。,,,,基本思想,,總 體(某種假設),,抽樣,樣 本(觀察結果),,,,檢驗,(不拒絕),(拒絕),小概率事件未 發(fā) 生,,,小概率事件發(fā) 生,,,6.1.2 假設檢驗的步驟,假設檢驗步驟,提出原假設和備擇假設確定一個適當?shù)臋z驗統(tǒng)計量,并利用樣本數(shù)

6、據(jù)算出其具體數(shù)值確定一個適當?shù)娘@著性水平根據(jù)顯著性水平計算出臨界值,指定拒絕域將統(tǒng)計量的值與臨界值進行比較,作出決策統(tǒng)計量的值落在拒絕域,拒絕原假設,否則不拒絕原假設也可以直接利用P值作出決策,檢驗步驟,,,,,建立總體假設H0,H1,抽樣得到樣本觀察值,1,2,選擇統(tǒng)計量確定H0為真時的抽樣分布,3,根據(jù)具體決策要求確定α,確定分布上的臨界點C和檢驗規(guī)則,計算檢驗統(tǒng)計量的數(shù)值,比較并作出檢驗判斷,7,4,5,6

7、,,,,,,,,,,,,原假設,原假設又稱“0假設”,用H0表示,是關于總體參數(shù)的一種陳述,總是有符號 ?, ? 或??,一般而言是被假定為正確的。例如, H0 : ? ?16公斤,之所以用零來修飾原假設,其原因是原假設的內(nèi)容總是表示沒有差異或沒有改變,或變量間沒有關系等等,即H0表示總體參數(shù)與樣本統(tǒng)計量的差異或改變是由抽樣誤差引起的,而不是本質上的差異。,備擇假設,是在原假設不成立時而成立的關于總體參數(shù)一種假定。用 H1表示,總是有符

8、號?,?? 或 ?,表示總體參數(shù)與樣本統(tǒng)計量的差異或改變不是由抽樣誤差引起的,而是本質上的差異。例如, H1 :? < 16公斤,備擇假設,【例1】的原假設和備擇假設為: H0 : ? ? 16公斤 H1 :? < 16公斤,原假設和備擇假設是一個完備事件組,且相互對立等號“=”總是放在原假設上先確定備擇假設,再確定原假設 。,提出假

9、設,6.1.3 兩類錯誤與顯著性水平,假設檢驗中的兩類錯誤,1.第Ⅰ類錯誤(棄真錯誤)原假設為正確時拒絕原假設,認為其不正確第Ⅰ類錯誤的概率記為α。2.第Ⅱ類錯誤(取偽錯誤)原假設為錯誤時未拒絕原假設, 而認為其正確第Ⅱ類錯誤的概率記為β?,?,?,,H0: 無罪,假設檢驗中的兩類錯誤,假設檢驗就好像一場審判過程,統(tǒng)計檢驗過程,,? 錯誤和 ? 錯誤的關系,,,,?,?,你要同時減少兩類錯誤的惟一辦法是增加樣本容

10、量!,,?和? 的關系就像翹翹板,?小? 就大, ?大? 就小,兩類錯誤的控制,一般來說,發(fā)生哪一類錯誤的后果更為嚴重,就應該首要控制哪類錯誤發(fā)生的概率。但由于犯第Ι類錯誤的概率是可以由研究者控制的,因此在假設檢驗中,人們往往先控制第Ι類錯誤的發(fā)生概率,盡量避免犯棄真錯誤,若想同時減少α和β,唯一的辦法就是增大樣本容量。,顯著性水平?(significant level),1.是一個概率值,它是:小概率事件的標準;幫助確定抽樣分布

11、的拒絕域;原假設為真時,拒絕原假設的概率(棄真錯誤的最大概率)2.表示為 ??,由研究者事先確定常用的 ??值有0.01, 0.05, 0.10,6.2 假設檢驗的方法,6.2.1 雙側檢驗和單側檢驗,對總體平均數(shù)的假設檢驗可分兩類,即雙側(尾)檢驗和單側(尾)檢驗。單側檢驗又分為左側檢驗和右側檢驗,它們的原假設和備擇假設的形式不同。,雙側檢驗,【例2】根據(jù)美國人口普查數(shù)據(jù),1998年美國家庭平均擁有人口3.18人。一研究人員

12、想檢驗1998年以后,這一均值是否發(fā)生了變化。 如果自1998年以后,家庭平均人口增加或減少了,那么家庭人口規(guī)模就發(fā)生了變化。這是一個雙尾檢驗的例子。 則原假設和備擇假設為: H0 : ? ? 3.18人 H1 :? ? 3.18人,雙側檢驗,雙側檢驗的拒絕區(qū)域,左側檢驗,【例3】某健康俱樂部的管理層聲稱:“該

13、組織會員在加入該組織后,在第一個月將減掉10磅或以上的體重”。一消費者組織想確認該說法是否屬實,因而從該俱樂部隨機選取了36名會員作為樣本,發(fā)現(xiàn)所選取的會員在第一個月內(nèi)平均減掉9.2磅,而該樣本的標準差則為24磅。如果α = 0.05,能否證明該俱樂部說法屬實?,左側檢驗,以μ表示會員第一個月能夠減掉的體重 H0 : μ ≥ 10磅 (均值不小于10磅,0.8磅的差距為隨機誤差引起

14、差異) H1 : μ < 10磅 (均值小于10磅,0.8磅的差距為本質上的差異),當備擇假設包含一小于符號 (<)時,這一檢驗是左尾檢驗。,左側檢驗,左側檢驗,右側檢驗,【例4】某儲蓄銀行的經(jīng)理一直很注重為客戶提供服務的質量。在舊計算機系統(tǒng)下,應答機每小時平均可服務22名客戶。銀行管理層注意到如果以這種效率提供服務,客戶等待時間將會很長。最近銀行管理層更換了計算機系

15、統(tǒng),期望以此縮短客戶等待時間,從而提高顧客滿意度。為檢測新系統(tǒng)是否比舊系統(tǒng)更具效率,銀行管理層隨機地選取了18個小時作為一個樣本,發(fā)現(xiàn),這些時間內(nèi)平均每小時每個應答機服務的顧客人數(shù)為28人,而標準差為2.5人. 在1%的顯著水平下,你能否得出新系統(tǒng)更為有效的結論?假定每小時服務的人數(shù)近似服從標準正態(tài)分布。,右側檢驗,以μ表示應答機每小時服務的客戶數(shù)H0 : μ ≤ 22人 (其新系統(tǒng)服務的人數(shù)沒有提高,不大于22人,6個人的差異是由抽

16、樣誤差引起的)H1 : μ > 22人 (其新系統(tǒng)服務的人數(shù)提高了,大于22人, 6個人的差異不是由抽樣誤差引起的,而是本質差異),當備擇假設中包含大于符號 (>) 時,檢驗是右尾檢驗。,右側檢驗,,,,,,,根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設和備擇假設作出決策的某個樣本統(tǒng)計量。對樣本估計量的標準化結果。原假設H0為真點估計量的抽樣分布,6.2.2 檢驗統(tǒng)計量,,,,,,6.2.3 假設檢驗結論的表述,

17、1.當拒絕原假設時,我們稱樣本結果統(tǒng)計上是顯著的拒絕原假設時結論是清楚的。并且,能給出犯錯誤的概率(α)。,“統(tǒng)計顯著”意思是指:這樣的(樣本)結果不是偶然得到的,或者說,不是靠隨機因素能夠得到的,2. 當不拒絕原假設時,稱樣本結果是統(tǒng)計上不顯著的不拒絕原假設時,并未給出明確的結論,不能說原假設是正確的,也不能說它不是正確的。,假設檢驗結論的表述(“接受”與“不拒絕”),假設檢驗的目的在于試圖找到證據(jù)拒絕原假設,而不在于證明什么

18、是正確的當沒有足夠證據(jù)拒絕原假設時,不采用“接受原假設”的表述,而采用“不拒絕原假設”的表述?!安痪芙^”的表述實際上意味著并未給出明確的結論,我們沒有說原假設正確,也沒有說它不正確“接受”的說法有時會產(chǎn)生誤導,因為這種說法似乎暗示著原假設已經(jīng)被證明是正確的了。,6.3 總體均值的檢驗,,一個總體參數(shù)的檢驗,,,6.3.1 總體均值的檢驗 (大樣本),1.假定條件大樣本(n?30)2. 使用z檢驗統(tǒng)計量? 2 已知

19、:? 2 未知:,總體均值的檢驗(? 2 已知),【例5】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平?=0.05 ,檢驗該天生產(chǎn)的飲料容量是否符合標準要求?,雙側檢驗,總體均值的檢驗(? 2 已知)(雙側檢驗),1、H0 :? = 255 H1 :? ? 255

20、 ? = 0.05 n = 40(大樣本),2、確定檢驗統(tǒng)計量并計算,4、決策:,不拒絕H0,,3、臨界值(雙側檢驗):,總體均值的檢驗(? 2 未知)(例題分析),【例6】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊

21、機床相比是否有顯著降低? (?=0.01),左側檢驗,,,,,,,,,,,總體均值的檢驗(? 2 未知)(左側檢驗),1、H0 :? ?1.35 H1 :? <1.35 ? = 0.01 n = 50(大樣本),2、確定檢驗統(tǒng)計量并計算,拒絕H0,4、決策:,,3、臨界值(左側檢驗):,總體均值的檢驗(? 2 未知)(例題分析),【例7】某一小麥品種的平均產(chǎn)量為5200kg/hm2 。一家研究機構對小麥品種

22、進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120/hm2 。試檢驗改良后的新品種產(chǎn)量是否有顯著提高? (?=0.05),右側檢驗,,,,,,,,,,,總體均值的檢驗(? 2 未知)(右側檢驗),1、H0 :? ?5200 H1 :? >5200 ? = 0.05 n = 36(大樣本),2、確定檢驗統(tǒng)計量

23、并計算,4、決策:拒絕H0,3、臨界值(右側檢驗):,,,總體均值的檢驗 (大樣本檢驗方法的總結),,6.3.2 總體均值的檢驗(小樣本),1.假定條件總體服從正態(tài)分布,并且為小樣本(n < 30)2. 檢驗統(tǒng)計量? 2 已知:? 2 未知:,,總體均值的檢驗 (小樣本檢驗方法的總結),注:? 已知時的拒絕域同大樣本條件下,總體均值的檢驗 (例題分析),【例8】某郵遞家具公司收到了許多客戶關于不按期送

24、貨的投訴。該公司懷疑責任在于他們雇用的貨物運輸公司。貨物運輸公司保證說他們的平均運輸時間不超過24天。于是家具公司隨機抽選25次運輸記錄,得知樣本均值為24.9天,樣本標準差為1.5天。已知貨物運輸天數(shù)服從正態(tài)分布,試以0.01的顯著性水平對貨運公司的保證作出判斷。,總體均值的檢驗 (例題分析),1、H0 :? ≤24 H1 :? >24? = 0.01n = 25(小樣本,且總體方差未知),2、確定檢驗統(tǒng)計量并計算,拒

25、絕H0,結論:說明運輸公司的保證是不可信的,平均運輸時間應該超過了24天。這個結論正確的可能性至少為99%。,4、決策:,,3、臨界值(t分布右側檢驗):,,總體均值的檢驗 (例題分析),【例9】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產(chǎn)的配件

26、長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?,總體均值的檢驗 (例題分析),1、H0 :? =12 H1 :? ?12? = 0.05n = 10(小樣本),2、確定檢驗統(tǒng)計量并計算,4、決策:不拒絕H0,結論:樣本提供的證據(jù)還不能證明該供貨商提供的零件不符合要求 。,3、臨界值(t分布雙側檢驗):,,6.3.3 利用P值進行決策,什么是P 值?(P-value),如果原假設為真,所

27、得到的樣本結果會像實際觀測結果那么極端或更極端的概率,稱為P值。P值告訴我們:如果原假設是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應該拒絕原假設。它是對原假設H0的支持度。 被稱為觀察到的(或實測的)顯著性水平?jīng)Q策規(guī)則:若p值≤?, 拒絕 H0,否則不決絕H0,,雙側檢驗的P 值,,左側檢驗的P 值,,右側檢驗的P 值,總體均值的檢驗(? 2 未知)(例題分析),【例7】某一小麥品種的平均產(chǎn)量

28、為5200kg/hm2 。一家研究機構對小麥品種進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120/hm2 。試檢驗改良后的新品種產(chǎn)量是否有顯著提高? (?=0.05),右側檢驗,,,,,,,,,,,總體均值的檢驗(? 2 未知)(右側檢驗),1、H0 :? ?5200 H1 :? >5200 ? = 0.05

29、 n = 36(大樣本),2、確定檢驗統(tǒng)計量并計算,4、決策:拒絕H0,改良后的新品種產(chǎn)量有顯著提高,這個結論錯誤的可能性不超過5%。,結論:,3、臨界值(右側檢驗):,,總體均值的檢驗(P值檢驗),1、H0 :? ?5200 H1 :? >5200 ? = 0.05 n = 36(大樣本),2、確定檢驗統(tǒng)計量并計算:,4、決策:拒絕H0,結論:改良后的新品種產(chǎn)量有顯著提高 ,該結論錯誤的可能性為0.0

30、88%。,3、查表得到P值: P值=0.000088 < 0.05,,總體均值的檢驗(z檢驗) (P 值的圖示),用P值進行檢驗比根據(jù)統(tǒng)計量檢驗提供更多的信息統(tǒng)計量檢驗是我們事先給出的一個顯著性水平,以此為標準進行決策,無法知道實際的顯著性水平究竟是多少。與其大致知道犯第Ⅰ錯誤的概率,不如干脆知道一個確切的犯第Ⅰ類錯誤的概率(P值),P 值決策與統(tǒng)計量的比較,6.4 總體比例的檢驗,總體比例檢驗,假定條件總體服從二項

31、分布可用正態(tài)分布來近似(大樣本)2. 檢驗的 z 統(tǒng)計量,? 0為假設的總體比例,總體比例的檢驗 (例題分析),【例9】:工作正常時,制造計算器芯片的機器不會產(chǎn)生超過4%的瑕疵品。 無論什么時候,如果機器生產(chǎn)的芯片有超過4%的不合格品,那么這臺機器需要調試。為檢測一臺機器是否正常工作,公司質量部門需要抽取產(chǎn)品樣本以檢查產(chǎn)品是否為合格的。最近從生產(chǎn)線抽取的包含200芯片的隨機樣本有14片不合格。在5%的顯著性水平下,這臺機器

32、是否需要進行調整?,,解:已知n = 200,,1、H0: p ≤ 0.04 (這臺機器不需要調整) H1: p > 0.04 (這臺機器需要調整),3、由α=0.05,查表得:,0 1.645,p = 0 .04,z,,臨界值,,α =0 .05,不拒絕 H0,拒絕H0,,2.17,,4、因此應拒絕原假設H0,即這臺機器瑕疵品率超過4%,需要調整,這個結論正確的可能性至少達

33、到95%。,總體比例的檢驗 (例題分析),【例10】:某公司市場部非常重視顧客對其品牌的滿意情況,通過加強質量、提高服務等措施,一直使消費者對其品牌的滿意程度保持在0.65的水平上。最近,市場部經(jīng)理接到一些消費者的抱怨,也得到一些消費者的表揚,這使他對目前的顧客滿意程度產(chǎn)生了懷疑,為了掌握市場情況,了解本品牌在市場中的位置,他委托一家市場調查公司在該地區(qū)抽取了315個有效樣本,其中有214人對其品牌表示滿意。以0.1為顯著性水平,能否

34、證明顧客的滿意度沒有變化?,總體比例的檢驗 (例題分析),1、H0 :? = 65% H1 :? ? 65%? = 0.1n = 315(大樣本),2、確定檢驗統(tǒng)計量并計算:,4、決策:不拒絕H0,盡管顧客存在不同的反映,但還不足以影響該公司品牌的整體顧客滿意水平,顧客滿意度沒有發(fā)生變化。,結論:,3、臨界值(雙側檢驗):,,,總體比例的檢驗 (檢驗方法的總結),本章小結,假設檢驗的基本思想(反證法和小概率原理)假

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論