版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 編號(hào) 2010211919 </p><p><b> 畢業(yè)論文 </b></p><p><b> ?。?014屆本科)</b></p><p> 非參數(shù)假設(shè)檢驗(yàn)的幾種檢驗(yàn)方法及其簡單應(yīng)用</p><p> Several test methods of No
2、nparametric hypothesis test and its simple applications</p><p> 學(xué) 院: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 </p><p> 專 業(yè): 數(shù)學(xué)與應(yīng)用數(shù)學(xué) </p><p> 作者姓名:
3、 </p><p> 指導(dǎo)教師: 職稱: 副教授 </p><p> 完成日期: 2014 年 5 月 20 日</p><p><b> 二○一四 年五 月</b></p&
4、gt;<p> 摘 要 本文主要介紹了非參數(shù)假設(shè)檢驗(yàn)的概念和非參數(shù)假設(shè)檢驗(yàn)的幾種檢驗(yàn)方法,卡方檢驗(yàn)、柯爾莫哥洛夫檢驗(yàn)、秩和檢驗(yàn)以及符號(hào)檢驗(yàn),并通過結(jié)合生產(chǎn)和生活中的實(shí)例給出了一些具體的應(yīng)用.</p><p> 關(guān)鍵詞 樣本;非參數(shù)假設(shè)檢驗(yàn);卡方檢驗(yàn);柯爾莫哥洛夫檢驗(yàn);秩和檢驗(yàn);符號(hào)檢驗(yàn)</p><p> Abstract:This paper mainly int
5、roduces the concept of nonparametric hypothesis testing and several kinds of test methods,such as chi-square test, kolmogorov test, sum of ranks inspection test and symbols test, by using examples of production process a
6、nd living, some specific applications are given.</p><p> Keywords: Sample; Nonparametric hypothesis testing; Chi-square test; Kolmogorov test; sum of ranks inspection; Sign test </p><p><b&g
7、t; 1 引言 </b></p><p> 非參數(shù)檢驗(yàn)是統(tǒng)計(jì)學(xué)的一個(gè)重要分支,它不依賴于總體的分布,僅需要一些一般(例如連續(xù)分布,對(duì)稱分布等)的假設(shè),進(jìn)行統(tǒng)計(jì)推斷時(shí),只利用樣本觀察值中一些非常直觀的信息.非參數(shù)檢驗(yàn)常用于以下四種情況:(1)待分析資料不滿足參數(shù)檢驗(yàn)所要求的假定,因而無法應(yīng)用參數(shù)檢驗(yàn).(2)資料僅由一些等級(jí)構(gòu)成,因而無法應(yīng)用參數(shù)檢驗(yàn).(3)所提的問題中并不包含總體參數(shù),這時(shí)也適宜采
8、用非參數(shù)方法.(4)要迅速得出結(jié)果時(shí)采用的簡單方法.非參數(shù)檢驗(yàn)與參數(shù)檢驗(yàn)相對(duì)應(yīng),含有豐富的統(tǒng)計(jì)思想,并在社會(huì)學(xué)、醫(yī)學(xué)、心理學(xué)、教育學(xué)等領(lǐng)域都有廣泛應(yīng)用.</p><p><b> 2 卡方檢驗(yàn)</b></p><p> 定義1[1] 非參數(shù)檢驗(yàn)是指不需要對(duì)總體分布做任何事先的假定,也不以檢驗(yàn)總體的參數(shù)為目的的假設(shè)檢驗(yàn). </p><p>
9、; 定理1[2](皮爾遜定理) 當(dāng)隨機(jī)樣本容量充分大()時(shí),將樣本分成互斥的類,每類實(shí)際出現(xiàn)的頻數(shù)為,而根據(jù)對(duì)總體的假設(shè),每類應(yīng)出現(xiàn)的理論頻數(shù)(或稱期望頻數(shù))為,則統(tǒng)計(jì)量</p><p> 近似服從自由度為的分布.</p><p> 皮爾遜定理表明,檢驗(yàn)就是檢驗(yàn)觀察值與理論值之間的緊密程度.根據(jù)皮爾遜定理,檢驗(yàn)步驟如下:</p><p><b>
10、(1)提出假設(shè)</b></p><p> 原假設(shè):總體服從某一理論分布;</p><p> 備擇假設(shè):總體不服從某一理論分布;</p><p> (2)隨機(jī)抽取容量為的樣本,將樣本分成類;</p><p> (3)根據(jù)分類結(jié)果確定每類的實(shí)際頻數(shù);</p><p> (4)假定原假設(shè)為真,算出每類的
11、理論頻數(shù),若,則將相鄰幾類的頻數(shù)合并;</p><p> (5)建立檢驗(yàn)統(tǒng)計(jì)量</p><p> 它近似服從自由度為的分布,為指定分布中被估計(jì)的參數(shù)的個(gè)數(shù); </p><p> (6)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,根據(jù)給定的顯著性水平做出決策.</p><p> 若,則拒絕;反之接受.</p><p> 例1 在對(duì)I
12、T行業(yè)的工作滿意度調(diào)查中,7%的信息系統(tǒng)管理者認(rèn)為“非常滿意”,58%認(rèn)為“基本滿意”,24%認(rèn)為“不太滿意”,4%認(rèn)為“根本不滿意”,7%認(rèn)為“不確定”.而計(jì)算機(jī)程序員工作滿意度樣本數(shù)據(jù)由表1給出.</p><p> 表1 計(jì)算機(jī)程序員工作滿意度評(píng)價(jià)實(shí)際頻數(shù)表</p><p> 試判斷計(jì)算機(jī)程序員工作滿意度和信息系統(tǒng)管理者工作滿意度是否相同?取.</p><p&
13、gt; 解 如果計(jì)算機(jī)程序員工作滿意度和信息系統(tǒng)管理者工作滿意度相同,那么計(jì)算機(jī)程序員工作滿意度的概率分布就應(yīng)與信息系統(tǒng)管理者工作滿意度的分布相同.因此可提出如下假設(shè):</p><p> 原假設(shè):總體服從分布;</p><p> 備擇假設(shè):總體不服從分布;</p><p> 在原假設(shè)成立的條件下可計(jì)算出計(jì)算機(jī)程序員工作滿意度評(píng)價(jià)的理論頻數(shù),見表2.<
14、/p><p><b> 計(jì)算檢驗(yàn)統(tǒng)計(jì)量</b></p><p><b> ,</b></p><p> 因?yàn)?,而,所以拒絕原假設(shè),即可以得出結(jié)論,計(jì)算機(jī)程序員的工作滿意度和信息系統(tǒng)管理者的不相同.</p><p> 表2 計(jì)算機(jī)程序員的工作滿意度評(píng)價(jià)理論頻數(shù)計(jì)算表</p>&l
15、t;p> 定理2[3] 設(shè)為總體的理論分布,理論頻率為,則當(dāng)成立時(shí),不論F是什么分布,統(tǒng)計(jì)量</p><p> 當(dāng)時(shí)的極限分布為,其中是分組的組數(shù).</p><p> 注1:(1)定義各項(xiàng)中,是反映了頻率與概率的偏差,如果偏大應(yīng)拒絕;若偏小可接受,系數(shù)是為了使有一個(gè)理想的極限分布;</p><p> (2)統(tǒng)計(jì)量的定義與樣本空間的劃分有關(guān),只有當(dāng)樣本
16、空</p><p> 間的劃分取得合適時(shí),構(gòu)造的離散分布才能較好地近似,這其實(shí)也是檢驗(yàn)法的一個(gè)缺陷所在;</p><p> (3)實(shí)際中遇到最多的是分布族的檢驗(yàn),也就是檢驗(yàn)總體是否屬于某種分布族.</p><p> 例2 將一顆骰子擲了120次,結(jié)果如下:</p><p> 點(diǎn)數(shù):1,2,3,4,5,6;</p>&l
17、t;p> 頻數(shù):21,28,19,24,16,12;</p><p> 試在顯著性水平下檢驗(yàn)骰子是否均勻?</p><p> 解 檢驗(yàn)骰子是否均勻,就是要檢驗(yàn)假設(shè)</p><p><b> 計(jì)算得:</b></p><p><b> .</b></p><p&g
18、t; 對(duì),,,故接受假設(shè),即認(rèn)為這顆骰子是均勻.</p><p> 注2:在用定理2計(jì)算統(tǒng)計(jì)量時(shí),必須滿足: </p><p> (1)一定要夠大,最好達(dá)到;</p><p> (2)每不能太小,最好達(dá)到,否則應(yīng)適當(dāng)合并以滿足要求.</p><p><b> 3 符號(hào)檢驗(yàn)</b></p><
19、p> 符號(hào)檢驗(yàn)是利用正、負(fù)號(hào)的數(shù)目對(duì)某種假設(shè)作出判斷的方法.它直觀、簡單,不需要知道被檢驗(yàn)量的分布規(guī)律,用途十分廣泛.在實(shí)際應(yīng)用中,它分為單樣本和兩個(gè)樣本的符號(hào)檢驗(yàn).在這里,只介紹兩個(gè)相關(guān)樣本的符號(hào)檢驗(yàn).</p><p> 兩個(gè)相關(guān)樣本的符號(hào)檢驗(yàn)是通過對(duì)比樣本的成對(duì)數(shù)據(jù)來確定正負(fù)號(hào),根據(jù)正負(fù)號(hào)的數(shù)目的對(duì)比來判斷兩個(gè)樣本有無顯著差異.</p><p> 定理3[4] 設(shè)是正號(hào)出
20、現(xiàn)的概率,是負(fù)號(hào)出現(xiàn)的概率;若兩樣本無顯著差異,則正負(fù)號(hào)出現(xiàn)的概率應(yīng)該相等.</p><p><b> 原假設(shè);備擇假設(shè).</b></p><p> 兩個(gè)樣本數(shù)據(jù)分別和,比較成對(duì)數(shù)據(jù),首先去掉觀察值相同的樣本對(duì);若,差值為正記為“+”,若,差值為負(fù)記為“-”,正號(hào)和負(fù)號(hào)的數(shù)量分別為和,正負(fù)號(hào)之和是樣本容量,即.</p><p> 在小樣本
21、情況下統(tǒng)計(jì)量為 </p><p> , (1)</p><p> 在大樣本情況下,若原假設(shè)為真,則二項(xiàng)分布可近似服從于正態(tài)分布,檢驗(yàn)統(tǒng)計(jì)量為</p><p><b> (2)</b></p><p> 在小樣本情況下,若值,則拒絕原假設(shè);</p><p&
22、gt; 在大樣本情況下,若,則拒絕原假設(shè).</p><p> 符號(hào)檢驗(yàn)僅利用了符號(hào)的信息,并沒有考慮數(shù)據(jù)大小,因而精確度不高.</p><p> 例3 某公司目前招聘一名廣告市場分析的研究員,共有20名應(yīng)聘者前來應(yīng)聘,客戶部經(jīng)理和市場部經(jīng)理給這20名應(yīng)聘者的面試分?jǐn)?shù)由表3給出,試分析客戶部經(jīng)理和市場部經(jīng)理的評(píng)價(jià)標(biāo)準(zhǔn)是否一致.</p><p> 解 該問題
23、可以用符號(hào)檢驗(yàn)的方法進(jìn)行處理,根據(jù)題意提出假設(shè):</p><p> 原假設(shè),即客戶部經(jīng)理和市場部經(jīng)理的評(píng)價(jià)標(biāo)準(zhǔn)一致;</p><p> 備擇假設(shè),即客戶部經(jīng)理和市場部經(jīng)理的評(píng)價(jià)標(biāo)準(zhǔn)不一致.</p><p> 根據(jù)已知表的數(shù)據(jù),計(jì)算樣本對(duì)差值的符號(hào),結(jié)果由表4給出. 根據(jù)表4中的樣本數(shù)據(jù)得,,,.由于,所以屬于小樣本情況,根據(jù)公式(1)得</p>
24、<p><b> ,</b></p><p><b> .</b></p><p> 顯著性水平,,故接受原假設(shè),即認(rèn)為兩個(gè)經(jīng)理的評(píng)價(jià)標(biāo)</p><p><b> 準(zhǔn)一致.</b></p><p> 表3 應(yīng)聘者得分統(tǒng)計(jì)表</p><p
25、> 表4 樣本對(duì)觀察值的差值的符號(hào)</p><p> 例4 某公司采用廣告銷售,隨即選取30個(gè)城市,得到廣告促銷前后的銷售額的樣本數(shù)據(jù),如表5所示(單位:萬元).</p><p> 試用符號(hào)檢驗(yàn)分析促銷活動(dòng)的效果.</p><p> 解 根據(jù)題意提出假設(shè)為:</p><p> 原假設(shè),即認(rèn)為廣告前后銷售額無顯著差異;&l
26、t;/p><p> 備擇假設(shè),即認(rèn)為廣告前后銷售額有顯著差異.</p><p> 根據(jù)表5中的數(shù)據(jù)得,,,.</p><p><b> ,</b></p><p><b> 統(tǒng)計(jì)量的觀察值</b></p><p><b> .</b></p&
27、gt;<p> 顯著水平,查表得到,而,所以拒絕原假設(shè),即認(rèn)為廣告前后銷售額有顯著差異,廣告有助于促銷.</p><p> 表5 廣告促銷前后銷售額的比較表</p><p> 4 柯爾莫哥洛夫檢驗(yàn)</p><p> 與檢驗(yàn)中的情況一樣,假設(shè)有,,在總體中取個(gè)樣本并將其樣本值按大小排成的順序,記為不大于的樣本值出現(xiàn)的概率,則</p>
28、<p><b> 稱為樣本分布函數(shù).</b></p><p> 定理4[7](格列汶科定理) 設(shè)總體分布函數(shù)為,樣本分布函數(shù)為,則</p><p><b> .</b></p><p> 即當(dāng)時(shí),以概率1關(guān)于均勻收斂于.它表明,當(dāng)很大時(shí),可以用近似代替,</p><p> 即
29、 </p><p> 這是能用樣本推斷總體的理論根據(jù).</p><p> 柯爾莫哥洛夫檢驗(yàn)方法如下:</p><p><b> (1)提出假設(shè)</b></p><p><b> 原假設(shè):;</b></p><p&g
30、t;<b> 備擇假設(shè):.</b></p><p><b> 利用對(duì)進(jìn)行檢驗(yàn).</b></p><p><b> (2)取統(tǒng)計(jì)量</b></p><p> 并稱為與的差異度. 是一個(gè)隨機(jī)變量,它有自己的分布.柯爾莫哥洛夫證明了:若是連續(xù)型隨機(jī)變量,對(duì)任意常數(shù),記,則</p>&l
31、t;p> 的值已被列成數(shù)表,可供查用,由此得出,當(dāng)充分大時(shí)</p><p><b> ,即;</b></p><p> (3)對(duì)給定的,寫出小概率事件的概率表達(dá)式</p><p><b> ;</b></p><p> (4)查數(shù)表,能求得,方法如下:因?yàn)?lt;/p>&l
32、t;p><b> 所以,是對(duì)應(yīng)于的.</b></p><p> 根據(jù)樣本值和,,求出;</p><p> (5)判斷:若,則拒絕,若,則接受.</p><p> 例5 為確定總體的分布,取容量的樣本測得樣本值如下</p><p> 0.54, 0.21,0.31,0.40,0.46,0.17, 0.14
33、,0.12, 0.51,0.50試判斷總體在區(qū)間上是否服從均勻分布?</p><p> 解 若在上服從均勻分布,則有理論分布</p><p> 現(xiàn)在樣本值按由小到大的順序列于表6中.</p><p> 由樣本的經(jīng)驗(yàn)分布函數(shù)為</p><p> ,的數(shù)值以及它們的差值都在表6中.</p><p><b>
34、; 表6</b></p><p><b> 現(xiàn)對(duì)進(jìn)行檢驗(yàn).</b></p><p><b> (1)原假設(shè):;</b></p><p> (2)在成立的條件下,取統(tǒng)計(jì)量</p><p><b> ;</b></p><p><
35、b> (3)對(duì)給定的,;</b></p><p> (4)查表,,,從表6中看出</p><p><b> ;</b></p><p> (5)判斷:,所以接受,即在上服從均勻分布.</p><p><b> 5 秩和檢驗(yàn)</b></p><p>
36、 定義2[8] 設(shè)兩個(gè)總體的分布函數(shù)分別為和,分別在兩個(gè)總體中抽取容量為和的樣本,將兩個(gè)樣本的觀測數(shù)據(jù)按大小順序排列,并統(tǒng)一編號(hào),規(guī)定每個(gè)數(shù)據(jù)在排列中所對(duì)應(yīng)的序號(hào)稱為該數(shù)的秩,對(duì)于相同的數(shù)值則用它們序數(shù)的平均值作為秩.把容量為的樣本的秩加起來得秩和,把容量為的樣本的秩加起來得秩和.</p><p><b> 秩和檢驗(yàn)方法如下:</b></p><p><b
37、> (1)提出假設(shè)</b></p><p><b> 原假設(shè):;</b></p><p><b> 備擇假設(shè):.</b></p><p><b> (2)取統(tǒng)計(jì)量為</b></p><p> 容量為的樣本所對(duì)應(yīng)的秩和</p><p
38、><b> 即當(dāng)時(shí),當(dāng)時(shí);</b></p><p> (3)對(duì)給定的,查秩和檢驗(yàn)表,可得出對(duì)應(yīng)于的下限和上限;</p><p> (4)判斷:當(dāng)時(shí),接受,即認(rèn)為兩總體差異不顯著;反之則拒絕,即認(rèn)為兩總體差異顯著.</p><p> 例6 用兩種不同材料的燈絲制造燈泡,現(xiàn)分別隨機(jī)抽取若干個(gè)燈泡進(jìn)行壽命試驗(yàn),得數(shù)據(jù)如下(單位:h)&
39、lt;/p><p> 問兩種材料的燈泡壽命有無明顯差異().</p><p> 解 將數(shù)據(jù)按大小次序排列成表7.</p><p> 這里1700h甲乙兩種材料均有,它們的秩取平均數(shù).材料2的容量最小,于是統(tǒng)計(jì)量應(yīng)取材料2的秩和,即.</p><p> 在秩和檢驗(yàn)表的,,的欄內(nèi),查的秩和下限,秩和上限.</p><p&
40、gt; 現(xiàn)在,故拒絕原假設(shè),認(rèn)為兩種材料對(duì)燈泡壽命的影響有顯著差異.</p><p><b> 表7</b></p><p> 注3:秩和檢驗(yàn)表中對(duì)應(yīng)于和中的較小者,對(duì)應(yīng)于和中的較大者.在表中只列到的情況,當(dāng)其中有一個(gè)大于10時(shí),我們可以利用的極限分布來檢驗(yàn).可以證明,當(dāng)較大時(shí),近似地服從正態(tài)分布:</p><p> ?。ㄆ渲惺桥c中的較小
41、者,對(duì)應(yīng)于與中的較大者).這時(shí)可用檢驗(yàn)法,統(tǒng)計(jì)量</p><p> 服從,從而對(duì)水平,查正態(tài)分布表即可.</p><p><b> 致謝 </b></p><p> 感謝魏老師的悉心指導(dǎo).</p><p> 參 考 文 獻(xiàn)</p><p> [1]范金城,梅長林.數(shù)據(jù)分析[M].北
42、京:科學(xué)出版社.2002</p><p> [2]孫建軍.應(yīng)用數(shù)理統(tǒng)計(jì)[M].南京:東南大學(xué)出版社.2007</p><p> [3]史道濟(jì),張玉環(huán).應(yīng)用數(shù)理統(tǒng)計(jì)[M].天津:天津大學(xué)出版社.2008</p><p> [4]張德培,羅蘊(yùn)玲.應(yīng)用概率統(tǒng)計(jì)[M].北京:高等教育出版社.2000</p><p> [5]李永樂,胡慶軍.應(yīng)
43、用數(shù)理統(tǒng)計(jì)[M].北京:國防科技大學(xué)出版社.1995</p><p> [6]宋占杰,胡飛.應(yīng)用概率統(tǒng)計(jì)[M].天津:天津大學(xué)出版社.2012</p><p> [7]陳魁.應(yīng)用概率統(tǒng)計(jì)[M].北京:清華大學(xué)出版社.2004</p><p> [8]繆銓生.概率與統(tǒng)計(jì)[M].上海:華東師范大學(xué)出版社.2007</p><p> [9]
44、葉鋼,李重文,余丹,馬世龍.基于非參數(shù)假設(shè)檢驗(yàn)的程序缺陷定位方法[J].北京航空航天大學(xué).2012,10(8):56-63</p><p> [10]葛元沖,林正大.一種非參數(shù)假設(shè)檢驗(yàn)法的討論[J].廣西師院(自然科學(xué)版).1991,16(2):21-27</p><p> [11] 王金玉,李霞,潘德惠.非參數(shù)假設(shè)檢驗(yàn)的在證劵投資分析中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí).2005,24(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 非參數(shù)假設(shè)檢驗(yàn)的幾種檢驗(yàn)方法及其簡單應(yīng)用
- 預(yù)防醫(yī)學(xué)基于秩次的假設(shè)檢驗(yàn)方法
- 25335.應(yīng)用序貫檢驗(yàn)方法解決一類假設(shè)檢驗(yàn)問題
- 參數(shù)估計(jì)和假設(shè)檢驗(yàn)
- 比例參數(shù)模糊假設(shè)檢驗(yàn)的bayes方法
- 假設(shè)檢驗(yàn)t檢驗(yàn)
- 參數(shù)估計(jì)和假設(shè)檢驗(yàn)
- 參數(shù)估計(jì)與假設(shè)檢驗(yàn)
- 假設(shè)檢驗(yàn)48924
- 《醫(yī)學(xué)假設(shè)檢驗(yàn)》
- 比例參數(shù)模糊假設(shè)檢驗(yàn)的Bayes方法.pdf
- 假設(shè)檢驗(yàn)匯總
- 參數(shù)估計(jì)和假設(shè)檢驗(yàn)案例
- 假設(shè)檢驗(yàn)亦稱
- 數(shù)據(jù)分析方法假設(shè)檢驗(yàn)
- 12894.多重假設(shè)檢驗(yàn)的方法及其參數(shù)估計(jì)的研究
- 管理統(tǒng)計(jì)學(xué)第3章--非參數(shù)假設(shè)檢驗(yàn)
- 論假設(shè)檢驗(yàn)中的檢驗(yàn)矛盾
- 概率論畢業(yè)論文外文翻譯--統(tǒng)計(jì)假設(shè)檢驗(yàn)
- 假設(shè)檢驗(yàn)-例題講解
評(píng)論
0/150
提交評(píng)論