[學習]概率論與數(shù)理統(tǒng)計王明慈第二版第5章數(shù)理統(tǒng)計的基本知識1-3節(jié)_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2024/3/26,1,數(shù)理統(tǒng)計是概率論的應用;,概率論是數(shù)理統(tǒng)計的理論基礎.,前言,2. 數(shù)理統(tǒng)計學的基本內(nèi)容,(1) 有效地收集數(shù)據(jù);,(2) 對數(shù)據(jù)初步處理;,運用數(shù)理統(tǒng)計推斷方法對,(3) 分析數(shù)據(jù)的信息,,總體進行推斷和預測,,得出合理的結(jié)論.,1. 概率論與數(shù)理統(tǒng)計的關系,2024/3/26,2,3. 數(shù)理統(tǒng)計與計算機的結(jié)合,國內(nèi)外著名的統(tǒng)計軟件包: SPSS, SAS, Matlab,,可以讓你快速、簡便地進行數(shù)據(jù)處理,這

2、大大普及了數(shù)理統(tǒng)計的應用.,提供了強有力的技術支持.,計算機的誕生與發(fā)展為統(tǒng)計方法(數(shù)據(jù)處理),R、Stata等,,和分析,,2024/3/26,3,概率論中的一個最基本的假設——,在實際中,我們往往不知道隨機變量X確切分布,,研究對象X,這就是數(shù)理統(tǒng)計所討論問題的應用背景.,它需要用,數(shù)理統(tǒng)計研究內(nèi)容十分廣泛, 其中一類重要問題,便是統(tǒng)計推斷.,4. 實際案例的提出,已有的部分信息去推斷整體情況.,的分布已知.,2024/3/26,4

3、,比如:產(chǎn)前篩查(唐氏綜合征)課題,數(shù)據(jù)來源:溫州市二醫(yī) 產(chǎn)前篩查中心實驗室,血清學指標:AFP,hCG等,分析:,以AFP為例,據(jù)大量的醫(yī)學統(tǒng)計研究表明,AFP服從或近似服從正態(tài)分布,,其中分布的參數(shù),未知.,要分析研究此課題,,首先應利用,AFP的數(shù)據(jù)(20054例)對參數(shù)進行估計,——參數(shù)估計 (第6章).,2024/3/26,5,一、總體與樣本二、樣本分布函數(shù)與直方圖三、樣本函數(shù)與統(tǒng)計量四、 分布、t 分布、F 分布

4、五、正態(tài)總體統(tǒng)計量的分布,第五章數(shù)理統(tǒng)計的基本知識,基本內(nèi)容:,2024/3/26,6,第一節(jié) 總體與樣本,基本內(nèi)容: 一、總體與個體 二、(簡單) 隨機樣本 ★ 樣本的分布,2024/3/26,7,一、總體與個體,總體: 把研究對象的全體稱為總體 (或母體).,個體:總體中每個研究對象稱為個體.,例如, 考察溫醫(yī)

5、07屆本科生的學習質(zhì)量.,溫醫(yī)的該屆本科生的全體稱為一個總體;,其中的每一個本科生稱為一個個體.,2024/3/26,8,,總體,個體,例1.,考察某批電視機的壽命質(zhì)量,,的全體稱為一個總體,,這批電視機,每臺電視機稱為一個個體.,2024/3/26,9,總體(指標)是指一個隨機變量,,隨機變量的一個取值.,通常,我們用隨機變量X, Y, Z 等表示總體.,因此,在理論上可以把總體與概率分布等同起來.,每個個體是,注:,實際上,我們常關

6、注總體的某項或幾項指標.,2024/3/26,10,二、隨機樣本,1.樣本的定義,樣本中所包含個體的數(shù)量n稱為樣本容量.,從總體X中,隨機地抽取n個個體:,稱為總體X的一個樣本,記為,注:,2024/3/26,11,(2)樣本是被調(diào)查的100名08屆該專業(yè)本科畢業(yè),例2.,(1)總體是該地區(qū)08屆該專業(yè)本科畢業(yè)生月薪;,(3)樣本容量是100.,為了了解生命與科學專業(yè)本科畢業(yè)生的,月薪情況,,本科生的月薪情況,試問,(1)什么是總體?,

7、(2)什么是樣本?,(3)樣本容量是多少?,生的月薪;,調(diào)查了某地區(qū)100名2008屆該專業(yè)的,解:,2024/3/26,12,2.樣本值,每一次抽取,所得到的n個確定的,具體數(shù)值,記為,稱為樣本,的一個樣本值(觀察值).,★數(shù)理統(tǒng)計的基本任務是:根據(jù)從總體中抽取的,樣本,利用樣本的信息推斷或預測總體的情況.,2024/3/26,13,3.簡單隨機樣本,兩個特征:,獲得簡單隨機樣本的抽樣方法稱為簡單隨機抽樣.,(1) 代表性:,(2)

8、獨立性:,若來自總體X的樣本,具有下列,中每一個與總體 X,有相同的分布.,是相互獨立的隨機變量.,為容量 n的簡單隨機樣本.,則稱,注:今后,凡提到樣本都是指簡單隨機樣本.,2024/3/26,14,實際中,怎么樣抽取簡單隨機樣本?,一般情況下總體都是有限總體.,總體中個體總數(shù)不是太大時,,可得到簡單隨機樣本,,當總體中個體總數(shù)比樣本,容量大得多時,,采用不放回抽樣方式,,可近似得到,簡單隨機樣本.,對于有限總體,,采取放回抽樣方式,

9、,2024/3/26,15,補充:隨機變量的獨立性,定義:設X與Y是兩個隨機變量,,若對于任意的實數(shù),x與y,,有,即,則稱X與Y是相互獨立的.,2024/3/26,16,(1)離散隨機變量X與Y相互獨立,,(X, Y)的聯(lián)合概率函數(shù)p (x, y) = pX (x) pY (y);,(2)連續(xù)隨機變量X與Y相互獨立,,(X, Y)的聯(lián)合概率密度函數(shù)f (x, y) = fX (x) fY (y).,隨機變量的獨立性可以擴充到n個隨機變

10、量的情形.,2024/3/26,17,定理,4.樣本的分布,2024/3/26,18,,注: 熟記以上三種不同情形下樣本的聯(lián)合概率分布的具體形式是解決問題的關鍵!!,2024/3/26,19,設總體X服從參數(shù)為,是來自于總體的樣本,,的聯(lián)合概率函數(shù).,解:,總體X 的概率函數(shù)為,所以,的聯(lián)合概率函數(shù)為,因為,獨立同分布,,例4.,的Poisson分布,,求此樣本,且服從泊松分布.,2024/3/26,20,例5.,設總體X服從正態(tài)分布,

11、從總體 X,中抽取樣本,概率密度函數(shù).,求,解:,其概率密度為,的聯(lián)合概率密度函數(shù)為,的聯(lián)合,2024/3/26,21,用樣本直方圖來推斷總體的概率密度函數(shù),用樣本分布函數(shù)來推斷總體的分布函數(shù),第二節(jié) 直方圖 樣本分布函數(shù),基本思路:,2024/3/26,22,Step 3:計算樣本觀測值落在各子區(qū)間的頻數(shù) 及頻率 ;,Step 2: 適當選擇邊界點a、b,使,把區(qū)間(a,b)分成l 個子區(qū)間,Step

12、1: 找出,直方圖的具體步驟:,Step 4:畫直方圖:以每個子區(qū)間長 為底, 以相應的 為高作長方形, 這一系列長方形構成樣本頻率直方圖.,一、直方圖(histogram),和分點,(8≤ l≤15):,2024/3/26,23,某工廠測量100個自動車床的質(zhì)

13、量,,459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755

14、 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496

15、 468 499 544 645 764 558 378 765 666 763 217 715 310 851,例6.,如下:,得到樣本觀測值,2024/3/26,24,SPSS 軟件中,畫出自動車床質(zhì)量X的直方圖:,2024/3/26,25,,是來自總體X中樣本,把觀測值從小到大排列:,則樣本分布函數(shù),,,,,,,,,,,的觀測值,,二、樣本分布函數(shù),2024/3/26,26,樣本分布函數(shù)Fn(x)的性

16、質(zhì),樣本分布函數(shù)Fn (x)近似于總體分布函數(shù)F (x),當n→∞時,,,2024/3/26,27,第三節(jié) 樣本函數(shù)與統(tǒng)計量,基本內(nèi)容: 一、統(tǒng)計量的定義 二、常用統(tǒng)計量及其性質(zhì),2024/3/26,28,一、 統(tǒng)計量,由樣本推斷總體情況,需要對樣本進行“加工”,,定義.,信息集中起來.,這就需要構造一些樣本的函數(shù),它把樣本中所含的,統(tǒng)計量.,2024/3/26,29,注:,2°

17、統(tǒng)計量用于統(tǒng)計推斷,,3º 統(tǒng)計量是樣本的函數(shù),,總體 X 的未知參數(shù);,統(tǒng)計量的分布稱為抽樣分布.,故不應含任何關于,它是一個隨機變量,,2024/3/26,30,(未知)的Poisson分布,,為來自總體的樣本,判斷下列那些,是統(tǒng)計量?,設總體X服從參數(shù)為,例7.,是,不是,是,2024/3/26,31,例8.,其中 ? 已知,? 未知 ,,設 X1, X 2, X3 來自正態(tài)總體 X ~(? ,? 2) 的樣本,,問下

18、列哪些是統(tǒng)計量? ( ),A. (X1 + X2 + X3 )/3 ;,D. X1 ;,E. Max{ X1, X2, X3 }.,?,?,?,?,ABDE,2024/3/26,32,,(1)樣本均值,其觀測值,1.樣本矩的定義,可用于推斷:總體均值 E(X).,它反映了總體均值的信息,二、幾個常用統(tǒng)計量,2024/3/26,33,其觀測值,可用于推斷:總體方差D(X).,(2)樣本方差,它反映了總體方差的信息

19、,2024/3/26,34,,(3)樣本標準差,其觀測值,2024/3/26,35,,其觀測值,(5) 樣本 k 階中心矩,其觀測值,(4)樣本k 階原點矩,比較總體k 階原點矩E(Xk),比較總體k 階中心矩E[X-E(X)]k,2024/3/26,36,2.樣本矩的性質(zhì),,,,2024/3/26,37,例8.,設總體 X 服從兩點分布 B(1 , p),,是來自于總體分布的樣本,,是樣本均值與樣本方差,試計算:,解:,利用樣本矩的性

20、質(zhì)得,由兩點分布知 E(X)=p, D(X)=p(1-p),,2024/3/26,38,內(nèi)容小結(jié),理解總體和個體、樣本和樣本值、樣本函數(shù),和統(tǒng)計量的概念;,說明:一個總體對應一個隨機變量X, 我們將不區(qū)分總體,和相應的隨機變量, 統(tǒng)稱為總體X.,總體(理論分布),樣本,樣本值,,,,總體、樣本、樣本值的相互關系:,(抽樣),(推斷),2024/3/26,39,2. 掌握樣本的分布、常用統(tǒng)計量的概念及性質(zhì);,①樣本均值,②樣本方差,兩個

21、重要統(tǒng)計量:,兩個重要統(tǒng)計量的性質(zhì):,,,2024/3/26,40,3.了解樣本頻率直方圖、樣本分布函數(shù).,通過樣本頻率直方圖或樣本分布函數(shù)圖來推斷總體,的分布情況.,2024/3/26,41,作業(yè),習題五(P145): 1、2、15習題六(P180)2中,求樣本的概率密度函數(shù).,2024/3/26,42,備用題,A. 獨立但分布不同; B. 分布相同但不相互獨立;C. 獨立同分布; D. 不能確定.,1.設X

22、1,X2 ,…,Xn是來自總體X的簡單隨機樣本,,則X1,X2 ,…,Xn必然滿足( ).,2.,2024/3/26,43,3.,,,( ).,2024/3/26,44,分析:1.由簡單隨機樣本的定義知,應選C.,2. 由于統(tǒng)計量中不含任何未知參數(shù),應選D.,3. 由樣本矩的性質(zhì),應選B.,2024/3/26,45,設總體 X 服從參數(shù)為,是來自于總體的樣本,,的聯(lián)合概率密度函數(shù).,解:,總體X 的概率密度函數(shù)為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論