版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、概率論與數(shù)理統(tǒng)計(jì)輔導(dǎo),王曉謙wxqmath@263.net,引言 數(shù)學(xué)是刻畫自然規(guī)律和社會(huì)規(guī)律的科學(xué)語言和有效工具。在自然科學(xué)、技術(shù)科學(xué)、經(jīng)濟(jì)科學(xué)、社會(huì)科學(xué)的應(yīng)用不斷深入。與計(jì)算機(jī)的結(jié)合,使以前只有理論而無法計(jì)算的內(nèi)容找到了廣闊的應(yīng)用領(lǐng)域。 概率和統(tǒng)計(jì)具有不同于其他數(shù)學(xué)分支的思維方式。我們?cè)诮虒W(xué)實(shí)踐中既要體會(huì)概率和統(tǒng)計(jì)思想與其他數(shù)學(xué)思想的不同,但也必須注意到它們與其他數(shù)學(xué)分支之間的密切關(guān)系。要培養(yǎng)利用概率、
2、統(tǒng)計(jì)的思想思考、處理問題的能力。,第一部分 概率第一節(jié) 隨機(jī)事件及其概率A. 隨機(jī)現(xiàn)象與隨機(jī)事件,,概率論就是研究隨機(jī)現(xiàn)象的數(shù)學(xué)分支。,研究隨機(jī)現(xiàn)象的第一步:定義事件 在給定條件下,可能發(fā)生這樣的結(jié)果,也可能發(fā)生那樣的結(jié)果,這就是隨機(jī)現(xiàn)象。 特點(diǎn):一個(gè)隨機(jī)現(xiàn)象,我們知道所有可能的結(jié)果有哪些,但是在條件沒有實(shí)現(xiàn)之前,無法判斷會(huì)出現(xiàn)哪個(gè)結(jié)果。隨機(jī)事件:我們把在給定條件實(shí)
3、現(xiàn)之后,可以判斷是否發(fā)生的結(jié)果叫做隨機(jī)事件,用大些英文字母表示。,例如,研究某個(gè)射擊運(yùn)動(dòng)員的射擊水平。 在正常條件下,他射出一發(fā)子彈,落點(diǎn)會(huì)是隨機(jī)的,都有哪些隨機(jī)事件呢?無窮多個(gè)隨機(jī)事件:A:十環(huán) B:九環(huán),……,E:沒有脫靶,F(xiàn):脫靶,……,等等等等,這些都是可能發(fā)生的結(jié)果,都是隨機(jī)事件。 只要實(shí)現(xiàn)一次條件,即在正常條件下,他射出一發(fā)子彈,哪個(gè)事件發(fā)生,哪個(gè)
4、沒有發(fā)生,一目了然。,兩個(gè)特例: 不可能事件:用字母Φ表示。 例如上面例子里,“既沒有脫靶,也沒有上靶”這個(gè)事件就是不可能事件。 必然事件:用字母Ω表示。 例如上面例子里,“脫靶或沒有脫靶”就是一個(gè)必然事件。,,B. 事件的概率 事件的概率就是刻劃該事件在一次試驗(yàn)中發(fā)生的可能性大小的數(shù)量指標(biāo)。設(shè)A是一個(gè)事件,用P(A)表示這個(gè)事件的
5、概率。 概率的第一個(gè)基本性質(zhì):對(duì)于任意事件A,,,這是一種要求!,例:七個(gè)有變異的豌豆特征(P89) 子的形狀,子的顏色,豆莢的形狀,豆莢外衣的顏色,未成熟豆莢的顏色,花的位置,豆梗的長度 孟德爾把綠色豌豆與黃色豌豆雜交,結(jié)果下一代都是黃色豌豆。 對(duì)其他六個(gè)特征做試驗(yàn),也有類似的結(jié)果。 我們把這一代叫做雜交第一子代,簡(jiǎn)稱為子一代。問題是,用它們作為種子,
6、下一代會(huì)怎樣呢?這是中學(xué)教師孟德爾的問題,這個(gè)問題的解決讓他名崔青史。(1822~1884),孟德爾把雜交黃色豌豆作為第一子代F1,培育出第二子代F2。在第二子代中豌豆會(huì)是什么顏色的呢?他提出了一種遺傳學(xué)理論,用這個(gè)理論來預(yù)測(cè)第二子代的顏色。他的預(yù)言是: 75%的黃色豌豆 25%綠色豌豆即兩者比例為3:1。,【用G代表綠色基因,Y代表黃色基因,則第一子代F1可表示為YG。 這
7、樣的豌豆自由雜交,在第二子代F2中會(huì)出現(xiàn)四種情況:YY,YG,GY,GG。每種情況出現(xiàn)的機(jī)會(huì)均等。其中 黃色:YY,YG,GY; 綠色:GG所以黃色豌豆與綠色豌豆數(shù)量的比例應(yīng)該是3:1?!?課本上89頁表7-1-1的數(shù)據(jù)就是試驗(yàn)觀測(cè)結(jié)果。這里用的是頻率估計(jì)概率的思想。,我們不知道當(dāng)初老孟是先有的數(shù)據(jù)還是先做的理論分析。不過大多數(shù)人相信是 1、先做的試驗(yàn), 2、然后
8、利用觀測(cè)到的現(xiàn)象(概率統(tǒng)計(jì)思想)提 出大膽的理論, 3、利用提出的理論對(duì)觀測(cè)結(jié)果作出解釋, 4、再利用理論作預(yù)測(cè), 5、然后通過試驗(yàn)驗(yàn)證理論預(yù)測(cè)的可靠性。這是科學(xué)研究的一種基本方法。,為了估計(jì)事件A發(fā)生的概率,我們?cè)谙嗤瑮l件下進(jìn)行重復(fù)試驗(yàn),記錄試驗(yàn)次數(shù)n和事件A發(fā)生的次數(shù)m,然后用事件A在這n次試驗(yàn)中發(fā)生的頻率作為事件A發(fā)生的概率的估計(jì)值,求概率之基本方法——試驗(yàn)
9、法。有誤差。,,概率的第二個(gè)基本性質(zhì) :,這不是公式,是一種規(guī)范化要求。,第二節(jié) 古典概型 試驗(yàn)或觀測(cè)只有有限多種可能的基本結(jié)果,這些結(jié)果具有以下特點(diǎn): (1)、這些可能結(jié)果有限多個(gè);(2)、每次試驗(yàn),這些結(jié)果中必有一個(gè)會(huì)發(fā)生,而且 只有一個(gè)會(huì)發(fā)生;(3)、每個(gè)結(jié)果的發(fā)生是等可能的。 滿足前兩條的結(jié)果叫基本事件。假設(shè)共有n個(gè)
10、基本事件。如果還滿足第三條的話,這樣的隨機(jī)現(xiàn)象的概率計(jì)算模型就叫做古典概型。,古典概型里,每個(gè)基本事件的概率都是,,.,如果事件A的發(fā)生等價(jià)于m個(gè)基本事件之一發(fā)生,那么事件A發(fā)生的概率就是,第三節(jié) 幾何概型 試驗(yàn)或觀測(cè)有無限多種可能的基本結(jié)果,這些結(jié)果具有以下特點(diǎn):(1)、這些可能結(jié)果有無限多個(gè);(2)、每次試驗(yàn),這些結(jié)果中必有一個(gè)會(huì)發(fā)生,而且 只有一個(gè)
11、會(huì)發(fā)生;(3)、每個(gè)結(jié)果的發(fā)生是等可能的。這樣的隨機(jī)現(xiàn)象的概率計(jì)算模型就叫做幾何概型。,方程有實(shí)根的概率是多少?,例一、方程,,中的系數(shù),分別在,區(qū)間隨機(jī)取值,那么這個(gè),解:我們把,放到一起考慮,,那么任取,中的,兩個(gè)值作為,,矩形區(qū)域 S 中任取一個(gè)點(diǎn),把橫坐標(biāo)作為,,可以看作是在平面直角坐標(biāo)系中,,,縱坐,。,坐標(biāo)作為,,方程有實(shí)根等價(jià)于,這等價(jià)于要求點(diǎn)必須取在區(qū)域A中。所以,,例二、怎樣求一個(gè)不規(guī)則圖形的面積?
12、 做正方形S,隨機(jī)向圖中投點(diǎn),計(jì)算落在A中的點(diǎn)的頻率,A的面積的近似值就是該頻率與S的面積的乘積。,例三 貝特朗奇論 在圓內(nèi)任取一弦,問其長度超過內(nèi)接等邊三角形 邊長的概率是多少? 貝特朗給出了三中求解方法。,設(shè)該圓半徑為,則內(nèi)接等邊三角形邊長為,記弦的長度為,,(1)、由于弦長只跟它與圓心的距離有關(guān),而與方向無關(guān),因而可假定弦垂直于某直徑EF。如圖所示:,當(dāng)且僅當(dāng)弦AB與圓形的距離小于,時(shí),
13、有,所以所求概率為,(2)、弦長由其中點(diǎn)唯一確定。當(dāng)且僅當(dāng)弦的中點(diǎn)落到半徑為,的同心圓內(nèi)時(shí),弦長,所以,如圖所示,,所求概率為,(3)、因?yàn)槿魏蜗叶冀粓A于兩點(diǎn),并且具有對(duì)稱性,所以不妨固定弦的一端A于圓周上,另一端在圓周上任意取。如圖,考慮等邊三角形ADE,如B落在角A所對(duì)應(yīng)的弧,上,則弦長,所以所求概率為,第四節(jié) 互斥事件與概率兩個(gè)事件互斥 一組事件是互斥的 設(shè)是A,B是兩個(gè)互斥事件,我們用 A+B表
14、示一個(gè)新的事件,即“A,B中至少有一件發(fā)生”這個(gè)事件。,,,,是一組互斥事件,那么,中至少有一個(gè)發(fā)生這個(gè)事件。,表示,概率的第三個(gè)基本性質(zhì)要求,例如,,表示某射擊運(yùn)動(dòng)員打中k環(huán)這個(gè)事件,k=1,2,…,10. 那么它們是10個(gè)互斥事件。如果知道每個(gè)事件的概率,我們就可以算出許多其它事件的概率。例如打到8環(huán)以內(nèi)這樣的事件的概率。,,例如,,對(duì)立事件:如果兩個(gè)事件互斥,而且每次試驗(yàn)或觀測(cè)兩個(gè)事件中必有一個(gè)發(fā)生,那么這
15、兩個(gè)事件就叫做一對(duì)對(duì)立事件。如果用A表示其中的一個(gè)事件,另一個(gè)就用,來表示。顯然,所以,或等價(jià)地,例、求500人中至少有一人生日在今天的概率。解法一、用A表示“500人中至少有一人生日在今天”,用,表示“500人中恰有k人生日在今天”,k=0,1,…,500。,互斥,而且,所以,則不難發(fā)現(xiàn)這501個(gè)事件,由于,所以,解法二、顯然,表示,所以,“500人中沒有一人在今天過生日”,,我們可以求出,比較這兩個(gè)結(jié)果你可以發(fā)現(xiàn)一個(gè)公式
16、,即,事實(shí)上,,第五節(jié) 獨(dú)立性概念 積事件:設(shè)A,B是兩個(gè)隨機(jī)事件,稱“事件A與B同時(shí)發(fā)生”這個(gè)事件為事件A與事件B的積事件,記作AB。類似地,用,表示一個(gè)新事件,該事件的發(fā)生等價(jià)于,這n個(gè)事件同時(shí)發(fā)生。,例如:,表示第k次投擲硬幣出現(xiàn)正面,k=1,2,……,,就表示“連續(xù)投擲硬幣n次都出現(xiàn)正面”這個(gè)隨機(jī)事件。,那么,定義:稱事件A,B相互獨(dú)立,如果,一般地,稱一組事件相互獨(dú)立,如果其中任意有限個(gè)同時(shí)發(fā)生的概率等于它們
17、每一個(gè)發(fā)生的概率的乘積。 所以,如果知道事件相互獨(dú)立,那么事件同時(shí)發(fā)生的概率就等于每一個(gè)發(fā)生的概率的積。,例、求500人中至少有一人生日在今天的概率。,表示,不難理解,也是相互獨(dú)立的一組事件,而且,,方法三、用,第k個(gè)人在今天過生日,k=1,2,……,500。,則我們一般認(rèn)為這500個(gè)事件相互獨(dú)立。顯然,所以,,連續(xù)投擲一枚硬幣n次,計(jì)算其中恰好出現(xiàn) k次正面的概率,,這個(gè)問題有如下三點(diǎn)要注意: (1).每次試驗(yàn)(或觀測(cè)
18、)只有兩種可能的結(jié)果,其 一記為 A,另一個(gè)就是,(2).每次試驗(yàn)(或觀測(cè))結(jié)果不受其它試驗(yàn)(或觀 測(cè))結(jié)果的影響。即各次試驗(yàn)或觀測(cè)相互獨(dú)立。,(3).每次A發(fā)生的概率都相同,記為,這個(gè)問題的答案就是二項(xiàng)概率公式:,這種隨機(jī)試驗(yàn)或觀測(cè)我們叫做獨(dú)立試驗(yàn)序列。在研究獨(dú)立試驗(yàn)序列時(shí),一個(gè)基本問題就是,n次試驗(yàn)中事件A恰好發(fā)生k次的概率是多少?,,特別地,所以,每個(gè)人是否在今天過生日相互獨(dú)立。所以500人中恰有
19、k人在今天過生日的概率為,方法四、每個(gè)人在今天過生日的概率都是,例、求500人中至少有一人生日在今天的概率。,某車間有十臺(tái)機(jī)床,彼此獨(dú)立工作。據(jù)統(tǒng)計(jì)每臺(tái)機(jī)床每小時(shí)有12分鐘在工作,工作時(shí)需8千瓦的電力。供電部門供多少電給該車間合適呢?,該車間恰好有k臺(tái)機(jī)床在同時(shí)工作的概率為,解:用A表示一臺(tái)機(jī)床在工作,則,我們把恰好有0,1,2,……,10臺(tái)機(jī)床在同時(shí)工作的概率都計(jì)算出來,列在下表里:,,從表中數(shù)據(jù)可以看出,,所以,供給,千瓦電力就可以
20、保證有0.9936的,概率不會(huì)誤事。完全沒有必要供給80千瓦的電力。,第五節(jié) 隨機(jī)變量簡(jiǎn)介 隨機(jī)變量是這樣的一種“函數(shù)”,它把隨機(jī)試驗(yàn)的每一個(gè)基本結(jié)果對(duì)應(yīng)成一個(gè)實(shí)數(shù)。 例如,擲一枚硬幣有兩個(gè)基本結(jié)果,正面和反面。我們?nèi)是這樣的一種對(duì)應(yīng)法則: 如果擲出正面,取X=1,如果擲出反面,取X=-1.則X就是一個(gè)隨機(jī)變量,取-1和1兩個(gè)值,到底取哪個(gè)在實(shí)驗(yàn)沒有結(jié)束之前不能確定,即取值是隨機(jī)的。,所有可能取值的概率
21、總和必為1。,,我們關(guān)心的是隨機(jī)變量的取某個(gè)值或取值落在某個(gè)范圍里的概率。怎樣計(jì)算,依不同情況而定。 隨機(jī)變量有兩種類型,一種是它的所有可能的取值可以一一列舉出來。例如上面提到的。這樣的隨機(jī)變量叫做離散型隨機(jī)變量。對(duì)于這樣的隨機(jī)變量,我們要搞清楚它可能取的每一個(gè)值,而且要求出取每一個(gè)值的概率。 例如,投擲一個(gè)硬幣100次,用X表示其中出現(xiàn)的正面次數(shù),則所有可能的取值是0,1,2,……,100,且,所有可能取值的概率總和
22、必為1。,,對(duì)于隨機(jī)變量,我們常常會(huì)求它的取值的平均值,還要考慮它的取值的分散程度。,那么這個(gè)運(yùn)動(dòng)員的水平該怎樣評(píng)價(jià)呢?我們計(jì)算一下他打一槍平均來說可能的環(huán)數(shù):,這個(gè)數(shù)叫隨機(jī)變量X的數(shù)學(xué)期望。,例如,X表示一個(gè)射擊運(yùn)動(dòng)員命中的環(huán)數(shù),則它是一個(gè)隨機(jī)變量。假設(shè)我們已經(jīng)知道X取每一個(gè)值的概率,如下表所示:,相對(duì)于數(shù)學(xué)期望,隨機(jī)變量的取值有時(shí)偏大,有時(shí)偏小,那么平均偏差該怎樣計(jì)算呢?先把這些偏差做平方,然后再平均。考慮到每一個(gè)偏差出現(xiàn)的可能性實(shí)
23、際上就是原先的取值對(duì)應(yīng)的概率,所以也要用求數(shù)學(xué)期望那樣的方法來求偏差平方的平均值。例如,上面的X,,由上表可見,偏差平方的平均值為,這個(gè)數(shù)叫隨機(jī)變量X的方差。,,,隨機(jī)變量的數(shù)學(xué)期望反映了它取值的平均大小,是一個(gè)平均值; 隨機(jī)變量的方差反映了它相對(duì)于平均值而言的分散程度。方差越小,取值的分散程度越小。如果方差為0,那這個(gè)隨機(jī)變量就幾乎是一個(gè)常數(shù)。,例: 據(jù)氣象預(yù)報(bào),某地區(qū)下月有小洪水的概率為0.25,有大洪水的概率為0
24、.01。設(shè)工地上有一臺(tái)大型設(shè)備,為保護(hù)設(shè)備,有以下三種方案: 1、運(yùn)走設(shè)備,需花費(fèi)3800元; 2、建一保護(hù)墻,需花費(fèi)2000元。但無法抵御大洪水,大洪水來臨的話,設(shè)備受損,損失60000元; 3、不采取任何措施,祈禱不發(fā)生洪水。大洪水來臨損失60000元,小洪水來臨損失10000元。試比較哪種方案好。,解:分別用X,Y,Z表示三種方案下可能帶來的費(fèi)用,則都是隨機(jī)變量。我們把各個(gè)隨機(jī)變量的分布列在
25、下表里:,則E(X)=3800E(Y)=2600E(Z)=3100平均來說,方案二比較好。,第二部分 統(tǒng)計(jì)統(tǒng)計(jì)在我們國家有兩種意義:社會(huì)統(tǒng)計(jì) 數(shù)理統(tǒng)計(jì)我們要討論的是數(shù)理統(tǒng)計(jì)。,引言 你要研究什么?研究對(duì)象——總體 由全體成員構(gòu)成。例如 1、某地區(qū)高中學(xué)生的身高發(fā)育情況 2、袁隆平新水稻品種的畝產(chǎn)量 3、某班學(xué)生的數(shù)學(xué)學(xué)習(xí)成
26、績 4、某個(gè)學(xué)生的數(shù)學(xué)學(xué)習(xí)成績 5、姚明的技術(shù)水平(投籃,三分球,命中 率, 籃板等) 6、學(xué)習(xí)成績與性別的關(guān)系 7、紅樓夢(mèng)前80回與后40回的用字、用詞的 差異,為什么要學(xué)習(xí)統(tǒng)計(jì)?1、當(dāng)我們要對(duì)總體進(jìn)行研究時(shí),由于種種原因,不
27、 可把每個(gè)個(gè)體的特征都記錄研究;2、不可能收集到所有數(shù)據(jù);3、可能收集到所有數(shù)據(jù),但是要花費(fèi)大量的財(cái)力物 力;4、即使收集到了所有的數(shù)據(jù)資料,面對(duì)大量的雜亂 無章的數(shù)據(jù),不用科學(xué)的方法處理,我們也無法 得到想要得到的信息。,統(tǒng)計(jì)正是處理上面遇到的窘境的理想手段:1、怎樣收集數(shù)據(jù)資料;2、怎樣對(duì)收集到的數(shù)據(jù)資料進(jìn)行科學(xué)的分析處理;3、合理解釋處理結(jié)果。,樣本
28、 從總體中抽取一部分個(gè)體出來,測(cè)量其相應(yīng)的數(shù)量指標(biāo)和特征并記錄。這一部分個(gè)體放到一起就叫做一個(gè)樣本。 一般來說,我們總是把測(cè)得的數(shù)據(jù)全體叫做樣本。 樣本中所考慮的個(gè)體的數(shù)目叫樣本容量。,例如:1、隨機(jī)抽查某地區(qū)100名高中二年級(jí)學(xué)生測(cè)量身高得到的200個(gè)數(shù)據(jù); 2、將水稻新品種種植在其他條件相同的10塊試驗(yàn)田里,收割后測(cè)得的10個(gè)畝產(chǎn)量數(shù)據(jù);,第一節(jié) 抽樣方法 A、簡(jiǎn)單隨機(jī)抽樣法
29、 從有N個(gè)個(gè)體的總體中不重復(fù)地取出n個(gè)個(gè)體,n<N,每個(gè)個(gè)體都有相同的機(jī)會(huì)被抽到。抽簽法: 編號(hào)、制簽、攪勻、隨機(jī)抽簽k次隨機(jī)數(shù)表:省掉制簽、攪勻、隨機(jī)抽簽過程,隨機(jī)數(shù)表是一個(gè)重要工具。 它是一張由數(shù)字0到9構(gòu)成的數(shù)表,可能三個(gè)三個(gè)地由三位數(shù)構(gòu)成。也可能由四位數(shù)構(gòu)成 。 我們可以用某種編程語言產(chǎn)生隨機(jī)數(shù)表。 用Excel就可以方便地產(chǎn)生隨機(jī)數(shù)表:,1、在單
30、元格C1里輸入 =RAND() 產(chǎn)生一個(gè)0到1之間的隨機(jī)數(shù),拖拽C1的填充柄就可以產(chǎn)生不同的隨機(jī)數(shù)。65536行,可產(chǎn)生大量隨機(jī)數(shù)。(0,1之間隨機(jī)數(shù)) 2、輸入 =INT(100*RAND())產(chǎn)生0到99之間的整隨機(jī)數(shù)。 (兩位隨機(jī)數(shù))3、隨機(jī)數(shù)發(fā)生器 選擇 工具——數(shù)據(jù)分析——隨機(jī)數(shù)發(fā)生器(隨機(jī)數(shù)) 4、 計(jì)算器可能會(huì)有不同的方法,要參考有關(guān)說明書。,B、系統(tǒng)抽樣 分成相同的n組,每
31、組隨機(jī)抽取一個(gè)。C、分層抽樣 總體由差異明顯的幾個(gè)部分組成,各部分稱為層。根據(jù)比例在各層進(jìn)行抽樣。,第二節(jié) 總體分布的估計(jì)統(tǒng)計(jì)的任務(wù): 在統(tǒng)計(jì)里我們感興趣的是:如果從總體中任取一個(gè)個(gè)體,這個(gè)個(gè)體的某個(gè)或幾個(gè)數(shù)量指標(biāo)會(huì)有什么特征?我們不知道其指標(biāo)會(huì)是多少。統(tǒng)計(jì)的任務(wù)就是希望搞清楚,任取一個(gè)個(gè)體,其指標(biāo)會(huì)遵循什么規(guī)律。 當(dāng)然不會(huì)是一個(gè)確定性的規(guī)律,而是一個(gè)“統(tǒng)計(jì)規(guī)律”
32、,就是一個(gè)具有概率意義的規(guī)律。例如某地某段時(shí)間里高溫出現(xiàn)概率;某校高一年級(jí)男生的身高在某個(gè)范圍里的概率。,從總體中任取一個(gè)個(gè)體,其指標(biāo)不知道會(huì)是多少,就把它作為一個(gè)隨機(jī)變量對(duì)待。 對(duì)總體的研究,就是要達(dá)到搞清楚這個(gè)隨機(jī)變量的分布的目的。這就是統(tǒng)計(jì)的基本目的。 在概率論里,我們研究各種分布。在統(tǒng)計(jì)里,我們要利用樣本數(shù)據(jù)確定表示總體指標(biāo)的那個(gè)隨機(jī)變量到底應(yīng)該是什么分布。如果分布完全是已知的,那統(tǒng)計(jì)就沒有任何意義了。,
33、參數(shù)問題:對(duì)總體指標(biāo)的數(shù)字特征,比如數(shù)學(xué)期望,方差,中為數(shù)等的估算、刻畫。 非參數(shù)問題多個(gè)隨機(jī)變量之間的關(guān)系問題,所以,要知道我們會(huì)遇到的問題:刻劃總體分布刻劃總體數(shù)字特征刻劃各種關(guān)系 在所有的問題中,歸根結(jié)底是估計(jì)概率的問題,而估計(jì)概率最基本的方法,就是利用頻率。要計(jì)算頻率,就要抽樣——做實(shí)驗(yàn)獲取數(shù)據(jù)。,由于我們是從樣本出發(fā)做出的結(jié)論,結(jié)論勢(shì)必會(huì)有出錯(cuò)的可能。 數(shù)理統(tǒng)計(jì)的結(jié)論不同于
34、其他的結(jié)論,其精華就在于:在給出結(jié)論的同時(shí),還會(huì)告訴你,這個(gè)結(jié)論出錯(cuò)的概率有多大。,總體分布的估計(jì)方法頻率分布表全距 組距 頻數(shù) 頻率 頻率/組距 頻率分布直方圖與折線圖 頻率直方圖,第三節(jié) 總體特征數(shù)的估計(jì) 總體分布的特征數(shù)有各種各樣,我們?cè)诟怕收摾锝兴鼈冏鲾?shù)字特征。例如數(shù)學(xué)期望,方差,中位數(shù),眾數(shù),等等。 在統(tǒng)計(jì)里這些往往都是不知道的。統(tǒng)計(jì)的任務(wù)之一就是利用樣本數(shù)
35、據(jù)來估計(jì)這些數(shù)字特征。在這里就是要向?qū)W生介紹其中最基本的幾種估計(jì)量。,A、平均數(shù)的估計(jì) 平均數(shù)指總體X平均數(shù),即數(shù)學(xué)期望E(X),一般用希臘字母μ表示。怎樣用樣本值來估計(jì)這個(gè)數(shù)呢? 設(shè)我們得到的樣本為,,那么我們就用,來做為μ的估計(jì)值,有時(shí)記為,這個(gè)公式叫做樣本均值或樣本平均數(shù)。,在統(tǒng)計(jì)研究中我們正是要討論這種公式的意義和價(jià)值,而不會(huì)對(duì)具體的計(jì)算結(jié)果說它的優(yōu)劣。 為什么?因?yàn)樵俸玫墓揭矔?huì)有計(jì)算出
36、糟糕結(jié)果的時(shí)候。例如抽樣的時(shí)候碰巧樣本取的不好,這是有可能的。,樣本均值的最大優(yōu)點(diǎn)有兩個(gè),無偏性和最小方差性:,總體X的方差是,描述了總體取值相對(duì)于其平均值μ的離散程度。我們要估計(jì)方差,就要先算出μ的估計(jì)來,然后看看樣本值相對(duì)于這個(gè)估計(jì)值的離散程度有多大。所以就用,,作為總體方差的估計(jì)值。這就是樣本方差。對(duì)其開方,就得到樣本標(biāo)準(zhǔn)差。,例如,要對(duì)一種新的水稻品種和一種老的品種做比較,看看新品種到底好不好,怎樣比?我們需要進(jìn)行抽樣,得到
37、樣本: 對(duì)每個(gè)品種種植試驗(yàn),例如,新品種種m塊試驗(yàn)田,得到m個(gè)畝產(chǎn)數(shù)據(jù),老品種種n塊試驗(yàn)田,得到n個(gè)畝產(chǎn)數(shù)據(jù)。我們就有了兩個(gè)樣本。 分別計(jì)算相應(yīng)的樣本均值和樣本方差。樣本均值越大越好,樣本方差則越小越好。,MODE鍵 +3鍵:進(jìn)入統(tǒng)計(jì)模式SHIFT鍵+KAC鍵:開始輸入數(shù)據(jù)每輸入一個(gè)數(shù)據(jù)按一次 DATA鍵輸完后,KOUT鍵+n鍵,顯示數(shù)據(jù)個(gè)數(shù)SHIFT+1鍵:顯示樣本均值SHIFT+2鍵:顯示
38、樣本標(biāo)準(zhǔn)差,再按平方鍵可得樣本方差。 KOUT+2鍵可計(jì)算樣本值的總和,叫回歸方程。,,第四節(jié) 線性回歸方程 有兩個(gè)量 x 和 y,x 的變化會(huì)導(dǎo)致 y 發(fā)生變化。但是,并不是每一個(gè)x值唯一地對(duì)應(yīng)一個(gè)y值,即使已知x的取值,也無法完全確定y的取值,它有隨機(jī)性。y與x之間不是我們以前學(xué)過的函數(shù)關(guān)系,這種關(guān)系我們叫相關(guān)關(guān)系。對(duì)于具有相關(guān)關(guān)系的 y 和 x ,我們?cè)鯓永脭?shù)學(xué)知識(shí)比較準(zhǔn)確地刻畫它們之間的關(guān)系呢?
39、我們希望能夠搞清楚,如果不考慮隨機(jī)因素,y與x之間的確定性關(guān)系是什么?,.,叫回歸方程。,這就是傳說中的回歸模型。相應(yīng)的函數(shù)叫回歸函數(shù),而把,設(shè)這個(gè)確定性關(guān)系可以用函數(shù)f(x)表示。那么y與x之間的相關(guān)關(guān)系應(yīng)該用下式來刻畫:,回歸分析的基本理論任務(wù)有三個(gè):1、確定到底有沒有這種回歸關(guān)系?2、如果有,回歸函數(shù)是什么樣子的?3、誤差項(xiàng)作為隨機(jī)變量服從什么分布?至少應(yīng)該估 計(jì)出它的數(shù)學(xué)期望和方差。至于它的
40、應(yīng)用,非常廣泛。,為了解決以上問題,必須有樣本!作n次觀測(cè),每次觀測(cè)一個(gè)x值和它相應(yīng)的y值,依次記為,這就是樣本。在這一章我們假設(shè)已經(jīng)得到了樣本,下面解決相應(yīng)的問題。樣本一般用一張表列出。,,的形式。這樣的回歸分析叫線性回歸分析,相應(yīng)的關(guān)系叫線性回歸關(guān)系。,我們要先考慮選擇一個(gè)適當(dāng)?shù)暮瘮?shù),然后看看這個(gè)函數(shù)是不是合適。在中學(xué)課本里,我們選擇線性函數(shù),就是取,如果y與x之間完全沒有任何線性依賴關(guān)系,那么給定x對(duì)計(jì)算y沒有任何意義。這時(shí)b自然
41、應(yīng)該是0。所以在線性回歸里如果b幾乎是0,那么線性回歸就沒有什么意義了。,我們也正是通過數(shù)據(jù)計(jì)算這兩個(gè)系數(shù)的,而且也是通過判斷 b與 0的接近程度來判斷 y 與 x 之間有沒有線性回歸關(guān)系的。,散點(diǎn)圖,回歸系數(shù)的計(jì)算選用怎樣的直線最好呢?假如我們選定了一條直線是,那么如果不考慮隨機(jī)因素,把x帶入這個(gè)方程計(jì)算出來的,應(yīng)該與觀測(cè)到的y值越接近越好。如果把樣本里的所有x的取值依次帶入,就可以計(jì)算得到相應(yīng)的,好的直線應(yīng)該使得這里計(jì)算出來的值
42、與相應(yīng)的觀測(cè)值,相差不大。,把所有的誤差的平方累積起來就是,我們要取這樣的,,使得,達(dá)到最小。,最小二乘思想,,,,其中,不難看出,為使,達(dá)到最小,只要取,就可以了。而且這時(shí),達(dá)到最小值,。,我們得到的回歸直線為,,帶入到此方程,即可得到一個(gè)相應(yīng)的,此值可以看作是,的計(jì)算值。,把樣本中的,,,我們把,叫做殘差平方和。回歸直線就是使殘差平方和達(dá)到最小的那條直線。,越小,說明直線回歸越好。這就部分地解決了我們判斷線性回歸好不好的問題。,,這
43、里還得到一個(gè)副產(chǎn)品:,從而,,,所以,相關(guān)系數(shù),,,可見,|r|越接近于1,直線回歸越好。,如果|r|接近于1,F(xiàn)值就會(huì)比較大。但是如果沒有線性相關(guān)關(guān)系,F(xiàn)值較大的可能性很小。所以據(jù)此判斷有線性相關(guān)關(guān)系。,事實(shí)上,如果沒有線性相關(guān)關(guān)系,那么,例:教材73頁例一的數(shù)據(jù)。用 Excel計(jì)算:1、輸入數(shù)據(jù)2、作散點(diǎn)圖:插入—圖表—散點(diǎn)圖3、作回歸方程:激活散點(diǎn)圖—點(diǎn)一個(gè)散點(diǎn)—右鍵—添加趨勢(shì)線—線性—選項(xiàng)卡—顯示公式,R平方值回歸,也可
44、以用計(jì)算器:MODE+2 進(jìn)入回歸狀態(tài)1、輸入數(shù)據(jù):SHIFT+KAC(即開關(guān)鍵)開始輸入數(shù)據(jù):95+(xD,yD)(四排一鍵)+6.2+DATA鍵(最后一鍵)這樣就完成一對(duì)數(shù)的輸入。重復(fù)地輸入所有數(shù)據(jù);2、SHIFT+A (即7鍵) 給出 a,SHIFT+B (即8鍵)給出b;3、SHIFT+r(即9鍵)給出相關(guān)系數(shù);4、輸入一個(gè)x值+y^鍵(四排二鍵)給出對(duì)應(yīng)的y的預(yù)測(cè)值;5、輸入一個(gè)y值+SHIFT+x^鍵(四排二鍵
45、)給出對(duì)應(yīng)的x的控制值。,第五節(jié) 獨(dú)立性檢驗(yàn),美國在殺人犯的死刑判決中存在種族差異?一位叫Radelet的研究人員對(duì)此進(jìn)行了研究。 怎樣研究? 總體:美國殺人犯 問題:A表示殺人犯是白人, B表示被判處死刑。A,B這兩個(gè)隨機(jī)事件是否獨(dú)立?,A,B如果獨(dú)立,則,這些式子用一句話說就是: 殺人犯是白人還是黑人和判不判死刑沒有關(guān)系我們?cè)鯓觼砼袛噙@個(gè)言論的對(duì)錯(cuò)呢?,用統(tǒng)計(jì)
46、的方法,估計(jì)上面涉及到的每一個(gè)概率,看看估計(jì)的結(jié)果和上面的等式之間會(huì)不會(huì)發(fā)生沖突。 所以,首先要抽樣。,在殺人犯中任取326人,其中白人160名,黑人166名。結(jié)果發(fā)現(xiàn):160名白人中有19人被判死刑,141人未判死刑; 166名黑人中有17人被判死刑,149人未判死刑。 為了便于說明,我們把這些數(shù)據(jù)總結(jié)在如下的表格中:,我們先列出上面提到的所有概率的估
47、計(jì)值:,,,,,,,,,如果A,B相互獨(dú)立,那么下面各數(shù)都不應(yīng)該太大:,,,,如果A,B相互獨(dú)立,則當(dāng)n比較大時(shí),有,,,,,,,,,都是小概率事件,所以,如果我們把表里的數(shù)據(jù)代到公式里求出的,大于其中的某個(gè)數(shù),我們就有理由做出,A,B不相互獨(dú)立,的結(jié)論。,在死刑問題里,小概率事件沒有發(fā)生。所以我們沒有理由否定 A,B相互獨(dú)立的結(jié)論,認(rèn)為數(shù)據(jù)不能充分說明在死刑判決中存在種族
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 18秋地大《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)二輔導(dǎo)資料
- 18秋北交《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)一輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計(jì)18春平時(shí)作業(yè)1輔導(dǎo)資料
- 經(jīng)濟(jì)數(shù)學(xué)概率論與數(shù)理統(tǒng)計(jì)
- 概率論與數(shù)理統(tǒng)計(jì)
- 18秋地大《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)一-3輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計(jì)18春平時(shí)作業(yè)2輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計(jì)18春平時(shí)作業(yè)3輔導(dǎo)資料
- 吉大18春學(xué)期《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)一輔導(dǎo)資料
- 概率論與數(shù)理統(tǒng)計(jì)復(fù)習(xí)資料
- 概率論與數(shù)理統(tǒng)計(jì)[0001]
- 概率論與數(shù)理統(tǒng)計(jì)習(xí)題
- 18秋北交《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)一-1輔導(dǎo)資料
- 18秋北交《概率論與數(shù)理統(tǒng)計(jì)》在線作業(yè)一-2輔導(dǎo)資料
- 概率論與數(shù)理統(tǒng)計(jì)教材
- 《概率論與數(shù)理統(tǒng)計(jì)》論文
- 概率論與數(shù)理統(tǒng)計(jì)試題
- 概率論與數(shù)理統(tǒng)計(jì)試題
- 概率論與數(shù)理統(tǒng)計(jì)答案
- 概率論與數(shù)理統(tǒng)計(jì)題庫
評(píng)論
0/150
提交評(píng)論