數(shù)理統(tǒng)計(jì)1.1_第1頁
已閱讀1頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章 緒論,§1-1 什么是數(shù)理統(tǒng)計(jì)§1-2 數(shù)理統(tǒng)計(jì)幾個(gè)基本概念§1-3 抽樣分布,學(xué)習(xí)目標(biāo),1. 理解數(shù)理統(tǒng)計(jì)的涵義2. 理解了解統(tǒng)計(jì)研究對象的特點(diǎn)3. 了解統(tǒng)計(jì)研究的基本環(huán)節(jié)4. 了解統(tǒng)計(jì)學(xué)的產(chǎn)生與發(fā)展過程5. 重點(diǎn)掌握數(shù)理統(tǒng)計(jì)的基本概念與抽樣分布,,§1-1 什么是數(shù)理統(tǒng)計(jì),一、統(tǒng)計(jì)(Statistics)的涵義 我們先從數(shù)理統(tǒng)計(jì)學(xué)開始,數(shù)理統(tǒng)計(jì)學(xué)是研究收集數(shù)據(jù)

2、、分析數(shù)據(jù)并據(jù)以對所研究的問題作出一定的結(jié)論的科學(xué)和藝術(shù)。數(shù)理統(tǒng)計(jì)學(xué)所考察的數(shù)據(jù)都帶有隨機(jī)性(偶然性)的誤差。這給根據(jù)這種數(shù)據(jù)所作出的結(jié)論帶來了一種不確定性,其量化要借助于概率論的概念和方法。數(shù)理統(tǒng)計(jì)學(xué)與概率論這兩個(gè)學(xué)科的密切聯(lián)系,正是基于這一點(diǎn)。 Statistics: the science of collecting, analyzing, presenting, and interpreting data. (不列顛百科全書)

3、,統(tǒng)計(jì)學(xué)起源于收集數(shù)據(jù)的活動(dòng),小至個(gè)人的事情,大至治理一個(gè)國家,都有必要收集種種有關(guān)的數(shù)據(jù),如在我國古代典籍中,就有不少關(guān)于戶口、錢糧、兵役、地震、水災(zāi)和旱災(zāi)等等的記載?,F(xiàn)今各國都設(shè)有統(tǒng)計(jì)局或相當(dāng)?shù)臋C(jī)構(gòu)。當(dāng)然,單是收集、記錄數(shù)據(jù)這種活動(dòng)本身并不能等同于統(tǒng)計(jì)學(xué)這門科學(xué)的建立,需要對收集來的數(shù)據(jù)進(jìn)行排比、整理,用精煉和醒目的形式表達(dá),在這個(gè)基礎(chǔ)上對所研究的事物進(jìn)行定量或定性估計(jì)、描述和解釋,并預(yù)測其在未來可能的發(fā)展?fàn)顩r。例如

4、根據(jù)人口普查或抽樣調(diào)查的資料對我國人口狀況進(jìn)行描述,根據(jù)適當(dāng)?shù)某闃诱{(diào)查結(jié)果,對受教育年限與收入的關(guān)系,對某種生活習(xí)慣與嗜好(如吸煙)與健康的關(guān)系作定量的評估。根據(jù)以往一般時(shí)間某項(xiàng)或某些經(jīng)濟(jì)指標(biāo)的變化情況,預(yù)測其在未來一般時(shí)間的走向等,做這些事情的理論與方法,才能構(gòu)成一門學(xué)問——數(shù)理統(tǒng)計(jì)學(xué)的內(nèi)容。,這樣的統(tǒng)計(jì)學(xué)始于何時(shí)?恐怕難于找到一個(gè)明顯的、大家公認(rèn)的起點(diǎn)。一種受到某些著名學(xué)者支持的觀點(diǎn)認(rèn)為,英國學(xué)者葛朗特在1662年發(fā)

5、表的著作《關(guān)于死亡公報(bào)的自然和政治觀察》,標(biāo)志著這門學(xué)科的誕生。中世紀(jì)歐洲流行黑死病,死亡的人不少。自1604年起,倫敦教會(huì)每周發(fā)表一次“死亡公報(bào)”,記錄該周內(nèi)死亡的人的姓名、年齡、性別、死因。以后還包括該周的出生情況——依據(jù)受洗的人的名單,這基本上可以反映出生的情況。幾十年來,積累了很多資料,葛朗特是第一個(gè)對這一龐大的資料加以整理和利用的人,他原是一個(gè)小店主的兒子,后來子承父業(yè),靠自學(xué)成才。他因這一部著作被選入當(dāng)年

6、成立的英國皇家學(xué)會(huì),反映學(xué)術(shù)界對他這一著作的承認(rèn)和重視。,圖1英國約克大學(xué)葛朗特,圖2  帕齊利,這是一本篇幅很小的著作,主要內(nèi)容為8個(gè)表,從今天的觀點(diǎn)看,這只是一種例行的數(shù)據(jù)整理工作,但在當(dāng)時(shí)則是有原創(chuàng)性的科研成果,其中所提出的一些概念,在某種程度上可以說沿用至今,如數(shù)據(jù)簡約(大量的、雜亂無章的數(shù)據(jù),須注過整理、約化,才能突出其中所包含的信息)、頻率穩(wěn)定性(一定的事件,如“生男”、“生女”,在較長時(shí)期中有一個(gè)基本穩(wěn)定的比率

7、,這是進(jìn)行統(tǒng)計(jì)性推斷的基礎(chǔ))、數(shù)據(jù)糾錯(cuò)、生命表(反映人群中壽命分布的情況,至今仍是保險(xiǎn)與精算的基礎(chǔ)概念)等。,葛朗特的方法被他同時(shí)代的政治經(jīng)濟(jì)學(xué)家佩蒂引進(jìn)到社會(huì)經(jīng)濟(jì)問題的研究中,他提倡在這類問題的研究中不能尚空談,要讓實(shí)際數(shù)據(jù)說話,他的工作總結(jié)在他去世后于1690年出版的《政治算術(shù)》一書中。,圖4:高斯,當(dāng)然,也應(yīng)當(dāng)指出,他們的工作還停留在描述性的階,不是現(xiàn)代意義下的數(shù)理統(tǒng)計(jì)學(xué),那時(shí),概率論尚處在萌芽的階段,不足以給數(shù)理統(tǒng)計(jì)學(xué)的發(fā)

8、展提供充分的理論支持,但不能由此否定他們工作的重大意義,作為現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)發(fā)展的幾個(gè)源頭之一,他們以及后續(xù)學(xué)者在人口、社會(huì)、經(jīng)濟(jì)等領(lǐng)域的工作,特別是比利時(shí)天文學(xué)家兼統(tǒng)計(jì)學(xué)家凱特勒19世紀(jì)的工作,對促成現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)的誕生起了很大的作用。,數(shù)理統(tǒng)計(jì)學(xué)的另一個(gè)重要源頭來自天文和測地學(xué)中的誤差分析問題。早期,測量工具的精度不高,人們希望通過多次量測獲取更多的數(shù)據(jù),以便得到對量測對象的精度更,圖3 拉普拉斯,高的估計(jì)值。量測誤差有隨機(jī)性,

9、適合于用概率論即統(tǒng)計(jì)的方法處理,遠(yuǎn)至伽利略就做過這方面的工作,他對測量誤差的性態(tài)作了一般性的描述,法國大數(shù)學(xué)家拉普拉斯曾對這個(gè)問題進(jìn)行了長時(shí)間的研究,現(xiàn)今概率論中著名的“拉普拉斯分布”,即是他在這研究中的一個(gè)產(chǎn)物,這方面最著名且影響深遠(yuǎn)的研究成果有二:一是法國數(shù)學(xué)家兼天文家勒讓德19世紀(jì)初(1805)在研究慧星軌道計(jì)算時(shí)發(fā)明的“最小二乘法”,他在估計(jì)過巴黎的子午線長這一工作中,曾使用這個(gè)方法?,F(xiàn)今著作中把這一方法的發(fā)明歸

10、功于高斯,但高斯使用這一方法最早見諸文字是1809年,比勒讓德晚。一種現(xiàn)在逐步取得公認(rèn)——這項(xiàng)發(fā)明系由二人獨(dú)立做出,看來使比較妥當(dāng)?shù)摹A硗庖粋€(gè)重要成果是德國大學(xué)者高斯1809年在研究行星繞日運(yùn)動(dòng)時(shí)提出用正態(tài)分布刻畫測量誤差的分布。正態(tài)分布也常稱為高斯分布,其曲線是鐘形,極象頤和園中玉帶橋那樣的形狀,故有時(shí)又稱為“鐘形曲線”,它反映了這樣一種極普通的情況:天下形,圖4:高斯,圖5:連續(xù)型隨機(jī)變量,天下形形色色的事物中,“兩頭

11、小,中間大”的居多,如人的身高,太高太矮的都不多,而居于中間者占多數(shù)——當(dāng)然,這只是一個(gè)極粗略的描述,要作出準(zhǔn)確的描述,須動(dòng)用高等數(shù)學(xué)的知識(shí)。正是其數(shù)學(xué)上的特性成為其廣泛應(yīng)用的根據(jù)。,正態(tài)分布在數(shù)理統(tǒng)計(jì)學(xué)中占有極重要的地位,現(xiàn)今仍在常用的許多統(tǒng)計(jì)方法,就是建立在“所研究的量具有或近似地具有正態(tài)分布”這個(gè)假定的基礎(chǔ)上,而經(jīng)驗(yàn)和理論(概率論中所謂“中心極限定理”)都表明這個(gè)假定的現(xiàn)實(shí)性,現(xiàn)實(shí)世界許多現(xiàn)象看來是雜亂無章的,如

12、不同的人有不同的身高、體重。大批生產(chǎn)的產(chǎn)品,其質(zhì)量指標(biāo)各有差異 ??磥砗翢o規(guī)則,但它們在總體上服從正態(tài)分布。這一點(diǎn),顯示在紛亂中有一種秩序存在,提出正態(tài)分布的高斯,一生在多個(gè)領(lǐng)域里面有不少重大的貢獻(xiàn),但在德國10馬克的有高斯圖像的鈔票上,單只畫出了正態(tài)曲線,以此可以看出人們對他這一貢獻(xiàn)評價(jià)之高。,,20世紀(jì)以前數(shù)理統(tǒng)計(jì)學(xué)發(fā)展的一個(gè)重要成果,是19世紀(jì)后期由英國遺傳學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓發(fā)起,并經(jīng)現(xiàn)代統(tǒng)計(jì)學(xué)的奠基人之一K&#

13、183;皮爾遜和其他一些英國學(xué)者所發(fā)展的統(tǒng)計(jì)相關(guān)與回歸理論。所謂統(tǒng)計(jì)相關(guān),是指一種非決定性的關(guān)系如人的身高X與體重Y,存在一種大致的關(guān)系,表現(xiàn)在X大(小)時(shí),Y也傾向于大(?。?,但非決定性的:由X并不能決定Y。現(xiàn)實(shí)生活中和各種科技領(lǐng)域中,這種例子很多,如受教育年限與收入的關(guān)系,經(jīng)濟(jì)發(fā)展水平與人口增長速度的關(guān)系等,都是屬于這種性質(zhì),統(tǒng)計(jì)相關(guān)的理論把這種關(guān)系的程度加以量化,而統(tǒng)計(jì)回歸則是把有統(tǒng)計(jì)相關(guān)的變量,如上文的身高X和體

14、重Y的關(guān)系的形式作近似的估計(jì),稱為回歸方程,現(xiàn)實(shí)世界中的現(xiàn)象往往涉及眾多變量,它們之間有錯(cuò)綜復(fù)雜的關(guān)系,且許多屬于非決定性質(zhì),相關(guān)回歸理論的發(fā)明,提供了一種通過實(shí)際觀察去對這種關(guān)系進(jìn)行定量研究的工具,有著重大的認(rèn)識(shí)和實(shí)用意義。,到20世紀(jì)初年,由于上述幾個(gè)方面的發(fā)展,數(shù)理統(tǒng)計(jì)學(xué)已積累了很豐富的成果——在此因篇幅關(guān)系,我們不能詳盡無遺地一一列舉有關(guān)的重要成果,如抽樣調(diào)查的理論和方法方面的進(jìn)展,但是直到這時(shí)為止,我們還不能說

15、現(xiàn)代意義下的數(shù)理統(tǒng)計(jì)學(xué)已經(jīng)建立起來,其主要標(biāo)志之一就是這門學(xué)問還缺乏一個(gè)統(tǒng)一的理論框架,這個(gè)任務(wù)在20世紀(jì)上半葉得以完成,狹義一點(diǎn)說可界定在1921——1938年,起主要作用的是幾位大師級的人物,特別是英國的費(fèi)歇爾·K·皮爾遜,發(fā)展統(tǒng)計(jì)假設(shè)檢驗(yàn)理論的奈曼與E·皮爾遜和提出統(tǒng)計(jì)決策函數(shù)理論的瓦爾德等。我國已故著名統(tǒng)計(jì)學(xué)家許寶(1910——1970)在這項(xiàng)工作中也卓有建樹。,自二戰(zhàn)結(jié)束迄今,數(shù)理統(tǒng)

16、計(jì)學(xué)有了迅猛的發(fā)展,主要有以下三方面的原因:一是數(shù)理統(tǒng)計(jì)學(xué)理論框架的建立以及概率論和數(shù)學(xué)工具的進(jìn)展,為統(tǒng)計(jì)理論在面上和向縱深的發(fā)展打開了門徑和提供了手段,許多在早期比較粗略的理論和方法,在理論上得到了完善與深入,并不斷提出新的,論和方法,在理論上得到了完善與深入,并不斷提出新的研究課題;二是實(shí)用上的需要,不斷提出了復(fù)雜的問題與模型,吸引了學(xué)者們的研究興趣;三是電子計(jì)算機(jī)的發(fā)明與普及應(yīng)用,一方面提供了必要的計(jì)算工具——統(tǒng)計(jì)方法的

17、實(shí)施往往涉及大量數(shù)據(jù)的處理與運(yùn)算,用人力無法在合理的時(shí)間內(nèi)完成,所以在早年,一些統(tǒng)計(jì)方法人們雖然知道,但很少付諸實(shí)用,就因?yàn)槭侨肆λy及。計(jì)算機(jī)的出現(xiàn)解決了這個(gè)問題。而賦予統(tǒng)計(jì)方法以現(xiàn)實(shí)的生命力。同時(shí),計(jì)算機(jī)對促進(jìn)統(tǒng)計(jì)理論研究也有助益,統(tǒng)計(jì)模擬是其表現(xiàn)之一,在承認(rèn)上述成就的同時(shí),不少統(tǒng)計(jì)學(xué)家也指出這一時(shí)期發(fā)展中出現(xiàn)的一些問題或偏向,其中主要的一點(diǎn)是,數(shù)理統(tǒng)計(jì)學(xué)理論研究中的“數(shù)學(xué)化”氣味愈來愈重,相當(dāng)一部分研究工作停留在數(shù)學(xué)的層面,早期

18、那種理論研究與現(xiàn)實(shí)問題密切結(jié)合的優(yōu)良傳統(tǒng)有所淡化,一些學(xué)者還提出了補(bǔ)救的建議,對未來統(tǒng)計(jì)學(xué)發(fā)展的方向進(jìn)行探討。同時(shí),現(xiàn)實(shí)問題愈來愈涉及到大量的,結(jié)構(gòu)復(fù)雜的數(shù)據(jù),按現(xiàn)行的數(shù)理統(tǒng)計(jì)學(xué)規(guī)范去處理,顯得力所不及,需要一些帶有根本性創(chuàng)新的思路,使統(tǒng)計(jì)學(xué)的發(fā)展登上一個(gè)新的臺(tái)階,以適應(yīng)應(yīng)用上的需要,考慮這一背景,有的統(tǒng)計(jì)學(xué)家樂觀地認(rèn)為數(shù)理統(tǒng)計(jì)學(xué)正面臨一個(gè)新的突破。,在上面講述數(shù)理統(tǒng)計(jì)學(xué)的發(fā)展?fàn)顩r時(shí),我們著重在實(shí)際 需要所起的促進(jìn)作用方面,由于概率

19、論的概念和方法是數(shù) 理統(tǒng)計(jì)學(xué)的理論基礎(chǔ),概率論的進(jìn)展也必然對數(shù)理統(tǒng)計(jì)學(xué) 的發(fā)展起促進(jìn)作用。,概率,又稱幾率,或然率,指一種不確定的情況出現(xiàn)可能性的大小,例如,投擲一個(gè)硬幣,“出現(xiàn)國徽”(國徽一面朝上)是一個(gè)不確定的情況。因?yàn)橥稊S前,我們無法確定所指情況(“出現(xiàn)國徽”)發(fā)生與否,若硬幣是均勻的且投擲有充分的高度,則兩面的出現(xiàn)機(jī)會(huì)均等,我們說“出現(xiàn)國徽”的概率是1/2;同時(shí),投擲一個(gè)均勻骰子,“出現(xiàn)4點(diǎn)”的概率是1/6,

20、除了這些以及類似的簡單情況外,概率的計(jì)算不容易,往往需要一些理論上的假定,在現(xiàn)實(shí)生活中則往往用經(jīng)驗(yàn)的方法確定概率,例如某地區(qū)有N人,查得其中患某種疾病者有M人,則稱該地區(qū)的人患該種疾病的概率為M/N,這事實(shí)上是使用統(tǒng)計(jì)方法對發(fā)病概率的一個(gè)估計(jì)。,概率的概念起源于中世紀(jì)以來的歐洲流行的用骰子賭博,這一點(diǎn)不難理解,某種情況出現(xiàn)可能性的大小要能夠體察并引起研究的興趣,必須滿足兩個(gè)條件:一是該情況可以在多次重復(fù)中被觀察其發(fā)生與否(

21、在多次重復(fù)下出現(xiàn)較頻繁的情況有更大的概率),一是該情況發(fā)生與否與當(dāng)事人的利益有關(guān)或?yàn)槠渑d趣關(guān)注之所在,用骰子賭博滿足這些條件。,當(dāng)時(shí)有一個(gè)“分賭本問題”曾引起熱烈的討論,并經(jīng)歷了長達(dá)一百多年才得到正確的解決。在這過程中孕育了概率論一些重要的基本概念,舉該問題的一個(gè)簡單情況:甲、乙二人賭博,各出賭注30元,共60元,每局甲、乙勝的機(jī)會(huì)均等,都是1/2。約定:誰先勝滿3局則他贏得全部賭注60元,現(xiàn)已賭完3局,甲2勝1負(fù),而因故中斷賭

22、情,問這60元賭注該如何分給2人,才算公平,初看覺得應(yīng)按2:1分配,即甲得40元,乙得20元,還有人提出了一些另外的解法,結(jié)果都不正確,正確的分法應(yīng)考慮到如在這基礎(chǔ)上繼續(xù)賭下去,甲、乙最終獲勝的機(jī)會(huì)如何,至多再賭2局即可分出勝負(fù),這2局有4種可能結(jié)果:甲甲、甲乙、乙甲、乙乙。前3種情況都是甲最后取勝,只有最后一種情況才是乙取勝,二者之比為3:1,故賭注的公平分配應(yīng)按3:1的比例,即甲得45元,乙15元。,當(dāng)時(shí)的一些學(xué)者,如惠更斯、巴斯

23、噶、費(fèi)爾馬等人,對這類賭情問題進(jìn)行了許多研究,有的出版了著作,如惠更斯的一本著作曾長期在歐洲作為概率論的教科書,這些研究使原始的概率和有關(guān)概念得到發(fā)展和深化。不過,在這個(gè)概率論的草創(chuàng)階段,最重要的里程碑是伯努利的著作《推測術(shù)》。在他死后的1713年發(fā)表,這部著作除了總結(jié)前人關(guān)于賭情的概率問題的成果并有所提高外,還有一個(gè)極重要的內(nèi)容,即如今以他的名字命名的“大數(shù)律”,大數(shù)律是關(guān)于(算術(shù))平均值的定理,算術(shù)平均值,即若干個(gè)數(shù)X

24、1、X2……Xn之和除以n,是最常用的一種統(tǒng)計(jì)方法,人們經(jīng)常使用并深信不疑。但其理論根據(jù)何在,并不易講清楚, 就是伯努利的大數(shù)律要回答的問題,在某種程度上可以說,這個(gè)大數(shù)律是整個(gè)概率論最基本的規(guī)律之一,也是數(shù)理統(tǒng)計(jì)學(xué)的理論基石。,概率論雖發(fā)端于賭博,但很快在現(xiàn)實(shí)生活中找到多方面的應(yīng)用,首先是在人口、保險(xiǎn)精算等方面,在其發(fā)展過程中出現(xiàn)了若干里程碑的《機(jī)遇的原理》,其第三版發(fā)表于1756年,法國大數(shù)學(xué)家拉普拉斯的《分析概率論》

25、,發(fā)表于1812年,1933年蘇聯(lián)教學(xué)家柯爾莫哥洛夫完成了概率論的公理體系,在幾條簡潔的公理之下,發(fā)展出概率論整座的宏偉建筑,有如在歐幾里得公理體系之下發(fā)展出整部幾何。自那以來,概率論成長為現(xiàn)代數(shù)學(xué)的一個(gè)重要分支,使用了許多深刻和抽象的數(shù)學(xué)理論,在其影響下,數(shù)理統(tǒng)計(jì)的理論也日益向深化的方向發(fā)展。,中 國,(1)公元前22世紀(jì)的夏禹王朝,分中國為九州,人口為1355萬人,這是我國最早的土地和人口調(diào)查資料。(2)西周建立了統(tǒng)計(jì)報(bào)

26、告制度,經(jīng)歷春秋戰(zhàn)國,到秦統(tǒng)一中國,形成 了“上計(jì)”報(bào)告制度。(3)統(tǒng)計(jì)被認(rèn)為是治理國家的重要手段,例如,管子“舉事必成,不知計(jì)數(shù)不可”,“不明于數(shù)而欲大事,猶無舟楫而欲經(jīng)于水險(xiǎn)也?!鼻厣眺眲t指出“強(qiáng)國知十三數(shù)”的主張。(4)封建時(shí)代,中國的戶籍和田畝統(tǒng)計(jì)都有很大發(fā)展。秦始皇建立編戶制,東漢曾進(jìn)行全國田地測量,唐代計(jì)口授田,宋明有田畝魚鱗冊的土地調(diào)查地圖。明代人口普查的“戶帖”和“黃冊”。,西 方,(1)埃及在公元前27世紀(jì),為建金

27、字塔和大型農(nóng)業(yè)灌溉系統(tǒng),進(jìn)行全國人口和財(cái)產(chǎn)調(diào)查。(2)公元前15世紀(jì)猶太人為了戰(zhàn)爭對以色列進(jìn)行男丁調(diào)查。(3)《舊約》中記載,公元前10世紀(jì)前后,猶太國王大衛(wèi)和所羅門對全國進(jìn)行比較完整的人口和財(cái)產(chǎn)調(diào)查。(4)公元前6世紀(jì),羅馬帝國以國勢調(diào)查作為治理國家的有效手段,規(guī)定每五年一次人口、土地、牲畜、家奴的調(diào)查。,,(5)進(jìn)入封建社會(huì),統(tǒng)計(jì)調(diào)查往往采取財(cái)產(chǎn)目錄的形式,例如公元9世紀(jì),法蘭克福國王查理大帝為編制“國庫財(cái)產(chǎn)大綱”而進(jìn)行包括人

28、口、土地、收入、農(nóng)產(chǎn)品、畜產(chǎn)品、工業(yè)品的調(diào)查。   11世紀(jì)英國國王威廉為編“最終稅冊”對全國封建主和自由民的土地占有情況和市民財(cái)產(chǎn)狀況進(jìn)行調(diào)查。(6)15至18世紀(jì)歐洲封建社會(huì)進(jìn)入繁榮時(shí)期,統(tǒng)計(jì)更作為說明各國國情的工具,出現(xiàn)了許多以報(bào)導(dǎo)國情為內(nèi)容統(tǒng)計(jì)著作,如英國的“死亡公報(bào)”。,,以上簡單介紹資本主義社會(huì)以前的統(tǒng)計(jì)活動(dòng),多半是結(jié)合賦稅、征兵作中進(jìn)行,為國家統(tǒng)治階級服務(wù)的。隨著資本主義經(jīng)濟(jì)的發(fā)展,特別是現(xiàn)代化大生產(chǎn),對統(tǒng)計(jì)提出了新的

29、要求,大大促進(jìn)統(tǒng)計(jì)活動(dòng)和統(tǒng)計(jì)科學(xué)的發(fā)展。經(jīng)濟(jì)統(tǒng)計(jì)形成了工業(yè)、農(nóng)業(yè)、商業(yè)、交通、郵電、海關(guān)、銀行、保險(xiǎn)等等專業(yè)分支。   例如,1790年美國舉辦現(xiàn)代意義的人口普查,并按法律規(guī)定每十年舉辦一次;19世紀(jì)初西方各國政府設(shè)立專業(yè)的統(tǒng)計(jì)機(jī)構(gòu)。19世紀(jì)末成立國際統(tǒng)計(jì)學(xué)會(huì)。統(tǒng)計(jì)方法也有很大發(fā)展,出現(xiàn)統(tǒng)計(jì)學(xué)。,二、數(shù)理統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)意義與作用,籠統(tǒng)地說,數(shù)理統(tǒng)計(jì)學(xué)的理論和方法,與人類活動(dòng)的各個(gè)領(lǐng)域在不同程度上都有關(guān)聯(lián)。因?yàn)楦鱾€(gè)領(lǐng)域內(nèi)的活動(dòng),都得在

30、不同的程度上與數(shù)據(jù)打交道。都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計(jì)學(xué)用武之地。我們可以舉幾個(gè)例子來說明這一點(diǎn),如在工業(yè)中生產(chǎn)一種產(chǎn)品,首先有設(shè)計(jì)的問題,包括配方和工藝條件的選定,這要通過從大量可能的條件組合中,通過分析試驗(yàn)結(jié)果來選定,可能的條件組合很多,選擇哪一部分去做試驗(yàn)是一個(gè)很有講究的問題,在數(shù)理統(tǒng)計(jì)學(xué)中有一個(gè)專門分支叫“試驗(yàn)設(shè)計(jì)”,就是研究怎樣在盡可能少的試驗(yàn)次數(shù)之下,達(dá)到盡可能高效率的分析結(jié)果;其次,

31、在生產(chǎn)過程中,由于原材料,設(shè)備調(diào)整及工藝參數(shù)等條件可能的變化,而造成生產(chǎn)條件不正常并導(dǎo)致出現(xiàn)廢品,在統(tǒng)計(jì)學(xué)中有一門“工序控制”的學(xué)問,通過在生產(chǎn)過程中隨時(shí)收集數(shù)據(jù)并用統(tǒng)計(jì)方法進(jìn)行處理,可以監(jiān)測出不正常情況的出現(xiàn)以便隨時(shí)加以糾正,避免出大的問題;然后,大批量的產(chǎn)品生產(chǎn)出來后,還有一個(gè)通過抽樣檢驗(yàn)以檢驗(yàn)其質(zhì)量是否達(dá)到要求,是否可以出廠或?yàn)橘I方所接受的問題,處理這個(gè)問題也要使用數(shù)理統(tǒng)計(jì)方法,在我國現(xiàn)行的國家標(biāo)準(zhǔn)中有一些就與這個(gè)

32、問題有關(guān)。,圖1 股票分析系統(tǒng),,圖2 經(jīng)濟(jì)統(tǒng)計(jì)分析,大的問題;然后,大批量的產(chǎn)品生產(chǎn)出來后,還有一個(gè)通過抽樣檢驗(yàn)以檢驗(yàn)其質(zhì)量是否達(dá)到要求,是否可以出廠或?yàn)橘I方所接受的問題,處理這個(gè)問題也要使用數(shù)理統(tǒng)計(jì)方法,在我國現(xiàn)行的國家標(biāo)準(zhǔn)中有一些就與這個(gè)問題有關(guān)。,在農(nóng)業(yè)上,有關(guān)選種,耕作條件,肥料選擇等一系列的問題的解決,都與統(tǒng)計(jì)方法的應(yīng)用有關(guān),在歷史上,現(xiàn)行的一些重要的統(tǒng)計(jì)設(shè)計(jì)與分析方法,就是近代最偉大的數(shù)理統(tǒng)計(jì)學(xué)家費(fèi)歇爾于上世紀(jì)20年代

33、在英國一個(gè)農(nóng)業(yè)試驗(yàn)站工作時(shí),因研究田間試驗(yàn)的問題而發(fā)明的。,醫(yī)學(xué)與生物學(xué)是統(tǒng)計(jì)方法應(yīng)用最多的領(lǐng)域之一,統(tǒng)計(jì)學(xué)是在有變異的數(shù)據(jù)中研究和發(fā)現(xiàn)統(tǒng)計(jì)規(guī)律的科學(xué),就醫(yī)學(xué)而言,人體變異是一個(gè)重要的因素,不同的人的情況千差萬別,其對一種藥物和治療方法的反應(yīng)也各不相同,因此,對一種藥物和治療方法的評價(jià),是一種統(tǒng)計(jì)性規(guī)律的問題,不少國家對一種新藥的上市和一種治療方法的批準(zhǔn),都設(shè)定了很嚴(yán)格的試驗(yàn)和統(tǒng)計(jì)檢驗(yàn)的要求,又如:許多生活習(xí)慣(如吸煙、飲酒

34、、高鹽飲食之類)對健康的影響,環(huán)境污染對健康的影響,都要通過收集大量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析來研究。,對社會(huì)現(xiàn)象的研究大量地使用統(tǒng)計(jì)方法,因?yàn)榻M成社會(huì)的單元——人、家庭、單位、地區(qū)等,都有很大的變異性,如果說,在自然現(xiàn)象中還不乏一些(在誤差可以允許的限度內(nèi))嚴(yán)格的、確定性的規(guī)律,在社會(huì)現(xiàn)象中這種規(guī)律則絕少,因此只能從統(tǒng)計(jì)的角度去考察,我們常說,某某措施,某某政策,對大多數(shù)人是有利的,這就是一種統(tǒng)計(jì)性規(guī)律,因?yàn)檫@種“有利”是指對大多數(shù),

35、而非一切人。在20世紀(jì)初,就有統(tǒng)計(jì)學(xué)家研究過在英國幾種救助貧困的方式的效果的評估,這都是借助抽樣調(diào)查并通過復(fù)雜的統(tǒng)計(jì)分析得出的結(jié)果,如今,抽樣調(diào)查已經(jīng)成為研究社會(huì)現(xiàn)象的一種最有力的工具,因?yàn)槿嬲{(diào)查往往不可行,而抽樣調(diào)查,從其方案的制定到數(shù)據(jù)的分析,都是以數(shù)理統(tǒng)計(jì)學(xué)的理論和方法為基礎(chǔ)。,三、統(tǒng)計(jì)學(xué)發(fā)展前景展望,這個(gè)問題在前面第一個(gè)問題中曾涉及一點(diǎn)?,F(xiàn)在再簡單的補(bǔ)充幾句,前面曾提到,20世紀(jì)下半葉以來,由于人們對當(dāng)時(shí)數(shù)理統(tǒng)計(jì)學(xué)發(fā)

36、展中某些偏向進(jìn)行反思,統(tǒng)計(jì)學(xué)界就不時(shí)地討論到“統(tǒng)計(jì)學(xué)未來發(fā)展方向”這個(gè)問題,自20世紀(jì)70年代以來國際上有過一系列以此為主題或涉及此主題的學(xué)術(shù)會(huì)議,臨近上世紀(jì)末,更有若干知名的統(tǒng)計(jì)學(xué)者撰文討論這個(gè)問題,當(dāng)今的情況是:對某些一般的原則性的問題有普遍的共識(shí),但對未來統(tǒng)計(jì)學(xué)將向那個(gè)方向發(fā)展或應(yīng)當(dāng)向那個(gè)方向發(fā)展這個(gè)問題,則不能說已有了廣泛一致的看法和意見,下面只就幾個(gè)比較有影響的觀點(diǎn)來談?wù)劇?一個(gè)大家都同意的原則是,數(shù)理統(tǒng)計(jì)學(xué)的發(fā)展

37、,應(yīng)當(dāng)繼承和發(fā)揚(yáng)早期那種與實(shí)際密切結(jié)合的優(yōu)良傳統(tǒng),這不是否定理論研究的作用,而是提倡,理論研究的成果應(yīng)當(dāng)對分析實(shí)際數(shù)據(jù)有用,美國老一輩著名統(tǒng)計(jì)學(xué)家圖基早在1960年代就提出,對于那種于分析數(shù)據(jù)無用的研究成果,其意義僅限于從純數(shù)學(xué)的角度去評價(jià)。,另一種得到比較廣泛認(rèn)同的觀點(diǎn),是認(rèn)同 統(tǒng)計(jì)學(xué)研究應(yīng)努力與其他實(shí)用學(xué)科結(jié)合而形成交叉或邊緣學(xué)科,這一點(diǎn)目前已有一定的表現(xiàn),如生物統(tǒng)計(jì)、醫(yī)藥統(tǒng)計(jì)、工業(yè)統(tǒng)計(jì)、金融統(tǒng)計(jì)等,都是當(dāng)前發(fā)展很快的熱點(diǎn)

38、,有的學(xué)者認(rèn)為 研究數(shù)理統(tǒng)計(jì)學(xué)必須與另一門專門學(xué)問結(jié)合,才有可能做出有重要意義的成果。這一點(diǎn)已在若干成功的學(xué)者身上得到印證,有個(gè)別走得更遠(yuǎn)的學(xué)者認(rèn)為,統(tǒng)一的統(tǒng)計(jì)學(xué)將會(huì)因?yàn)榕c其他學(xué)科結(jié)合發(fā)展而分裂成許多并行的學(xué)科,好比一個(gè)大國分裂成一些小國,并把這稱為統(tǒng)計(jì)學(xué)的巴爾干化——與昔日巴爾干半島上統(tǒng)一的南斯拉夫如今分裂為一些小國相比。但是,數(shù)理統(tǒng)計(jì)學(xué)與其他學(xué)科結(jié)合形成交叉學(xué)科這,個(gè)引人注目的發(fā)展,是否將導(dǎo)致“統(tǒng)一的”或“一般的”統(tǒng)計(jì)學(xué)的

39、消亡或衰落,這一點(diǎn)現(xiàn)在看來并不確定,至少多數(shù)學(xué)者現(xiàn)在還不這么認(rèn)為。,圖基在1962年在一篇長文中提出“數(shù)據(jù)分析”的思想,幾十年來得到國際上一些有影響的學(xué)者的支持,要全面講清楚這種觀點(diǎn)需要較多的篇幅,這里只就其一個(gè)核心的觀點(diǎn)來討論一下,這涉及到對現(xiàn)行的數(shù)理統(tǒng)計(jì)規(guī)范的地位問題,前面我們曾談到,由于統(tǒng)計(jì)學(xué)處理的是帶隨機(jī)誤差的數(shù)所,由分析這種數(shù)數(shù)據(jù),得出的結(jié)論就有可能出錯(cuò)或不準(zhǔn)確,出錯(cuò)的可能性的大小,不準(zhǔn)確的程度如何,需要用概率論的

40、概念和方法作定量的刻畫,在研究統(tǒng)計(jì)問題時(shí),必須把這作為一個(gè)目標(biāo),朝這個(gè)方向努力,這就是現(xiàn)行數(shù)理統(tǒng)計(jì)學(xué)的規(guī)范。數(shù)理統(tǒng)計(jì)學(xué)之所以能被承認(rèn)為一門有嚴(yán)格理論基礎(chǔ)的學(xué)科,是與遵守這一規(guī)范聯(lián)系在一起的。但是,如果我們真的嚴(yán)格遵守這一規(guī)范,則以現(xiàn)在我們的知識(shí)水平而言,許多問題將無法下手。于是,學(xué)者們只好轉(zhuǎn)向一些人為的、不太復(fù)雜的、用現(xiàn)行數(shù)學(xué)工具可以處理的模型,這種模型往往有“閉門造車”的缺點(diǎn)而缺乏現(xiàn)實(shí)性,圖基的“數(shù)據(jù)分析”思想的一個(gè)觀點(diǎn)是

41、,主張淡化這個(gè)規(guī)范。,這種說法有一定的事實(shí)根據(jù),可以說,在實(shí)用統(tǒng)計(jì)學(xué)的領(lǐng)域中,這個(gè)規(guī)范并不總是得到嚴(yán)格遵守的,現(xiàn)在我們有一些統(tǒng)計(jì)方法,它用起來有較好的效果,但在理論上并沒有搞清楚其錯(cuò)誤或偏差的可能性或數(shù)量有多大;另外,隨著科技的發(fā)展,不斷提出一些更復(fù)雜的模型,以我們現(xiàn)有的知識(shí)水平,沒有可能對之作出完全符合上述規(guī)范的處理,而只能退而求其次,尋求一種在實(shí)用上可行的解法,當(dāng)然,應(yīng)當(dāng)明確,在研究工作中達(dá)不到上述規(guī)范,與從根本上取消或淡

42、化這個(gè)規(guī)范是兩回事,一門學(xué)科必須有其規(guī)范或科學(xué)的定位(回答這門學(xué)科是什么的問題,判定其成果的可信性與意義等等,而這不能用籠統(tǒng)的說法,必須用確切的科學(xué)語言)。如果用數(shù)據(jù)分析取代現(xiàn)行的數(shù)理統(tǒng)計(jì)學(xué),就有一個(gè)為數(shù)據(jù)分析定位的問題,而這至今還沒有一個(gè)滿意的解決,以此之故,雖然數(shù)據(jù)分析的提法獲得不少支持且在實(shí)際的統(tǒng)計(jì)應(yīng)用中有所反映(例如現(xiàn)在媒體中常提及的“數(shù)據(jù)挖掘”Data Mining)。雖然,數(shù)據(jù)挖掘并不單純是一個(gè)統(tǒng)計(jì)學(xué)課題,它至今

43、尚未能動(dòng)搖現(xiàn)行數(shù)理統(tǒng)計(jì)學(xué)的主流地位。,除了上述幾種富于原則性的思想外,也有一部分學(xué)者致力于在現(xiàn)行統(tǒng)計(jì)學(xué)的框架下尋求新的生長點(diǎn),在這方面也有不少的討論或爭論,如關(guān)于費(fèi)歇爾的統(tǒng)計(jì)學(xué)思想和研究成果的再認(rèn)識(shí),關(guān)于數(shù)理統(tǒng)計(jì)學(xué)中的“頻率學(xué)派”與“貝葉斯學(xué)派”之間的爭論等,因涉及較多的數(shù)學(xué)概念,不能在此細(xì)談了。,我個(gè)人認(rèn)為,由于統(tǒng)計(jì)學(xué)是一門有廣泛應(yīng)用的學(xué)科,應(yīng)用問題的多面性,要求不拘一格的處理方法,應(yīng)用效果的多目標(biāo)性以及統(tǒng)計(jì)問題的“不完全信

44、息”的性質(zhì)(指數(shù)據(jù)并未包含與問題有關(guān)的完整信息),也決定了統(tǒng)計(jì)方法的發(fā)展不致受某一種思想所支配,因此,至少在可以預(yù)見的將來,統(tǒng)計(jì)學(xué)的進(jìn)展將是一種“多元”的局面,不會(huì)出現(xiàn)某種趨勢占絕對優(yōu)勢的情況。,三、統(tǒng)計(jì)研究的基本環(huán)節(jié),統(tǒng)計(jì)設(shè)計(jì),,收集數(shù)據(jù),,整理與分析,,資料積累開發(fā)應(yīng)用,統(tǒng)計(jì)學(xué)理論與相關(guān)實(shí)質(zhì)性學(xué)科理論,統(tǒng)計(jì)調(diào)查、實(shí)驗(yàn),描述統(tǒng)計(jì)推斷統(tǒng)計(jì),—— 對隨機(jī)現(xiàn)象進(jìn)行觀測、試驗(yàn), 以取得有代表性的觀測值,——

45、對已取得的觀測值進(jìn)行整理、 分析,作出推斷、決策,從而 找出所研究的對象的規(guī)律性,,,四、數(shù)理統(tǒng)計(jì)的分類,數(shù)參估計(jì) (第二章),假設(shè)檢驗(yàn) (第三章),回歸分析 (第四章),方差分析 (第五章),推斷 統(tǒng)計(jì)學(xué),,,正交分析 (第六章),總體 —— 研究對象全體元素組成的集合 所研究的對象的某個(gè)(或某些)數(shù)量指標(biāo)的全體,它是一個(gè)隨機(jī)變量(或多維隨機(jī)變量).記為X .,X 的分布函數(shù)和數(shù)字特征稱為總體的分布函數(shù)和數(shù)字

46、特征.,§ 1.2 數(shù)理統(tǒng)計(jì)基本概念,樣本 —— 從總體中抽取的部分個(gè)體.,稱 為總體 X 的一個(gè)容量為n的樣本觀測值,或稱樣本的一個(gè)實(shí)現(xiàn).,用 表示, n 為樣本容量.,樣本空間 —— 樣本所有可能取值的集合.,個(gè)體 —— 組成總體的每一個(gè)元素 即總體的每個(gè)數(shù)量指標(biāo),可看作隨機(jī)變量 X 的某個(gè)取值.用 表示.,若總體 X 的樣本

47、 滿足:,一般,對有限總體,放回抽樣所得到的樣本為簡單隨機(jī)樣本,但使用不方便,常用不放回抽樣代替.而代替的條件是,(1) 與X 有相同的分布,(2) 相互獨(dú)立,則稱 為簡單隨機(jī)樣本.,簡單隨機(jī)樣本,N / n ? 10.,設(shè)總體 X 的分布函數(shù)為F (x),則樣本,若總體X 的密 d.f.為 f( x),則樣本,的聯(lián)合 d.f.為,的聯(lián)合分布函數(shù)為,例如: X1,X2,

48、…,Xn 為取自總體 N(0,1) 的樣本,則其聯(lián)合密度函數(shù),例如 設(shè)某批產(chǎn)品共有N 個(gè),其中的次品數(shù)為M, 其次品率為,若 p 是未知的,則可用抽樣方法來估計(jì)它.,X 服從參數(shù)為p 的0-1分布,可用如下表示方法:,從這批產(chǎn)品中任取一個(gè)產(chǎn)品,用隨機(jī)變量X來描述它是否是次品:,設(shè)有放回地抽取一個(gè)容量為 n 的樣本,的聯(lián)合分布為,其樣本值為,樣本空間為,若抽樣是無放回的,則前次抽取的結(jié)果會(huì)影響后面抽取的結(jié)果.例如,所以, 當(dāng)樣本容量

49、 n 與總體中個(gè)體數(shù)目N 相比很小時(shí), 可將無放回抽樣近似地看作放回抽樣.,例1(P147)隨機(jī)地觀測總體X 得8個(gè)數(shù)據(jù):2.5,3,2.5,3.5,3,2.7,2.5,2,試求X 的一個(gè)經(jīng)驗(yàn)分布函數(shù)。,解,2 < 2.5 = 2.5 = 2.5 < 2.7 < 3 = 3 < 3.5,2 2.5 2.7 3 3.5,1/8 3/8 1/8 2/8 1/8,一般Fn(x

50、)對應(yīng)分布列:,P(X=xi)=1/n,i=1,2,...,n,,隨機(jī)模擬顯示,格列汶科定理,,右連續(xù),設(shè) 是取自總體X 的一個(gè)樣本,,為一實(shí)值連續(xù)函數(shù),且不含有未知參數(shù),,稱,定義,例 是未知參數(shù),,若 ? ,? 已知,則為統(tǒng)計(jì)量,是一樣本,,是統(tǒng)計(jì)量, 其中,則,常用的統(tǒng)計(jì)量,為樣本均值,為樣本方差,為樣本標(biāo)準(zhǔn)差,為樣本的k 階原點(diǎn)矩,為樣本的k 階中心矩,例如,,(5) 順序統(tǒng)

51、計(jì)量與極差,為樣本值,且,定義 r.v.,其中,,注 樣本方差 與樣本二階中心矩 的不同,故,推導(dǎo),2),例1 從一批機(jī)器零件毛坯中隨機(jī)地抽取10件, 測得其重量為(單位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199求這組樣本值的均值、方差、二階原點(diǎn)矩與二階中心矩.,解,令,例1,則,例2 在總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論