2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩182頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,除了統(tǒng)計(jì)圖和統(tǒng)計(jì)表之外,還可以用少量的特征值(代表值)對數(shù)據(jù)分布的數(shù)量規(guī)律進(jìn)行精確、簡潔的描述。,第三章 數(shù)據(jù)分布特征的統(tǒng)計(jì)描述,2,大量的數(shù)據(jù)經(jīng)過整理后,已經(jīng)能初步反映總體分布的特征。 為了更加準(zhǔn)確的了解數(shù)據(jù)分布的特征和規(guī)律,需要找到反映數(shù)據(jù)分布特征的代表值,三類:集中趨勢、離中趨勢、分布形態(tài),說明:,,,3,集中趨勢:即反映各數(shù)據(jù)向中心值靠攏的程度,返回本節(jié)首頁,4,離中趨勢:即反映各數(shù)據(jù)遠(yuǎn)離中心值的程度,兩個(gè)不同的

2、曲線表示兩個(gè)不同的總體,它們的集中趨勢相同但離中趨勢不同。,因?yàn)榧词宫F(xiàn)象的集中趨勢相同,其離中趨勢也可能不同。,5,實(shí)際中還會遇到:集中趨勢和離中趨勢均相同的現(xiàn)象,其分布的形態(tài)也可能不同。,這表明:除了集中和離中趨勢外,分布還有其他方面的特征:分布的形態(tài)。,指:數(shù)據(jù)分布的對稱程度和扁平(高低)程度,,,,,測度指標(biāo)是偏度,,,測度指標(biāo)是峰度,是相對于對稱分布而言,相對于正態(tài)分布而言,,,6,偏度:測定分布的偏斜程度的指標(biāo),,,偏斜是

3、相對于對稱分布而言,峰度:測定分布的高低(尖峭)程度的指標(biāo),,,尖峭是相對于正態(tài)分布而言,7,正態(tài)分布,,對稱分布,,8,峰態(tài),,偏態(tài),與對稱分布比較,,9,正態(tài)分布中有兩個(gè)參數(shù):,一般記為:,μ、σ2 是正態(tài)分布的參數(shù),不確定常數(shù)。 不同的μ、不同的σ2對應(yīng)不同的正態(tài)分布,10,標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布中的一種,記為:,11,本章內(nèi)容,第一節(jié) 集中趨勢的測度 第二節(jié) 離散程度的測度 第三節(jié) 偏度與

4、峰度,12,第一節(jié) 集中趨勢的測度,集中趨勢是指一組數(shù)據(jù)向其中心值靠攏的傾向測度集中趨勢就是尋找一組數(shù)據(jù)的代表值或中心值,在統(tǒng)計(jì)中是使用平均指標(biāo)來測度的。,13,本節(jié)內(nèi)容,一、平均指標(biāo)含義二、平均指標(biāo)的計(jì)算 (一)算術(shù)平均數(shù) (二)調(diào)和平均數(shù) (三)幾何平均數(shù) (四)眾數(shù) (五)中位數(shù)三、各種平均數(shù)之間的相互關(guān)系,,,數(shù)值平均,位置平均,14,一、平均指標(biāo)含義,1、定義:又稱平均數(shù)。 是將同質(zhì)

5、總體內(nèi)各單位的數(shù)量差異抽象化,以反映總體的一般水平。,被平均的對象必須具有同質(zhì)性,,15,2、平均指標(biāo)有兩大類,數(shù)值平均:,位置平均:,根據(jù)總體內(nèi)全部數(shù)據(jù)計(jì)算:算術(shù)平均、調(diào)和平均、幾 何平均。,根據(jù)數(shù)據(jù)在分配數(shù)列中的位置確定:眾數(shù)、中位數(shù)。,,16,3、平均指標(biāo)作用,a、反映總體各單位變量值分布的集中趨勢 b、比較同一現(xiàn)象在不同空間或不同時(shí)間的發(fā)展 水平 c、分析現(xiàn)象間的依存關(guān)系,17,集中趨勢:,總體中各單

6、位某一標(biāo)志值的具體表現(xiàn)是各不相同的,但一般呈正態(tài)分布,即很小或很大的標(biāo)志值出現(xiàn)的次數(shù)較少,接近平均數(shù)的標(biāo)志值出現(xiàn)的次數(shù)較多,大多數(shù)的標(biāo)志值都圍繞著平均數(shù)左右波動(dòng)。,返回本節(jié)首頁,18,現(xiàn)象間的依存關(guān)系:,19,二、平均指標(biāo)計(jì)算,(一)算術(shù)平均數(shù),又稱均值。根據(jù)掌握的資料不同: 簡單法和加權(quán)法。,20,1、簡單法:適用于沒有分組的原始數(shù)據(jù),均值,即算術(shù)平均數(shù),,x 標(biāo)志值或變量值,見49頁例題,21,2、加權(quán)法:分組且各組

7、標(biāo)志值出現(xiàn)的次數(shù) (權(quán)數(shù) f )不相等時(shí),公式:,返回本節(jié)首頁,x 為標(biāo)志值,又稱變量值;f 為各組標(biāo)志值出現(xiàn)的次數(shù),22,計(jì)算平均日產(chǎn)量,23,24,用統(tǒng)計(jì)功能的計(jì)算器計(jì)算:2ndF,ON,20?1M+ 22?4M+ 24?6M+26?8M+ 28?12M+ 30?10M+, x→M結(jié)果為26.73,25,例1:用計(jì)算器對下列數(shù)據(jù)求平均,,26,mode2Shift scl = 25 Shift

8、;10 DT 35 Shift;70 DT 45 Shift;90DT 55 Shift;30 DTShift,注意:DT是儲存功能的加號,,27,注意:當(dāng)各組權(quán)數(shù)均相等時(shí),加權(quán)算術(shù)平均數(shù)等于簡單算術(shù)平均數(shù):,返回本節(jié)首頁,28,可用簡單式計(jì)算均值,各組權(quán)數(shù)都相等的數(shù)列,29,對稱數(shù)列:,可用簡單式計(jì)算均值,30,3、權(quán)數(shù),加權(quán)均值的大小受兩個(gè)因素的影響: 各組變量值(x) 各組次數(shù),即權(quán)數(shù)(f

9、),,31,(1)權(quán)數(shù)的定義,權(quán)數(shù):即次數(shù),分布在各組間的總體單位數(shù), 因?yàn)樗鼘档拇笮∑饳?quán)衡輕重的作 用,故又稱權(quán)數(shù)。,出現(xiàn)次數(shù)多的標(biāo)志值對平均數(shù)的影響大,,,32,(2)權(quán)數(shù)的表現(xiàn)及應(yīng)用,絕對數(shù)權(quán)數(shù) f 相對數(shù)權(quán)數(shù),,,,第一、權(quán)數(shù)表現(xiàn):有兩種形式:,33,,,絕對權(quán)數(shù):,相對權(quán)數(shù):,計(jì)算公式:,例題見教科書51頁表3~3,34,第二、權(quán)數(shù)的實(shí)質(zhì),是相對數(shù)

10、權(quán)數(shù)。 即權(quán)數(shù)對均值的影響作用,取決于相對權(quán)數(shù)而非絕對權(quán)數(shù)。,舉例:,35,計(jì)算平均獎(jiǎng)金額,,雖然各組絕對人數(shù)變化了,但各組人數(shù)的比重未變,比重%,10,37.5,52.5,100,36,4、平均數(shù)應(yīng)用舉例:,統(tǒng)計(jì)中有三大綜合指標(biāo): 總量指標(biāo)、相對指標(biāo)和平均指標(biāo),反映現(xiàn)象總規(guī)模、總水平,用絕對數(shù)表示如:2010年中國GDP 39.8萬億元人民幣,,相對指標(biāo)是兩個(gè)有聯(lián)系的指標(biāo)值對比的比率,如:三次產(chǎn)業(yè)比重、企

11、業(yè)勞動(dòng)生產(chǎn)率、產(chǎn)出的計(jì)劃完成百分?jǐn)?shù)、經(jīng)濟(jì)發(fā)展速度和增長速度…,37,例1、10個(gè)企業(yè)資金利潤率資料:,求:10個(gè)企業(yè)的平均利潤率,,“企業(yè)的平均利潤率” 等同于 “企業(yè)的總利潤率”,企業(yè)的總利潤率 = 利潤總額 / 資金總額,39,,利潤總額,資金總額,,,,,40,計(jì)算150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù),例2、150個(gè)企業(yè)的資料:,,“150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù)” 就是“150個(gè)企業(yè)總的計(jì)劃完成百分?jǐn)?shù)”。,企業(yè)總計(jì)劃完成百

12、分?jǐn)?shù) = 總實(shí)際數(shù) / 總計(jì)劃數(shù),42,,實(shí)際產(chǎn)值,計(jì)劃產(chǎn)值,,,,,43,5、算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì),見52頁,44,(二)調(diào)和平均數(shù),1、含義:總體內(nèi)各個(gè)變量值倒數(shù)的算術(shù)平均 數(shù)的倒數(shù),又稱倒數(shù)平均數(shù)。,如有三個(gè)變量值: 8、10、12,求調(diào)和平均數(shù)。步驟如下:,45,、,、,,,即為調(diào)和平均數(shù),,公式:,46,(1)簡單式:,(2)加權(quán)式:,各變量值出現(xiàn)次數(shù)相等,各變量值出現(xiàn)

13、次數(shù)不等,設(shè) m為次數(shù),2、 調(diào)和平均數(shù)的計(jì)算,47,舉例:,某蔬菜單價(jià)早中晚分別為0.5、0.4、 0.25(元/斤) (1)早中晚各買1元,求平均價(jià)格 (2)早中晚各買1斤,求平均價(jià)格 (3)早中晚各買2元、3元、4元,求平均價(jià)格 (4)早中晚各買2斤、3斤、4斤,求平均價(jià)格,48,(1)問:用調(diào)和平均。先求早、中、晚購買的斤數(shù)。早 1/0.5=2(斤) 、中 1/0.4=2.5(斤)、晚 1/0.25=4(斤)

14、,(2)問:用算術(shù)平均,49,(3)問:用加權(quán)調(diào)和平均,(4)問:用加權(quán)算術(shù)平均,50,3、調(diào)和平均數(shù)和算術(shù)平均數(shù)間的關(guān)系,調(diào)和平均數(shù)是一種特殊的均值,(1)兩者存在著變形關(guān)系:,51,(2)當(dāng)掌握的資料無法直接計(jì)算算術(shù)平均數(shù)時(shí),可用調(diào)和法計(jì)算。,這時(shí)兩者計(jì)算結(jié)果相同,只是根據(jù)已知條件不同,需選擇不同的公式。,52,已知對比分母,將分母定為f,求分子xf,然后用加權(quán)算術(shù)公式,即:,已知對比分子,將分子定為m,求分母m/x用加權(quán)調(diào)和公

15、式,即 :,53,某公司下屬三個(gè)部門銷售利潤資料,求三個(gè)部門的平均利潤率。,54,,思考:如果已知銷售利潤率和銷售額資料,該如何計(jì)算?,55,56,計(jì)算:20個(gè)商店平均銷售計(jì)劃完成程度及總的流通費(fèi)用率。,57,58,(1)20個(gè)商店的平均銷售計(jì)劃完成程度,(2)20個(gè)商店總的流通費(fèi)用率,59,(三)幾何平均數(shù),1.定義: n 個(gè)變量值乘積的 n 次方根,60,3、計(jì)算方法,簡單法:,加權(quán)法:,61,例1:2004-2008年我國某工

16、業(yè)品產(chǎn)量環(huán)比發(fā)展速度分別為107.6%、102.5%、100.6%、102.7%、102.2%。計(jì)算平均每年的發(fā)展速度,62,按計(jì)算器:1.076,?,1.025, ?,1.006, ?,1.027, ?,1.022,=,2ndF,,, 5,=,,出現(xiàn)結(jié)果:1.0309即103.1%,63,例2:某廠有四個(gè)流水連續(xù)作業(yè)車間,某月的合格率分別為:0.95,0.92,0.90,0.80,求四個(gè)車間的平均合格率。,,64,例3:某地區(qū)

17、25年的年經(jīng)濟(jì)發(fā)展速度分別是: 1年103%,4年105%,8年108%, 10年 110%,2年115%, 求該地區(qū)經(jīng)濟(jì)的平均年發(fā)展速度。,65,1.03,?,(,1.05,yx,4,),?,(,1.08,yx,8,), ?,(,1.1,yx,10,),?,(,1.15,yx,2,), =,2ndF,,, 25,=,,出現(xiàn)結(jié)果:1.086即108.6%,66,4、使用幾何平均法注意問題,第一、變量值

18、要是相對數(shù),且不能為負(fù)值或零,第二、這些相對數(shù)的連乘積要等于總速度或總比率,幾何平均法適用于對比率數(shù)據(jù)(相對數(shù))的平均, 主要用于計(jì)算平均比率和平均速度,67,幾何平均數(shù)是一種特殊的均值:,可寫成:,68,(四)眾數(shù),1、定義: 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,2、計(jì)算:分兩種情況:,,品質(zhì)數(shù)列和單項(xiàng)式數(shù)列組距式數(shù)列,69,Mo=可口可樂,(1)品質(zhì)數(shù)列計(jì)算眾數(shù),定性變量,,70,Mo=不滿意,甲城市家庭對住房狀況評價(jià)的頻數(shù)

19、分布,71,眾數(shù)是數(shù)列中出現(xiàn)次數(shù)最多的變量值,眾數(shù),,(2)單項(xiàng)數(shù)列計(jì)算眾數(shù),定性變量,,72,(3)組距式數(shù)列計(jì)算眾數(shù),先確定眾數(shù)所在的組,然后用公式計(jì)算分:上限公式和下限公式,返回本節(jié)首頁,定性變量,,73,分?jǐn)?shù)x 人數(shù) f60以下 260~70 770~80 15 80~90 10 90以上 6

20、 合計(jì) 40,fm-1,fm+1,,fm,,,L :眾數(shù)所在組的下限U :眾數(shù)所在組的上限,74,,上限公式:,下限公式:,75,76,3、眾數(shù)說明,(1)不受極端值的影響(2)既適用于品質(zhì)數(shù)列,也適用于變量數(shù)列(3)一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù),返回本節(jié)首頁,77,無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8,多于一個(gè)眾數(shù)原始數(shù)據(jù): 25 28 28 3

21、6 42 42,一個(gè)眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5,78,(五)中位數(shù),1、中位數(shù)的含義: 將各單位標(biāo)志值按大小排列,居于中間位 置的那個(gè)標(biāo)志值。,返回本節(jié)首頁,79,2、中位數(shù)的計(jì)算,分兩種情況:(1)未分組原始資料(2)組距式數(shù)據(jù),返回本節(jié)首頁,80,(1)未分組原始資料,先將數(shù)據(jù)從小到大排序,項(xiàng)數(shù)為奇數(shù)時(shí),中間位置上的標(biāo)志值即為中位數(shù),,項(xiàng)數(shù)為偶數(shù)時(shí),中間位置上2個(gè)標(biāo)

22、志值的平均為中位數(shù),,81,有9個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14 中位數(shù)為第5個(gè),即9 有10個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14、15 中位數(shù)為第5、第6個(gè)數(shù)據(jù)的平均值,即9.5,,82,(2)組距數(shù)列,,fm,,SMe+1,SMe-1,,83,B、確定中位數(shù)所在的組: 本例為: 40/2=20,即中位數(shù)應(yīng)在將分?jǐn)?shù)從 高到低排列后的第20

23、個(gè)學(xué)生的分?jǐn)?shù)上,A、先將次數(shù)進(jìn)行累計(jì),C、利用公式計(jì)算中位數(shù) ( 公式 見56頁 ),84,公式:,下限公式=上限公式=,,,85,帶入資料得:,(分) (分),,,86,附:四分位數(shù),四分位數(shù):是指位于全部數(shù)據(jù)

24、¼ 位置和 ¾ 位置上的數(shù)據(jù),分別稱為下四分位數(shù)和上四分位數(shù)。也稱為第一個(gè)四分位數(shù) 和 第三個(gè)四分位數(shù)。,即:排序后處于25%和75%位置上的值。實(shí)際上,中位數(shù)就是第二個(gè)四分位數(shù),87,四分位的位置:,88,,箱線圖:可以觀察數(shù)據(jù)分布的特征,,,,4,6,8,10,12,,,,,,,,,,,,,Median/Quart./Range箱線圖,Me,89,某電腦公司2005年前四個(gè)月120天的銷售量數(shù)據(jù),試?yán)孟渚€

25、圖對數(shù)據(jù)分布特征進(jìn)行分析。,,90,,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖,91,,某電腦公司銷量分組表,,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試通過多批箱線圖分析各科考試成績的分布特征。,93,,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,8門課程考試成績的Median/Quart./Range箱線圖,94,,11名學(xué)生8門課程考試成績的Median/Quart./Rang

26、e箱線圖,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖,95,96,三、各種平均數(shù)之間的關(guān)系,兩者都屬于抽象化的代表值,但有區(qū)別,前者容易受極端值的影響,后者不會。,,1、數(shù)值平均數(shù)和位置平均數(shù)的比較:,97,某公司中層干部2010年的收入,求平均收入,職位 收入(元)財(cái)務(wù)部經(jīng)理 10 000市場部經(jīng)理 450000人事部經(jīng)理 90 000

27、研發(fā)部經(jīng)理 100 000生產(chǎn)部經(jīng)理 10 000,實(shí)際中可利用切尾平均法:去掉極端值, 將剩余的數(shù)據(jù)求平均。,98,收入(元) 人數(shù)1000 53000 255000 5610000 105000

28、0 330000000 1,計(jì)算其平均收入時(shí),位置平均和數(shù)值平均哪一種方法更合適?,99,2、三種平均數(shù)之間的關(guān)系,有極小值,拉動(dòng)均值向極小值靠近,有極大值,拉動(dòng)均值向極大值靠近,,,100,眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用,眾數(shù):不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用 中位數(shù):不受極端值影響 數(shù)據(jù)分布偏斜

29、程度較大時(shí)應(yīng)用 平均數(shù):易受極端值影響 數(shù)據(jù)對稱分布或接近對稱分布時(shí)應(yīng)用,,,101,離散程度是測定數(shù)據(jù)分布特征的另一重要指標(biāo),第二節(jié) 離散程度測度,統(tǒng)計(jì)是使用變異指標(biāo)來測度分布的離散程度,用于測定一組數(shù)據(jù)中各數(shù)值之間的差異程度,即:在一個(gè)分布中各數(shù)值與均值的離差程度,102,三個(gè)集中趨勢相同但離中趨勢不同的總體,離散程度指標(biāo)可從另一個(gè)角度說明集中趨勢測度值的代表程度。,103,一、變異指標(biāo)的意義和作用二、變異指標(biāo)

30、的種類(一)全距(極差)(二)平均差(三)標(biāo)準(zhǔn)差(四)離散系數(shù),返回本章首頁,本節(jié)內(nèi)容,104,一、變異指標(biāo)的意義和作用,㈠變異指標(biāo)的含義 又稱標(biāo)志變動(dòng)度、離散程度或離中程度。 是描述總體內(nèi)各數(shù)據(jù)之間差別大小程度的指標(biāo),,返回本節(jié)首頁,甲:20,40,60,70,80,100,120乙:67,68,69,70,71,72,73,如兩組數(shù)據(jù),請直觀判斷哪一組的離散程度大,105,70,70,,,,,,,,,,,,,,,返回本

31、節(jié)首頁,106,㈡ 標(biāo)志變動(dòng)度的作用,2、能衡量現(xiàn)象變動(dòng)的均衡性或穩(wěn)定性,3、能反映各變量值分布的離散程度(離中趨勢),1、是評價(jià)平均數(shù)代表性的依據(jù),甲企業(yè) 25 25 25 25 ——均勻、協(xié)調(diào)乙企業(yè) 10 15 20 55丙企業(yè) 5 10 15 70 ——不均勻。,企業(yè)產(chǎn)值各季度計(jì)劃完成情況,107,平均數(shù)的代表性和標(biāo)志變動(dòng)度的關(guān)

32、系,標(biāo)志變動(dòng)度大,平均數(shù)的代表性就??;反之 ,平均數(shù)的代表性就大例如:三組學(xué)生的年齡(歲) 20 20 20 20 20 ---差距最小,20歲的代表性最好 18 19 20 21 22 15 16 20 24 25---差距最大,20 歲的代表性最差,108,二、標(biāo)志變異指標(biāo)的種類,㈠全距 1、含義:總體各單位標(biāo)志的最大值和最小值之差。

33、 R = Xmax-Xmin,109,2、全距的優(yōu)點(diǎn)和缺點(diǎn),優(yōu)點(diǎn):計(jì)算簡單、涵義直觀,缺點(diǎn):易受極端數(shù)值的影響 不能反映中間標(biāo)志值的變動(dòng),110,附:四分位差(見 60 頁),四分位差Qd = Q3 - Q1,111,(二)平均差,1、含義 是各變量值與其算術(shù)平均數(shù)離差絕對值 的算術(shù)平均數(shù),即:,,平均差能全面反映一組數(shù)據(jù)的離散狀況,112,2、平均差計(jì)算:,返回本節(jié)首頁

34、,簡單式:,加權(quán)式:,113,,1819202122,,,-2-1 0 1 2,2 1 0 1 2,x,,,,,,,合計(jì) -- 6,一組學(xué)生年齡: 18 19 20 21 22求平均差。,114,某廠200個(gè)工人產(chǎn)量資料(單位:公斤),日產(chǎn)量30以下30~4040~5050以上合計(jì)求A.D,工人數(shù) 10 70 90 30

35、 200,115,X25354555合計(jì),,-17 -7 3 13 --,f10709030200,,17 7 3 13 --,,170 490 270 390 1320,,250 2450 4050 1650 8400,,,,,,,,,,,,116,結(jié)論:該廠工人平均日產(chǎn)量為42公斤,但各工人生產(chǎn)水平有差異,其差異平均為6.6公斤。,117,3、平均差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):和全距相

36、比,彌補(bǔ)了全距不足,能反 映中間標(biāo)志值的變動(dòng)。缺點(diǎn):加絕對值號為計(jì)算帶來了不便。,118,(三)標(biāo)準(zhǔn)差(均方差),1、概念 是各變量值與其算術(shù)平均數(shù)離差平方的算術(shù) 平均數(shù)的平方根,又稱均方差。,119,2、計(jì)算: 已知資料不同采用不同方法:,,加權(quán)式:,簡單式:,120,標(biāo)準(zhǔn)差的平方即為方差,121,一組學(xué)生年齡: 18 19 20 21 22 18

37、 -2 4 19 -1 1 20 0 0 21 1 1 22 2 4 合計(jì) - 10,,,,,,,,,,,簡單式舉例:,122,某廠200個(gè)工人產(chǎn)量資料:(單位:公斤),日產(chǎn)量30以下30~4040~50

38、50以上合計(jì),工人數(shù) 10 70 90 30 200,求標(biāo)準(zhǔn)差,加權(quán)式舉例:,123,x25354555合計(jì),-17 -7 3 13 --,f10709030200,289 49 9169 --,2890 3430 810 507012200,250 2450 4050 1650 8400,,,,,,,,,,,,,,,124,,標(biāo)準(zhǔn)差的計(jì)算可以用統(tǒng)計(jì)功能的計(jì)算器。,

39、結(jié)論:各工人生產(chǎn)產(chǎn)量與平均產(chǎn)量相比,平均相差7.8公斤。,125,計(jì)算器的使用,開機(jī):ON,2ndF,ON進(jìn)入到統(tǒng)計(jì)功能后,用計(jì)算平均數(shù)的方法輸數(shù)據(jù)所有的數(shù)據(jù)輸完后,按 2ndF 鍵,再按x→M 健,即為標(biāo)準(zhǔn)差,注意:所有的數(shù)據(jù)輸完后,如果直接按x→M 健,即為平均數(shù)。,126,統(tǒng)計(jì)功能的計(jì)算器的使用Mode2Shift scl = 25 Shift;10 DT 35 Shift;70 DT45 Shift;90

40、 DT 55 Shift;30 DTShift,,127,3、標(biāo)準(zhǔn)差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):彌補(bǔ)了平均差和全距的不足。缺點(diǎn):利用標(biāo)準(zhǔn)差不能比較性質(zhì)不同的數(shù)列(即水平高低不等和計(jì)量單位不同)離散程度的大小。,128,如:兩組動(dòng)物體重(單位:公斤),甲: 2, 3, 4乙:200,210,220試比較平均數(shù)的代表性。,,,129,,,,130,上述結(jié)論不一定正確,因?yàn)椋簝山M數(shù)據(jù)性質(zhì)不同(水平高低不等或者計(jì)量單位不同),不能直

41、接用標(biāo)準(zhǔn)差(或平均差)比較平均數(shù)的代表性。須用相對離散程度指標(biāo) — 離散系數(shù)。,131,(四)離散系數(shù),又稱變異系數(shù),是一組相對數(shù)形式的變異指標(biāo)有全距系數(shù)、平均差系數(shù)、標(biāo)準(zhǔn)差系數(shù)等等以標(biāo)準(zhǔn)差系數(shù)為例說明其計(jì)算。,132,對于上例,,,,133,總結(jié):,比較兩組數(shù)據(jù)的離散程度,即比較平均數(shù)的代表性時(shí): 如果兩組數(shù)據(jù)的平均數(shù)相等且計(jì)量單位相同,可直接使用標(biāo)準(zhǔn)差比較; 除此之外,均需使用標(biāo)準(zhǔn)差系數(shù)比較。,134,對稱鐘形分布特點(diǎn):以

42、均值為中心兩邊對稱,且中間數(shù)據(jù)出現(xiàn)的頻數(shù)多而兩尾出現(xiàn)的頻數(shù)少。,附:標(biāo)準(zhǔn)差的應(yīng)用,約有68%數(shù)據(jù)在均值加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%數(shù)據(jù)在均值加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%數(shù)據(jù)在均值加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),1、對稱鐘形分布中的,法則:,135,1、求是非標(biāo)志(交替標(biāo)志)的標(biāo)準(zhǔn)差,按品質(zhì)標(biāo)志分組且只有兩種表現(xiàn)的標(biāo)志,,136,是否是是非標(biāo)志?,137,,,是非標(biāo)志 變量 x 次數(shù)

43、 是 1 否 0 求是非標(biāo)志的平均數(shù)及方差,,,,,,138,,,,,,,139,140,3、標(biāo)準(zhǔn)化值(數(shù)據(jù)的標(biāo)準(zhǔn)得分),,有兩個(gè)班(1、2班)的同一門課成績,假定兩個(gè)班水平類似,但由于兩個(gè)任課老師的評分標(biāo)準(zhǔn)不同,使得兩個(gè)班成績的均值和標(biāo)準(zhǔn)差都不同:,那么1班得90分的張英和2班得82分的劉抒成績能否比較?,1班均值:78.

44、53,標(biāo)準(zhǔn)差:9.432班均值:70.19,標(biāo)準(zhǔn)差:7.0,不能直接比,但可以將它們進(jìn)行標(biāo)準(zhǔn)化后再對比。,141,,標(biāo)準(zhǔn)化的方法:,劉抒標(biāo)準(zhǔn)得分:,張英的標(biāo)準(zhǔn)得分:,劉抒的成績優(yōu)于張英。,142,標(biāo)準(zhǔn)化值實(shí)際上是將不同均值和標(biāo)準(zhǔn)差的總體都轉(zhuǎn)化為均值為0 ,標(biāo)準(zhǔn)差為1 的總體。,如:一組數(shù)據(jù):25、28、31、34、37、40、43。試計(jì)算其標(biāo)準(zhǔn)化值。,首先計(jì)算出均值為34,標(biāo)準(zhǔn)差為6,143,均值為34,標(biāo)準(zhǔn)差為6,,均值為0,標(biāo)準(zhǔn)

45、差為1,,標(biāo)準(zhǔn)化后的數(shù)據(jù)雖然均值和標(biāo)準(zhǔn)差發(fā)生了改變但數(shù)據(jù)內(nèi)部點(diǎn)的相對位置是沒有變化的。,144,科目 平均分 標(biāo)準(zhǔn)差 甲生 乙生語文 70 8 91 71數(shù)學(xué) 56 4 50 64 外語 42 5 40 51 政治 80

46、 10 85 80物理 50 4 60 70 化學(xué) 40 12 75 45合計(jì) - - 401 381,原始成績,,,,,,,,例:已知某年高考全部考生分科總平均成績和標(biāo)準(zhǔn)差值,又知兩名考生的實(shí)際成績?nèi)缦拢?計(jì)算兩考生的

47、標(biāo)準(zhǔn)化值,并進(jìn)行比較。,145,146,,第一、甲考生偏科,數(shù)學(xué)和英語成績均低于 平均成績;乙考生比較全面,各科成績都不 低于平均成績。,原因:,第二、乙考生在平均分偏低且水平差距較?。?biāo)準(zhǔn)差)的物理、數(shù)學(xué)和英語等科目中取得了較好的成績,甲考生則在這些科目上表現(xiàn)不好,影響了其標(biāo)準(zhǔn)成績。,147,3、總方差、組間方差和組內(nèi)方差,在總體分組的情況下會產(chǎn)生上述三種方差 總方差:各標(biāo)志值與總平均數(shù)的離差 組間方差:各

48、組平均數(shù)與總平均數(shù)的離差 組內(nèi)方差:各組組內(nèi)的標(biāo)志值與各組內(nèi)平均數(shù)的離差,三者關(guān)系:總方差 = 組間方差 + 組內(nèi)方差的算術(shù)平均數(shù),148,其中 i 代表總體內(nèi)的組數(shù),149,150,舉例:,某公司7個(gè)門市部營業(yè)額數(shù)據(jù): 88、90、96、98、110、140、200 分成兩組: 88、90、96、98 110、140、200 計(jì)算總方差、組內(nèi)方差和組間方差,151,,,1

49、52,組內(nèi)方差的算術(shù)平均數(shù):,153,第三節(jié) 分布形態(tài)的測定(偏度和峰度),集中趨勢和離中趨勢是數(shù)據(jù)分布的兩個(gè)重要特征。但即使集中趨勢和離中趨勢均相同的現(xiàn)象,其分布的形態(tài)也有可能不同。,這表明:除了集中趨勢和離中趨勢外,分布還有其他方面的特征:分布的形態(tài)。,154,反映數(shù)據(jù)分布形狀的指標(biāo)有兩個(gè):偏態(tài)和峰度,偏態(tài):是測定分布的偏斜方向和偏斜程度的指標(biāo),,,是相對于對稱分布而言,峰度:是測定分布的尖峭程度的指標(biāo),,,是相對于正態(tài)分布

50、而言,155,,正態(tài)分布,,對稱分布,,,156,首先介紹“矩”的概念,矩:又稱動(dòng)差,物理學(xué)上的術(shù)語。統(tǒng)計(jì)上用 來刻畫數(shù)據(jù)分布特征的的指標(biāo)的統(tǒng)稱。,K 階矩:所有變量值與數(shù)值a之離差的K 次方 的平均數(shù)稱為變量 x 關(guān)于 a 的K 階矩,當(dāng):a等于0時(shí)稱為 K 階原點(diǎn)矩 a等于 時(shí)稱為 K 階原點(diǎn)矩,一階原點(diǎn)階矩就是算術(shù)平均數(shù)二階中心距就是方差,157,一階原點(diǎn)矩

51、 即為均值,,二階中心矩 即為方差,,158,1、偏態(tài):,偏態(tài):是對分布的偏斜方向和偏斜程度的測定,測定偏態(tài)程度的指標(biāo)稱為偏態(tài)系數(shù),如果次數(shù)的分布是完全對稱的,稱為對稱分布否為非對稱分布,即偏態(tài)分布,分左偏和右偏,和 對稱分布比較而言,,159,偏態(tài)系數(shù):用三階中心矩定義,該系數(shù)為0時(shí),為對稱分布大于0時(shí),為右偏態(tài)分布小于0時(shí),為左偏態(tài)分布越接近0,偏斜程度就越低,若分布不對稱,只有一階中心矩為0,其余的奇數(shù)階中心矩

52、都不為0。若分布對稱,所有奇數(shù)階中心矩應(yīng)為0,,,,消除量綱,160,2、峰度,峰度:是指分布圖形的尖峭程度。,和標(biāo)準(zhǔn)正態(tài)分布比較而言的,實(shí)際中,標(biāo)準(zhǔn)正態(tài)分布曲線的峰頂為正態(tài)峰,和標(biāo)準(zhǔn)正態(tài)分布曲線相比,陡峭的為尖峰,平緩的為平峰頂。,測定峰度的指標(biāo)稱為 峰度系數(shù)。,,161,峰態(tài),162,峰度系數(shù):用四階中心矩定義。因?yàn)榉植嫉募馇统潭群团紨?shù)階中心矩?cái)?shù)值大小有關(guān).,所以該系數(shù)和3比:等于3,為正態(tài)分布;大于3時(shí),為尖峰分布;小于3

53、時(shí),平峰分布,,消除量綱,因?yàn)椋赫龖B(tài)分布曲線的四階中心矩和標(biāo)準(zhǔn)差的4次方之比為3,163,尖頂分布(K>3),平頂分布(K<3),正態(tài)分布(K=3),,,,164,因?yàn)閷τ谡龖B(tài)分布,所以,峰度的標(biāo)準(zhǔn)測定公式為:,165,☆ 用EXCEL計(jì)算描述統(tǒng)計(jì)量,用EXCEL計(jì)算平均數(shù)、標(biāo)準(zhǔn)差等描述性統(tǒng)計(jì) 量有兩種方法: 一是用函數(shù) 二是用“數(shù)據(jù)分析”工具,,166,第一、

54、函數(shù),均值:average中位數(shù):median眾數(shù):mode標(biāo)準(zhǔn)差: 總體標(biāo)準(zhǔn)差:stdevp; 樣本標(biāo)準(zhǔn)差: stdev分位數(shù):quartile,Excel用于計(jì)算描述統(tǒng)計(jì)量的函數(shù):,167,168,分位數(shù)quartile的語法結(jié)構(gòu),Quartile(array, quart),Array:計(jì)算四分?jǐn)?shù)的數(shù)據(jù)區(qū)域。輸入待計(jì)算數(shù)據(jù)的地址即可。,Quart:計(jì)算的是第幾個(gè)四分?jǐn)?shù)可輸入:0、1、2、

55、3、4。分別表示最小值、第1、2、3個(gè)四分位數(shù)和最大值。,169,第二、 “數(shù)據(jù)分析”工具,第一次使用“數(shù)據(jù)分析”時(shí),需在EXCEL工具 菜單中選“加載宏”,選“分析工具庫”。 這樣在“工具”菜單中就會出現(xiàn)“數(shù)據(jù)分析”。,170,①選擇“網(wǎng)上沖浪”工作表。②打開“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開數(shù)據(jù)分析對話框如圖所示。,,171,③雙擊“描述統(tǒng)計(jì)”項(xiàng)或先單擊此項(xiàng)再選擇“確定”按鈕,描述統(tǒng)計(jì)對話框打開如圖所示。

56、④在“輸入?yún)^(qū)域”中輸入A1:A21。,172,⑤由于所選數(shù)據(jù)范圍包括一個(gè)標(biāo)志名稱,單擊“標(biāo)志位于第一行”選項(xiàng)邊上的復(fù)選框。⑥單擊“輸出區(qū)域”項(xiàng),旁邊出現(xiàn)了一個(gè)輸入框,單擊此框出現(xiàn)插入符,單擊C1,在輸入框中出現(xiàn)輸出地址“$B$1”,這是輸出結(jié)果的左上角起始位置。⑦單擊“匯總統(tǒng)計(jì)”,如不選此項(xiàng),則Excel省略部分輸出結(jié)果。,,173,平均 38.75標(biāo)準(zhǔn)誤差 2.435348中位數(shù)

57、 38.5眾數(shù) 29標(biāo)準(zhǔn)差 10.89121方差 118.6184峰度 -1.0812偏度 0.277013區(qū)域 36最小值 22最大值 58求和 775觀測數(shù) 20,⑧單擊“確定”按鈕,輸出結(jié)果如下圖所示:,174,案例研究“Old Faithful”間歇噴泉的噴發(fā),間歇噴泉是一種向

58、空中噴出熱水和熱氣的溫泉,其名字的由來是因?yàn)檫@種噴泉要經(jīng)過一段相對穩(wěn)定的狀態(tài)后才能噴發(fā)。有時(shí)它噴射的時(shí)間間隔不太穩(wěn)定。Ohio(俄亥俄)州黃石國家公園中的“Old Faithful”間歇噴泉是世界上最著名的間歇噴泉之一。參觀者們都希望到公園后不用等多久就能看到噴泉的噴發(fā)。國家公園的服務(wù)部門就在噴泉處安裝了一個(gè)指示牌,預(yù)報(bào)下次噴泉噴發(fā)的時(shí)間,如下表所示。,175,“Old Faithful”間歇噴泉噴發(fā)時(shí)間表,176,公園是如何得到這

59、個(gè)結(jié)果的呢?為了了解噴泉噴發(fā)間隔時(shí)間的規(guī)律,以1978年8月至1979年8月間噴泉222次噴發(fā)的間隔時(shí)間記錄為樣本進(jìn)行分析。①打開“噴泉“工作表。②單擊“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開“直方圖”對話框。③在輸入?yún)^(qū)域輸入單元格C1:C223,選擇“標(biāo)志”,在輸出區(qū)域中輸入單元格“D1”,選擇“圖表輸出”,單擊“確定”按鈕。,177,從圖中可以看出,噴泉噴發(fā)的間隔時(shí)間一般在40~100分鐘內(nèi)變動(dòng)。但是,在數(shù)據(jù)中明顯地存

60、在兩個(gè)子群,它們的中心大約分別在噴發(fā)間隔55分鐘和80分鐘,這樣在圖形中間形成一個(gè)缺口。然而我們利用描述統(tǒng)計(jì)分析工具所得的結(jié)果與此便大不一樣。,將所得的直方圖進(jìn)行修飾,便得到下圖:,178,利用描述統(tǒng)計(jì)分析工具分析該噴泉的間隔時(shí)間,方法如下:①打開“4數(shù)據(jù)描述.xls”工作簿,選擇“噴泉”工作表。②從“工具”菜單中選擇“數(shù)據(jù)分析”選項(xiàng),打開“描述統(tǒng)計(jì)”對話框。③在輸入?yún)^(qū)域中輸入“C1:C223”,選擇標(biāo)志位于第一行。“輸出

61、區(qū)域”選擇D19。⑥選擇“匯總統(tǒng)計(jì)”和“平均數(shù)置信度”,單擊“確定”按鈕,結(jié)果如下表所示。,179,平均 71.00901中位數(shù) 75眾數(shù) 75標(biāo)準(zhǔn)差 12.799018峰度 -1.0812偏度 0.277013全距 53最小值 42最大值 95觀測數(shù) 222,“Old Faithfaul” 噴

62、泉間隔時(shí)間描述統(tǒng)計(jì)表,180,由于描述統(tǒng)計(jì)指標(biāo)的概括性與抽象性,容易使人對事物的真實(shí)情況產(chǎn)生誤解。例如:從上表中可以看出平均間隔時(shí)間大約為71分鐘。事實(shí)上,間歇時(shí)間大致呈現(xiàn)雙峰分布,因而這一平均數(shù)并不能確切描述上述兩個(gè)子群中任何一個(gè)子群的特征。按噴發(fā)持續(xù)的時(shí)間將觀察值分成兩組,可以對兩種噴發(fā)的不同特性在更多細(xì)節(jié)上作出檢測。下表是以噴發(fā)持續(xù)的時(shí)間是少于還是大于3分鐘為依據(jù)分組,分別列出噴發(fā)間歇時(shí)間的主要統(tǒng)計(jì)指標(biāo)。,181,噴泉噴發(fā)間歇時(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論