應(yīng)用統(tǒng)計chapter2_第1頁
已閱讀1頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章:數(shù)據(jù)的分類和收集,統(tǒng)計數(shù)據(jù)的分類,(按數(shù)據(jù)來源分) 統(tǒng)計數(shù)據(jù)的分類,初級數(shù)據(jù)與次級數(shù)據(jù)初級數(shù)據(jù): 如果數(shù)據(jù)分析和數(shù)據(jù)采集-置于同一整體方案指導(dǎo)下,從原始數(shù)據(jù)的載體或提供者那里采集數(shù)據(jù),繼而進行分析,就稱統(tǒng)計分析使用的是初級數(shù)據(jù)。次級數(shù)據(jù): 如果進行分析時數(shù)據(jù)來自本項統(tǒng)計活動之外的數(shù)據(jù)采集和編輯結(jié)果,就稱統(tǒng)計分析使用的是次級數(shù)據(jù)。如:研究收入與教育、職業(yè)、家庭等因素的關(guān)系。,(按計量尺度分) 統(tǒng)計數(shù)據(jù)的分類,分類數(shù)據(jù)(c

2、ategorical data) 只能歸于某一類別的非數(shù)字型數(shù)據(jù)對事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,人口按性別分為男、女兩類 順序數(shù)據(jù)(rank data) 只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等 數(shù)值型數(shù)據(jù)(metric data) 按數(shù)字尺度測量的觀察值結(jié)果表現(xiàn)為具體的數(shù)值,對事物的精確測度例如:身高為

3、175cm、168cm、183cm,(按收集方法分) 統(tǒng)計數(shù)據(jù)的分類,觀測的數(shù)據(jù)(observational data) 通過調(diào)查或觀測而收集到的數(shù)據(jù)在沒有對事物人為控制的條件下而得到的有關(guān)社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)試驗的數(shù)據(jù)(experimental data) 在試驗中控制試驗對象而收集到的數(shù)據(jù)比如,對一種新藥療效的試驗,對一種新的農(nóng)作物品種的試驗等自然科學領(lǐng)域的數(shù)據(jù)大多數(shù)都為試驗數(shù)據(jù),(按時間狀況分)

4、統(tǒng)計數(shù)據(jù)的分類,截面數(shù)據(jù)與時間序列數(shù)據(jù)截面數(shù)據(jù)(cross-sectional data) 在相同或近似相同的時間點上收集的數(shù)據(jù)描述現(xiàn)象在某一時刻的變化情況比如,2003年我國各地區(qū)的國內(nèi)生產(chǎn)總值數(shù)據(jù)時間序列數(shù)據(jù)(time series data) 在不同時間上收集到的數(shù)據(jù)描述現(xiàn)象隨時間變化的情況比如,1996年至2003年國內(nèi)生產(chǎn)總值數(shù)據(jù),統(tǒng)計數(shù)據(jù)的分類,定性數(shù)據(jù)和定量數(shù)據(jù)標志(attribute)表示總體單位屬

5、性的名詞。數(shù)量標志(quantitative attribute )表現(xiàn)為數(shù)量上不等的標志。品質(zhì)標志(qualitative attribute)表現(xiàn)為狀態(tài)上差異的標志。,質(zhì)別數(shù)據(jù),量別數(shù)據(jù),,,統(tǒng)計數(shù)據(jù)的分類,統(tǒng)計數(shù)據(jù)的來源,(二手數(shù)據(jù))統(tǒng)計數(shù)據(jù)的來源,政府、行業(yè)或者個人已經(jīng)公布或出版的各種數(shù)據(jù)統(tǒng)計部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計年鑒各類經(jīng)濟信息中心、信息咨詢機構(gòu)、專業(yè)調(diào)查機構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊、報紙、書籍所

6、提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術(shù)性研討會上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料專門的數(shù)據(jù)公司,如A.C.尼爾森(A.C.Nielsen)公司、信息資源(Information Resources Inc.)公司。,(直接來源)統(tǒng)計數(shù)據(jù)的來源,統(tǒng)計調(diào)查統(tǒng)計調(diào)查分為普查和抽查普查(全面調(diào)查),是對總體無一遺漏地進行調(diào)查。抽查(抽樣調(diào)查),從總體中抽取部分樣本進行調(diào)查。按抽樣方式不同分為隨機調(diào)

7、查和非隨機調(diào)查。統(tǒng)計調(diào)查的工具問卷調(diào)查卷,統(tǒng)計調(diào)查方式,統(tǒng)計調(diào)查方式,統(tǒng)計數(shù)據(jù)的采集,實驗通過實驗方法得到的數(shù)據(jù)通常是對自然現(xiàn)象而言 也被廣泛運用到社會科學中如心理學、教育學、社會學、經(jīng)濟學、管理學等試驗設(shè)計對照原則齊同原則隨機原則觀察研究,統(tǒng)計調(diào)查方式,抽樣方法,概率抽樣,根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽樣.特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被

8、抽中的概率是已知的,或是可以計算出來的 當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率,簡單隨機抽樣,從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中 抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其

9、他輔助信息以提高估計的效率,簡單隨機抽樣,【例】某公司想從800名專職雇員中抽取一個由32名專職雇員組成的樣本,來獲得有關(guān)公司發(fā)起的護牙計劃支出情況的信息。公司認為,并非每個人都愿意回答問卷,因此他們必須寄多于32份的問卷才能獲得想要的32份答案。假設(shè)平均每10個專職雇員中有8人愿意回答調(diào)查問卷(即80%的回答率),就必須抽取總數(shù)為40個雇員的樣本才能得到想要的32份回答。因此,要從公司的個人檔案中抽取40名專職雇員。在實際工作中,該怎

10、樣進行簡單隨機抽樣?,系統(tǒng)抽樣(等距抽樣),將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難【例】續(xù)上例,分層抽樣,將總體單位按某種特征或某種規(guī)則劃分為不同的層(類),然后從不同的層中獨立、隨機地抽取樣

11、本原則:層間差異較大,而層內(nèi)差異較小優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計,分層抽樣,【例】假設(shè)某大學的商學院想對今年的畢業(yè)生進行一次調(diào)查,以便了解他們的就業(yè)傾向。該學院有5個專業(yè):會計,金融,市場營銷,經(jīng)營管理,信息系統(tǒng)。今年共有1500名畢業(yè)生,其中會計專業(yè)500名,金融專業(yè)350名,市場營銷專業(yè)300名,經(jīng)營管理專業(yè)150名,信息系

12、統(tǒng)專業(yè)200名。假定要選取180人作為樣本,各專業(yè)應(yīng)抽取的人數(shù)分別為:會計專業(yè)60人,金融專業(yè)62人,市場營銷專業(yè)36人,經(jīng)營管理專業(yè)18人,信息系統(tǒng)24人。,整群抽樣,將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查 原則:群間差異小,群內(nèi)差異大。特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差,多階段抽樣,先抽取群,但并不是調(diào)

13、查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法,非概率抽樣,相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的

14、要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式,方便抽樣,調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場所進行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進行的調(diào)查優(yōu)點:容易實施,調(diào)查的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體,判斷抽樣,研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目

15、的選擇一些單位作為樣本有重點抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據(jù)隨機的原則,調(diào)查結(jié)果不能用于對推斷總體,自愿樣本,被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機性無關(guān)樣本是有偏的不能依據(jù)

16、樣本的信息推斷總體,滾雪球抽樣,先選擇一組調(diào)查單位,對其實施調(diào)查之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進行此后的調(diào)查。這個過程持續(xù)下去,就會形成滾雪球效應(yīng)適合于對稀少群體和特定群體研究優(yōu)點:容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低,配額抽樣,先將體中的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡單,可以保證總體中不同類別的單

17、位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時,不是依據(jù)隨機原則,屬于非概率抽樣,概率抽樣與非概率抽樣的比較,概率抽樣依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的無法使用樣本的結(jié)果推斷總體,數(shù)據(jù)的收集方法,數(shù)據(jù)的收集方法,數(shù)據(jù)的誤差,抽樣誤差,由于抽樣的隨機性所帶來的誤差 所有樣本可能的結(jié)果與總體真值之間的

18、平均性差異 影響抽樣誤差的大小的因素樣本量的大小總體的變異性,非抽樣誤差,相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差,誤差的控制,抽樣誤差可計算和控制非抽樣誤差的控制調(diào)查員的挑選調(diào)查員的培訓督導(dǎo)員的調(diào)查專業(yè)水平調(diào)查過程控制調(diào)查結(jié)果進行檢驗、評估現(xiàn)場調(diào)查人員進行獎

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論