版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p><b> 常用統(tǒng)計分析方法</b></p><p><b> ——SPSS應(yīng)用</b></p><p> General Method of Statistical Analysis </p><p> SPSS Application</p><p><b>
2、 杜志淵 編著</b></p><p><b> 前 言</b></p><p> 《統(tǒng)計學(xué)》是一門計算科學(xué),是自然科學(xué)在社會經(jīng)濟(jì)各領(lǐng)域中的應(yīng)用學(xué)科,是許多學(xué)科的高校在校本科生的必修課程。</p><p> 在統(tǒng)計學(xué)原理的學(xué)習(xí)和統(tǒng)計方法的實際應(yīng)用中,經(jīng)常需要進(jìn)行大量的計算。因此,統(tǒng)計分析軟件問世使強(qiáng)大的計算機(jī)功能得到充分發(fā)
3、揮,不僅能夠減輕計算工作量,計算結(jié)果非常準(zhǔn)確,而且還節(jié)省了統(tǒng)計分析時間。因此,應(yīng)用統(tǒng)計分析軟件進(jìn)行數(shù)據(jù)處理已經(jīng)成為社會學(xué)家和科學(xué)工作者必不可少的工作內(nèi)容。為了使高校的學(xué)生能夠更好的適應(yīng)社會的發(fā)展和需求,學(xué)習(xí)和使用統(tǒng)計軟件已經(jīng)成為當(dāng)前管理學(xué)、社會學(xué)、自然科學(xué)、生物醫(yī)學(xué)、工程學(xué)、農(nóng)業(yè)科學(xué)、運(yùn)籌學(xué)等學(xué)科的本科生或研究生所面臨的普遍問題。為了使大學(xué)生和專業(yè)人員在掌握統(tǒng)計學(xué)原理的基礎(chǔ)上能夠正確地運(yùn)用計算機(jī)做各種統(tǒng)計分析,掌握統(tǒng)計分析軟件的操作是非
4、常有必要的?,F(xiàn)將常用的SPSS統(tǒng)計分析軟件處理數(shù)據(jù)和分析數(shù)據(jù)的基本方法編輯成冊,供高校學(xué)生及對統(tǒng)計分析軟件有興趣的人員學(xué)習(xí)和參考,希望能夠?qū)W(xué)習(xí)者有所幫助。</p><p> 本書以統(tǒng)計學(xué)原理為理論基礎(chǔ),以高等學(xué)校本科生學(xué)習(xí)的常用的統(tǒng)計方法為主要內(nèi)容,重點介紹這些統(tǒng)計分析方法的SPSS 軟件的應(yīng)用。為了便于理解,每一種方法結(jié)合一個例題解釋SPSS軟件的操作步驟和方法,并且對統(tǒng)計分析的輸出結(jié)果進(jìn)行相應(yīng)的解釋和分析
5、。同時也結(jié)合工業(yè)、農(nóng)業(yè)、商業(yè)、醫(yī)療衛(wèi)生、文化教育等實際問題,力求使學(xué)生對統(tǒng)計分析方法的應(yīng)用有更深刻的認(rèn)識和理解,以提高學(xué)生學(xué)習(xí)的興趣和主動性。另外,為了方便學(xué)習(xí)者的查詢,將常用統(tǒng)計量的數(shù)學(xué)表達(dá)式作為附錄1,SPSS中所用的主要函數(shù)釋義作為附錄2,希望對學(xué)習(xí)者能夠的所幫助。</p><p><b> 編者</b></p><p><b> 目錄</b
6、></p><p> 第一章 數(shù)據(jù)文件的建立及基本統(tǒng)計描述1</p><p> §1.1 SPSS的啟動及數(shù)據(jù)庫的建立1</p><p> §1.1.2 SPSS簡介1</p><p> §1.1.2 啟動SPSS軟件包2</p><p> §1.
7、1.3 數(shù)據(jù)文件的建立3</p><p> §1.2 數(shù)據(jù)的編輯與整理5</p><p> §1.2.1 數(shù)據(jù)窗口菜單欄功能操作5</p><p> §1.2.2 Date數(shù)據(jù)功能5</p><p> §1.2.3 Transform 變換及轉(zhuǎn)換功能7</p>
8、<p> §1.2.4 數(shù)據(jù)的編輯8</p><p> §1.2.5 SPSS對變量的編輯13</p><p> §1.3 基本統(tǒng)計描述16</p><p> §1.3.1 描述統(tǒng)計分析過程16</p><p> §1.3.2 頻數(shù)分析18</p&
9、gt;<p> §1.4 交叉列聯(lián)表分析29</p><p> §1.4.1 交叉列聯(lián)表的形成30</p><p> §1.4.2 兩變量關(guān)聯(lián)性檢驗(Chi-square Test卡方檢驗)31</p><p> 第二章 均值比較檢驗與方差分析37</p><p>
10、67;2.1 單個總體的 t 檢驗(One-Sample T Test)分析37</p><p> §2.2 兩個總體的 t 檢驗39</p><p> §2.2.1 兩個獨立樣本的t檢驗(Independent-sample T Test)39</p><p> §2.2.2 兩個有聯(lián)系總體間的均值比較(Paire
11、d-Sample T Test)41</p><p> §2.3 單因素方差分析43</p><p> §2.4 雙因素方差(Univariate)分析過程47</p><p> 第三章 相關(guān)分析與回歸模型的建立與分析55</p><p> §3.1 相關(guān)分析55</p>&
12、lt;p> §3.1.1 簡單相關(guān)分析55</p><p> §3.1.1.1 散點圖55</p><p> §3.1.1.2 簡單相關(guān)分析操作57</p><p> §3.1.2 偏相關(guān)分析58</p><p> §3.2 線性回歸分析61</p&g
13、t;<p> §3.3 曲線估計69</p><p> 第四章 時間序列分析76</p><p> §4.1 實驗準(zhǔn)備工作76</p><p> §4.1.1 根據(jù)時間數(shù)據(jù)定義時間序列76</p><p> §4.1.2 繪制時間序列線圖和自相關(guān)圖76<
14、/p><p> §4.2 季節(jié)變動分析80</p><p> §4.2.1 季節(jié)分析方法81</p><p> §4.2.2 進(jìn)行季節(jié)調(diào)整82</p><p> 第五章 非參數(shù)檢驗85</p><p> §5.1 Chi-Square Test 卡方檢驗
15、86</p><p> §5.2 一個樣本的K-S檢驗88</p><p> §5.3 兩個獨立樣本的檢驗(Test for Two Independent Sample)91</p><p> §5.4 兩個有聯(lián)系樣本檢驗(Test for Two related samples)94</p><
16、p> §5.6 多個樣本的非參數(shù)檢驗(K Samples Test)96</p><p> §5.6 游程檢驗(Runs Test)100</p><p> 附錄1 部分常用統(tǒng)計量公式104</p><p> §6.1 數(shù)據(jù)的基本統(tǒng)計特征描述104</p><p> §6
17、.2 總體均值檢驗統(tǒng)計量105</p><p> §6.3 方差分析中的統(tǒng)計量107</p><p> §6.4 回歸分析模型109</p><p> §6.5 非參數(shù)檢驗115</p><p> 附錄2 SPSS函數(shù)120</p><p> 第一章 數(shù)
18、據(jù)文件的建立及基本統(tǒng)計描述</p><p> 在社會各項經(jīng)濟(jì)活動和科學(xué)研究過程中,經(jīng)常獲得許多數(shù)據(jù),而這些數(shù)據(jù)中包含著大量有用的信息。若要準(zhǔn)確地、科學(xué)地提取這些信息,就要應(yīng)用各種統(tǒng)計分析方法,其中最基本的方法是數(shù)據(jù)的基本統(tǒng)計描述。通過數(shù)據(jù)的基本統(tǒng)計描述,可以得到數(shù)據(jù)的分布狀況,數(shù)據(jù)的主要特征值,時間序列的趨勢性,是否存在異常值以及數(shù)據(jù)的大致圖形等。當(dāng)然,要實現(xiàn)對數(shù)據(jù)的統(tǒng)計分析和描述,首先要從建立數(shù)據(jù)文件開始。這
19、一章主要介紹數(shù)據(jù)文件的建立和數(shù)據(jù)的基本統(tǒng)計描述方法。</p><p> §1.1 SPSS的啟動及數(shù)據(jù)庫的建立</p><p> §1.1.2 SPSS簡介</p><p> SPSS(Statistics Package for Social Science )for Windows是一種運(yùn)行在Windows系統(tǒng)下的社會科學(xué)統(tǒng)計軟件軟
20、件包。SPSS軟件包集數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能為一體,采用窗口操作界面,統(tǒng)計分析方法涵蓋面廣,用戶操作使用方便,輸出數(shù)據(jù)表格圖文并貌,并且隨著它的功能不斷完善,統(tǒng)計分析方法不斷充實,大大提高了統(tǒng)計分析工作的效率。從1968年由美國斯坦福大學(xué)開發(fā)使用至今,已經(jīng)擁有全球數(shù)以萬計的用戶,分布在通信、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科學(xué)教育等眾多的行業(yè)領(lǐng)域,成為世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件之一。</p>
21、<p> SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計、列聯(lián)分析,總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗等多個大類,每個類中還有多個專項統(tǒng)計方法。SPSS設(shè)有專門的繪圖系統(tǒng),可以根據(jù)使用者的需要將給出的數(shù)據(jù)繪制各種圖形,能夠滿足用戶的不同需求。</p><p><b> SPSS的運(yùn)行方式</b&
22、gt;</p><p> SPSS提供了3種基本運(yùn)行方式:完全窗口菜單方式,程序運(yùn)行方式、混合運(yùn)行方式。程序運(yùn)行方式和混合運(yùn)行方式是使用者從特殊的分析需要出發(fā),編寫自己的SPSS命令程序,通過語句直接運(yùn)行。這里只介紹完全窗口菜單管理方式,這種操作方式簡單明了,除數(shù)據(jù)輸入工作需要鍵盤外,大部分的操作命令、統(tǒng)計分析方法的實現(xiàn)是通過菜單、圖標(biāo)按鈕、對話框來完成的,非常適用于一般的統(tǒng)計分析人員和一般統(tǒng)計方法的應(yīng)用者。
23、</p><p> SPSS中使用的對話框主要有兩類,一類是文件操作對話框,文件操作對話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計分析對話框,統(tǒng)計分析對話框可以分為主窗口和下級窗口,在該類對話框中,選擇參與分析的各類變量及統(tǒng)計方法是對話框的主要任務(wù)。有關(guān)對話框的詳細(xì)操作將在后面的統(tǒng)計方法的實驗中解釋。</p><p> SPSS的實驗環(huán)境要求</p>&l
24、t;p><b> 1、系統(tǒng)運(yùn)行環(huán)境</b></p><p> SPSS10.0以上版本軟件包可以工作在兩種模式下,單機(jī)模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。</p><p> SPSS for Windows軟件包可以運(yùn)行在微軟公司的Windows98、Windows NT 4.0、Windows ME、Windows2000和Windows XP操作系統(tǒng)之下
25、。由于統(tǒng)計分析軟件的數(shù)據(jù)量比較大,所以系統(tǒng)運(yùn)行需要大于16M以上空間。</p><p><b> 2、輔助軟件環(huán)境</b></p><p> SPSS可以直接將SPSS數(shù)據(jù)文件保存為Excel工作表,也可以直接打開一個Excel工作表,因此,為了方便數(shù)據(jù)錄入(許多人對Excel工作表編輯比較熟習(xí)),應(yīng)在操作系統(tǒng)下安裝一個Excel軟件。另外,許多數(shù)據(jù)在處理之前可能
26、保存在某個數(shù)據(jù)庫中,例如FoxBase、Sybase、SQL_Server、Oracle等等,如有需要從數(shù)據(jù)庫中獲取數(shù)據(jù)的分析,應(yīng)在操作系統(tǒng)下安裝相應(yīng)的數(shù)據(jù)庫管理系統(tǒng)。</p><p><b> SPSS的主要界面</b></p><p> SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。數(shù)據(jù)編輯窗口與微軟的Exdel類似,但SPSS的統(tǒng)計功能更多。SPSS的結(jié)果
27、輸出窗口是顯示統(tǒng)計分析的結(jié)果,此窗口的內(nèi)容可以以結(jié)果文件.spo的形式保存。數(shù)據(jù)編輯窗口和結(jié)果輸出窗口的詳細(xì)描述將在有關(guān)SPSS的數(shù)據(jù)文件建立的內(nèi)容中查到。</p><p><b> SPSS的幫助系統(tǒng)</b></p><p> SPSS對一些基本模塊中的統(tǒng)計提供了幫助,可以通過單擊Help菜單中的Statistics Coach命令,選擇所需要的統(tǒng)計指導(dǎo)。 &l
28、t;/p><p> §1.1.2 啟動SPSS軟件包</p><p> 當(dāng)用戶在操作系統(tǒng)下運(yùn)行SPSS軟件后,計算機(jī)屏幕上出現(xiàn)一個對話框,如圖1.1所示:</p><p> 圖1.1 SPSS啟動后操作對話框</p><p> 對話框包括一個六選一單選對話框和一個復(fù)選對話框,其內(nèi)容為:</p><p>
29、; Run the tutorial 運(yùn)行操作指南;</p><p> Type in data 輸入數(shù)據(jù)選項,建立新的數(shù)據(jù)集時可選擇此項;</p><p> Run an existing query 運(yùn)行一個已經(jīng)存在的數(shù)據(jù)文件選項;</p><p> Create new query using Database Wizard 用數(shù)據(jù)庫處理工具建立新文件
30、;</p><p> Open an existing date source 打開一個已經(jīng)存在的數(shù)據(jù)文件;</p><p> Open another type of file 打開其他類型的文件。</p><p> Don’t show this dialog in the future 是一復(fù)選對話框,選中該復(fù)選項后,下次啟動SPSS時將不會顯示對話框,
31、直接顯示數(shù)據(jù)編輯窗口。</p><p> §1.1.3 數(shù)據(jù)文件的建立</p><p> 當(dāng)對話框選擇Type in data后,點擊OK,系統(tǒng)將顯示出SPSS軟件包數(shù)據(jù)編輯主窗口,數(shù)據(jù)文件的建立就是在數(shù)據(jù)編輯窗口中完成的。數(shù)據(jù)編輯窗口可以顯示兩張表,分別是Data View(見圖1.2)和Variable View(見圖1.3),通過點擊下端的2個同名窗口標(biāo)簽按鈕實現(xiàn)相互
32、切換。</p><p> 數(shù)據(jù)編輯區(qū)是SPSS的主要操作窗口,是一個二維平面表格,用于對數(shù)據(jù)進(jìn)行各種編輯;標(biāo)尺欄由縱向標(biāo)尺欄和橫向標(biāo)尺欄,橫向標(biāo)尺欄顯示數(shù)據(jù)變量,縱向標(biāo)尺欄顯示數(shù)據(jù)順序(如時間順序)。</p><p> Data View表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測個體的序號,最上端行邊框顯示變量名。</p><p> Varia
33、ble View表用來定義和修改變量的名稱、類型及其他屬性,如圖1.3所示。</p><p> 圖1.3 Variable View 表</p><p> 在Variable View表中,每一行描述一個變量,依次是:</p><p> Name:變量名。變量名必須以字母、漢字及@開頭,總長度不超過8個字符,共容納4個漢字或8個英文字母,英文字母不區(qū)別大小寫
34、,最后一個字符不能是句號。</p><p> Type:變量類型。變量類型有8 種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型,Comma逗號型(隔3位數(shù)加一個逗號)等。</p><p> Width:變量所占的寬度。</p><p> Decimals:小數(shù)點后位數(shù)。</p><p>
35、Label:變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說明。</p><p> Values:變量值標(biāo)簽。關(guān)于變量各個取值的涵義說明。</p><p> Missing:缺失值的處理方式。</p><p> Columns:變量在Date View 中所顯示的列寬(默認(rèn)列寬為8)。</p><p> Align:數(shù)據(jù)對齊格式(默認(rèn)為右對齊)。<
36、;/p><p> Measure:數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認(rèn)為等間距尺度)。</p><p> 如果輸入變量名后回車,將給出變量的默認(rèn)屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認(rèn)變量Var00001,Var00002等。</p><p> 定義了變量的各種屬性后,回到Data View表中,就可以直接在表中錄入數(shù)據(jù)。輸
37、入數(shù)據(jù)后可以點擊Save或Save as作為數(shù)據(jù)文件保存。另外對于統(tǒng)計分析的結(jié)果也可以作為文件保存起來。</p><p> 為了在統(tǒng)計分析過程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴(kuò)展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件。</p><p> SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys;</p><p> Exce
38、l 報表程序產(chǎn)生的數(shù)據(jù)文件*.xls;</p><p> DBASE 數(shù)據(jù)庫格式文件*.dbf;</p><p> SAS統(tǒng)計軟件產(chǎn)生的數(shù)據(jù)文件。</p><p> §1.2 數(shù)據(jù)的編輯與整理</p><p> 當(dāng)錄入數(shù)據(jù)之后,就可以對原始數(shù)據(jù)進(jìn)行整理和分析,關(guān)于數(shù)據(jù)的整理和分析都是在數(shù)據(jù)窗口完成的。下面將介紹SPSS統(tǒng)計
39、分析軟件在數(shù)據(jù)窗口的主要操作方式和菜單相應(yīng)的功能。</p><p> §1.2.1 數(shù)據(jù)窗口菜單欄功能操作</p><p> 數(shù)據(jù)編輯窗口的主菜單如圖1.4所示,主菜單中的具體功能包括:</p><p> 圖1.4 SPSS主菜單</p><p> 1.File:文件操作。</p><p> 2
40、.Edit:文件編輯。</p><p> 3.View:視圖編輯。</p><p> 4.Data:數(shù)據(jù)操作。</p><p> 5.Transform:數(shù)據(jù)轉(zhuǎn)換。</p><p> 6.Analyze:統(tǒng)計分析方法。 </p><p> 7.Graphs: 圖形編輯。</p><p>
41、; 8.Utilities:實用程序。 </p><p> 9.Windows:窗口控制。</p><p> 10.Help:幫助。</p><p> 在統(tǒng)計分析過程中常用的功能主要集中在數(shù)據(jù)操作、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分析、統(tǒng)計圖形的建立與編輯等操作。</p><p> §1.2.2 Date數(shù)據(jù)功能</p>&
42、lt;p> 數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能,如圖1.5所示。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。</p><p> 這些功能為各種統(tǒng)計分析要求提供極其靈活了數(shù)據(jù)整理功能,用戶可以根據(jù)不同統(tǒng)計分析對數(shù)據(jù)的要求對數(shù)據(jù)進(jìn)行整理。</p><p> 一、定義和編輯變
43、量、觀測量的命令</p><p> Define Variable Properties 用于定義變量屬性;</p><p> Copy Data Properties 由外部文件和工作文件拷貝數(shù)據(jù)變量和屬性;</p><p> Define Dates 定義或編輯日期變量格式;</p><p> Insert
44、Variable 在數(shù)據(jù)編輯窗口插入一個變量;</p><p> Insert Case 在數(shù)據(jù)編輯窗口插入一個觀測量;</p><p> Goto Case 光標(biāo)跳轉(zhuǎn)到某一指定觀測量。</p><p> 二、變量數(shù)據(jù)變換的命令</p><p> Sort Cases 對觀測量進(jìn)行排序;</
45、p><p> Transpose 對觀測量進(jìn)行轉(zhuǎn)置;</p><p> Restructure 對現(xiàn)有的觀測量進(jìn)行重新構(gòu)造,形成新格式的數(shù)據(jù)文件;</p><p> Merge File 把外部文件數(shù)據(jù)合并到工作文件中;</p><p> Aggregate 對數(shù)據(jù)進(jìn)行分類或不分類匯總,產(chǎn)生新文件或代替工作文件。
46、</p><p> Identify Duplicate Cases 標(biāo)識重復(fù)觀測量;</p><p> Orthogonal Design 進(jìn)行正交設(shè)計。</p><p> 三、觀察量數(shù)據(jù)整理的命令</p><p> Split File 拆分?jǐn)?shù)據(jù)文件的觀測量,觀測量進(jìn)行條件分組;</p&g
47、t;<p> Select Cases 選擇觀測量;</p><p> Weight Cases 對觀測量進(jìn)行加權(quán)處理。</p><p> 通過選擇上述命令,可以實現(xiàn)對數(shù)據(jù)的整理編輯。</p><p> §1.2.3 Transform 變換及轉(zhuǎn)換功能</p><p> 數(shù)據(jù)編輯窗口的Trans
48、form菜單為用戶創(chuàng)建和定義復(fù)雜的數(shù)據(jù)提供了方便的功能,如圖2.3所示。它與Data菜單共同使用,可對基本的數(shù)據(jù)進(jìn)行重新編輯,形成新的變量和觀測量。這個菜單主要對變量進(jìn)行操作,分為三部分的功能。這些功能也為各種統(tǒng)計分析要求提供極其靈活了數(shù)據(jù)處理功能。</p><p> 一. 通過基本變量創(chuàng)建各種新變量;</p><p> Compute 計算產(chǎn)生新變量,SPSS提供了10類100
49、多個函數(shù),通過該菜單可以用表達(dá)式產(chǎn)生一個新變量;</p><p> Random Number Seed 創(chuàng)建隨機(jī)數(shù)種子;</p><p> Create Times Series 創(chuàng)建時間序列變量;</p><p> 二. 創(chuàng)建各種參數(shù)變量;</p><p> Count 創(chuàng)建一個計數(shù)變量,用于統(tǒng)計計數(shù)
50、;</p><p> Recode 對變量值重新編碼;</p><p> Rank Cases 為觀測量排秩,求得的秩在數(shù)據(jù)窗口作為一個新變量保存;</p><p> Categorize Variables 建立新的分組變量,使數(shù)據(jù)分成若干個組;</p><p> Automatic Recode
51、 對變量值自動編碼,產(chǎn)生一個連續(xù)的變量值編碼;</p><p> Replace Missing Values 創(chuàng)建替代缺失值變量;</p><p> 三.運(yùn)行其它自定義的轉(zhuǎn)輸程序。</p><p> Run Pending Transform 運(yùn)行其它轉(zhuǎn)換程序。</p><p> 在一般的情況下,通過Date菜單
52、和Transform菜單的操作就可以實現(xiàn)對原始數(shù)據(jù)的整理和變換。</p><p> §1.2.4 數(shù)據(jù)的編輯</p><p> 在Data View中,用鼠標(biāo)左鍵單擊數(shù)據(jù)表左邊框的觀測個體序號,這一行值就會被選中,用鼠標(biāo)左鍵單擊上邊框的變量名,這個列就被選中,和其它Windows中的操作類似,也可以用鼠標(biāo)對選中一部分單元格,選中的行、列、單元格后,單擊鼠標(biāo)右鍵,可以對它們進(jìn)
53、行復(fù)制、刪除、剪切等操作。</p><p> 如果需要對已經(jīng)輸入的數(shù)據(jù)進(jìn)行修改,就要對已經(jīng)存在的數(shù)據(jù)進(jìn)行編輯,SPSS有許多數(shù)據(jù)編輯功能。下面介紹幾種常用的數(shù)據(jù)編輯功能。</p><p> 一、插入一個新觀測量(Case)</p><p> 插入一個新觀測量(數(shù)據(jù))的命令是Insert Cases。</p><p> 在數(shù)據(jù)窗口主菜單
54、上單擊DateInsert Cases命令,可以在光標(biāo)所在位置的前上一行插入一行新的觀測個體,可以輸入新的觀測數(shù)據(jù)。</p><p> 二、查找指定的觀測量(數(shù)據(jù))</p><p> 查找指定的觀測數(shù)據(jù)的命令是Go to Case。</p><p> 在數(shù)據(jù)窗口單擊DateGo to Case,彈出一個對話框,如圖1.7所示:輸入要找的觀測量的序號后,點OK按
55、鈕,數(shù)據(jù)表中光標(biāo)就會指到選定的觀測量個體。</p><p> 圖1.7 Go To Case對話框</p><p><b> 三、 觀測數(shù)據(jù)排序</b></p><p> 給觀測量數(shù)據(jù)排序的命令是Sort Cases。</p><p> 在數(shù)據(jù)窗口單擊DateSort Cases,打開Sort Cases對話
56、框(見圖1.8 )。</p><p> 圖1.8 Sort Case對話框</p><p> 從對話框左側(cè)的變量列表中選擇排序變量,點擊右箭頭按鈕加入Sort by框中,然后在Sort Order欄中選擇排序順序:</p><p> Ascending 觀測個體按照選定的排序變量值由小到大的升序排列;</p><p> Desc
57、ending 觀測個體按照選定的排序變量值降序排列。</p><p> 注意:觀測個體.排序變量可以是一個或多個,當(dāng)選擇多個排序變量時,首先按第一個變量值排序,然后在第一個變量取值相同的那些個體中再按第二個變量值排序,依次類推。</p><p> 注意在排序的時候,觀測個體整行的值一同變到新位置,而不是只有排序變量那一列變動。但數(shù)據(jù)表中左邊框上的序號并不隨著變動,因此,為了保留原始數(shù)據(jù)
58、的信息,最好自己定義一個變量來記錄觀測個體的序號。</p><p> 四、在數(shù)據(jù)中選取子集</p><p> 如果需要從數(shù)據(jù)文件中選取一部分?jǐn)?shù)據(jù),可以在數(shù)據(jù)編輯窗口單擊Data →Select Case,打開Select Case對話框,如圖1.9所示:</p><p> 圖1.9 Select Case對話框</p><p> 在
59、該對話框的Select欄中選擇挑選數(shù)據(jù)子集的方式(單選):</p><p> All case:選擇所有數(shù)據(jù);</p><p> If condition is satisfied: 按指定條件選擇數(shù)據(jù)。</p><p> 單擊If按紐,打開Select Case:If對話框,如圖1.10所示,先選擇變量,然后定義條件。</p><p>
60、; Random Sample of cases:對觀察值進(jìn)行隨機(jī)抽樣。單擊Sample 按紐,打開Select Case:Random sample對話框。如圖1.11所示。</p><p> 圖1.10 Select Case:If對話框</p><p> 在Sample Size欄中有兩種選擇方式,一種是大概抽樣(Approximately),即鍵入抽樣比例后由系統(tǒng)隨機(jī)抽樣;
61、另一種是精確抽樣((Exactly),要求輸入從第幾個觀察值起抽取多少數(shù)據(jù)。</p><p> 圖1.11 Select Case:Random Sample對話框</p><p> Based on time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。</p>
62、;<p> Use filter variable:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標(biāo)上刪除記號,系統(tǒng)對標(biāo)有刪除記號的觀測單位不作分析。</p><p> 選擇了挑選數(shù)據(jù)子集的方式后,單擊OK,在數(shù)據(jù)窗口可看到新的變量filter_s。如在數(shù)據(jù)文件SY-1中,選擇年齡大于48歲的人作為選擇子集。則滿足條件的年齡大于48歲的相應(yīng)的新變量數(shù)據(jù)為1,否則
63、為0。</p><p> 五、數(shù)據(jù)分類匯總(數(shù)據(jù)分組匯總)</p><p> 用戶可以根據(jù)需要對數(shù)據(jù)按指定的變量的數(shù)值進(jìn)行歸類分組匯總。以數(shù)據(jù)庫SY-2兩個班的學(xué)生成績?yōu)槔?,如果按照性別對數(shù)學(xué)成績進(jìn)行匯總,可以使用分類匯總命令實現(xiàn)。具體操作如下。</p><p> 1.指定分類變量和匯總變量。</p><p> 打開數(shù)據(jù)庫SY-2,在
64、數(shù)據(jù)窗口單擊DateAggregate命令,打開Aggregate Date對話框。如圖1.12所示:</p><p> 圖1.12 Aggregate Date對話框</p><p> 2. 在變量名列表框中選擇分類變量”性別”進(jìn)入Break Variable(s)。</p><p> 3. 在變量名列表框中選擇匯總變量”Math”進(jìn)入Aggregate
65、Variable(s)。</p><p> 4. 單擊Function按紐,打開Aggregate Date:Function對話框,如圖1.13所示。在此對話框中可以選擇平均值、數(shù)據(jù)和、標(biāo)準(zhǔn)差的形式,特別值形式,百分?jǐn)?shù)形式、頻數(shù)形式等其中之一的方法進(jìn)行分類匯總。選擇分類匯總的函數(shù)形式后返回Aggregate Date對話框中。</p><p> 圖1.13 Aggregate Da
66、te:Aggregate Function對話框</p><p> 5. 在Aggregate Date對話框中指定匯總文件的保存路徑。有兩種選擇:一種是選中創(chuàng)建新數(shù)據(jù)文件,通過File按紐,重新指定結(jié)果文件名。一種是替代原來數(shù)據(jù)文件,用分類匯總結(jié)果覆蓋當(dāng)前編輯窗口的數(shù)據(jù)。</p><p> 6. 單擊Name&Label按紐,可以重新指定結(jié)果文件中的變量名并加入變量標(biāo)簽。SP
67、SS默認(rèn)的結(jié)果文件中的變量名為原變量名最后加上_1.</p><p> 7. 如果希望在結(jié)果文件中保存各分類組的數(shù)據(jù)個數(shù),可以選擇Save number of case in break group as variable項。最后單擊OK,可得相應(yīng)的數(shù)據(jù)文件。</p><p> 六、缺失值的替代方式</p><p> 如果用戶希望對缺失值進(jìn)行定義,可以采用以下
68、的操作:</p><p> 在數(shù)據(jù)窗口點擊TransformReplace Missing Values,打開Replace Missing Values,對話框,如圖.1.14.所示:</p><p> 圖1.14 Replace Missing Values對話框</p><p> 在變量中選擇具有缺失值的變量進(jìn)入New Variable框內(nèi),系統(tǒng)可以自動
69、產(chǎn)生替代缺失值的新變量,也可處定義新變量。然后在Method的下拉菜單中選擇缺失值的替代方式。五種方式依次是:</p><p> Series mean 用該變量所有非缺失值的平均值替代缺失值;</p><p> Mean of nearly point 用缺失值相鄰點的的非缺失值的平均數(shù)據(jù)替代缺失值;</p><p> Median of nearly p
70、oint 用缺失值相鄰點的的非缺失值的中位數(shù)替代缺失值;</p><p> Linear interpolation 用缺失值相鄰點的的非缺失值的中點值替代缺失值;</p><p> Linear trend at point 用線性擬合方式替代缺失值。</p><p> 七、數(shù)據(jù)秩(序)的確定</p><p> 如果用戶需要對
71、已有的數(shù)據(jù)變量排秩(序),如對數(shù)據(jù)SY-1中兩個班的數(shù)學(xué)成績分別排出名次,可以在數(shù)據(jù)窗口采用以下操作。 </p><p> 1. 單擊TransformRand Cases,打開Rand Cases對話框,如圖1.15所示:</p><p> 圖1.15 Rand Cases對話框</p><p> 2. 從左邊變量名列表框中選擇變量”數(shù)學(xué)”(也可選擇多個變
72、量)進(jìn)入Variable(s)框中,選擇變量”班級”進(jìn)入By框中,則系統(tǒng)排序時將按照進(jìn)入By的變量值“班級”進(jìn)行分別排序。</p><p> 3. 單擊Ties按紐,選擇Ties(Ties是指兩個或兩個以上的數(shù)據(jù)相等的情況)的處理方式。由于秩與數(shù)據(jù)個數(shù)是一一對應(yīng)的,當(dāng)數(shù)據(jù)有相同的時,確定它們相應(yīng)的秩有三種處理方式:對應(yīng)秩的Mean平均值、Low最小值和high最大值。如本例選擇最大值。選擇后返回在主對話框。點擊
73、OK,就可以在數(shù)據(jù)窗口看到排序結(jié)果。</p><p> Rank Types按紐提供排秩方式。單擊Rank Types按紐,打開types對話框,從中選擇排秩類型,排秩類型從左到右依次是:Rank普通排序(系統(tǒng)默認(rèn)),新變量的值就是秩;Fractional rank as% 累計百分?jǐn)?shù)排序;Savage score以指數(shù)分布為基礎(chǔ)的原始分排序;Sum of Case weights 以分組例數(shù)之和的權(quán)重排序;F
74、ractional rank以秩變量除以分組例數(shù)之和排序;Ntile先給定一個大于1 的整數(shù),系統(tǒng)按照此數(shù)的范圍確定秩。</p><p> §1.2.5 SPSS對變量的編輯</p><p><b> 一、插入一個新變量</b></p><p> 插入一個新變量的命令是Insert Variable。</p>&
75、lt;p> 在數(shù)據(jù)窗口單擊Data→Insert Variable,會在光標(biāo)所在位置的前一列插入一個新的變量,變量名字和屬性可以在Variable View窗口中定義。</p><p> 二、已存在的變量生成新變量</p><p> 對于已存在的數(shù)據(jù)變量,根據(jù)需要進(jìn)行計算生成新變量的命令是Compute。</p><p> 在數(shù)據(jù)窗口單擊Transfo
76、rm Compute,打開Compute Variable對話框,如圖1.16所示。</p><p> 在對話框左上方Target Variable欄中,鍵入即將生成的新變量的名稱,并單擊Type & Lable按紐確定變量標(biāo)簽及數(shù)據(jù)類型。對話框的左下欄中給出了數(shù)據(jù)文件中所有可用的變量列表,我們可以用右箭頭按鈕從中選取所需的變量進(jìn)入右上方的Numeric Expression欄中,該欄存放運(yùn)算表達(dá)式,運(yùn)
77、算表達(dá)式中所需要的常用函數(shù)可以從下的Functions列表中直接選取。這些常用函數(shù)(見附錄2)和其它語言中的函數(shù)名稱類似,在框中按字母順序排列,用鼠標(biāo)選中某個函數(shù),用Functions右面的上箭頭按鈕加入數(shù)值表達(dá)式中,對話框中間是一個小鍵盤,可以用來輸入數(shù)字、運(yùn)算符號等。Compute Variable對話框的下面還有一個if按鈕,可以選一部分滿足某種條件的觀測個體來做運(yùn)算,不滿足條件觀測,其新變量值缺失。</p><
78、;p> 圖1.16 Compute Variable對話框</p><p> 如圖1.16表示的是數(shù)據(jù)SY-2中每個學(xué)生的數(shù)學(xué)和物理總成績。在Compute Variable對話框中填好新變量名稱和運(yùn)算表達(dá)式后,點擊OK按鈕,就可以在數(shù)據(jù)文件中看到,已經(jīng)生成了一個新變量Total。</p><p><b> 三、產(chǎn)生計數(shù)變量</b></p>
79、<p> 如果用戶需要對滿足某項條件的數(shù)據(jù)進(jìn)行計數(shù),可以使用Count命令。以學(xué)生成績數(shù)據(jù)SY-1為例,說明具體操作步驟:</p><p> 在數(shù)據(jù)窗口單擊TransformCount,打開Count Occurrence of Value within Cases對話框,如圖1.17所示:</p><p> 圖1.17 Count Occurrence of Valu
80、e within Cases對話框</p><p> 先在Target Variable中指定一個變量(可以是已經(jīng)存在的變量或新變量),并定義變量標(biāo)簽,然后指定要統(tǒng)計的變量加到Numeric Variables框中,再單擊Define Values按紐,打開Value to Count對話框。如圖1.18所示: </p><p> 圖1.18 Count Values within C
81、ases:Value to Count對話框</p><p> 在上面的對話框中,確定需要計數(shù)的數(shù)值,其Value值的設(shè)置項依次是:</p><p> Value:輸入某個值為清點對象;</p><p> System-missing:以系統(tǒng)的缺失值為清點對象;</p><p> System-or user missing:以系統(tǒng)或
82、用戶指定的缺失值為清點對象;</p><p> Range:指定數(shù)值的計數(shù)區(qū)域:其中包括: </p><p> ( )through( )在框內(nèi)指定下限和上限</p><p> lowest through( ): 在框內(nèi)只指定上限;</p><p> ?。?)highest through: 在框內(nèi)只指
83、定下限。</p><p> 圖中給出的是計算達(dá)到優(yōu)良標(biāo)準(zhǔn),即學(xué)生達(dá)到80分以上課程數(shù)。確定了計數(shù)數(shù)值后,單擊Add,使選擇結(jié)果進(jìn)入Values to count 框內(nèi)。單擊Continue按紐,返回主對話框中。如果需要,可以單擊If按紐確定計數(shù)條件。最后點OK可在數(shù)據(jù)窗口得到計數(shù)變量。</p><p> 四、變量分組(編碼)與自動分組(編碼)</p><p>
84、 Transform菜單下還有以上兩條分組(編碼)命令。對變量數(shù)據(jù)的重新分組(編碼),是指給每個變量值重新賦予一個碼來描述他們的某些屬性。碼數(shù)相同的即為一組。比如,可以對年齡重新分組,19歲及以下年齡賦予一個編碼1,20-29歲的年齡碼賦予2,30-39歲年齡碼賦予3,依此類推,這些碼只能取正整數(shù)值。從某種程度上來講,編碼也可以看做分組:一個組對應(yīng)一個組號,這樣就把這些人按年齡分為幾個組,一目了然。</p><p&g
85、t; 變量重新編碼命令為Recode,自動重新編碼命令為Automatic Recode。Automatic 兩者的區(qū)別是:Automatic Recode命令是SPSS系統(tǒng)自動設(shè)定碼為正整數(shù),而Recode可以根據(jù)用戶的需要指定特別的碼值。自動編碼的具體操作為:</p><p> 在數(shù)據(jù)窗口單擊Transform Automatic Recode打開Automatic Recode。對話框,從左側(cè)的變量列表
86、中選出被將重新編碼的原變量,在New Name按鈕右邊空白欄中輸入新的碼值的變量名,點New Name按鈕放到上面的欄中。對話框底下有兩個選項,以確定編碼是從最小的開始,還是從最大的開始,點OK執(zhí)行這條命令。需要注意的是,碼與秩是不同的,請讀者在學(xué)習(xí)時注意它們的區(qū)別。</p><p> 如果用戶需要自定義分組的條件,可選擇Recode命令。Recode命令有兩個選項,分別是:</p><p&
87、gt; Into Same Variables:數(shù)據(jù)編碼后新的碼值直接放到原來的變量中;</p><p> Into Different Variables:數(shù)據(jù)編碼后新的碼值存到一個新變量中。</p><p> 為了避免數(shù)據(jù)丟失,盡量不要輕易選擇前者。 選擇后者的Recode命令對話框如圖1.19所示,</p><p> 圖1.19 Recode In
88、to Different Variables對話框</p><p> 選擇需要重新分組(編碼)的變量進(jìn)入Numeric VariableOutput框中,并在右邊的Output Variable框中定義新的變量名及變量標(biāo)簽,單擊Old and New Values按紐,打開對話框,Old and New Values對話框最左側(cè)有六個選項,用來確定原變量的取值區(qū)間(或單個變量值),它們將被賦予一個相同的新碼值,
89、新的碼值在右上方的New Value欄中填入。填好后Add按鈕就被激活了,單擊此按鈕,就把這個舊的變量區(qū)間(值)以及新的碼值到Old->News欄中。重復(fù)以上步驟,把所有的區(qū)間一個一個都輸入后,點Continue按鈕回到Recode Into Different Variables菜單,點OK按鈕執(zhí)行命令,即在數(shù)據(jù)窗口可得到需要的分組賦值變量。</p><p> §1.3 基本統(tǒng)計描述<
90、/p><p> 在建立了數(shù)據(jù)文件之后,需要對數(shù)據(jù)作進(jìn)一步的考察,如了解數(shù)據(jù)的基本特征,如數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、四分位點,數(shù)據(jù)的分布形態(tài)等,這個過程稱為對數(shù)據(jù)進(jìn)行基本統(tǒng)計描述。所以說,數(shù)據(jù)的基本統(tǒng)計描述的目的是:了解數(shù)據(jù)的基本特征和基本分布形狀,為進(jìn)一步分析做好充分準(zhǔn)備。</p><p> 本節(jié)主要內(nèi)容:數(shù)據(jù)的基本統(tǒng)計描述方法:頻數(shù)分析、探索分析及交叉列聯(lián)表分析等。</p>&l
91、t;p> §1.3.1 描述統(tǒng)計分析過程</p><p> 描述統(tǒng)計分析是對數(shù)據(jù)進(jìn)行基礎(chǔ)性描述??梢缘贸鰯?shù)據(jù)的平均值(Mean)、和(sum)、標(biāo)準(zhǔn)差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、極差(range)、平均值標(biāo)準(zhǔn)誤(S.E.Mean),峰度(Kurtosis)、偏度(Skewness)等統(tǒng)計量。</p><p&
92、gt; 以2002年全國職工平均工資表為例(數(shù)據(jù)庫SY-2),介紹描述統(tǒng)計分析的具體操作步驟如下:</p><p> 1、首先打開數(shù)據(jù)表SY-2,按照AnalyzeDescriptives Statistics Descriptives打開Descriptives對話框,如圖1.20所示</p><p> 圖1.20 Descriptives 主對話框</p>&l
93、t;p> 從左邊源變量中選擇一個或者幾個變量進(jìn)入右框中,單擊Options按鈕,打開Options對話框,如圖1.21所示:</p><p> 圖1.21 Descriptives Options對話框</p><p> 在對話框中最上面一行是Mean:均值,sum:算術(shù)和</p><p> Dispersion離差欄</p><
94、p> Std.Deviation 標(biāo)準(zhǔn)差 Minimum 最小值</p><p> Variance 方差 Maximum 最大值</p><p> Range 極差 S.E.mean 均值的標(biāo)準(zhǔn)誤</p><p> Distribution分布狀態(tài)欄</p><
95、p> Skewness 偏度 Kurtosis 峰度</p><p> Display Order欄,選擇輸出方式:</p><p> Variable List 按變量表次序;</p><p> Alphabetic 按字母順序;</p><p> Ascending Meas 按平均值升序;<
96、;/p><p> Descending Means 按平均值降序。</p><p> 如在此例中選擇按平均值升序項,返回主對話框,單擊OK,在輸出窗口得描述統(tǒng)計分析輸出表。</p><p> 表1.1 Descriptive Statistics基本描述統(tǒng)計表</p><p> Descriptive Statistics</
97、p><p> §1.3.2 頻數(shù)分析</p><p> 對于一組數(shù)據(jù),考察不同的數(shù)據(jù)出現(xiàn)的頻數(shù),或者是數(shù)據(jù)所落入指定的區(qū)域內(nèi)的頻數(shù),可以了解數(shù)據(jù)的分布狀況。數(shù)據(jù)文件SY-3是一個公司職員表,其中有性別、年齡,受教育年限等五個變量,具體操作如下:</p><p> 1、打開數(shù)據(jù)文件SY-3后,單擊AnalyzeDescriptive Statistics
98、 Frequencies 打開頻數(shù)分析對話框如圖1.22所示。</p><p> 圖1.22 頻數(shù)分布主對話框</p><p> 2、在左邊的變量框中選中一個或多個變量送入Variable(s)。</p><p> 3、選中Display frequency tables要求輸出分布表。</p><p> 4、單擊Statist
99、ics按鈕,得到對話框圖1.23。</p><p> 在Frequencies: Statistics對話框中選擇要求輸出的統(tǒng)計量。</p><p> 圖1.23 Frequencies: Statistics對話框</p><p> Percentile Values百分?jǐn)?shù)選擇項欄(復(fù)選項)</p><p> Quartile四分
100、位數(shù),</p><p> Cut points equal groups等分位點百分位數(shù)(取值范圍在2100之間)。</p><p> Percentile(s)自定義百分?jǐn)?shù)。</p><p> Dispersion 離差欄(見§1.3.1基本統(tǒng)計描述過程)</p><p> Central Tendency 中心趨勢欄&l
101、t;/p><p> Mean 算術(shù)平均值(均值), Median 中位數(shù), Mode 眾數(shù), Sum 算術(shù)和.</p><p> Distribution分布狀態(tài)欄</p><p> 在本例中選擇四分位點、10等分的百分位點;標(biāo)準(zhǔn)差、方差、最大、最小值;全距、均值、均值的標(biāo)準(zhǔn)誤,中位數(shù)、偏度、峰度等復(fù)選項。</p><p> 5、單擊C
102、hart按鈕,得到Frequencies: Chart對話框圖1.24. 在對話框中有</p><p> Chart Type圖形欄(單選),選擇輸出的圖形類型。</p><p> None 不輸出圖形(系統(tǒng)默許) Bar charts 條形圖</p><p> Pie charts 餅圖 Histograms 直方圖</
103、p><p> With normal curve直方圖中顯示正態(tài)曲線(只有選擇直方圖時才能選擇)。</p><p> Chart Values欄,選擇圖形中分類值的表現(xiàn)形式。</p><p> Frequencies直方圖縱軸為頻數(shù),餅圖中每塊表示屬于該組觀測值頻數(shù);</p><p> Percentage直方圖縱軸為百分比,餅圖中每塊表
104、示該組的觀測量數(shù)占總數(shù)的百分比。 </p><p> 圖1.24 Frequencies: Chart對話框</p><p> 6、單擊Format按鈕,得到對話框圖1.25。</p><p> 圖1.25 Frequencies: Format 對話框</p><p> 在Frequencies: Format 對話框中:</
105、p><p> Order by 排序欄,表示頻數(shù)分布表的排列順序。(單選)</p><p> Ascending values 按變量值升序排列(系統(tǒng)默許)。</p><p> Descending values 按變量值降序排列。</p><p> Ascending counts 按變量各種取值發(fā)生的頻數(shù)升序排列。</p>
106、<p> Descending counts按變量各種取值發(fā)生的頻數(shù)降序排列。</p><p> 如果設(shè)置了直方圖,頻數(shù)表將按照變量值順序排列。</p><p> Multiple Variables多變量輸出表格設(shè)置(單選)。</p><p> Compare variables 將所有變量的結(jié)果輸出在一個表中。</p><
107、;p> Organize output by variables 為每一個變量輸出一個表。</p><p> Suppress tables with more than _ categories控制頻數(shù)表輸出的分類數(shù)復(fù)選項。Maximum number of categories 分類數(shù)最大參數(shù)值,默許值是10.</p><p> 本例中均選擇系統(tǒng)默認(rèn)項。點擊OK,得到輸出表
108、1.2.</p><p> 表 1-2(a) Statistics統(tǒng)計分析表</p><p><b> 年齡 </b></p><p> 表1-2(b) 頻數(shù)表</p><p><b> 年齡</b></p>
109、<p> 表1.2(c)直方圖</p><p> 從上面的表和直方圖中可以觀察到該公司32歲至47歲之間的人數(shù)最多,占到總?cè)藬?shù)的60%以上。</p><p> §1.3.3 探索分析過程</p><p> 探索分析是對數(shù)據(jù)進(jìn)行初步的觀察分析,主要的分析項目有:</p><p> 觀察數(shù)據(jù)的分布特征:可通過繪制
110、箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。 </p><p> 正態(tài)分布檢驗:檢驗數(shù)據(jù)是否服從正態(tài)分布。</p><p> 方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。</p><p> 以數(shù)據(jù)庫SY-1提供的兩個班的學(xué)習(xí)成績數(shù)據(jù)為例,對兩個班的數(shù)學(xué)成績按照性別進(jìn)行數(shù)據(jù)的分布、按照性別檢驗其數(shù)學(xué)
111、成績的方差是否相等。打開數(shù)據(jù)庫SY-1,具體操作步驟:</p><p> 1、單擊Analyze->Descriptive statistics->Explore,打開Explore主對話框:如圖1.26所示:</p><p> 圖1.26 探索分析主對話框</p><p> 從左側(cè)的變量列表中選出變量”數(shù)學(xué)”,送入Dependent List欄
112、;</p><p> 選擇”性別”作為因子變量,送入Factor List欄。有了因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組,再分組考察Dependent List中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。</p><p> 選擇”班級”標(biāo)識變量送入Label Case欄,當(dāng)輸出涉及到觀測量時,使用該變量值標(biāo)識各觀測量。</p&g
113、t;<p> 在Display欄中選擇輸出項,依次是Both選擇項,輸出圖形與描述統(tǒng)計量(系統(tǒng)默認(rèn)),只輸出描述統(tǒng)計量和只輸出圖形。本例中選擇默認(rèn)項。</p><p> 2、單擊Statistics統(tǒng)計量按鈕,打開Statistics對話框,選擇統(tǒng)計輸出量。有四個選擇項,分別是:</p><p> Descriptives基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度,系
114、統(tǒng)默認(rèn)為95%。</p><p> M-估計(M估計在計算時對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠(yuǎn)近而變化);</p><p> Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值;</p><p> Percentiles輸出百分?jǐn)?shù)。</p><p> 本例中選擇Descriptives和Outliers后,返回主對話框。如
115、圖1.27所示。</p><p> 圖1.27 探索分析 Statistics對話框</p><p> 單擊Plots 圖形按鈕,打開Plots對話框,如圖1.28所示。</p><p> 圖1.28 探索分析 Plots對話框</p><p> 對話框中有四個選擇欄:</p><p> Boxplot
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)的收集和整理2
- 數(shù)據(jù)的收集和整理課件8
- 《數(shù)據(jù)的收集、整理與描述》知識點和題型整理
- 第3章-統(tǒng)計數(shù)據(jù)的整理和顯示
- 訪談資料的整理和分析方法
- 大數(shù)據(jù)時代的數(shù)據(jù)分析和挖掘
- 大學(xué)統(tǒng)計學(xué)-ch3數(shù)據(jù)的整理和展示
- 大數(shù)據(jù)時代的數(shù)據(jù)分析和挖掘
- 大數(shù)據(jù)時代的數(shù)據(jù)分析和挖掘
- 數(shù)據(jù)的統(tǒng)計描述和分析
- 數(shù)據(jù)的統(tǒng)計描述和分析
- 大數(shù)據(jù)時代的數(shù)據(jù)分析和挖掘
- 課件 數(shù)據(jù)的收集與整理
- 定制住宅模式整理和分析
- 數(shù)據(jù)挖掘分析的要素和方法
- 土地整理項目中空間數(shù)據(jù)的精度分析.pdf
- 建設(shè)用地數(shù)據(jù)整理的方法探討
- 最全的大數(shù)據(jù)學(xué)習(xí)資料整理
- 數(shù)據(jù)整理與圖表.xls
- 數(shù)據(jù)整理與圖表.xls
評論
0/150
提交評論