版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二章 數(shù)據(jù)與數(shù)據(jù)的獲得,《管理統(tǒng)計學(xué)》謝湘生廣東工業(yè)大學(xué)管理學(xué)院,2.1 總體、個體、特征與數(shù)據(jù),總體(Population or Universe)個體(Individual or Case)或成分(Elements)指標(biāo)或變量(Variable)指標(biāo)值(變量值)或數(shù)據(jù)(Data),2.2 數(shù)據(jù)類型 2.2.1 數(shù)據(jù)測度的分類,測度級(Scale)數(shù)據(jù)比率級(Ratio) 具有一定單位 0值非人為制定
2、 可以進行加減乘除運算間距級(interval) 具有一定單位 0值人為制定 可加減運算,不能乘除運算次序級(Ordinal)數(shù)據(jù) 用于區(qū)分對象的類別與次序名義級(Nominal)數(shù)據(jù) 用于區(qū)分對象的類別,2.2.2 不同類型數(shù)據(jù)的用途特點,不同測度級別的數(shù)據(jù),應(yīng)用范圍不同。等級越高,應(yīng)用范圍越廣泛;等級越低應(yīng)用范圍越受限。一般來說,等級高的數(shù)據(jù)可以兼有等級低的數(shù)據(jù)的功能;而等級低的
3、數(shù)據(jù),不能兼有等級高的數(shù)據(jù)的功能。名義級的數(shù)據(jù),通常是樣本分類(分組)的依據(jù)。,2.2.3 觀察數(shù)據(jù)和實驗數(shù)據(jù),,數(shù)據(jù),來源,,,直接來源,,,間接來源,,,試驗,,,出版物,(或者網(wǎng)上),,,,,,,,,,,問卷調(diào)查,,,觀察,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,間接來源(二手?jǐn)?shù)據(jù)),每天翻開報紙或打開電視,就可以看到各種數(shù)據(jù)。比如高速公路通車?yán)锍獭⑽飪r指數(shù)、股票
4、行情、外匯牌價、犯罪率、房價、流行病的有關(guān)數(shù)據(jù)(確診病例、疑似病例、死亡人數(shù)和出院人數(shù)等等);當(dāng)然還有國家統(tǒng)計局定期發(fā)布的各種國家經(jīng)濟數(shù)據(jù)、海關(guān)發(fā)布的進出口貿(mào)易數(shù)據(jù)等等。從中可以選取對自己有用的信息。這些間接得到的數(shù)據(jù)都是二手?jǐn)?shù)據(jù)。,直接來源(第一手?jǐn)?shù)據(jù)),獲得第一手?jǐn)?shù)據(jù)并不象得到二手?jǐn)?shù)據(jù)那么輕松。某些在華的外資企業(yè)每年至少要花三四千萬元來收集和分析數(shù)據(jù)。他們調(diào)查其產(chǎn)品目前在市場中的狀況和地位并確定其競爭對手的態(tài)勢;他們調(diào)查不同
5、地區(qū),不同階層的民眾對其產(chǎn)品的認知程度和購買意愿以改進產(chǎn)品或推出新品種爭取新顧客;他們還收集各地方的經(jīng)濟交通等信息以決定如何保住現(xiàn)有市場和開發(fā)新市場。市場信息數(shù)據(jù)對企業(yè)是至關(guān)重要的。他們很舍得在這方面花錢。因為這是企業(yè)生存所必需的,絕不是可有可無的。,觀察數(shù)據(jù):在獲得數(shù)據(jù)的過程中,不對被調(diào)查數(shù)據(jù)產(chǎn)生的條件施加任何控制所得到的數(shù)據(jù)。觀察數(shù)據(jù)通常是(但不一定是)眾多因素共同作用的結(jié)果。實驗數(shù)據(jù):在獲得數(shù)據(jù)的過程中,對被調(diào)查數(shù)據(jù)產(chǎn)生的條
6、件實施了控制而得到的數(shù)據(jù)。實驗數(shù)據(jù)通常是(但不一定是)單一因素作用的結(jié)果。,數(shù)據(jù)產(chǎn)生過程,,觀察數(shù)據(jù),數(shù)據(jù)產(chǎn)生過程,,,實驗數(shù)據(jù),,,,2.3獲得數(shù)據(jù)的調(diào)查方法 與問卷設(shè)計,獲得數(shù)據(jù)的方法,,調(diào)查方法,實驗方法,,普查方法,抽樣調(diào)查方法,普查(Census):調(diào)查有限總體中每個個體的有關(guān)指標(biāo)值抽樣調(diào)查(Sampling):在總體中抽取部分個體進行調(diào)查,從所了解的局部數(shù)據(jù)來了解總體情況樣本(Sample)集合:總體中部分個
7、體所組成的集合,觀察方法,與普查的方法比較,抽樣調(diào)查方法具有如下的意義,抽樣調(diào)查的成本要低得多(經(jīng)濟性強)抽樣調(diào)查所用的時間要少得多(時效性高)在收集個體的信息方面,抽樣調(diào)查可以更為詳盡(深入性與廣泛性強)在收集個體的信息方面,抽樣調(diào)查可以做得更加準(zhǔn)確(準(zhǔn)確性高) 調(diào)查具有破壞性,,隨機抽樣(Random Sampling)或概率抽樣(Probability Sampling):按一定隨機規(guī)則(一定概率分配),從總體中抽取部分個
8、體。簡單隨機抽樣(Simple Random Sampling):在隨機抽樣的過程中,每個個體抽到的機會(概率)相等。,抽樣方法(Methods of Sampling),以廣州交通問題的調(diào)查為例,在簡單隨機抽樣的情況下,如果樣本容量(sample size,也就是樣本中個體的數(shù)目)在總體中的比例為1/5000,那么,無論在越秀區(qū)或者在從化區(qū),無論在白領(lǐng)階層還是外來民工被問到的人的比例都應(yīng)該大體是1/5000。,非隨機抽樣或判斷性抽樣
9、(Judgment Sampling):依據(jù)對個體或總體特征的判斷,從總體中抽取個體的做法。 典型調(diào)查:指在分析總體特征的基礎(chǔ)上,有意識地選擇具有代表性的個體,做深入細致的調(diào)查。這里的“代表性”是主觀判斷得到的。 方便抽樣:指在難以獲得隨機樣本的情形,所采取的利用現(xiàn)有條件獲得盡可能具有代表性的個體的抽樣方式。,還以廣州的交通問題的調(diào)查為例。假定按照隨機選出的電話號碼進行調(diào)查。這樣肯定節(jié)省時間和資源,但這樣得到的就不是一
10、個隨機樣本了。如果按照隨機選擇的數(shù)字(無論號碼本上有沒有)打電話,那很多電話是空號或單位電話;顯然這種樣本也不是隨機樣本,它稱為方便樣本(convenience sample)。,常用的綜合抽樣方法,分層(分類)抽樣:按照總體中個體的某特征,把總體中的個體分為若干群(類);然后,對各個群中的個體進行簡單隨機抽樣。分層抽樣要求層之間的差異大于層的內(nèi)部個體的差異。不同群體所抽取的個體個數(shù),一般有三種方法確定等數(shù)分配法:對每一類分配同樣
11、的個體數(shù)等比分配法:讓每一類抽得的個體數(shù)與該類總體個數(shù)的比,都相等最優(yōu)分配法(方差分配法):從各類抽得的樣本數(shù)ni與所要抽得的總樣本數(shù)n之比,等于該類的方差與各類方差和之比,即,常用的綜合抽樣方法(續(xù)),整群抽樣:將總體中的各個個體,按照某一標(biāo)志量分為若干群,然后以群為單位,對群進行(簡單)隨機抽樣,接著對抽出來的群進行普查。要求群與群之間具有相似性。等距抽樣:是按某一標(biāo)志量,將總體中的個體排序,然后按一定的間隔,抽取個體多階段
12、抽樣:根據(jù)總體的層次結(jié)構(gòu)特征,分層次(階段)進行(簡單)隨機抽樣。,在決定所抽取的群體個數(shù)時,常常需要考慮經(jīng)費的限制,必須清楚抽樣的目的,抽取樣本往往是希望基于樣本得到的結(jié)論能適用于該樣本所屬的總體所以首先要求了解樣本是否確實來源于所關(guān)注的總體其次清楚樣本是否具有好的代表性.,2.3.2數(shù)據(jù)調(diào)查中的若干重要問題,作為自學(xué)材料,請課后認真學(xué)習(xí)補充獲得敏感問題誠實回答的統(tǒng)計方法(見《政治及有關(guān)模型》),對于調(diào)查中一些敏感問題,按通常的
13、方法可能難以得到得到誠實的回答。教材中介紹了若干通過適當(dāng)?shù)卦O(shè)立問題來獲得誠實回答的方法。作為補充這里介紹一種結(jié)合問題的設(shè)立與提問方式,利用統(tǒng)計計算來得到問題的誠實回答的方法。,例如要調(diào)查了解某班學(xué)生期末考試某門課程作弊學(xué)生的比例。顯然不能指望直接提問學(xué)生獲得誠實的回答。但可以通過如下方式得到相對真實的答案。,1 設(shè)立問題:,A 你考試作弊了嗎? B 你是廣東的考生嗎?,2 制作與抽取學(xué)生人數(shù)相等的簽,其中有記號A的比例為p,其
14、余有記號B。,3 每個抽到的學(xué)生隨機地抽取一個簽(只有本人知道抽得的是A還是B),然后按抽得的記號回答“是”或“否”。,4 若μ是回答“是”的學(xué)生的比例,則利用概率的性質(zhì)應(yīng)有,其中πA , πB分別是問題A,B回答“是”的比例。于是我們可以估計出該課程作弊的學(xué)生的比例為:,注:問題B應(yīng)該是一個不敏感的問題,并且它的概率是已知或事先已經(jīng)估計出來的。,調(diào)查方案設(shè)計,調(diào)查方案是指導(dǎo)整個調(diào)查過程的綱領(lǐng)性文件,大體包括調(diào)查目的、調(diào)查對象、調(diào)查項目
15、和調(diào)查表等內(nèi)容。 1、調(diào)查目的:回答“為什么調(diào)查”; 2、調(diào)查對象:回答“向誰調(diào)查”; 3、調(diào)查項目和調(diào)查表:回答“調(diào)查什么” 4、其他內(nèi)容:明確調(diào)查所采用的方法、調(diào)查時間、調(diào)查組織和實施的細節(jié),2.3.2 問卷與問卷設(shè)計,一、 問卷與問卷的組成,1 問卷與問卷設(shè)計的重要地位問卷是管理學(xué)科調(diào)查收集一手?jǐn)?shù)據(jù)的最重要的工具之一。一項以一手?jǐn)?shù)據(jù)為基礎(chǔ)的研究項目,其深度本質(zhì)上由問卷的深度決定。
16、問卷設(shè)計時沒有想到的問題,在問卷調(diào)查完后再想研究,就不大可能了。,問卷設(shè)計步驟,,,,,,,,,,確定調(diào)查目的、來源與限制因素等,確定數(shù)據(jù)收集方法,評估內(nèi)容與編排,確定問卷流程和編排,決定問題的用詞,確定問題形式,獲得各方面的認同,預(yù)調(diào)查與修訂,準(zhǔn)備最后印刷,實施,,2 構(gòu)成問卷的問題類型1)開放型問題與封閉型問題根據(jù)事先是否準(zhǔn)備好了問題的答案可將問題分為:開放型問題與封閉型問題。開放型問題:沒有事先準(zhǔn)備的答案,通常在問
17、卷形成階段使用,在最終問卷中應(yīng)慎用。封閉型問題:事先準(zhǔn)備了答案,應(yīng)答者只能在事先準(zhǔn)備的答案中選擇。封閉型問題的數(shù)據(jù)轉(zhuǎn)化工作量,大為減少。,2)回憶型問題與非回憶型問題回憶型問題要求應(yīng)答者把自己的有關(guān)記憶表達出來。它可以是開放型的,沒有備選答案。也可以是封閉型的。有些回憶型問題需要查記錄可能才能回答。例如,貴公司去年的利潤有多少?但是如果將它轉(zhuǎn)化為封閉型問題:“貴公司去年的利潤屬于以下哪個區(qū)間?”(接下來列出所有可能的區(qū)間),問題的
18、回答將得到極大簡化。,3)封閉型問題中的單選問題與多選問題單選問題是指應(yīng)答者只能在備選答案中選擇一個的問題。單選問題中的備選答案之間必須是互斥的。多選問題是指應(yīng)答者能夠在備選答案中選擇多個答案的問題。多選問題的備選答案是相容的。,4)單選問題中的排序型和非排序型(1)排序問題 排序問題本質(zhì)上是單選問題,要求對兩個以上的對象排序。例如對重要性排序:你認為在企業(yè)合并中如下三個因素,哪個最重要:企業(yè)文化的近似性,B. 企業(yè)技術(shù)的互補
19、性,C. 市場的互補性顯然要求排序的對象越多,排序的難度就越大。,(2)單選中的非排序問題。顯然,單選問題不一定是排序問題。但是排序問題可以轉(zhuǎn)化為如下的非排序的單選問題:請對企業(yè)合并中企業(yè)文化的近似性、技術(shù)的互補性、市場的互補性三個要素的重要地位打分:,依據(jù)眾多的應(yīng)答者對上述問題的評分,計算出每個要素的平均分之后,就可以根據(jù)平均分值的大小,對三個要素的重要性排序。需要注意的是,這樣做的前提是各要素的平均分間存在顯著差異(顯著差異的
20、概念見第6章)。,構(gòu)成問卷的問題類別一覽,3. 問卷中的一些常用量表,1)量表的概念量表是測量應(yīng)答者對某個問題(特別是復(fù)合型的問題)的反應(yīng)強度(或態(tài)度、看法)的工具。它是構(gòu)成問卷的最主要成分之一。把單選問題的備選答案量化,就得到單問題量表。例如:你認為企業(yè)文化差異對企業(yè)合并的影響是:,這就是一個單項量表。單項在這里是指該量表僅僅反應(yīng)了應(yīng)答者對一個問題的態(tài)度。,2)連續(xù)評分量表上述量表的評分刻度僅從1到5,如果采用0到100的刻度
21、,則稱為連續(xù)評分量表。,3)分項評分量表:Likert量表如果量表涉及多個關(guān)聯(lián)的單選問題,就稱為分項評分量表(Itemized Rating Scale)。分項評分量表中的多個單選問題必須有關(guān)聯(lián),是某個總項(上一層的變量)的一個分解。下表給出了一個分項量表的例子。,高校合并問題的一個分項評分量表,這種分項評分量表由于由美國社會心理學(xué)家R. A. Likert于1932年提出而稱為Likert量表。Likert量表的度量級別:通常是5級
22、,但不一定是5級,在應(yīng)用中7級,9級均可;但通常不低于5級,不高于9級。這與感覺辨析能力有關(guān)。,Likert量表的關(guān)鍵特點是:所有分項共同構(gòu)成一個總項,分項的得分加總后,就得到總項的得分。所以Likert量表又稱為加總量表(或求和量表)。,4)比較型量表與排序量表量表又可分為比較型和非比較型。前面給出例子中的量表是非比較型量表。下面給出一個比較型量表的例子。,影響學(xué)校文化差異的主要因素的一個兩兩比較量表,請兩兩對比,如果i比j重要,則
23、在(i, j)的位置填入數(shù)字1,否則填入數(shù)字0。,這樣的比較量表也稱為兩兩比較量表或配對比較量表(Paired Comparison Scaling)。,在上述調(diào)查中,如果不明顯地列出兩兩依次對比的表格,僅僅要求對5個被比較對象對形成學(xué)校文化差異的重要性排序,就是所謂的等級順序量表(Rank-order Scaling)了。相應(yīng)于上述問題的等級順序量表為:,等級順序量表的一個示例,請給出如下5個要素對形成學(xué)校文化差異的重要性順序:,進一
24、步閱讀:弗洛德 J. 福勒,Jr 《調(diào)查研究方法》重慶大學(xué)出版社 2004年 10月版,獲得數(shù)據(jù)的信度與效度的基本概念,一、測量誤差問卷是獲取數(shù)據(jù)的工具。進一步說,問卷是用來測量被研究對象的有關(guān)特征(變量)處于什么數(shù)值狀態(tài)的。無論是用問卷來測量變量值(由被研究對象自己來表述),還是由研究者來觀察變量值,都可能出現(xiàn)誤差。這就是測量誤差。,測量誤差由系統(tǒng)誤差(系統(tǒng)偏誤)和隨機誤差構(gòu)成。其中系統(tǒng)誤差表現(xiàn)由測量工具的偏誤所導(dǎo)致;而隨機誤差則是
25、由眾多隨機因素導(dǎo)致的。,如果記測量到的變量值為X,變量的真值為T,系統(tǒng)偏誤為S,隨機誤差為R,則,X = T + S + R,二、測量的信度,1. 測量的信度(Reliability)的定義,測量的信度是指測量結(jié)果的穩(wěn)定性或一致性。當(dāng)然這里是指對一個變量重復(fù)測量時表現(xiàn)出來的性質(zhì)(一致性、穩(wěn)定性或不變性)。,在用三個要素T,S,R來表述變量X的測量值,即X=T+S+R時,只有隨機變量R會影響測量的一致性。如果R=0,多次測量一個結(jié)果都是不
26、變的,那么這個測量結(jié)果是完全可信的。反之如果第一次測量與第二次測量的結(jié)果差異大,那么你會感到測量的結(jié)果不可靠,也就是可信度低。,測量信度是對測量工具及其操作的整體質(zhì)量的一種量度,是測驗性能的重要質(zhì)量指標(biāo)。信度高是良好測驗的必要條件,但不是充分條件。一個測驗只具有可靠性還不行,還必須具備有效性。,靶形圖說明穩(wěn)定性和準(zhǔn)確性的關(guān)系:水平發(fā)揮不但要穩(wěn)定還要打得準(zhǔn),2. 重測信度(Test-retest Reliability),既然信度是測量
27、的可靠性(重復(fù)測量的穩(wěn)定性或一致性),檢查信度的一個簡單方法就是重新測量一次,看看兩次測量結(jié)果之間的關(guān)系。重測信度,就是在盡可能相同的條件下測量兩次,用兩次測量的相關(guān)程度來表示信度。其大小等于同一組應(yīng)答者在兩次測量上所得分?jǐn)?shù)的相關(guān)系數(shù)(相關(guān)系數(shù)見第9章)。,在測量涉及心理判斷過程(問卷調(diào)查的多數(shù)問題涉及這一過程)時,使用重測信度來檢驗測量的可靠性,有個前提,第一次測量應(yīng)當(dāng)對第二次測量沒有影響。所以一般要間隔20~30天再做第二次測量,計
28、算測量的重測信度才相對可靠些。當(dāng)然間隔時間太長也不好,一些外在的因素也可能會影響測量結(jié)果。,間隔多久恰當(dāng)呢?無固定標(biāo)準(zhǔn),一般來說,在間隔時間內(nèi),被試的遺忘和練習(xí)的效果基本上相互抵消,即為適度的時間間隔。*適用于速度測量而不適應(yīng)于難度測量的信度估計。*重測信度檢驗測量跨時間的穩(wěn)定性。*注意提高被試的積極性。,3. 復(fù)本信度(Alternate-form Reliability or Equivalent Form Reliabil
29、ity) 有些測量不適合施測兩次,這時我們可以編制兩份等值但并不相同的量表對被測對象施測(其時距盡量短,可短到兩次測驗接著進行),兩個平行測量來檢測同一批被試所得結(jié)果的一致性程度稱為復(fù)本信度,其大小等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。 所謂測量的等值(或平行)是指: & 問卷(量表)題型、題數(shù)、難度、指導(dǎo)語說明、施測要求等方面都相當(dāng) & 用來測量相同潛
30、在特質(zhì)或?qū)傩?& 量表問題不相同。 兩種方式:同一時間連續(xù)施測;間隔一段較短的時間后施測。,幾點說明:,在實際操作中,為了抵消順序效應(yīng),可以使半數(shù)被試先做 A本再做B本,使另一半被試先做B本再做A本;兩次測量的時距應(yīng)盡可能短;由于復(fù)本在許多方面相似,所以信度系數(shù)有稍微偏高的傾向;注意被試的厭倦心理對測驗產(chǎn)生的影響; ※ 適用于難度測量,也適用于速度測量的信度估計。 ※ 構(gòu)造兩份
31、真正的平行測驗很難!如果平行不能保證,則結(jié)論無價值。,4. 內(nèi)部一致性信度(Internal Consistent Reliability or Inter-item Reliability),重測信度和復(fù)本信度在使用的方法上分別屬于跨時間和跨類型的,實際操作中存在困難,均需測量兩次,復(fù)本不易做到等值,很難用同一測驗對同一組被試重復(fù)進行測驗等,于是引入內(nèi)部一致性信度來計算測驗的信度。內(nèi)部一致性信度 也叫同質(zhì)性信度,是指測量內(nèi)
32、部所有題項間的一致性程度。題項間的一致性含有兩層意思:其一是指所有題項測的是同一種心理特質(zhì);其二是指所有題項得分之間都具有較高的正相關(guān)。 同質(zhì)性信度基于的假設(shè)是:當(dāng)一個測量具有較高的同質(zhì)性信度時,說明測項主要測的是某一單個心理特質(zhì),由于眾多的題項測試了同一心理特質(zhì),那么實測結(jié)果就是該特質(zhì)水平的反映。 估計同質(zhì)性信度的方法主要有:分半信度、庫德-理查遜信度、克龍巴赫α系數(shù)、荷伊特信度。,估計內(nèi)部一致性信度的方法之一
33、:折半信度(分半信度),折半信度 指的是將一個測量中的問題分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。 計算不難,把對等的兩半測驗看成是在最短時間距離內(nèi)施測的兩個平行測驗。難的是,如何將測驗分成相等的兩半。 按題號的奇偶分半、按題目的 難易程度分半、按題目的內(nèi)容分半等等。 實際應(yīng)用中,由于題目一般依據(jù)難度大小排列,采用奇偶分半可使兩半測驗的題目在難度上基本相等,因此常被采納。
34、 如果一個測驗無法分成對等的兩半,則不宜使用分半信度。,5. 評價者信度(Inter-observer Reliability)含義:指多個評價者對某些人、事、物進行評價的一致性程度。 其基本思想是:如果測量工具本身較為規(guī)范,則(水平高,沒有偏見的)不同評價者的評價結(jié)果應(yīng)該不應(yīng)相差很大。當(dāng)評價非常復(fù)雜時,評估評價者信度是非常重要的。評價者信度的計算 當(dāng)評價者人數(shù)為兩人時,評價者信度等于兩個評價者給同一批被試對象所評分?jǐn)?shù)
35、的相關(guān)系數(shù),依據(jù)數(shù)據(jù)形式,采用不同的相關(guān)系數(shù)計算方法。當(dāng)評分者人數(shù)多于兩人時,評分者信度可用肯德爾和諧系數(shù)進行估計。注意:如果各個評價者的評價寬嚴(yán)程度保持一致,則評價者的評價尺度變化不會對評價者信度產(chǎn)生影響。,三、測量的效度,1. 效度的概念測量的有效程度一個測驗或量表實際能測出其所要測量的特性或功能的程度任何測量都存在效度的問題效度是針對一定測量目的而言的效度是針對測量結(jié)果而言的效度只有程度上的差異評價一個測量是否
36、有效要多角度、多方面地收集證據(jù),效度是指:一個測驗或量表實際能測出其所要測量的特性或功能的程度記為:效度的統(tǒng)計定義設(shè) X=T+S+R有則:,2. 效度的類別,測量題目樣本對于應(yīng)測內(nèi)容與行為領(lǐng)域的代表性程度。側(cè)重于測量題目取樣的代表性,考查這些題目對所欲測量的內(nèi)容和行為反應(yīng)測量的有效程度,結(jié)構(gòu):心理學(xué)或社會學(xué)上的一種理論構(gòu)想或特質(zhì)側(cè)重于一個測量能夠量測到心理學(xué)或社會學(xué)的抽象概念或特質(zhì)的程度,效標(biāo):檢驗測量效度的參照標(biāo)準(zhǔn)
37、,實際上是本測量所想量測或要預(yù)測的特性或功能測量分?jǐn)?shù)與作為效標(biāo)的另一獨立測量結(jié)果之間的一致性程度,內(nèi)容效度( content validity)的概念內(nèi)容效度:測驗內(nèi)容對所要測量的特性、功能等的代表性程度。也就是說:一個測量要具備較好的內(nèi)容效度必須滿足兩個條件:一是確定好內(nèi)容范圍,并使測量的全部項目均在此范圍內(nèi)。二是測量項目應(yīng)是已界定的內(nèi)容范圍的代表性樣本。換句話說,就是選出的項目能包含所測的內(nèi)容范圍的主要方面,并且使各部分項目所
38、占比例適當(dāng)。,內(nèi)容效度的常用驗證方法邏輯分析法(定性的方法)依靠有關(guān)專家對測驗題目與應(yīng)測內(nèi)容范圍的吻合程度作出判斷量化分析方法將專家的判斷綜合為一個內(nèi)容效度系數(shù)的統(tǒng)計方法專家在仔細審閱測驗?zāi)繕?biāo)的基礎(chǔ)上,獨立地對測驗每個題目作出判斷:該題目實際測到的內(nèi)容與其欲測量的目標(biāo)內(nèi)容之間相關(guān)程度如何,表面效度表面效度:測量在表面上使被測對象直覺感到的有效程度。一個測量使被測對象從表面上看來,它能夠測量出它所欲測的屬性,則認為該測驗具有
39、表面效度內(nèi)容效度與表面效度的關(guān)系:經(jīng)?;煜?。表面效度是由非專業(yè)人士對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是所要測的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價建立的。雖然二者都是根據(jù)測驗內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮題目與測量目的之間的明顯的、直接的關(guān)系,后者則考慮到題目與測量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。如果測驗內(nèi)容看起來與測量目標(biāo)和要作的決定不
40、相干,就會使被試產(chǎn)生不配合、馬馬馬乎乎、應(yīng)付了事等反應(yīng),而影響測驗的效度。相反,典型行為測驗卻要求較低的表面效度。如果被試很容易從測驗題目看出測驗的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。,結(jié)構(gòu)效度(construct validity)的概念檢驗對于人的假設(shè)屬性或理論概念測量到的程度這些假設(shè)屬性或理論概念是決定人們外部行為的內(nèi)隱或潛在的特性但這種特性不能予以操作性的定義,它所支配的行為也不能直接觀察到,比如:中學(xué)生數(shù)學(xué)能力的研
41、究數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、運算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。編制測驗題,進行測驗并收集測驗結(jié)果分析測驗結(jié)果,考查測試的結(jié)構(gòu)效度,考查測驗結(jié)果是否支持理論構(gòu)想,結(jié)構(gòu)效度的建立過程① 對所欲測量的屬性根據(jù)某種理論提出假定的結(jié)構(gòu)② 根據(jù)假定的結(jié)構(gòu)擬定測量問題,編制量表③ 尋求測量分?jǐn)?shù)與其它評定之間的關(guān)系④ 以檢驗結(jié)果為根據(jù)來驗證假設(shè)結(jié)構(gòu)中的各種因素是否成立,驗
42、證的方法可以從差異性上尋求證據(jù)⑤ 將與假設(shè)結(jié)構(gòu)相違背的問題題刪去,對測量進行修改之后,再重新實施第③和第④個步驟,調(diào)查問卷中的問題是調(diào)查者預(yù)先設(shè)計的,并且人為地歸結(jié)成幾個模塊,這稱為設(shè)計結(jié)構(gòu)。而問卷調(diào)查的實際結(jié)果本身具有一定的潛結(jié)構(gòu),也就是說,可以通過數(shù)學(xué)方法,依據(jù)調(diào)查問卷結(jié)果,將原始問題歸納成幾個模塊,形成統(tǒng)計結(jié)構(gòu)。統(tǒng)計結(jié)構(gòu)與設(shè)計結(jié)構(gòu)吻合的好壞就表明了調(diào)查問卷的結(jié)構(gòu)效度。,例如嚴(yán)進等人在“履歷數(shù)據(jù)測評的效度分析”(心理學(xué)報,vol
43、. 42, no. 3, 423-433,2010)一文中將基本資料、高考成績、在校成績、計算機操作水平、獲得的獎勵情況、學(xué)生社團工作經(jīng)歷作為履歷分析半結(jié)構(gòu)化問卷的維度。利用因子分析方法,對 履歷數(shù)據(jù)中的11 個轉(zhuǎn)換后的指標(biāo)(學(xué)生社團中工作內(nèi)容,學(xué)生社團中職務(wù)高低,參加學(xué)生社團次數(shù),累計學(xué)生社團時間,學(xué)生社團級別,在校成績,高考成績,計算機操作與應(yīng)用,計算機技術(shù)資格,獲得獎勵次數(shù),獲得獎勵級別), 提取出來 4 個公因子, 分別是
44、學(xué)生社團經(jīng)歷、學(xué)習(xí)成績、計算機水平和獲得獎勵情況, 每一個指標(biāo)變量的共性方差均在0.50以上, 四個維度對原 11 個指標(biāo)的累計貢獻率達 71.09%, 解釋變異達到可以接受水平以上, 說明履歷數(shù)據(jù)量表的構(gòu)思效度是良好的。,效標(biāo)關(guān)聯(lián)效度( criterion-related validity)的驗證方法效標(biāo):檢驗測驗效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn)效標(biāo)效度,也稱為效標(biāo)關(guān)聯(lián)效度,也稱為實證效度驗證方法是指一個測量對處于
45、特定情境中的個體行為進行預(yù)測時的有效性例: 高考成績預(yù)測大學(xué)學(xué)習(xí)成績 通過能力傾向測量來預(yù)測工作成效分類:同時效度:測量分?jǐn)?shù)與效標(biāo)資料的取得約在同一時間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系數(shù)即為同時效度 目的:診斷現(xiàn)狀預(yù)測效度:測量分?jǐn)?shù)取得一段時間后才獲得效標(biāo)資料,計算這兩種資料間的相關(guān)系數(shù) 目的:預(yù)測某個個體將來的行為,效標(biāo)關(guān)聯(lián)效度的估計方法,相關(guān)法直接計算測量分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù)積差相關(guān)、等級相關(guān)
46、、二列相關(guān)等顯著差異法根據(jù)效標(biāo)測量將被測對象分為兩個極端組,檢驗這兩個組測量分?jǐn)?shù)是否具有統(tǒng)計學(xué)上的差異顯著性,例如,某運動隊通過選拔錄取了一批運動員,過一段時間后,根據(jù)運動成績將他們分成合格的與不合格的兩組,然后回過頭來檢查他們的測驗分?jǐn)?shù),運用t 檢驗看兩組在測驗上的平均分?jǐn)?shù)是否有顯著差異??偟恼f來,兩組平均分?jǐn)?shù)的差異在統(tǒng)計上顯著,并不保證測驗效度就高。然而,假如測驗分?jǐn)?shù)無法區(qū)分效標(biāo)定義組,則測驗效度肯定很低。,四、信度與效
47、度的關(guān)系,信度是效度的必要條件。即 (1)信度低,效度不可能高。如果搜集的資料不可信,不可靠,那么它肯定不可能有效地說明所調(diào)查的指標(biāo)。(2)信度高,效度未必高。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。 由于信度的評估遠較效度的評估容易,因此在研究報告中評估了測量信度的要比評估了測量效度的多。嚴(yán)格地說,測量的信度與效度必須經(jīng)過檢驗才能保證測量獲得信息的質(zhì)量。如果測量的信度與效度不高,就應(yīng)該設(shè)法改進測量工具。但這一改進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)清單、數(shù)據(jù)的排序與篩選
- 通過數(shù)據(jù)挖掘獲得客戶智能的應(yīng)用研究.pdf
- 大數(shù)據(jù)與數(shù)據(jù)挖掘
- 【行業(yè)資料下載】從數(shù)據(jù)分析獲得滿意結(jié)果——emea保險數(shù)據(jù)分析研究
- 市場獲得、產(chǎn)業(yè)集聚與地區(qū)差距——基于滬蘇浙皖地區(qū)的數(shù)據(jù).pdf
- 模擬數(shù)據(jù)與數(shù)字?jǐn)?shù)據(jù)的比較
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘中數(shù)據(jù)清洗的研究.pdf
- 基于ARM的數(shù)據(jù)監(jiān)測與數(shù)據(jù)融合.pdf
- 基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的圖書借閱管理數(shù)據(jù)研究.pdf
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘論文
- 數(shù)據(jù)挖掘的數(shù)據(jù)倉庫與olap技術(shù)
- 數(shù)據(jù)的力量——營銷數(shù)據(jù)分析與決策
- VTS數(shù)據(jù)交換與數(shù)據(jù)融合的研究.pdf
- 醫(yī)學(xué)信息數(shù)據(jù)庫的建立與數(shù)據(jù)挖掘
- 內(nèi)存數(shù)據(jù)庫的數(shù)據(jù)同步與切換.pdf
- 數(shù)據(jù)倉庫元數(shù)據(jù)的管理與實現(xiàn).pdf
- 合同數(shù)據(jù)庫的建立與數(shù)據(jù)分析
- 數(shù)據(jù)更新與簡單的數(shù)據(jù)查詢實驗答案
- 基于社交網(wǎng)絡(luò)的數(shù)據(jù)過濾與數(shù)據(jù)推送.pdf
- 數(shù)據(jù)資源描述與組織的元數(shù)據(jù)方法.pdf
評論
0/150
提交評論