數(shù)據(jù)與數(shù)據(jù)的獲得_第1頁(yè)
已閱讀1頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 數(shù)據(jù)與數(shù)據(jù)的獲得,《管理統(tǒng)計(jì)學(xué)》謝湘生廣東工業(yè)大學(xué)管理學(xué)院,2.1 總體、個(gè)體、特征與數(shù)據(jù),總體(Population or Universe)個(gè)體(Individual or Case)或成分(Elements)指標(biāo)或變量(Variable)指標(biāo)值(變量值)或數(shù)據(jù)(Data),2.2 數(shù)據(jù)類型 2.2.1 數(shù)據(jù)測(cè)度的分類,測(cè)度級(jí)(Scale)數(shù)據(jù)比率級(jí)(Ratio) 具有一定單位 0值非人為制定

2、 可以進(jìn)行加減乘除運(yùn)算間距級(jí)(interval) 具有一定單位 0值人為制定 可加減運(yùn)算,不能乘除運(yùn)算次序級(jí)(Ordinal)數(shù)據(jù) 用于區(qū)分對(duì)象的類別與次序名義級(jí)(Nominal)數(shù)據(jù) 用于區(qū)分對(duì)象的類別,2.2.2 不同類型數(shù)據(jù)的用途特點(diǎn),不同測(cè)度級(jí)別的數(shù)據(jù),應(yīng)用范圍不同。等級(jí)越高,應(yīng)用范圍越廣泛;等級(jí)越低應(yīng)用范圍越受限。一般來(lái)說(shuō),等級(jí)高的數(shù)據(jù)可以兼有等級(jí)低的數(shù)據(jù)的功能;而等級(jí)低的

3、數(shù)據(jù),不能兼有等級(jí)高的數(shù)據(jù)的功能。名義級(jí)的數(shù)據(jù),通常是樣本分類(分組)的依據(jù)。,2.2.3 觀察數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù),,數(shù)據(jù),來(lái)源,,,直接來(lái)源,,,間接來(lái)源,,,試驗(yàn),,,出版物,(或者網(wǎng)上),,,,,,,,,,,問(wèn)卷調(diào)查,,,觀察,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,間接來(lái)源(二手?jǐn)?shù)據(jù)),每天翻開(kāi)報(bào)紙或打開(kāi)電視,就可以看到各種數(shù)據(jù)。比如高速公路通車(chē)?yán)锍?、物價(jià)指數(shù)、股票

4、行情、外匯牌價(jià)、犯罪率、房?jī)r(jià)、流行病的有關(guān)數(shù)據(jù)(確診病例、疑似病例、死亡人數(shù)和出院人數(shù)等等);當(dāng)然還有國(guó)家統(tǒng)計(jì)局定期發(fā)布的各種國(guó)家經(jīng)濟(jì)數(shù)據(jù)、海關(guān)發(fā)布的進(jìn)出口貿(mào)易數(shù)據(jù)等等。從中可以選取對(duì)自己有用的信息。這些間接得到的數(shù)據(jù)都是二手?jǐn)?shù)據(jù)。,直接來(lái)源(第一手?jǐn)?shù)據(jù)),獲得第一手?jǐn)?shù)據(jù)并不象得到二手?jǐn)?shù)據(jù)那么輕松。某些在華的外資企業(yè)每年至少要花三四千萬(wàn)元來(lái)收集和分析數(shù)據(jù)。他們調(diào)查其產(chǎn)品目前在市場(chǎng)中的狀況和地位并確定其競(jìng)爭(zhēng)對(duì)手的態(tài)勢(shì);他們調(diào)查不同

5、地區(qū),不同階層的民眾對(duì)其產(chǎn)品的認(rèn)知程度和購(gòu)買(mǎi)意愿以改進(jìn)產(chǎn)品或推出新品種爭(zhēng)取新顧客;他們還收集各地方的經(jīng)濟(jì)交通等信息以決定如何保住現(xiàn)有市場(chǎng)和開(kāi)發(fā)新市場(chǎng)。市場(chǎng)信息數(shù)據(jù)對(duì)企業(yè)是至關(guān)重要的。他們很舍得在這方面花錢(qián)。因?yàn)檫@是企業(yè)生存所必需的,絕不是可有可無(wú)的。,觀察數(shù)據(jù):在獲得數(shù)據(jù)的過(guò)程中,不對(duì)被調(diào)查數(shù)據(jù)產(chǎn)生的條件施加任何控制所得到的數(shù)據(jù)。觀察數(shù)據(jù)通常是(但不一定是)眾多因素共同作用的結(jié)果。實(shí)驗(yàn)數(shù)據(jù):在獲得數(shù)據(jù)的過(guò)程中,對(duì)被調(diào)查數(shù)據(jù)產(chǎn)生的條

6、件實(shí)施了控制而得到的數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)通常是(但不一定是)單一因素作用的結(jié)果。,數(shù)據(jù)產(chǎn)生過(guò)程,,觀察數(shù)據(jù),數(shù)據(jù)產(chǎn)生過(guò)程,,,實(shí)驗(yàn)數(shù)據(jù),,,,2.3獲得數(shù)據(jù)的調(diào)查方法 與問(wèn)卷設(shè)計(jì),獲得數(shù)據(jù)的方法,,調(diào)查方法,實(shí)驗(yàn)方法,,普查方法,抽樣調(diào)查方法,普查(Census):調(diào)查有限總體中每個(gè)個(gè)體的有關(guān)指標(biāo)值抽樣調(diào)查(Sampling):在總體中抽取部分個(gè)體進(jìn)行調(diào)查,從所了解的局部數(shù)據(jù)來(lái)了解總體情況樣本(Sample)集合:總體中部分個(gè)

7、體所組成的集合,觀察方法,與普查的方法比較,抽樣調(diào)查方法具有如下的意義,抽樣調(diào)查的成本要低得多(經(jīng)濟(jì)性強(qiáng))抽樣調(diào)查所用的時(shí)間要少得多(時(shí)效性高)在收集個(gè)體的信息方面,抽樣調(diào)查可以更為詳盡(深入性與廣泛性強(qiáng))在收集個(gè)體的信息方面,抽樣調(diào)查可以做得更加準(zhǔn)確(準(zhǔn)確性高) 調(diào)查具有破壞性,,隨機(jī)抽樣(Random Sampling)或概率抽樣(Probability Sampling):按一定隨機(jī)規(guī)則(一定概率分配),從總體中抽取部分個(gè)

8、體。簡(jiǎn)單隨機(jī)抽樣(Simple Random Sampling):在隨機(jī)抽樣的過(guò)程中,每個(gè)個(gè)體抽到的機(jī)會(huì)(概率)相等。,抽樣方法(Methods of Sampling),以廣州交通問(wèn)題的調(diào)查為例,在簡(jiǎn)單隨機(jī)抽樣的情況下,如果樣本容量(sample size,也就是樣本中個(gè)體的數(shù)目)在總體中的比例為1/5000,那么,無(wú)論在越秀區(qū)或者在從化區(qū),無(wú)論在白領(lǐng)階層還是外來(lái)民工被問(wèn)到的人的比例都應(yīng)該大體是1/5000。,非隨機(jī)抽樣或判斷性抽樣

9、(Judgment Sampling):依據(jù)對(duì)個(gè)體或總體特征的判斷,從總體中抽取個(gè)體的做法。 典型調(diào)查:指在分析總體特征的基礎(chǔ)上,有意識(shí)地選擇具有代表性的個(gè)體,做深入細(xì)致的調(diào)查。這里的“代表性”是主觀判斷得到的。 方便抽樣:指在難以獲得隨機(jī)樣本的情形,所采取的利用現(xiàn)有條件獲得盡可能具有代表性的個(gè)體的抽樣方式。,還以廣州的交通問(wèn)題的調(diào)查為例。假定按照隨機(jī)選出的電話號(hào)碼進(jìn)行調(diào)查。這樣肯定節(jié)省時(shí)間和資源,但這樣得到的就不是一

10、個(gè)隨機(jī)樣本了。如果按照隨機(jī)選擇的數(shù)字(無(wú)論號(hào)碼本上有沒(méi)有)打電話,那很多電話是空號(hào)或單位電話;顯然這種樣本也不是隨機(jī)樣本,它稱為方便樣本(convenience sample)。,常用的綜合抽樣方法,分層(分類)抽樣:按照總體中個(gè)體的某特征,把總體中的個(gè)體分為若干群(類);然后,對(duì)各個(gè)群中的個(gè)體進(jìn)行簡(jiǎn)單隨機(jī)抽樣。分層抽樣要求層之間的差異大于層的內(nèi)部個(gè)體的差異。不同群體所抽取的個(gè)體個(gè)數(shù),一般有三種方法確定等數(shù)分配法:對(duì)每一類分配同樣

11、的個(gè)體數(shù)等比分配法:讓每一類抽得的個(gè)體數(shù)與該類總體個(gè)數(shù)的比,都相等最優(yōu)分配法(方差分配法):從各類抽得的樣本數(shù)ni與所要抽得的總樣本數(shù)n之比,等于該類的方差與各類方差和之比,即,常用的綜合抽樣方法(續(xù)),整群抽樣:將總體中的各個(gè)個(gè)體,按照某一標(biāo)志量分為若干群,然后以群為單位,對(duì)群進(jìn)行(簡(jiǎn)單)隨機(jī)抽樣,接著對(duì)抽出來(lái)的群進(jìn)行普查。要求群與群之間具有相似性。等距抽樣:是按某一標(biāo)志量,將總體中的個(gè)體排序,然后按一定的間隔,抽取個(gè)體多階段

12、抽樣:根據(jù)總體的層次結(jié)構(gòu)特征,分層次(階段)進(jìn)行(簡(jiǎn)單)隨機(jī)抽樣。,在決定所抽取的群體個(gè)數(shù)時(shí),常常需要考慮經(jīng)費(fèi)的限制,必須清楚抽樣的目的,抽取樣本往往是希望基于樣本得到的結(jié)論能適用于該樣本所屬的總體所以首先要求了解樣本是否確實(shí)來(lái)源于所關(guān)注的總體其次清楚樣本是否具有好的代表性.,2.3.2數(shù)據(jù)調(diào)查中的若干重要問(wèn)題,作為自學(xué)材料,請(qǐng)課后認(rèn)真學(xué)習(xí)補(bǔ)充獲得敏感問(wèn)題誠(chéng)實(shí)回答的統(tǒng)計(jì)方法(見(jiàn)《政治及有關(guān)模型》),對(duì)于調(diào)查中一些敏感問(wèn)題,按通常的

13、方法可能難以得到得到誠(chéng)實(shí)的回答。教材中介紹了若干通過(guò)適當(dāng)?shù)卦O(shè)立問(wèn)題來(lái)獲得誠(chéng)實(shí)回答的方法。作為補(bǔ)充這里介紹一種結(jié)合問(wèn)題的設(shè)立與提問(wèn)方式,利用統(tǒng)計(jì)計(jì)算來(lái)得到問(wèn)題的誠(chéng)實(shí)回答的方法。,例如要調(diào)查了解某班學(xué)生期末考試某門(mén)課程作弊學(xué)生的比例。顯然不能指望直接提問(wèn)學(xué)生獲得誠(chéng)實(shí)的回答。但可以通過(guò)如下方式得到相對(duì)真實(shí)的答案。,1 設(shè)立問(wèn)題:,A 你考試作弊了嗎? B 你是廣東的考生嗎?,2 制作與抽取學(xué)生人數(shù)相等的簽,其中有記號(hào)A的比例為p,其

14、余有記號(hào)B。,3 每個(gè)抽到的學(xué)生隨機(jī)地抽取一個(gè)簽(只有本人知道抽得的是A還是B),然后按抽得的記號(hào)回答“是”或“否”。,4 若μ是回答“是”的學(xué)生的比例,則利用概率的性質(zhì)應(yīng)有,其中πA , πB分別是問(wèn)題A,B回答“是”的比例。于是我們可以估計(jì)出該課程作弊的學(xué)生的比例為:,注:?jiǎn)栴}B應(yīng)該是一個(gè)不敏感的問(wèn)題,并且它的概率是已知或事先已經(jīng)估計(jì)出來(lái)的。,調(diào)查方案設(shè)計(jì),調(diào)查方案是指導(dǎo)整個(gè)調(diào)查過(guò)程的綱領(lǐng)性文件,大體包括調(diào)查目的、調(diào)查對(duì)象、調(diào)查項(xiàng)目

15、和調(diào)查表等內(nèi)容。 1、調(diào)查目的:回答“為什么調(diào)查”; 2、調(diào)查對(duì)象:回答“向誰(shuí)調(diào)查”; 3、調(diào)查項(xiàng)目和調(diào)查表:回答“調(diào)查什么” 4、其他內(nèi)容:明確調(diào)查所采用的方法、調(diào)查時(shí)間、調(diào)查組織和實(shí)施的細(xì)節(jié),2.3.2 問(wèn)卷與問(wèn)卷設(shè)計(jì),一、 問(wèn)卷與問(wèn)卷的組成,1 問(wèn)卷與問(wèn)卷設(shè)計(jì)的重要地位問(wèn)卷是管理學(xué)科調(diào)查收集一手?jǐn)?shù)據(jù)的最重要的工具之一。一項(xiàng)以一手?jǐn)?shù)據(jù)為基礎(chǔ)的研究項(xiàng)目,其深度本質(zhì)上由問(wèn)卷的深度決定。

16、問(wèn)卷設(shè)計(jì)時(shí)沒(méi)有想到的問(wèn)題,在問(wèn)卷調(diào)查完后再想研究,就不大可能了。,問(wèn)卷設(shè)計(jì)步驟,,,,,,,,,,確定調(diào)查目的、來(lái)源與限制因素等,確定數(shù)據(jù)收集方法,評(píng)估內(nèi)容與編排,確定問(wèn)卷流程和編排,決定問(wèn)題的用詞,確定問(wèn)題形式,獲得各方面的認(rèn)同,預(yù)調(diào)查與修訂,準(zhǔn)備最后印刷,實(shí)施,,2 構(gòu)成問(wèn)卷的問(wèn)題類型1)開(kāi)放型問(wèn)題與封閉型問(wèn)題根據(jù)事先是否準(zhǔn)備好了問(wèn)題的答案可將問(wèn)題分為:開(kāi)放型問(wèn)題與封閉型問(wèn)題。開(kāi)放型問(wèn)題:沒(méi)有事先準(zhǔn)備的答案,通常在問(wèn)

17、卷形成階段使用,在最終問(wèn)卷中應(yīng)慎用。封閉型問(wèn)題:事先準(zhǔn)備了答案,應(yīng)答者只能在事先準(zhǔn)備的答案中選擇。封閉型問(wèn)題的數(shù)據(jù)轉(zhuǎn)化工作量,大為減少。,2)回憶型問(wèn)題與非回憶型問(wèn)題回憶型問(wèn)題要求應(yīng)答者把自己的有關(guān)記憶表達(dá)出來(lái)。它可以是開(kāi)放型的,沒(méi)有備選答案。也可以是封閉型的。有些回憶型問(wèn)題需要查記錄可能才能回答。例如,貴公司去年的利潤(rùn)有多少?但是如果將它轉(zhuǎn)化為封閉型問(wèn)題:“貴公司去年的利潤(rùn)屬于以下哪個(gè)區(qū)間?”(接下來(lái)列出所有可能的區(qū)間),問(wèn)題的

18、回答將得到極大簡(jiǎn)化。,3)封閉型問(wèn)題中的單選問(wèn)題與多選問(wèn)題單選問(wèn)題是指應(yīng)答者只能在備選答案中選擇一個(gè)的問(wèn)題。單選問(wèn)題中的備選答案之間必須是互斥的。多選問(wèn)題是指應(yīng)答者能夠在備選答案中選擇多個(gè)答案的問(wèn)題。多選問(wèn)題的備選答案是相容的。,4)單選問(wèn)題中的排序型和非排序型(1)排序問(wèn)題 排序問(wèn)題本質(zhì)上是單選問(wèn)題,要求對(duì)兩個(gè)以上的對(duì)象排序。例如對(duì)重要性排序:你認(rèn)為在企業(yè)合并中如下三個(gè)因素,哪個(gè)最重要:企業(yè)文化的近似性,B. 企業(yè)技術(shù)的互補(bǔ)

19、性,C. 市場(chǎng)的互補(bǔ)性顯然要求排序的對(duì)象越多,排序的難度就越大。,(2)單選中的非排序問(wèn)題。顯然,單選問(wèn)題不一定是排序問(wèn)題。但是排序問(wèn)題可以轉(zhuǎn)化為如下的非排序的單選問(wèn)題:請(qǐng)對(duì)企業(yè)合并中企業(yè)文化的近似性、技術(shù)的互補(bǔ)性、市場(chǎng)的互補(bǔ)性三個(gè)要素的重要地位打分:,依據(jù)眾多的應(yīng)答者對(duì)上述問(wèn)題的評(píng)分,計(jì)算出每個(gè)要素的平均分之后,就可以根據(jù)平均分值的大小,對(duì)三個(gè)要素的重要性排序。需要注意的是,這樣做的前提是各要素的平均分間存在顯著差異(顯著差異的

20、概念見(jiàn)第6章)。,構(gòu)成問(wèn)卷的問(wèn)題類別一覽,3. 問(wèn)卷中的一些常用量表,1)量表的概念量表是測(cè)量應(yīng)答者對(duì)某個(gè)問(wèn)題(特別是復(fù)合型的問(wèn)題)的反應(yīng)強(qiáng)度(或態(tài)度、看法)的工具。它是構(gòu)成問(wèn)卷的最主要成分之一。把單選問(wèn)題的備選答案量化,就得到單問(wèn)題量表。例如:你認(rèn)為企業(yè)文化差異對(duì)企業(yè)合并的影響是:,這就是一個(gè)單項(xiàng)量表。單項(xiàng)在這里是指該量表僅僅反應(yīng)了應(yīng)答者對(duì)一個(gè)問(wèn)題的態(tài)度。,2)連續(xù)評(píng)分量表上述量表的評(píng)分刻度僅從1到5,如果采用0到100的刻度

21、,則稱為連續(xù)評(píng)分量表。,3)分項(xiàng)評(píng)分量表:Likert量表如果量表涉及多個(gè)關(guān)聯(lián)的單選問(wèn)題,就稱為分項(xiàng)評(píng)分量表(Itemized Rating Scale)。分項(xiàng)評(píng)分量表中的多個(gè)單選問(wèn)題必須有關(guān)聯(lián),是某個(gè)總項(xiàng)(上一層的變量)的一個(gè)分解。下表給出了一個(gè)分項(xiàng)量表的例子。,高校合并問(wèn)題的一個(gè)分項(xiàng)評(píng)分量表,這種分項(xiàng)評(píng)分量表由于由美國(guó)社會(huì)心理學(xué)家R. A. Likert于1932年提出而稱為L(zhǎng)ikert量表。Likert量表的度量級(jí)別:通常是5級(jí)

22、,但不一定是5級(jí),在應(yīng)用中7級(jí),9級(jí)均可;但通常不低于5級(jí),不高于9級(jí)。這與感覺(jué)辨析能力有關(guān)。,Likert量表的關(guān)鍵特點(diǎn)是:所有分項(xiàng)共同構(gòu)成一個(gè)總項(xiàng),分項(xiàng)的得分加總后,就得到總項(xiàng)的得分。所以Likert量表又稱為加總量表(或求和量表)。,4)比較型量表與排序量表量表又可分為比較型和非比較型。前面給出例子中的量表是非比較型量表。下面給出一個(gè)比較型量表的例子。,影響學(xué)校文化差異的主要因素的一個(gè)兩兩比較量表,請(qǐng)兩兩對(duì)比,如果i比j重要,則

23、在(i, j)的位置填入數(shù)字1,否則填入數(shù)字0。,這樣的比較量表也稱為兩兩比較量表或配對(duì)比較量表(Paired Comparison Scaling)。,在上述調(diào)查中,如果不明顯地列出兩兩依次對(duì)比的表格,僅僅要求對(duì)5個(gè)被比較對(duì)象對(duì)形成學(xué)校文化差異的重要性排序,就是所謂的等級(jí)順序量表(Rank-order Scaling)了。相應(yīng)于上述問(wèn)題的等級(jí)順序量表為:,等級(jí)順序量表的一個(gè)示例,請(qǐng)給出如下5個(gè)要素對(duì)形成學(xué)校文化差異的重要性順序:,進(jìn)一

24、步閱讀:弗洛德 J. 福勒,Jr 《調(diào)查研究方法》重慶大學(xué)出版社 2004年 10月版,獲得數(shù)據(jù)的信度與效度的基本概念,一、測(cè)量誤差問(wèn)卷是獲取數(shù)據(jù)的工具。進(jìn)一步說(shuō),問(wèn)卷是用來(lái)測(cè)量被研究對(duì)象的有關(guān)特征(變量)處于什么數(shù)值狀態(tài)的。無(wú)論是用問(wèn)卷來(lái)測(cè)量變量值(由被研究對(duì)象自己來(lái)表述),還是由研究者來(lái)觀察變量值,都可能出現(xiàn)誤差。這就是測(cè)量誤差。,測(cè)量誤差由系統(tǒng)誤差(系統(tǒng)偏誤)和隨機(jī)誤差構(gòu)成。其中系統(tǒng)誤差表現(xiàn)由測(cè)量工具的偏誤所導(dǎo)致;而隨機(jī)誤差則是

25、由眾多隨機(jī)因素導(dǎo)致的。,如果記測(cè)量到的變量值為X,變量的真值為T(mén),系統(tǒng)偏誤為S,隨機(jī)誤差為R,則,X = T + S + R,二、測(cè)量的信度,1. 測(cè)量的信度(Reliability)的定義,測(cè)量的信度是指測(cè)量結(jié)果的穩(wěn)定性或一致性。當(dāng)然這里是指對(duì)一個(gè)變量重復(fù)測(cè)量時(shí)表現(xiàn)出來(lái)的性質(zhì)(一致性、穩(wěn)定性或不變性)。,在用三個(gè)要素T,S,R來(lái)表述變量X的測(cè)量值,即X=T+S+R時(shí),只有隨機(jī)變量R會(huì)影響測(cè)量的一致性。如果R=0,多次測(cè)量一個(gè)結(jié)果都是不

26、變的,那么這個(gè)測(cè)量結(jié)果是完全可信的。反之如果第一次測(cè)量與第二次測(cè)量的結(jié)果差異大,那么你會(huì)感到測(cè)量的結(jié)果不可靠,也就是可信度低。,測(cè)量信度是對(duì)測(cè)量工具及其操作的整體質(zhì)量的一種量度,是測(cè)驗(yàn)性能的重要質(zhì)量指標(biāo)。信度高是良好測(cè)驗(yàn)的必要條件,但不是充分條件。一個(gè)測(cè)驗(yàn)只具有可靠性還不行,還必須具備有效性。,靶形圖說(shuō)明穩(wěn)定性和準(zhǔn)確性的關(guān)系:水平發(fā)揮不但要穩(wěn)定還要打得準(zhǔn),2. 重測(cè)信度(Test-retest Reliability),既然信度是測(cè)量

27、的可靠性(重復(fù)測(cè)量的穩(wěn)定性或一致性),檢查信度的一個(gè)簡(jiǎn)單方法就是重新測(cè)量一次,看看兩次測(cè)量結(jié)果之間的關(guān)系。重測(cè)信度,就是在盡可能相同的條件下測(cè)量?jī)纱危脙纱螠y(cè)量的相關(guān)程度來(lái)表示信度。其大小等于同一組應(yīng)答者在兩次測(cè)量上所得分?jǐn)?shù)的相關(guān)系數(shù)(相關(guān)系數(shù)見(jiàn)第9章)。,在測(cè)量涉及心理判斷過(guò)程(問(wèn)卷調(diào)查的多數(shù)問(wèn)題涉及這一過(guò)程)時(shí),使用重測(cè)信度來(lái)檢驗(yàn)測(cè)量的可靠性,有個(gè)前提,第一次測(cè)量應(yīng)當(dāng)對(duì)第二次測(cè)量沒(méi)有影響。所以一般要間隔20~30天再做第二次測(cè)量,計(jì)

28、算測(cè)量的重測(cè)信度才相對(duì)可靠些。當(dāng)然間隔時(shí)間太長(zhǎng)也不好,一些外在的因素也可能會(huì)影響測(cè)量結(jié)果。,間隔多久恰當(dāng)呢?無(wú)固定標(biāo)準(zhǔn),一般來(lái)說(shuō),在間隔時(shí)間內(nèi),被試的遺忘和練習(xí)的效果基本上相互抵消,即為適度的時(shí)間間隔。*適用于速度測(cè)量而不適應(yīng)于難度測(cè)量的信度估計(jì)。*重測(cè)信度檢驗(yàn)測(cè)量跨時(shí)間的穩(wěn)定性。*注意提高被試的積極性。,3. 復(fù)本信度(Alternate-form Reliability or Equivalent Form Reliabil

29、ity) 有些測(cè)量不適合施測(cè)兩次,這時(shí)我們可以編制兩份等值但并不相同的量表對(duì)被測(cè)對(duì)象施測(cè)(其時(shí)距盡量短,可短到兩次測(cè)驗(yàn)接著進(jìn)行),兩個(gè)平行測(cè)量來(lái)檢測(cè)同一批被試所得結(jié)果的一致性程度稱為復(fù)本信度,其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。 所謂測(cè)量的等值(或平行)是指: & 問(wèn)卷(量表)題型、題數(shù)、難度、指導(dǎo)語(yǔ)說(shuō)明、施測(cè)要求等方面都相當(dāng) & 用來(lái)測(cè)量相同潛

30、在特質(zhì)或?qū)傩?& 量表問(wèn)題不相同。 兩種方式:同一時(shí)間連續(xù)施測(cè);間隔一段較短的時(shí)間后施測(cè)。,幾點(diǎn)說(shuō)明:,在實(shí)際操作中,為了抵消順序效應(yīng),可以使半數(shù)被試先做 A本再做B本,使另一半被試先做B本再做A本;兩次測(cè)量的時(shí)距應(yīng)盡可能短;由于復(fù)本在許多方面相似,所以信度系數(shù)有稍微偏高的傾向;注意被試的厭倦心理對(duì)測(cè)驗(yàn)產(chǎn)生的影響; ※ 適用于難度測(cè)量,也適用于速度測(cè)量的信度估計(jì)。 ※ 構(gòu)造兩份

31、真正的平行測(cè)驗(yàn)很難!如果平行不能保證,則結(jié)論無(wú)價(jià)值。,4. 內(nèi)部一致性信度(Internal Consistent Reliability or Inter-item Reliability),重測(cè)信度和復(fù)本信度在使用的方法上分別屬于跨時(shí)間和跨類型的,實(shí)際操作中存在困難,均需測(cè)量?jī)纱?,?fù)本不易做到等值,很難用同一測(cè)驗(yàn)對(duì)同一組被試重復(fù)進(jìn)行測(cè)驗(yàn)等,于是引入內(nèi)部一致性信度來(lái)計(jì)算測(cè)驗(yàn)的信度。內(nèi)部一致性信度 也叫同質(zhì)性信度,是指測(cè)量?jī)?nèi)

32、部所有題項(xiàng)間的一致性程度。題項(xiàng)間的一致性含有兩層意思:其一是指所有題項(xiàng)測(cè)的是同一種心理特質(zhì);其二是指所有題項(xiàng)得分之間都具有較高的正相關(guān)。 同質(zhì)性信度基于的假設(shè)是:當(dāng)一個(gè)測(cè)量具有較高的同質(zhì)性信度時(shí),說(shuō)明測(cè)項(xiàng)主要測(cè)的是某一單個(gè)心理特質(zhì),由于眾多的題項(xiàng)測(cè)試了同一心理特質(zhì),那么實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映。 估計(jì)同質(zhì)性信度的方法主要有:分半信度、庫(kù)德-理查遜信度、克龍巴赫α系數(shù)、荷伊特信度。,估計(jì)內(nèi)部一致性信度的方法之一

33、:折半信度(分半信度),折半信度 指的是將一個(gè)測(cè)量中的問(wèn)題分成對(duì)等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。 計(jì)算不難,把對(duì)等的兩半測(cè)驗(yàn)看成是在最短時(shí)間距離內(nèi)施測(cè)的兩個(gè)平行測(cè)驗(yàn)。難的是,如何將測(cè)驗(yàn)分成相等的兩半。 按題號(hào)的奇偶分半、按題目的 難易程度分半、按題目的內(nèi)容分半等等。 實(shí)際應(yīng)用中,由于題目一般依據(jù)難度大小排列,采用奇偶分半可使兩半測(cè)驗(yàn)的題目在難度上基本相等,因此常被采納。

34、 如果一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半,則不宜使用分半信度。,5. 評(píng)價(jià)者信度(Inter-observer Reliability)含義:指多個(gè)評(píng)價(jià)者對(duì)某些人、事、物進(jìn)行評(píng)價(jià)的一致性程度。 其基本思想是:如果測(cè)量工具本身較為規(guī)范,則(水平高,沒(méi)有偏見(jiàn)的)不同評(píng)價(jià)者的評(píng)價(jià)結(jié)果應(yīng)該不應(yīng)相差很大。當(dāng)評(píng)價(jià)非常復(fù)雜時(shí),評(píng)估評(píng)價(jià)者信度是非常重要的。評(píng)價(jià)者信度的計(jì)算 當(dāng)評(píng)價(jià)者人數(shù)為兩人時(shí),評(píng)價(jià)者信度等于兩個(gè)評(píng)價(jià)者給同一批被試對(duì)象所評(píng)分?jǐn)?shù)

35、的相關(guān)系數(shù),依據(jù)數(shù)據(jù)形式,采用不同的相關(guān)系數(shù)計(jì)算方法。當(dāng)評(píng)分者人數(shù)多于兩人時(shí),評(píng)分者信度可用肯德?tīng)柡椭C系數(shù)進(jìn)行估計(jì)。注意:如果各個(gè)評(píng)價(jià)者的評(píng)價(jià)寬嚴(yán)程度保持一致,則評(píng)價(jià)者的評(píng)價(jià)尺度變化不會(huì)對(duì)評(píng)價(jià)者信度產(chǎn)生影響。,三、測(cè)量的效度,1. 效度的概念測(cè)量的有效程度一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)量的特性或功能的程度任何測(cè)量都存在效度的問(wèn)題效度是針對(duì)一定測(cè)量目的而言的效度是針對(duì)測(cè)量結(jié)果而言的效度只有程度上的差異評(píng)價(jià)一個(gè)測(cè)量是否

36、有效要多角度、多方面地收集證據(jù),效度是指:一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)量的特性或功能的程度記為:效度的統(tǒng)計(jì)定義設(shè) X=T+S+R有則:,2. 效度的類別,測(cè)量題目樣本對(duì)于應(yīng)測(cè)內(nèi)容與行為領(lǐng)域的代表性程度。側(cè)重于測(cè)量題目取樣的代表性,考查這些題目對(duì)所欲測(cè)量的內(nèi)容和行為反應(yīng)測(cè)量的有效程度,結(jié)構(gòu):心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì)側(cè)重于一個(gè)測(cè)量能夠量測(cè)到心理學(xué)或社會(huì)學(xué)的抽象概念或特質(zhì)的程度,效標(biāo):檢驗(yàn)測(cè)量效度的參照標(biāo)準(zhǔn)

37、,實(shí)際上是本測(cè)量所想量測(cè)或要預(yù)測(cè)的特性或功能測(cè)量分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測(cè)量結(jié)果之間的一致性程度,內(nèi)容效度( content validity)的概念內(nèi)容效度:測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)量的特性、功能等的代表性程度。也就是說(shuō):一個(gè)測(cè)量要具備較好的內(nèi)容效度必須滿足兩個(gè)條件:一是確定好內(nèi)容范圍,并使測(cè)量的全部項(xiàng)目均在此范圍內(nèi)。二是測(cè)量項(xiàng)目應(yīng)是已界定的內(nèi)容范圍的代表性樣本。換句話說(shuō),就是選出的項(xiàng)目能包含所測(cè)的內(nèi)容范圍的主要方面,并且使各部分項(xiàng)目所

38、占比例適當(dāng)。,內(nèi)容效度的常用驗(yàn)證方法邏輯分析法(定性的方法)依靠有關(guān)專家對(duì)測(cè)驗(yàn)題目與應(yīng)測(cè)內(nèi)容范圍的吻合程度作出判斷量化分析方法將專家的判斷綜合為一個(gè)內(nèi)容效度系數(shù)的統(tǒng)計(jì)方法專家在仔細(xì)審閱測(cè)驗(yàn)?zāi)繕?biāo)的基礎(chǔ)上,獨(dú)立地對(duì)測(cè)驗(yàn)每個(gè)題目作出判斷:該題目實(shí)際測(cè)到的內(nèi)容與其欲測(cè)量的目標(biāo)內(nèi)容之間相關(guān)程度如何,表面效度表面效度:測(cè)量在表面上使被測(cè)對(duì)象直覺(jué)感到的有效程度。一個(gè)測(cè)量使被測(cè)對(duì)象從表面上看來(lái),它能夠測(cè)量出它所欲測(cè)的屬性,則認(rèn)為該測(cè)驗(yàn)具有

39、表面效度內(nèi)容效度與表面效度的關(guān)系:經(jīng)常混淆。表面效度是由非專業(yè)人士對(duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來(lái)好像是所要測(cè)的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)建立的。雖然二者都是根據(jù)測(cè)驗(yàn)內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮題目與測(cè)量目的之間的明顯的、直接的關(guān)系,后者則考慮到題目與測(cè)量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。如果測(cè)驗(yàn)內(nèi)容看起來(lái)與測(cè)量目標(biāo)和要作的決定不

40、相干,就會(huì)使被試產(chǎn)生不配合、馬馬馬乎乎、應(yīng)付了事等反應(yīng),而影響測(cè)驗(yàn)的效度。相反,典型行為測(cè)驗(yàn)卻要求較低的表面效度。如果被試很容易從測(cè)驗(yàn)題目看出測(cè)驗(yàn)的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。,結(jié)構(gòu)效度(construct validity)的概念檢驗(yàn)對(duì)于人的假設(shè)屬性或理論概念測(cè)量到的程度這些假設(shè)屬性或理論概念是決定人們外部行為的內(nèi)隱或潛在的特性但這種特性不能予以操作性的定義,它所支配的行為也不能直接觀察到,比如:中學(xué)生數(shù)學(xué)能力的研

41、究數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、運(yùn)算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。編制測(cè)驗(yàn)題,進(jìn)行測(cè)驗(yàn)并收集測(cè)驗(yàn)結(jié)果分析測(cè)驗(yàn)結(jié)果,考查測(cè)試的結(jié)構(gòu)效度,考查測(cè)驗(yàn)結(jié)果是否支持理論構(gòu)想,結(jié)構(gòu)效度的建立過(guò)程① 對(duì)所欲測(cè)量的屬性根據(jù)某種理論提出假定的結(jié)構(gòu)② 根據(jù)假定的結(jié)構(gòu)擬定測(cè)量問(wèn)題,編制量表③ 尋求測(cè)量分?jǐn)?shù)與其它評(píng)定之間的關(guān)系④ 以檢驗(yàn)結(jié)果為根據(jù)來(lái)驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立,驗(yàn)

42、證的方法可以從差異性上尋求證據(jù)⑤ 將與假設(shè)結(jié)構(gòu)相違背的問(wèn)題題刪去,對(duì)測(cè)量進(jìn)行修改之后,再重新實(shí)施第③和第④個(gè)步驟,調(diào)查問(wèn)卷中的問(wèn)題是調(diào)查者預(yù)先設(shè)計(jì)的,并且人為地歸結(jié)成幾個(gè)模塊,這稱為設(shè)計(jì)結(jié)構(gòu)。而問(wèn)卷調(diào)查的實(shí)際結(jié)果本身具有一定的潛結(jié)構(gòu),也就是說(shuō),可以通過(guò)數(shù)學(xué)方法,依據(jù)調(diào)查問(wèn)卷結(jié)果,將原始問(wèn)題歸納成幾個(gè)模塊,形成統(tǒng)計(jì)結(jié)構(gòu)。統(tǒng)計(jì)結(jié)構(gòu)與設(shè)計(jì)結(jié)構(gòu)吻合的好壞就表明了調(diào)查問(wèn)卷的結(jié)構(gòu)效度。,例如嚴(yán)進(jìn)等人在“履歷數(shù)據(jù)測(cè)評(píng)的效度分析”(心理學(xué)報(bào),vol

43、. 42, no. 3, 423-433,2010)一文中將基本資料、高考成績(jī)、在校成績(jī)、計(jì)算機(jī)操作水平、獲得的獎(jiǎng)勵(lì)情況、學(xué)生社團(tuán)工作經(jīng)歷作為履歷分析半結(jié)構(gòu)化問(wèn)卷的維度。利用因子分析方法,對(duì) 履歷數(shù)據(jù)中的11 個(gè)轉(zhuǎn)換后的指標(biāo)(學(xué)生社團(tuán)中工作內(nèi)容,學(xué)生社團(tuán)中職務(wù)高低,參加學(xué)生社團(tuán)次數(shù),累計(jì)學(xué)生社團(tuán)時(shí)間,學(xué)生社團(tuán)級(jí)別,在校成績(jī),高考成績(jī),計(jì)算機(jī)操作與應(yīng)用,計(jì)算機(jī)技術(shù)資格,獲得獎(jiǎng)勵(lì)次數(shù),獲得獎(jiǎng)勵(lì)級(jí)別), 提取出來(lái) 4 個(gè)公因子, 分別是

44、學(xué)生社團(tuán)經(jīng)歷、學(xué)習(xí)成績(jī)、計(jì)算機(jī)水平和獲得獎(jiǎng)勵(lì)情況, 每一個(gè)指標(biāo)變量的共性方差均在0.50以上, 四個(gè)維度對(duì)原 11 個(gè)指標(biāo)的累計(jì)貢獻(xiàn)率達(dá) 71.09%, 解釋變異達(dá)到可以接受水平以上, 說(shuō)明履歷數(shù)據(jù)量表的構(gòu)思效度是良好的。,效標(biāo)關(guān)聯(lián)效度( criterion-related validity)的驗(yàn)證方法效標(biāo):檢驗(yàn)測(cè)驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn)效標(biāo)效度,也稱為效標(biāo)關(guān)聯(lián)效度,也稱為實(shí)證效度驗(yàn)證方法是指一個(gè)測(cè)量對(duì)處于

45、特定情境中的個(gè)體行為進(jìn)行預(yù)測(cè)時(shí)的有效性例: 高考成績(jī)預(yù)測(cè)大學(xué)學(xué)習(xí)成績(jī) 通過(guò)能力傾向測(cè)量來(lái)預(yù)測(cè)工作成效分類:同時(shí)效度:測(cè)量分?jǐn)?shù)與效標(biāo)資料的取得約在同一時(shí)間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系數(shù)即為同時(shí)效度 目的:診斷現(xiàn)狀預(yù)測(cè)效度:測(cè)量分?jǐn)?shù)取得一段時(shí)間后才獲得效標(biāo)資料,計(jì)算這兩種資料間的相關(guān)系數(shù) 目的:預(yù)測(cè)某個(gè)個(gè)體將來(lái)的行為,效標(biāo)關(guān)聯(lián)效度的估計(jì)方法,相關(guān)法直接計(jì)算測(cè)量分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù)積差相關(guān)、等級(jí)相關(guān)

46、、二列相關(guān)等顯著差異法根據(jù)效標(biāo)測(cè)量將被測(cè)對(duì)象分為兩個(gè)極端組,檢驗(yàn)這兩個(gè)組測(cè)量分?jǐn)?shù)是否具有統(tǒng)計(jì)學(xué)上的差異顯著性,例如,某運(yùn)動(dòng)隊(duì)通過(guò)選拔錄取了一批運(yùn)動(dòng)員,過(guò)一段時(shí)間后,根據(jù)運(yùn)動(dòng)成績(jī)將他們分成合格的與不合格的兩組,然后回過(guò)頭來(lái)檢查他們的測(cè)驗(yàn)分?jǐn)?shù),運(yùn)用t 檢驗(yàn)看兩組在測(cè)驗(yàn)上的平均分?jǐn)?shù)是否有顯著差異。總的說(shuō)來(lái),兩組平均分?jǐn)?shù)的差異在統(tǒng)計(jì)上顯著,并不保證測(cè)驗(yàn)效度就高。然而,假如測(cè)驗(yàn)分?jǐn)?shù)無(wú)法區(qū)分效標(biāo)定義組,則測(cè)驗(yàn)效度肯定很低。,四、信度與效

47、度的關(guān)系,信度是效度的必要條件。即 (1)信度低,效度不可能高。如果搜集的資料不可信,不可靠,那么它肯定不可能有效地說(shuō)明所調(diào)查的指標(biāo)。(2)信度高,效度未必高。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。 由于信度的評(píng)估遠(yuǎn)較效度的評(píng)估容易,因此在研究報(bào)告中評(píng)估了測(cè)量信度的要比評(píng)估了測(cè)量效度的多。嚴(yán)格地說(shuō),測(cè)量的信度與效度必須經(jīng)過(guò)檢驗(yàn)才能保證測(cè)量獲得信息的質(zhì)量。如果測(cè)量的信度與效度不高,就應(yīng)該設(shè)法改進(jìn)測(cè)量工具。但這一改進(jìn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論