版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、體育測(cè)量與評(píng)價(jià)的基礎(chǔ)理論,第一節(jié) 體育測(cè)量的基礎(chǔ)理論,體育測(cè)量是體育教學(xué)、運(yùn)動(dòng)訓(xùn)練和體育科研的重要基礎(chǔ)。只有實(shí)施科學(xué)的測(cè)量,才能獲得準(zhǔn)確而可靠的數(shù)據(jù),并通過(guò)分析和研究,得出科學(xué)的結(jié)論。,一、體育測(cè)量的基本概念,(一)測(cè)量體育測(cè)量具有廣泛的含義,不僅包括物理量的測(cè)量,如身高、體重、跳高高度、跳遠(yuǎn)長(zhǎng)度、血壓等,而且包括非物理量的測(cè)量,如技戰(zhàn)術(shù)水平、疲勞程度、心理素質(zhì)、身體素質(zhì)等。史蒂文斯曾說(shuō),廣義而言,測(cè)量是根據(jù)法則給事物賦予數(shù)量。也就
2、是說(shuō),用一定的法則給事物屬性指派數(shù)字或符號(hào)的過(guò)程即為測(cè)量。體育測(cè)量是指依照一定的法則,對(duì)體育領(lǐng)域中事物的屬性或特征賦予數(shù)量的過(guò)程。,(二)測(cè)驗(yàn) 為了某種測(cè)量目的所進(jìn)行的一系列測(cè)量構(gòu)成的系統(tǒng)稱(chēng)為測(cè)驗(yàn)。與測(cè)量相比,測(cè)驗(yàn)具有完整性,強(qiáng)調(diào)的是系統(tǒng)性,一次測(cè)量未必就完成了一次測(cè)驗(yàn),可能只是一次測(cè)驗(yàn)的一部分,當(dāng)然一次測(cè)驗(yàn)可能只要一次測(cè)量,也可能需要多次測(cè)量,取決于測(cè)驗(yàn)的設(shè)計(jì)。,(三)測(cè)量的要素,1.待測(cè)屬性或特征
3、測(cè)量的目的是通過(guò)測(cè)量值反映事物的屬性或特征,那么“待測(cè)事物的屬性或特征是什么?”,是首先必須明確的問(wèn)題,也是最重要的問(wèn)題,所以待測(cè)事物的屬性或特征是測(cè)量的第一要素。在體育實(shí)踐中,事物的屬性有些很簡(jiǎn)單、直觀(guān),而有些卻很復(fù)雜、抽象。,2.法則,待測(cè)屬性明確之后,接著任務(wù)是如何去測(cè)量該事物的屬性或特征,這就需要制定一套能有效衡量事物屬性的規(guī)則和尺度,或是能顯示事物屬性的程序,即測(cè)量法則。,3.數(shù)字符號(hào),測(cè)量是對(duì)事物的屬性或特征數(shù)量化的過(guò)程,測(cè)
4、量結(jié)果需要用數(shù)字符號(hào)來(lái)表示。,(四)測(cè)量量表,測(cè)量量表是指測(cè)量所獲得數(shù)據(jù)屬性的表述規(guī)則(反映表示測(cè)量結(jié)果的數(shù)字符號(hào)的性質(zhì)和類(lèi)型)。這個(gè)表述規(guī)則是由實(shí)數(shù)列的諸特性所決定的。即實(shí)數(shù)列的三種特性:順序、距離、原點(diǎn)。具體的說(shuō),兩個(gè)以上的實(shí)數(shù)有順序之分,兩個(gè)實(shí)數(shù)之間的差距可以用距離描述,原點(diǎn)是對(duì)應(yīng)于零位數(shù)的那一點(diǎn)。 一般地,根據(jù)量表中含有實(shí)數(shù)列特征的多少,我們將量表分為四類(lèi):,1.名稱(chēng)量表,名稱(chēng)量表,又稱(chēng)定類(lèi)量表或分類(lèi)量表。
5、名稱(chēng)量表實(shí)所有量表中最簡(jiǎn)單的一種,它只能依照某種法則給事物或?qū)傩灾概擅Q(chēng)或類(lèi)別。它不含實(shí)數(shù)列中的任何特征,量表中的數(shù)字只起著表示符的作用,用來(lái)區(qū)分和歸類(lèi)所研究的對(duì)象。如足球運(yùn)動(dòng)員的一個(gè)號(hào)碼……,2.有序量表,有序量表又稱(chēng)定序量表或順序量表。它含有實(shí)數(shù)列的第一特性――有序性。如比賽名次表中的第一名、第二名,第一要優(yōu)于第二等。但不能確定好多少,能力上的偏差也不能從名次上的差異來(lái)確切反映。,3.等距量表,等距量表亦稱(chēng)定距量表,它含有實(shí)數(shù)列的第
6、一和第二兩個(gè)特征,即有序和距離。能反映事物的屬性或特征的差異大小程度。不僅能回答“好壞”的問(wèn)題,還能回答“好多少”的問(wèn)題。但因?yàn)闆](méi)有絕對(duì)零點(diǎn),所以不能用于數(shù)值之間的倍率的比較。,4.比例量表,比例量表也稱(chēng)定比量表或比率量表。它含有實(shí)數(shù)列的全部特征,可以表示兩個(gè)事物特性的差異程度,而且也可以說(shuō)明它們之間的比率。屬于高級(jí)量表。,(五)測(cè)量的類(lèi)型,測(cè)量的分類(lèi)方法較多,按照不同的分類(lèi)標(biāo)準(zhǔn),就有不同的分類(lèi),常見(jiàn)的測(cè)量類(lèi)型有:,1.按測(cè)量方法分類(lèi),
7、直接測(cè)量:直接獲取數(shù)據(jù),如身高、體重、跳遠(yuǎn)距離等間接測(cè)量:獲取間接數(shù)據(jù),如下肢爆發(fā)力通過(guò)立定跳遠(yuǎn)獲取間接數(shù)據(jù)來(lái)反映。,2.按測(cè)量屬性分類(lèi),物理量測(cè)量:直接測(cè)量物質(zhì)的實(shí)體,獲得其物理特性的定量數(shù)據(jù)。如身高、跑速、血壓等屬性的測(cè)量。非物理測(cè)量:指測(cè)量抽象、復(fù)雜的屬性,獲取非物理特性的數(shù)據(jù)。如疲勞程度、技戰(zhàn)術(shù)水平、心理素質(zhì)等的測(cè)量。,3.按測(cè)量的組織形式分類(lèi),連續(xù)性測(cè)量:是指在連續(xù)的一段時(shí)間內(nèi),對(duì)固定對(duì)象的某種屬性或特征所進(jìn)行的定期性測(cè)量
8、。反映縱向發(fā)展變化的規(guī)律。橫斷面測(cè)量:是指在規(guī)定的時(shí)間內(nèi),對(duì)各個(gè)年齡組的某種或某些指標(biāo)所進(jìn)行的一次性測(cè)量。顯示縱向發(fā)展變化的規(guī)律。,(六)體育測(cè)驗(yàn)的類(lèi)型,在體育領(lǐng)域里,由于運(yùn)動(dòng)現(xiàn)象的復(fù)雜性,體育測(cè)驗(yàn)有其特殊性。有些測(cè)驗(yàn)需要多個(gè)測(cè)試者同時(shí)對(duì)某一個(gè)受試者進(jìn)行測(cè)量,有些測(cè)驗(yàn)需要對(duì)受試者進(jìn)行多次重復(fù)測(cè)驗(yàn)。,1.按測(cè)試者人數(shù)分類(lèi)單個(gè)測(cè)試者的測(cè)驗(yàn):如身高多個(gè)測(cè)試者的測(cè)驗(yàn):如體操比賽中,6位裁判同時(shí)對(duì)某個(gè)運(yùn)動(dòng)員評(píng)分…2.按重復(fù)測(cè)量次數(shù)分類(lèi)測(cè)
9、試本身所安排的重復(fù)測(cè)量次數(shù)位測(cè)驗(yàn)的頻數(shù)。根據(jù)頻數(shù)大小,測(cè)驗(yàn)可分為“頻數(shù)等于1的測(cè)驗(yàn)”和“頻數(shù)大于1的測(cè)驗(yàn)”。,(七)測(cè)量誤差,體育測(cè)量中,由于測(cè)量?jī)x器精度、測(cè)量技術(shù)、測(cè)量方法與條件等限制,使得實(shí)測(cè)值與被測(cè)值之間會(huì)有一定的差距,出現(xiàn)各種測(cè)量誤差。所謂測(cè)量誤差,是指與測(cè)量目的無(wú)關(guān)的變因產(chǎn)生效應(yīng),所引起的觀(guān)測(cè)值與真值之間的差異。由于測(cè)量誤差在所難免,所以沒(méi)有絕對(duì)準(zhǔn)確和毫無(wú)誤差的測(cè)量。,測(cè)量誤差可以使用下式表示:
10、 E=X-T (2-1) 式中:E-表示誤差;X-表示測(cè)量結(jié)果;T-表示真值。 所有的被測(cè)事物或現(xiàn)象在特點(diǎn)的條件下,理論上都有一個(gè)對(duì)應(yīng)的客觀(guān)、實(shí)際值存在,我們稱(chēng)之為“理論真值”。它只是個(gè)理想的概念,這在誤差理論研究中非常重要。為了進(jìn)一步理解體育測(cè)量的誤差,可認(rèn)為地把體育測(cè)量過(guò)程分為三個(gè)子過(guò)程。,1.測(cè)量過(guò)程的分解,測(cè)量的目的在于了解被測(cè)事物或現(xiàn)象的真值。根據(jù)測(cè)量真值的近似可知性和體育測(cè)量的
11、推測(cè)過(guò)程的基本特點(diǎn),可把測(cè)量過(guò)程分解位以下過(guò)程: 式中:X-指標(biāo)測(cè)量值;T1-現(xiàn)象真值;T2指標(biāo)真值;T-待測(cè)真值。(1)第I過(guò)程:由測(cè)量值推測(cè)現(xiàn)象真值的過(guò)程。(2)第II過(guò)程:由現(xiàn)象真值推測(cè)指標(biāo)真值的測(cè)量過(guò)程。(3)第III過(guò)程:由指標(biāo)真值推測(cè)屬性的過(guò)程。,,2.測(cè)量誤差的分解,公式(2-1)給出了總測(cè)量誤差,即由測(cè)量值推測(cè)真值存在的誤差。依據(jù)測(cè)量過(guò)程的分解,可以將總誤差分解位測(cè)試者誤差、受試者誤差和指標(biāo)誤差三部分。
12、測(cè)試者誤差:在第I過(guò)程中,現(xiàn)象真值(T)是確定的,而測(cè)量值(X)與之有差異,很明顯,誤差來(lái)源是測(cè)試者。第I過(guò)程中的測(cè)量誤差稱(chēng)為測(cè)試者的誤差。,受試者誤差:在第II過(guò)程中,相對(duì)于T1來(lái)說(shuō),T2是確定的。該過(guò)程的誤差表現(xiàn)為現(xiàn)象真值與指標(biāo)真值之間的差異。造成這種誤差的原因有受試者本身、測(cè)量方法以及測(cè)試條件等多方面,但該誤差最終是通過(guò)受試者表現(xiàn)出來(lái)的,所以該過(guò)程的誤差稱(chēng)為受試者誤差。 指標(biāo)誤差:第III過(guò)程是通過(guò)指標(biāo)真值去推測(cè)屬性的過(guò)程,其
13、誤差大小主要決定于指標(biāo)能否真實(shí)地反映測(cè)試屬性。如果測(cè)量指標(biāo)中含有非待測(cè)屬性的因素較多,那么該過(guò)程的測(cè)量誤差較大。所以,這一過(guò)程的誤差主要來(lái)源于測(cè)量指標(biāo),有被稱(chēng)為指標(biāo)誤差。,以上所述為一般性的測(cè)量過(guò)程和測(cè)量誤差的分解,在實(shí)際應(yīng)用中,具體到某一次測(cè)驗(yàn),可能沒(méi)有三個(gè)過(guò)程,測(cè)量誤差也可能不需要考慮三部分。例如,標(biāo)槍我們一般不考慮測(cè)試者誤差,而主要考慮受試者誤差;而體操、武術(shù)等主管評(píng)分項(xiàng)目的比賽中,人們往往關(guān)心的是測(cè)試者的誤差。,測(cè)量理論的主要任
14、務(wù)是如何使測(cè)量具有科學(xué)性和可操作性,其中科學(xué)性就是控制測(cè)量誤差,使測(cè)量誤差盡可能小,所以分析測(cè)量誤差的來(lái)源、衡量測(cè)量誤差大小是其重要內(nèi)容。由于待測(cè)真值是未知的,直接計(jì)算測(cè)量誤差是不可能的,只能借助測(cè)量值去間接衡量。一般來(lái)說(shuō),測(cè)量誤差的來(lái)源很多,籠統(tǒng)地衡量總測(cè)量誤差是很困難的,借助于測(cè)量誤差的分解,可以就測(cè)試者誤差、受試者誤差和指標(biāo)誤差分別進(jìn)行度量,從而得到對(duì)總測(cè)量誤差的整體衡量。 出于對(duì)測(cè)試者的誤差、受試者誤差和指
15、標(biāo)誤差的間接度量,導(dǎo)致了測(cè)量客觀(guān)性、可靠性和有效性的產(chǎn)生。,二、體育測(cè)驗(yàn)的客觀(guān)性,(一)客觀(guān)性的概念 客觀(guān)性是間接衡量第I過(guò)程中測(cè)量誤差(測(cè)試者誤差)大小的一種量度。所謂間接衡量是指不同測(cè)試者對(duì)同一受試對(duì)象同時(shí)測(cè)量,通過(guò)測(cè)量結(jié)果的一致程度來(lái)衡量測(cè)試者誤差大小。直觀(guān)上看,如果測(cè)試者誤差小,那么由不同的測(cè)試者對(duì)同一受試者實(shí)施測(cè)量時(shí),會(huì)得出極為接近的測(cè)量結(jié)果,即所有測(cè)量值應(yīng)具有較高的一致性;反之,如果不同測(cè)試者測(cè)量結(jié)果的一致程度
16、低,則說(shuō)明測(cè)試者的測(cè)量誤差大。如果某一項(xiàng)測(cè)驗(yàn)的測(cè)試者誤差小,則該測(cè)驗(yàn)的客觀(guān)性高;反之,測(cè)驗(yàn)的客觀(guān)性低。所謂客觀(guān)性,一句話(huà)是指不同測(cè)試人員對(duì)同一批受試對(duì)象實(shí)施同一測(cè)量或?qū)嶒?yàn)手段,其測(cè)量結(jié)果的一致性。這種一致性,是用客觀(guān)性系數(shù)進(jìn)行描述的。 客觀(guān)性常見(jiàn)于一些主觀(guān)評(píng)分類(lèi)項(xiàng)目,也就是常常那些采用專(zhuān)家評(píng)定方法對(duì)某些定性指標(biāo)進(jìn)行評(píng)價(jià)時(shí),對(duì)不同專(zhuān)家評(píng)定結(jié)果的一致性估計(jì)尤為重要,如體操、武術(shù)、跳水、花樣滑冰等體育項(xiàng)目中。,1.測(cè)驗(yàn)的總體,在
17、體育測(cè)量中,測(cè)驗(yàn)本身對(duì)測(cè)試者和測(cè)試對(duì)象都有一定的要求,我們稱(chēng)滿(mǎn)足測(cè)驗(yàn)要求的所有測(cè)試者和測(cè)試對(duì)象構(gòu)成的全體稱(chēng)為測(cè)驗(yàn)的總體,記為(A、B),其中A代表測(cè)試者,B代表測(cè)試對(duì)象。明確了測(cè)驗(yàn)的總體,也就明確了測(cè)驗(yàn)的適用范圍。,2.測(cè)驗(yàn)的客觀(guān)性定義,設(shè)從測(cè)驗(yàn)總體中隨機(jī)抽取一名測(cè)試者(或若干名測(cè)試者)和一個(gè)受試對(duì)象,測(cè)驗(yàn)值為X,根據(jù)誤差理論和測(cè)量過(guò)程的分解,測(cè)驗(yàn)的第I過(guò)程誤差模型為: X=T1+e1 (2-3)
18、 式中,T1-受試對(duì)象表現(xiàn)的現(xiàn)象值;e1-測(cè)試者造成的誤差;e1和T1相互獨(dú)立。從而:,(2-4),,可見(jiàn),客觀(guān)系數(shù)是一個(gè)相對(duì)數(shù),反映測(cè)試者的測(cè)量誤差相對(duì)于個(gè)體差異的大小,若測(cè)量誤差相對(duì)較大,則客觀(guān)系數(shù)較小,反之亦反??陀^(guān)性系數(shù)介于0和1之間,最小值為0,最大值為1。公式(2-5)定義的客觀(guān)性系數(shù)是測(cè)驗(yàn)關(guān)于全體測(cè)試者和受試對(duì)象的客觀(guān)性系數(shù),即關(guān)于測(cè)驗(yàn)總體的客觀(guān)性系數(shù),稱(chēng)之為測(cè)驗(yàn)的總體客觀(guān)性,也稱(chēng)測(cè)驗(yàn)的客觀(guān)性,一般總是未知的,實(shí)
19、際應(yīng)用中需要通過(guò)樣本進(jìn)行檢驗(yàn)。,(二)影響客觀(guān)性的因素,實(shí)施測(cè)量的方法與程序是否標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化程度越高,測(cè)量結(jié)果的客觀(guān)性越強(qiáng)。測(cè)量指標(biāo)的難易程度、穩(wěn)定性及其指標(biāo)的性質(zhì)。測(cè)量方法比較復(fù)雜且難度較大的指標(biāo),測(cè)量結(jié)果的客觀(guān)性較差;穩(wěn)定性較差的指標(biāo),測(cè)量結(jié)果的客觀(guān)性也較差;定性指標(biāo)比定量指標(biāo)的客觀(guān)性差。受測(cè)試人員及受試者主觀(guān)因素影響的程度。受測(cè)試人員及受試者主觀(guān)因素影響程度越大,測(cè)量結(jié)果的客觀(guān)性越差。,測(cè)試人員的業(yè)務(wù)技術(shù)熟練程度。若采用專(zhuān)
20、家評(píng)定方法時(shí),參評(píng)專(zhuān)家的人數(shù)多少,知識(shí)經(jīng)驗(yàn)水平,也對(duì)評(píng)定結(jié)果的客觀(guān)性有著重要影響。參評(píng)專(zhuān)家人數(shù)過(guò)多,意見(jiàn)過(guò)于分散。參評(píng)專(zhuān)家人數(shù)過(guò)少,個(gè)別專(zhuān)家的意見(jiàn)正確與否,作用又太大。這些因素,都將使評(píng)定的客觀(guān)性受到不同程度的影響。,因此,在進(jìn)行研究方法設(shè)計(jì)時(shí),為了提高測(cè)量或?qū)嶒?yàn)結(jié)果的客觀(guān)性,必須盡量選擇那些可以用一定計(jì)量單位描述的定量指標(biāo),簡(jiǎn)易可行且穩(wěn)定性好的指標(biāo)。盡量少用那些易受測(cè)試人員和受試者主觀(guān)因素影響的指標(biāo)。然后,施以標(biāo)準(zhǔn)化的測(cè)量程序。對(duì)于那
21、些只能定性不能定量或只能用名次、序號(hào)進(jìn)行量化的定性指標(biāo),應(yīng)特別慎重。若采用專(zhuān)家評(píng)定的方法,必須對(duì)專(zhuān)家人數(shù)、業(yè)務(wù)水平提出明確要求。同時(shí),必須制定一個(gè)盡可能詳細(xì)而又能避開(kāi)專(zhuān)家某些主觀(guān)因素影響的具體評(píng)定標(biāo)準(zhǔn)。爾后,通過(guò)適當(dāng)方式,在不同專(zhuān)家間統(tǒng)一認(rèn)識(shí),統(tǒng)一評(píng)定標(biāo)準(zhǔn),這是十分必要的。,(三)估計(jì)客觀(guān)性的方法,對(duì)于客觀(guān)性的估計(jì),應(yīng)根據(jù)數(shù)據(jù)資料的性質(zhì)不同而采用不同的方法。,1. 參數(shù)統(tǒng)計(jì)力法,通過(guò)測(cè)量或?qū)嶒?yàn),當(dāng)所獲得的數(shù)據(jù)資料屬于用區(qū)間量表和比率量表
22、描述的計(jì)量資料且呈正態(tài)分布時(shí),可以采用參數(shù)統(tǒng)計(jì)方法估計(jì)其客觀(guān)性。這一客觀(guān)性,通常是用不同測(cè)試人員對(duì)同一批受試對(duì)象實(shí)施以同一測(cè)量或?qū)嶒?yàn)手段,然后計(jì)算不同測(cè)試人員間測(cè)量結(jié)果的相關(guān)系數(shù)并進(jìn)行顯著性檢驗(yàn)來(lái)進(jìn)行描述的。,2. 非參數(shù)統(tǒng)計(jì)方法,當(dāng)所獲得的數(shù)據(jù)資料是通過(guò)專(zhuān)家評(píng)定,用有序量表來(lái)描述的等級(jí)、名次、序號(hào)等計(jì)數(shù)資料且不知道是否屬于正態(tài)分布時(shí),可采用計(jì)算等級(jí)相關(guān)系數(shù)或相似系數(shù)(又稱(chēng)和諧系數(shù))的非參數(shù)統(tǒng)計(jì)方法估計(jì)其客觀(guān)性。
23、這里,僅就多名專(zhuān)家對(duì)多個(gè)被評(píng)價(jià)對(duì)象的水平和被評(píng)價(jià)因素的相對(duì)重要程度進(jìn)行專(zhuān)家評(píng)定時(shí),如何通過(guò)計(jì)算相似系數(shù)的方法估計(jì)不同專(zhuān)家間評(píng)定結(jié)果的客觀(guān)性問(wèn)題,做一詳細(xì)介紹。具體的方法與步驟:,(1)將專(zhuān)家評(píng)定結(jié)果列入相似系數(shù)計(jì)算表,下是5名專(zhuān)家對(duì)7名學(xué)生體質(zhì)水平(或7個(gè)體質(zhì)因素相對(duì)重要程度)的排序結(jié)果。,(2)計(jì)算7名學(xué)生(或因素)所得序號(hào)總 和的平均數(shù),可用兩種方法:,(3)分別計(jì)算每人(或每個(gè)因素)所得序號(hào)總和、離均差、離均差平方及離均差平方和,
24、并填入表2中。,(4)按下式計(jì)算相似系數(shù),即:,式中W為相似系數(shù);S為7名學(xué)生(或7個(gè)因素)所得序號(hào)總和的離均差平方和;m為參評(píng)專(zhuān)家人數(shù);n為學(xué)生人數(shù)(或因素個(gè)數(shù))。 相似系數(shù)W的取值范圍為0~1,0表示5名專(zhuān)家意見(jiàn)完全不一致,1表示意見(jiàn)完全一致。W值越接近于1,說(shuō)明專(zhuān)家評(píng)定的客觀(guān)性越強(qiáng),評(píng)價(jià)結(jié)果越可靠。,,(5)對(duì)相似系數(shù)進(jìn)行顯著性檢驗(yàn)(這里的相似系數(shù)就是指這5名專(zhuān)家打的分?jǐn)?shù),看這些分?jǐn)?shù)是否保持一致,如果一致說(shuō)明客觀(guān)性強(qiáng))
25、,相似系數(shù)的顯著性檢驗(yàn),用x2檢驗(yàn)方法。先用公式計(jì)算x2值,即x2=m(n-1)×w,再與x2界值表中相對(duì)于·05或·01水平的界值進(jìn)行比較,并對(duì)顯著性進(jìn)行判斷。本例x2=5×(7-1)×0.9=27,查x2界值表結(jié)果,x2 (6)×0.01界值為16.812。因?yàn)閤2>x2 (6)×0.01,所以P<0.01,相似系數(shù)有非常顯著意義。說(shuō)明5名專(zhuān)家的意見(jiàn)相
26、當(dāng)一致,客觀(guān)性很強(qiáng)。,(一)可靠性的基本概念和可靠性理論,可靠性,又稱(chēng)信度。所謂可靠性,是指在相同條件下,對(duì)同一批受試對(duì)象重復(fù)測(cè)量時(shí),測(cè)量結(jié)果的一致程度。在相同條件下,只要受試者自身狀態(tài)不發(fā)生變化,對(duì)同一批受試對(duì)象實(shí)施同一測(cè)量,一般應(yīng)得到一致的結(jié)果。然而,即使進(jìn)行最嚴(yán)格的標(biāo)準(zhǔn)化和規(guī)范化測(cè)量,使用最精密的量具和儀器,由最有經(jīng)驗(yàn)的測(cè)試人員進(jìn)行測(cè)試,其測(cè)量結(jié)果還會(huì)存在—定的誤差。這種誤差的大小,在很大程度上決定了測(cè)量的可靠性。但是,測(cè)量的可靠
27、性理論和誤差理論是有區(qū)別的。,在誤差理論中,被測(cè)量的量值被看作是不變的。而在可靠性理論中,每次測(cè)量時(shí),被測(cè)量的量值都有變化。例如,對(duì)某受試者進(jìn)行一次最大攝氧量測(cè)量,若使用精密度較高的實(shí)驗(yàn)儀器設(shè)備,并嚴(yán)格控制實(shí)驗(yàn)條件,就完全可以測(cè)量準(zhǔn)確。此時(shí),是把受試者最大攝氧雖看作在短時(shí)間內(nèi)不會(huì)發(fā)生變化的。如果有些誤差,也是由于儀器的基本誤差或試驗(yàn)條件控制不嚴(yán)等原因造成的。但是,要確定該受試者在某一時(shí)期內(nèi)的最大攝氧水平,則不管采用什么方法,都無(wú)法精確測(cè)
28、量。因?yàn)槊看螌?shí)驗(yàn)時(shí),受試者自身狀態(tài)(身體的、精神的)都有可能發(fā)生變化,故很難在每次測(cè)量中得到完全一致的結(jié)果。各次實(shí)驗(yàn)結(jié)果之間的誤差,是由于受試者自身狀態(tài)變化而引起的。,根據(jù)可靠性數(shù)學(xué)理論,對(duì)一名受試者進(jìn)行任何一次測(cè)量的結(jié)果(實(shí)測(cè)值),都是兩個(gè)量的和,即被測(cè)量的真值與由于不能被控制的受試者狀態(tài)變化和隨機(jī)誤差而引起的誤差之和,這就是可靠性的理論依據(jù),可用下面公式表示: xi (
29、x)=x?(T)+x? (e) 式中xi為某次測(cè)量的實(shí)測(cè)值;x?為被測(cè)量的真值;x?為由不能被控制的受試者狀態(tài)變化和隨機(jī)誤差而引起的誤差。,在相同條件下,當(dāng)觀(guān)測(cè)次數(shù)無(wú)窮大時(shí),人們常把xi的均數(shù)被看作是測(cè)量的真值。因此在x的下面標(biāo)以符號(hào)?,即x?。如果誤差是隨機(jī)的(隨機(jī)誤差的總和等于0,且在不同實(shí)驗(yàn)中相互獨(dú)立),按照數(shù)理統(tǒng)計(jì)方法,便可寫(xiě)成: 即在一次測(cè)量中,實(shí)測(cè)值的方差( )等于真值方差( )與誤差方
30、差( )之和。真值方差被稱(chēng)為理想的(即沒(méi)有誤差)的組間方差,為了跟前面一致性,常用 表示 ,誤差方差被稱(chēng)為組內(nèi)方差。由于誤差的影響,才使實(shí)測(cè)值的分布生變化。,,,,,可靠性高低,是用可靠性系數(shù)(或稱(chēng)信度系數(shù))進(jìn)行描述的。 可靠件系數(shù)(?ii),即真值方差與實(shí)測(cè)值方差之比??煽啃韵禂?shù)可用下面公式表示: 從上式可以看出,假如沒(méi)有測(cè)量誤差,即 =0,則可靠性系數(shù)?ii就等于1。隨著測(cè)量誤差的增大,可
31、靠性系數(shù)值也就越小。因此,可以認(rèn)為,測(cè)量的可靠性在很大程度上取決于測(cè)量誤差的大小。測(cè)量誤差越小,可靠性越高。,,,(二)影響可靠性的因素,1.測(cè)量誤差大小 從可靠性系數(shù)的含義及計(jì)算公式 來(lái)看,測(cè)量的可靠性,很大程度上取決于測(cè)最誤差的大小。因此,有必要將產(chǎn)生各種誤差(系統(tǒng)誤差、隨機(jī)誤差、過(guò)失誤差和抽樣誤差等)的誤差源進(jìn)行詳細(xì)的分析。受試者自身狀態(tài)的變化包括受試者對(duì)測(cè)量或?qū)嶒?yàn)方法的理解與掌握程度;受試
32、者在進(jìn)行測(cè)試時(shí)的身心狀態(tài),包括機(jī)能和健康狀況;受試者的興趣、意志和注意力集中程度;受試者思想和身體的準(zhǔn)備情況及能否積極主動(dòng)地配合等,都可能對(duì)測(cè)量結(jié)果的可靠性產(chǎn)生影響。,,測(cè)試人員自身狀態(tài)的變化包括測(cè)試人員對(duì)測(cè)試方法及技術(shù)掌握的熟練程度;測(cè)試人員的責(zé)任感和準(zhǔn)備工作情況;測(cè)試人員的組織工作經(jīng)驗(yàn);測(cè)試人員是否經(jīng)常更換,也可能對(duì)測(cè)量結(jié)果的可靠性產(chǎn)生不同程度的影響。量具和儀器功能狀態(tài)的變化包括精密度是否符合要求,使用前是否進(jìn)行了嚴(yán)格校準(zhǔn)或標(biāo)定;
33、群體測(cè)量時(shí),量具和儀器的規(guī)格、型號(hào)是否統(tǒng)—,裝置是否符合要求;能否保證標(biāo)準(zhǔn)的使用條件,如電壓、照度、室溫、濕度等,是產(chǎn)生系統(tǒng)誤差進(jìn)而影響可靠性的重要因素。,測(cè)試方法與程序是否標(biāo)準(zhǔn)化包括測(cè)試方的規(guī)范化;次數(shù)、時(shí)間、順序、難易度是否統(tǒng)一要求;對(duì)受試者的要求是否明確等。 外部環(huán)境的變化包括氣溫、濕度、風(fēng)力等氣候條件的變化;測(cè)試場(chǎng)所是否有干擾;場(chǎng)地布局是否合理,丈量是否準(zhǔn)確等,都可能使測(cè)量結(jié)果產(chǎn)生較大誤差而影響其可靠性。進(jìn)行群體測(cè)量時(shí)是否確
34、足夠樣本含量因?yàn)樗婕俺闃诱`差的大小。,2. 被測(cè)量值的分布范圍大小,可靠性系數(shù)(信度系數(shù)),正象所有的相關(guān)系數(shù)一樣,受實(shí)測(cè)值的分布范圍(即全距大?。┑挠绊憽7植挤秶叫?,即變異程度越小,可靠性系數(shù)就越小。因?yàn)椋瑥墓?可以看出,當(dāng)方差 不變而實(shí)測(cè)方差 減少時(shí),則分式值 增加,可靠系數(shù)?ii值減小;當(dāng)誤差方差 不變而實(shí)測(cè)方差 越大時(shí),則分式值 減小,可靠性系數(shù)?ii越大。這提示我們,當(dāng)樣本中個(gè)體之間
35、差異很大的時(shí)候,測(cè)量的可靠性就會(huì)提高。,,,,,,,個(gè)體差異分布范圍對(duì)可靠性的影響,可以克萊公式(Ke11y)檢查出來(lái)。假如測(cè)量工具或儀器能等同地量出整個(gè)差異范圍,則兩個(gè)不同的差異范圍的測(cè)量標(biāo)準(zhǔn)差將相等?;谶@一思想,克萊推演出如下公式: 式中?e為可靠性系數(shù)已知的樣本分布標(biāo)準(zhǔn)差;?n為可靠性系數(shù)未知的樣本分布標(biāo)準(zhǔn)差;?∞和?nn為兩個(gè)分布中各自的可靠性系數(shù)。,,例如,將某一測(cè)驗(yàn)應(yīng)用于某一群體,其實(shí)測(cè)值的標(biāo)準(zhǔn)差為12,可
36、靠性系數(shù)為0.84。假如應(yīng)用于另一個(gè)群體,標(biāo)準(zhǔn)差是8,其可靠性估計(jì)值可用上式求得,即: 因此,即使對(duì)某一群體測(cè)量可靠的手段,若用于另一群體時(shí)(非同質(zhì)群體),應(yīng)用克萊公式對(duì)其可靠性進(jìn)行重新估價(jià)。,,3. 測(cè)驗(yàn)的長(zhǎng)度,測(cè)驗(yàn)的長(zhǎng)度,指測(cè)驗(yàn)的次數(shù)或組數(shù)。 一般來(lái)說(shuō),測(cè)驗(yàn)的長(zhǎng)度增加,可靠性隨之提高。在實(shí)際工作中,當(dāng)我們認(rèn)為某項(xiàng)測(cè)驗(yàn)因測(cè)驗(yàn)次數(shù)或組數(shù)太少而感到可靠性不夠高時(shí),可以用增加測(cè)驗(yàn)的長(zhǎng)度來(lái)提高可靠性。究
37、竟將測(cè)驗(yàn)長(zhǎng)度增加幾倍才能滿(mǎn)足可靠性的要求,可以用由斯皮爾曼-布郎通式(即 )推導(dǎo)出的下式進(jìn)行計(jì)算,即,,,例如,某項(xiàng)測(cè)驗(yàn)的可靠性系數(shù)為0.75,問(wèn)加長(zhǎng)多少倍才能使其達(dá)到0.90的可靠性。代入上式可得: 也就是說(shuō),必須將原有測(cè)驗(yàn)的次數(shù)或組數(shù)增加三倍,才能達(dá)到0.90的可靠性。 反之,若原有測(cè)驗(yàn)過(guò)長(zhǎng),需要減少測(cè)驗(yàn)次數(shù)或組數(shù),也可用此法推出。,,4. 測(cè)驗(yàn)的難度,測(cè)驗(yàn)的難度與
38、可靠性沒(méi)有直接關(guān)系。然而,由于測(cè)驗(yàn)過(guò)于簡(jiǎn)單或過(guò)難會(huì)使被測(cè)量值分布范圍太小,也會(huì)造成可靠性降低。測(cè)驗(yàn)的難度與有效性密切相關(guān)。一個(gè)根本無(wú)效或效度很低的測(cè)驗(yàn),根本談不上可靠。因此,某項(xiàng)測(cè)驗(yàn)對(duì)某個(gè)群體太難或太容易,該測(cè)驗(yàn)本身就失去了鑒別個(gè)體差異的能力,故使測(cè)驗(yàn)無(wú)效或效度降低,可靠性也隨之降低。 所以,測(cè)驗(yàn)的難度水平,應(yīng)能產(chǎn)生最廣泛的分布,才能提高其可靠性。在心理測(cè)驗(yàn)或考試中,測(cè)題太難,受試者將對(duì)許多題目作出隨機(jī)反應(yīng),即猜
39、測(cè),這種測(cè)驗(yàn)結(jié)果,將使人難以置信。,(三)估計(jì)可靠性的方法,如前所述,測(cè)量的可靠性,是用可靠性系數(shù)進(jìn)行描述的,即真值方差與實(shí)測(cè)值方差之比。但是,真值卻是一個(gè)抽象的概念。進(jìn)行測(cè)量或?qū)嶒?yàn)時(shí),要在相同條件下無(wú)限制地增加觀(guān)測(cè)次數(shù),實(shí)際上是不可能的。也就是說(shuō)X00這個(gè)參數(shù)是得不到的。因此,無(wú)法直接計(jì)算其可靠性系數(shù),必須采用間接的方法,估計(jì)其可靠性。估計(jì)可靠性最常用的方法是,先進(jìn)行方差分析,再計(jì)算組內(nèi)相關(guān)系數(shù)(詳見(jiàn)《體育測(cè)量與評(píng)價(jià)》,邢文華等編著)
40、。因?yàn)榉讲罘治?,能夠?qū)y(cè)量結(jié)果的變差分解成幾種變差。這幾種變差,都是由影響可靠性的各種因素的影響而造成的。 如果測(cè)量只重復(fù)進(jìn)行兩次,組內(nèi)相關(guān)系數(shù)實(shí)際上與第一、二次測(cè)量結(jié)果的簡(jiǎn)單相關(guān)系數(shù)相近。因此,在這種情況下,便可用簡(jiǎn)單相關(guān)系數(shù)估計(jì)其可靠性。但是,應(yīng)特別強(qiáng)調(diào)的是,若測(cè)量和實(shí)驗(yàn)的重復(fù)次數(shù)超過(guò)了兩次,尤其是采用復(fù)雜的實(shí)驗(yàn)方案,如在兩天內(nèi),每天進(jìn)行兩次實(shí)驗(yàn),就必須通過(guò)計(jì)算組內(nèi)相關(guān)系數(shù)的方法估計(jì)其可靠性了。,測(cè)量的可靠性,是通過(guò)穩(wěn)
41、定性、內(nèi)部一致性和等價(jià)性等不同形式表現(xiàn)出來(lái)。表現(xiàn)的形式不同,估計(jì)可靠性的方法也不同。,1. 穩(wěn)定性及其估價(jià)方法 測(cè)量或?qū)嶒?yàn)指標(biāo)的穩(wěn)定性,是指經(jīng)過(guò)一定時(shí)間(非同日),在相同條件下重復(fù)測(cè)量或?qū)嶒?yàn)時(shí),測(cè)量結(jié)果再現(xiàn)的一致程度。,測(cè)量或?qū)嶒?yàn)的穩(wěn)定性,與指標(biāo)特點(diǎn)、受試對(duì)象特點(diǎn)和重復(fù)測(cè)量的時(shí)間間隔等有關(guān)。一般情況下,形態(tài)指標(biāo)在短時(shí)間內(nèi)變化不大,比較穩(wěn)定,重復(fù)測(cè)量時(shí),測(cè)量結(jié)果再現(xiàn)的一致性強(qiáng)。而機(jī)能指標(biāo)、動(dòng)作技術(shù)及運(yùn)動(dòng)能力測(cè)
42、驗(yàn),因易受主客觀(guān)因素的影響,重復(fù)測(cè)量時(shí)再現(xiàn)的一致性較差,其測(cè)量結(jié)果的穩(wěn)定性較差。另外,由于測(cè)量結(jié)果易受受試者生理、心理、學(xué)習(xí)經(jīng)驗(yàn)和訓(xùn)練水平高低等自身狀態(tài)變化的影響,即使是同一測(cè)量或試驗(yàn)手段,在實(shí)施于不同對(duì)象時(shí),其穩(wěn)定性也不同.一般情況下,成人要比少年兒童穩(wěn)定,運(yùn)動(dòng)員要比一般人穩(wěn)定。同時(shí),穩(wěn)定性會(huì)隨重復(fù)測(cè)量時(shí)間間隔的延長(zhǎng)而下降。,“測(cè)量——再測(cè)量”,是估計(jì)測(cè)量或?qū)嶒?yàn)穩(wěn)定性常用的一種方法。即讓一批受試者在不同時(shí)間,用相同的方法,在相同的條件
43、下進(jìn)行兩次測(cè)量,用第一次與第二次兩次測(cè)量結(jié)果之間的相關(guān)系數(shù)估計(jì)其穩(wěn)定性。這個(gè)系數(shù)越接近1,則測(cè)量或試驗(yàn)結(jié)果就越穩(wěn)定而可靠。若兩次測(cè)量結(jié)果之間相關(guān)程度很低,則說(shuō)明穩(wěn)定性很差。 這種方法用于估計(jì)群體測(cè)量指標(biāo)穩(wěn)定性時(shí),為節(jié)省時(shí)間,一般可采用第一天對(duì)全部受試者進(jìn)行測(cè)量,第二天采用隨機(jī)抽取一定的受試者進(jìn)行再測(cè)量,并計(jì)算隨機(jī)抽取的部分受試者兩次測(cè)量結(jié)果的相關(guān)系數(shù),以估計(jì)其穩(wěn)定性。,2. 內(nèi)部一致性及其估計(jì)方法,測(cè)量的內(nèi)部一致性,是指在
44、同一天內(nèi),在相同條件下(由一測(cè)量人員、用同一測(cè)量或?qū)嵲嚪椒?、使用同一量具或儀器,在同一場(chǎng)地)對(duì)同一批受試對(duì)象實(shí)施兩次測(cè)量,其測(cè)量或?qū)嶒?yàn)結(jié)果的一致程度。,估計(jì)內(nèi)部一致性的常用方法是裂半法,即在同一天內(nèi)進(jìn)行偶 數(shù)次測(cè)量,然后把測(cè)量結(jié)果分成相等的兩個(gè)部分,奇數(shù)次作為一半。偶數(shù)次作為一半,對(duì)每個(gè)受試者而言,可以取得兩種數(shù)據(jù),即奇數(shù)次測(cè)量結(jié)果的總和與偶數(shù)次測(cè)量結(jié)果的總和。最后,用這兩個(gè)裂半之間的相關(guān)系數(shù)估計(jì)測(cè)量的一致性可靠性。估計(jì)整個(gè)測(cè)量的一致性
45、時(shí),可用下式計(jì)算,即 式中?11為全部測(cè)量結(jié)果的一致性可靠性系數(shù);?1/2?1/2為測(cè)量結(jié)果兩個(gè)裂半之間的相關(guān)系數(shù)。,,當(dāng)某一測(cè)量或試驗(yàn)長(zhǎng)度(即重復(fù)次數(shù))加倍時(shí),用裂半法估計(jì)一致性可靠性,常用到斯皮爾曼—布朗預(yù)測(cè)公式,即 式中?nn為測(cè)驗(yàn)次數(shù)增加n倍后的一致性可靠性系數(shù);n為測(cè)驗(yàn)增加的倍數(shù);?ii為原來(lái)測(cè)驗(yàn)的可靠性系數(shù)。例如,某項(xiàng)測(cè)驗(yàn)進(jìn)行6次時(shí),用裂半法計(jì)算的一致性可靠性為0.82,若
46、測(cè)驗(yàn)長(zhǎng)度增加至12次,而難度不變,其可靠性應(yīng)為: ?ii = 0.82 , 2 代入上式,則 0.9 可見(jiàn)隨著測(cè)量長(zhǎng)度的增加,一致性可靠性越強(qiáng)。但測(cè)驗(yàn)難度保持不變,是使用這個(gè)公式的前提。,,,,3. 等價(jià)性及其估價(jià)方法,同日對(duì)同一批受試對(duì)象實(shí)施不同方式、相同難度并能測(cè)量同一屬性的同質(zhì)測(cè)驗(yàn)。其兩種
47、不同方式測(cè)驗(yàn)結(jié)果的一致程度,稱(chēng)為測(cè)量的等價(jià)性。等價(jià)性也是通過(guò)計(jì)算相關(guān)系數(shù)的方法來(lái)估價(jià)的,即計(jì)算兩種不同方式同質(zhì)測(cè)驗(yàn)結(jié)果之間的相關(guān)系數(shù)。在體質(zhì)研究中,人們往往從很多相同類(lèi)型的測(cè)驗(yàn)中選擇一種或幾種測(cè)驗(yàn)。例如,欲測(cè)量一組受試者跑的速度,可以選擇50m跑,也可選擇60m或100m跑;欲測(cè)量其一般耐力,可選責(zé)1000m跑,也可選擇1500m或3000m跑;欲測(cè)量上肢力量耐力,可選擇引體向上,也可以選擇俯臥撐或雙臂屈伸;欲測(cè)量心血管機(jī)能,可選擇
48、最大攝氧量,也可選擇PWC170機(jī)能試驗(yàn)臺(tái)階試驗(yàn)等。,當(dāng)我們讓同一組受試者完成同一類(lèi)型、兩種不同方式試驗(yàn)時(shí),一般用平行測(cè)驗(yàn)的方法,估價(jià)其等價(jià)性,即 方式A← →方式B 但是,在進(jìn)行科研方法時(shí),對(duì)如何看待和使用等價(jià)測(cè)驗(yàn),應(yīng)做具體分析。一方面,如果同時(shí)采用兩項(xiàng)或兩項(xiàng)以上等價(jià)測(cè)驗(yàn)的話(huà),可以提高測(cè)量與評(píng)價(jià)的可靠性、有效性,即可獲取更多有價(jià)值的信息。另一方面,若只采用一項(xiàng)等價(jià)測(cè)驗(yàn)?zāi)敲磸墓?jié)
49、省時(shí)間、人力、簡(jiǎn)化測(cè)驗(yàn)程序的角度考慮,也是有益的。不過(guò),一項(xiàng)測(cè)驗(yàn)的信息價(jià)值,要低于一組測(cè)驗(yàn)的信息價(jià)值。如何處理這一關(guān)系,主要取決于指標(biāo)的難度和測(cè)量的規(guī)模。一般對(duì)難度大,要求精密度高的指標(biāo),在實(shí)施較大規(guī)模測(cè)量時(shí),不宜同時(shí)采用過(guò)多的等價(jià)測(cè)驗(yàn)項(xiàng)目。,,統(tǒng)計(jì)學(xué)關(guān)于估價(jià)可靠性的方法很多,每一種方法,都有其特定的使用范圍。因此,在研究方法設(shè)計(jì)時(shí),應(yīng)針對(duì)所選用的測(cè)量或?qū)嶒?yàn)方法的特點(diǎn),選擇最適宜的估價(jià)可靠性的方法。同時(shí),還應(yīng)注意,雖是同一測(cè)量或試驗(yàn)方法
50、,當(dāng)用于不同群體時(shí),應(yīng)對(duì)其可靠性進(jìn)行重新估價(jià)。,四、有效性,測(cè)量的有效性,是測(cè)量的三性理論的核心,也是體質(zhì)研究中十分重要的一個(gè)理論問(wèn)題。 它不僅涉及測(cè)量或?qū)嶒?yàn)方法本身的科學(xué)性,而且也直接與科研方法設(shè)計(jì)是否合理相聯(lián)系。因?yàn)樵谠S多課題研究中,尤其是定量研究中,都要對(duì)某些指標(biāo)進(jìn)行實(shí)際的測(cè)量或?qū)嶒?yàn),以取得研究工作所需要的各種數(shù)據(jù)資料,進(jìn)而深入地研究并揭示其內(nèi)在的規(guī)律得出科學(xué)的結(jié)論。因此,所設(shè)計(jì)的研究指標(biāo)的測(cè)量或?qū)嶒?yàn)方法能否
51、準(zhǔn)確而有效地測(cè)量出事先欲測(cè)量的某一屬性,換句話(huà)說(shuō),即通過(guò)某一測(cè)量或?qū)嶒?yàn),所能測(cè)到的某一屬性與所要測(cè)量的屬性是否一致,其邏輯符合程度大或小,直接關(guān)系研究結(jié)論是否經(jīng)得起推敲以至能否成立。所以,它往往是研究工作成敗的關(guān)鍵。,(一)有效性的基本概念,所謂有效性(亦稱(chēng)效度或測(cè)量的信息價(jià)值),是指某一測(cè)量或?qū)嶒?yàn)指標(biāo)在測(cè)量某特性(質(zhì)量、能力、特征)時(shí),所能測(cè)出的某一屬性與所要測(cè)量屬性的一致性。有效性包括兩個(gè)方面的含義:一是這項(xiàng)測(cè)量或?qū)嶒?yàn)手段主要測(cè)量
52、什么,或者說(shuō)使用這一測(cè)量或?qū)嶒?yàn)手段進(jìn)行測(cè)量時(shí),是否能測(cè)出預(yù)先打算要測(cè)量的某一屬性;二是測(cè)量的準(zhǔn)確度如何,或者說(shuō)能夠獲得多少有價(jià)值的信息。在理解這個(gè)基本概念時(shí),有兩個(gè)方面必須加以考慮,即相關(guān)性和可靠性。相關(guān)性是指測(cè)量結(jié)果與被測(cè)量屬性的一致程度??煽啃允侵笢y(cè)量結(jié)果的準(zhǔn)確程度。有效性(或稱(chēng)效度)高低,是用有效性系數(shù)(或效度系數(shù))進(jìn)行描述的。,(二)影響有效性的因素,受試者的年齡、性別和知識(shí)經(jīng)驗(yàn)水平:對(duì)于某一性別、年齡組有效的測(cè)量或?qū)嶒?yàn)手段
53、,用于另一性別、年齡組就不一定有效;對(duì)于初學(xué)者有效的測(cè)量或?qū)嶒?yàn)手段,用于有一定學(xué)習(xí)經(jīng)驗(yàn)或已掌握了該項(xiàng)測(cè)驗(yàn)技能者也不一定有效;對(duì)于運(yùn)動(dòng)員有效的測(cè)量或?qū)嶒?yàn)手段,用于一般人也不一定有效。即使有效,其有效程度也會(huì)有差別,所得到的信息價(jià)值也各不相同。不同受試群體特點(diǎn)和測(cè)驗(yàn)指標(biāo)的鑒別能力:同一測(cè)量或?qū)嶒?yàn)手段,用于不同群體,其有效性也不同。一般來(lái)說(shuō),在一個(gè)群體中,個(gè)體之間差異越小,測(cè)驗(yàn)的鑒別能力差,則所得到的信息價(jià)值就小,有效性越差;個(gè)體差異越大,
54、測(cè)驗(yàn)的鑒別能力強(qiáng),則所得到的信息價(jià)值就越大,有效性越強(qiáng)。,3. 測(cè)驗(yàn)指標(biāo)的難度:當(dāng)一項(xiàng)測(cè)驗(yàn)用于受試者,多數(shù)不能完成,或多數(shù)都能很輕松完成,說(shuō)明這項(xiàng)測(cè)驗(yàn)不具備鑒別受試者某種屬性的能力,因而是無(wú)效的。因此,在多數(shù)情況下,是靠增加測(cè)驗(yàn)的難度來(lái)增大受試者之間變異的。只有當(dāng)測(cè)驗(yàn)具有一定難度,才能使受試者之間的個(gè)體差異客觀(guān)地顯現(xiàn)出來(lái),測(cè)驗(yàn)的有效性才能提高,所得到的信息價(jià)值才大。過(guò)難或過(guò)易都影響測(cè)驗(yàn)的有效性。4. 測(cè)驗(yàn)指標(biāo)自身和“效標(biāo)”的可靠性
55、:測(cè)量的有效性,一方面取決于待檢驗(yàn)的某項(xiàng)測(cè)驗(yàn)指標(biāo)本身的可靠性;另一方面還取決于用來(lái)檢驗(yàn)這項(xiàng)測(cè)驗(yàn)有效性所使用“效標(biāo)”的可靠性。一項(xiàng)可靠性很低的測(cè)驗(yàn)指標(biāo),其有效性永遠(yuǎn)也不會(huì)很強(qiáng)。同時(shí),效標(biāo)測(cè)驗(yàn)的可靠性達(dá)不到要求,也會(huì)使待檢驗(yàn)測(cè)驗(yàn)指標(biāo)的有效性降低,信息價(jià)值減小。,5.測(cè)驗(yàn)的方式:成套測(cè)驗(yàn)的有效性往往高于單項(xiàng)測(cè)驗(yàn)。實(shí)際應(yīng)用中往往有這樣的情況,當(dāng)某項(xiàng)測(cè)驗(yàn)單獨(dú)進(jìn)行時(shí),對(duì)鑒別某種能力的有效性可能差些,測(cè)驗(yàn)結(jié)果所獲得的信息價(jià)值小些。而當(dāng)這個(gè)測(cè)驗(yàn)被包括在
56、一組成套測(cè)驗(yàn)中時(shí),測(cè)驗(yàn)的有效性就會(huì)大大提高,究其原因可以發(fā)現(xiàn),這是由各指標(biāo)之間的互補(bǔ)作用和整體效應(yīng)造成的。 綜上所述,在進(jìn)行研究方法設(shè)計(jì)時(shí),充分認(rèn)識(shí)和估計(jì)影響有效性的各種因素,分析研究對(duì)象及其群體的特點(diǎn),事先估價(jià)所選指標(biāo)的可靠性及其用于作為效標(biāo)測(cè)驗(yàn)的可靠性,適當(dāng)加大測(cè)驗(yàn)的難度以提高其鑒別能力,確定合理的測(cè)驗(yàn)方式,對(duì)所采用的指標(biāo)進(jìn)行必要的有效性(即效度)檢驗(yàn),是保證科研方法設(shè)計(jì)嚴(yán)密性和科學(xué)性的重要前提。,(三)估計(jì)有效性的方法
57、,測(cè)量的有效性,大致有4種基本類(lèi)型。即內(nèi)容有效性、結(jié)構(gòu)有效性、實(shí)驗(yàn)有效性(或稱(chēng)效標(biāo)相關(guān)有效性)和推測(cè)有效性。有效性的類(lèi)型不同,其估價(jià)的方法也各異。,1. 內(nèi)容有效性的估計(jì)方法,內(nèi)容有效性,是指測(cè)驗(yàn)項(xiàng)目和指標(biāo)的內(nèi)容能有效地代表總體屬性的準(zhǔn)確程度,即測(cè)驗(yàn)的內(nèi)容與欲測(cè)量的總體屬性的一致性。如果它充分地反映了總體屬性的全部信息,則該測(cè)驗(yàn)內(nèi)容的設(shè)計(jì)或編制是有效的。有效性,一般是用測(cè)驗(yàn)所能測(cè)量的屬性與測(cè)驗(yàn)設(shè)計(jì)者所要測(cè)量屬性的相關(guān)程度進(jìn)行估價(jià)的,但
58、是,相關(guān)系數(shù)不是在任何情況下都能計(jì)算出來(lái)的。當(dāng)無(wú)法計(jì)算兩者的相關(guān)系數(shù),或通過(guò)實(shí)驗(yàn)和對(duì)實(shí)驗(yàn)結(jié)果的數(shù)學(xué)分析也無(wú)法確定其有效性時(shí),就不得不用定性的而不是定量的方法描述其有效性,即采用邏輯推理、判斷的方法估價(jià)有效性。這就引出了邏輯有效性的概念。對(duì)內(nèi)容有效性進(jìn)行估價(jià)時(shí)的邏輯分析,應(yīng)與通過(guò)實(shí)驗(yàn)及數(shù)學(xué)分析論證測(cè)驗(yàn)有效性的方法互為補(bǔ)充。對(duì)內(nèi)容有效性的邏輯分析、推理和判斷,要靠數(shù)學(xué)分析的方法提供有說(shuō)服力的論據(jù)。而數(shù)學(xué)分析方法得出的結(jié)論,也應(yīng)結(jié)合專(zhuān)業(yè)知識(shí)
59、、經(jīng)驗(yàn)進(jìn)行判斷。實(shí)際應(yīng)用中的情況比較復(fù)雜,應(yīng)特別注意。,2. 結(jié)構(gòu)有效性的估計(jì)方法,結(jié)構(gòu)有效性,是指由各種技術(shù)組成的一個(gè)或一組有特征的、完整的測(cè)量手段的結(jié)構(gòu)體系是否包含了欲測(cè)總體屬性的各種擬測(cè)成分,即指測(cè)驗(yàn)所能測(cè)量的屬性與各種擬測(cè)成分在結(jié)構(gòu)上的一致性或邏輯符合程度。估價(jià)結(jié)構(gòu)有效性多用于為研究運(yùn)動(dòng)技術(shù)設(shè)計(jì)的基本技術(shù)和技能測(cè)驗(yàn),在體質(zhì)研究中較少涉及。這里,我們就不詳細(xì)闡述了。,3. 效標(biāo)相關(guān)有效性的估計(jì)方法,將一項(xiàng)測(cè)驗(yàn)的結(jié)果,與一個(gè)公認(rèn)的
60、且已被證實(shí)是有效的測(cè)量或?qū)嶒?yàn)結(jié)果進(jìn)行比較,二者的相關(guān)程度,即為效標(biāo)相關(guān)有效性。估價(jià)效標(biāo)相關(guān)有效性(或信息價(jià)值)時(shí),有兩種不同情況。第一種情況是具有可以測(cè)量的“效標(biāo)”,第二種情況是沒(méi)有可用的統(tǒng)一“效標(biāo)”。因此,應(yīng)根據(jù)不同情況采用相應(yīng)的方法進(jìn)行估價(jià)。,(1)具有可以測(cè)量的“效標(biāo)”,在有可測(cè)量的“效標(biāo)”情況下,估價(jià)實(shí)驗(yàn)有效性,是將某一測(cè)量或?qū)嶒?yàn)手段與某種“效標(biāo)”進(jìn)行比較,其二者的相關(guān)系數(shù)即為有效性系數(shù)。作為“效際”使用的測(cè)驗(yàn),應(yīng)選擇那些一
61、看就知道,而且為大家所公認(rèn)并為實(shí)踐證明能有效地測(cè)量某種屬性的測(cè)量或?qū)嶒?yàn)手段。在體質(zhì)研究中,常用的“效標(biāo)”有以下幾種:①可以客觀(guān)測(cè)量并能用一定計(jì)量單位描述的定量指標(biāo);②非客觀(guān)測(cè)量并無(wú)法用一定計(jì)量單位描述的專(zhuān)家評(píng)定的名次和序號(hào);③“合成效標(biāo)”(即多項(xiàng)總分);④已被證明有效的標(biāo)準(zhǔn)化實(shí)驗(yàn)結(jié)果。,在進(jìn)行科研方法設(shè)計(jì)時(shí)(指標(biāo)設(shè)計(jì)),如何選擇估價(jià)這些指標(biāo)對(duì)測(cè)量某種屬性的有效性“效標(biāo)”,是一個(gè)很重要的問(wèn)題。確定效標(biāo),應(yīng)經(jīng)過(guò)以下幾個(gè)基本步驟:①首先要確
62、定所選效標(biāo)對(duì)測(cè)量某種屬性的邏輯有效性;②只有當(dāng)效標(biāo)是可靠的,而且可靠性系數(shù)足夠大時(shí),才可作為效標(biāo)使用;③最后要根據(jù)所設(shè)計(jì)指標(biāo)的測(cè)量結(jié)果與效標(biāo)的相關(guān)程度(即有效性系數(shù)),確定用這些指標(biāo)代替效標(biāo)測(cè)驗(yàn)是否合理。另外,為了提高“效標(biāo)”的可靠性,在選擇和設(shè)計(jì)“效標(biāo)”時(shí),還必須注意最大限度地消除所有明顯的“效標(biāo)”偏差的來(lái)源。,“效標(biāo)”的偏差,大體上有以下4種類(lèi)型,①“標(biāo)值不足”,即在“效標(biāo)”中省略了某些相關(guān)的元素。產(chǎn)生這種“標(biāo)值不足”的原因有3個(gè)
63、:與使用的量表類(lèi)型有關(guān)。例如,進(jìn)行專(zhuān)家評(píng)價(jià)時(shí),往往用高、較高、一般、較差、差或1、2、3、4、5級(jí)來(lái)描述評(píng)價(jià)等級(jí)的有序量表。這種評(píng)價(jià)等級(jí),只能粗略地描述出個(gè)體水平高低,不能精確地回答高到什么程度或低到什么程度的問(wèn)題,而且往往又因缺乏詳細(xì)而具體的標(biāo)準(zhǔn),使其評(píng)價(jià)結(jié)果的可靠性和客觀(guān)性受到影響。用這種評(píng)價(jià)結(jié)果作為“效標(biāo)”使用,很有可能造成“標(biāo)值不足”。,在制定評(píng)定細(xì)則時(shí),有可能忽略了反映總體屬性的某一個(gè)方面。使用“合成效標(biāo)”時(shí)沒(méi)有加權(quán)或加權(quán)
64、不合理。本來(lái)應(yīng)根據(jù)構(gòu)成“合成效標(biāo)”各指標(biāo)的相對(duì)重要程度,分別進(jìn)行加權(quán),但因設(shè)計(jì)者有時(shí)忽略了這一點(diǎn),或加權(quán)不合理,有可能造成“標(biāo)值不足”。例如,用身體素質(zhì)全面發(fā)展水平這個(gè)多指標(biāo)的T總分作為“合成效標(biāo)”使用時(shí),應(yīng)根據(jù)速度、力量、耐力、靈敏、柔韌等素質(zhì)的相對(duì)重要程度,在計(jì)算各指標(biāo)T總分時(shí)進(jìn)行加權(quán)。若該加權(quán)的沒(méi)有加權(quán),或加了權(quán)但不合理,往往會(huì)因“標(biāo)值不足”而影響“效標(biāo)”自身的可靠性。,②“標(biāo)值污染”,即在“效標(biāo)”中引進(jìn)了某些不相關(guān)的元素。,這種
65、偏差,常產(chǎn)生于制定指標(biāo)測(cè)試細(xì)則過(guò)程之中。即在制定測(cè)試細(xì)則時(shí),忽略了除隨機(jī)測(cè)量誤差以外的可能產(chǎn)生其他誤差的各種有關(guān)因素,并使這些因素在測(cè)量或?qū)嶒?yàn)過(guò)程中起了作用。例如,在用跑臺(tái)實(shí)驗(yàn)直接測(cè)得的最大攝氧量作為“效標(biāo)”來(lái)檢驗(yàn)?zāi)澈?jiǎn)易指標(biāo)的有效性時(shí),為使測(cè)得結(jié)果準(zhǔn)確、可靠,應(yīng)在實(shí)驗(yàn)設(shè)計(jì)時(shí)周密地考慮時(shí)間、環(huán)境、受試者機(jī)能狀態(tài)及儀器誤差等有關(guān)因素,并嚴(yán)格加以控制。這樣的實(shí)驗(yàn)結(jié)果作為“效標(biāo)”才是可靠的。否則,由于測(cè)試條件控制不嚴(yán),而使某些無(wú)關(guān)的因素在實(shí)驗(yàn)過(guò)
66、程中起了作用,就會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果不準(zhǔn)確、不可靠。把它當(dāng)做“效標(biāo)”使用時(shí),其自身的可靠性自然會(huì)受到影響。又如,通過(guò)專(zhuān)家進(jìn)行經(jīng)驗(yàn)評(píng)定時(shí),有時(shí)會(huì)出現(xiàn)因?qū)<蚁矚g某個(gè)人的個(gè)性而給其較高的評(píng)價(jià)等級(jí),或因不喜歡某個(gè)人的個(gè)性而給其較低的評(píng)價(jià)等級(jí)的情況。不管是哪種情況,都使與評(píng)價(jià)目標(biāo)無(wú)關(guān)的因素起了作用,造成了“效標(biāo)”的污染,使其自身的可靠性受到影響。,③“標(biāo)值量表單位偏差”,即較多地使用了量表的某一側(cè),這種偏差,常常在使用等級(jí)評(píng)定的有序量表時(shí)出現(xiàn)。例如,在
67、對(duì)學(xué)生體質(zhì)水平進(jìn)行經(jīng)驗(yàn)評(píng)定時(shí),使用的是1~10分的有序量表,而專(zhuān)家的給分,多數(shù)較集中在7~10分這個(gè)量表區(qū)間,從而使量表單位的使用偏向了一側(cè)。當(dāng)使用這一評(píng)分結(jié)果作為效標(biāo)時(shí),這樣的偏差,常會(huì)影響“效標(biāo)”自身的可靠性。,④“標(biāo)值變形”,標(biāo)值變形,對(duì)于前述的標(biāo)值不足、標(biāo)值污染和標(biāo)值量表的單位偏差,各有著不同的意義。在標(biāo)值不足的情況下,對(duì)于應(yīng)當(dāng)進(jìn)行非零加權(quán)的元素進(jìn)行了零加權(quán)(忽略了某些相關(guān)元素)。其結(jié)果,就會(huì)使“效標(biāo)”產(chǎn)生變形。在標(biāo)值污染的
68、情況下,即該賦予零權(quán)的元素反而加了權(quán)(引進(jìn)了無(wú)關(guān)的元素)致使標(biāo)值變形。在標(biāo)值量表單位偏差的情況下,標(biāo)值的變形表現(xiàn)在集中地使用了量表的一端,而使另一端的部分量表區(qū)間實(shí)際上被賦予了零權(quán)。,以上所分析的“效標(biāo)”偏差的來(lái)源,是在進(jìn)行研究方法設(shè)計(jì)時(shí)所不應(yīng)忽視的。它既是一個(gè)測(cè)量學(xué)的重要理論問(wèn)題,又是一個(gè)技術(shù)細(xì)節(jié)問(wèn)題。因?yàn)椤靶?biāo)”的選擇涉及定量研究所使用的測(cè)量或?qū)嶒?yàn)手段的有效性,因此稍有疏忽,就有可能導(dǎo)致研究結(jié)論的錯(cuò)誤。這一點(diǎn),必須引起科研工作者高
69、度重視。,(2)沒(méi)有統(tǒng)一的“效標(biāo)”,在實(shí)際研究工作中,往往會(huì)遇到這樣的情況,要估價(jià)某指標(biāo)的有效性,卻找不到可用的“效標(biāo)”,因此無(wú)法與“效標(biāo)”進(jìn)行比較。在這種情況下,借助于因素分析的方法會(huì)更有效。因素分析,是研究多指標(biāo)、多變量之間關(guān)系的一種有效的多元統(tǒng)計(jì)方法。它的主要原理和依據(jù)是,把任何一項(xiàng)測(cè)驗(yàn)成績(jī)都看作是一系列不能直接觀(guān)測(cè)的、由潛在因素共同影響和作用的結(jié)果。當(dāng)設(shè)計(jì)一組測(cè)試指標(biāo),并通過(guò)實(shí)際測(cè)試計(jì)算出它們之間的相關(guān)系數(shù)矩陣時(shí),就可以用因
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第二部分 基礎(chǔ)語(yǔ)法
- 第二部分 建設(shè)基礎(chǔ)
- 第二部分
- 食物與健康第二部分
- 酒吧第二部分
- 第二部分.doc
- 第二部分--活動(dòng)設(shè)計(jì)與指導(dǎo)
- 第二部分資產(chǎn)
- 體育測(cè)量與評(píng)價(jià)
- 第二部分練習(xí)篇
- 第二部分 通用技術(shù)
- 作業(yè)票第二部分
- 第二部分古典控制理論基礎(chǔ)習(xí)題詳解
- 合同第二部分全款
- 第二部分專(zhuān)題十六
- 第二部分 招標(biāo)文件
- 設(shè)計(jì)第二部分.doc
- 第二部分專(zhuān)題十五
- 第二部分施工組織
- 第二部分教師用書(shū)
評(píng)論
0/150
提交評(píng)論