多面rasch模型分析軟件facets在英語測試中的應(yīng)用_第1頁
已閱讀1頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、《中國英語教育》2009年第2期,總第24期EnglishEducationinChinaNumber220091多面Rh模型分析軟件Facets在英語測試中的應(yīng)用石志亮1,韓寶成2(1.中原工學院外語系,鄭州450007,河南;2.北京外國語大學中國外語教育研究中心,北京100089)提要:提要:提要:提要:本文闡釋了多面Rh模型的原理,并就其分析軟件Facets在國內(nèi)外英語測試中的研究現(xiàn)狀做了評述;然后,通過實例重點講述了如何運用F

2、acets軟件進行實驗設(shè)計、編寫分析語句、運行程序,以及如何從考生面、評分者面、評分標準面等對產(chǎn)生的圖表進行解讀。關(guān)鍵詞:關(guān)鍵詞:關(guān)鍵詞:關(guān)鍵詞:多面Rh模型Facets英語測試;應(yīng)用中圖分類號:中圖分類號:中圖分類號:中圖分類號:H319H319H319H319文獻標識碼:文獻標識碼:文獻標識碼:文獻標識碼:AAAA1.1.1.1.多面多面RhRhRhRh模型的原理模型的原理Rh模型由丹麥數(shù)學家GegRh于1960年提出,它是項目反應(yīng)

3、理論(itemresponsetheyIRT)中最重要的模型。Rh模型根據(jù)被試回答問題的情況,通過對題目特征函數(shù)的運算,來推測被試的能力。Rh模型超越了以往任何理論,它深入測驗的微觀領(lǐng)域,將被試特質(zhì)水平與被試在項目上的行為關(guān)聯(lián)起來并且將其參數(shù)化、模型化,是通過統(tǒng)計調(diào)整控制誤差的最好方法;它把項目難度參數(shù)與能力參數(shù)定義在同一個量表上,在此模型分析中考生能力與試題參數(shù)完全獨立;它可以在無樣本的情況下對考生的真分數(shù)或能力水平進行估計(Bach

4、man1999)。另外,通過Rh模型測得的被試能力水平,可以精確估計其測量誤差。自Rh模型建立以來,許多學者試圖將模型改進和推廣以適應(yīng)不同的情形。主要工作之一就是為模型添加參數(shù)(如,難度、區(qū)分度和猜測系數(shù)等),使模型與數(shù)據(jù)更加吻合,其中最為突出的是由芝加哥大學學者JohnMichaelLinacre于1989年提出的多面Rh模式(manyfacetRhmodel)。Rh模型是雙面(被試能力和試題難度)模型,也是單參數(shù)模型,對于項目只考慮

5、難度這一個參數(shù)(difficultyindex);若對這一模型進一步拓展,又考慮到區(qū)分度參數(shù)(discriminativepowderindex)時,它就是一個雙參數(shù)(三面)模型;三參數(shù)(四面)模型則又把猜測系數(shù)(guessingindex)也作為一個因素加以考慮。雙參數(shù)以上的Rh模型被稱為多面Rh模型。多面Rh模型繼承了Rh模型的特點并將此模型擴展到包括更復雜測試條件的研究。多面Rh模型認為測試結(jié)果除受被試能力和試題難度兩個面影響外,

6、還受更多個面,如評分員嚴厲程度等的影響。在測量分析中實際設(shè)定的面在數(shù)量上沒有特殊規(guī)定,研究者可以根據(jù)實際研究的目的確定面的數(shù)量。多面模型主要應(yīng)用于主觀性評價的客觀化分析,拓展了IRT理論在測評領(lǐng)域的應(yīng)用空間。多面Rh模型目前廣泛應(yīng)用在心理和教育測量領(lǐng)域,計算機自適應(yīng)測試(CAT)也是仰賴IRT的理論與技術(shù)。在英語主觀測試中,受評分員效應(yīng)等因素影響,主觀評分往往存在各種不一致性,從而導致主觀評分的信度降低。Bachman(1999)認為,

7、測試分數(shù)要想有效,首先必須是可靠的,即測試信度是效度的基礎(chǔ)。多面Rh模型提供的統(tǒng)計框架可以消除英語主觀測試評分中各個方面的因素對于評分結(jié)果的影響,從而提高評分結(jié)果的信度。因為多面Rh模型除了考生能力和試題難度兩個面以外,還將評分員以及評分量表等因素加入了模型,此外還能利用這一模型進行偏差分析,這樣它不僅可以分析考生能力和試題難度不同所導致的差異,而且可以找出由其它因素導致的誤差來源,從而為考察評分員的評分信度提供參考(劉建達,2007)

8、。2222多面多面RhRhRhRh模型的研究現(xiàn)狀模型的研究現(xiàn)狀目前國內(nèi)外有關(guān)多面Rh模型在英語測試中的應(yīng)用研究起步較晚,有關(guān)的論文為數(shù)《中國英語教育》2009年第2期,總第24期EnglishEducationinChinaNumber220093分不穩(wěn)定,就要對評分員進行有針對性的培訓等。使用Facets軟件多是對評分員的評分結(jié)果(ratereffect)進行檢驗,下面就從這個方面探討一下該軟件的實際使用情況。3.2實例操作3.2.1

9、實驗設(shè)計使用Facets軟件,首先要明確自己要研究什么,即先要做實驗設(shè)計。比如,15個學生進行口語決賽,由5位老師進行評分,通過該軟件就可以檢驗出:這5位老師的評分是否存在內(nèi)在的一致性,即他們是否都是合格的評分員。3.2.2分析語句編寫Facets軟件不像SPSS那樣可以直接導入數(shù)據(jù),然后進行運算。它需要先編寫出分析語句(程序指令),然后,把編寫好的分析語句導入到Facets軟件中進行運算,通過分析運算產(chǎn)生的圖表,我們就可以了解題目難度

10、如何,被試的能力水平怎樣,評分員是否合格等。Facets軟件的分析語句主要有兩部分構(gòu)成:即指令(specification)和數(shù)據(jù)(data)。指令是引導程序怎樣去分析處理數(shù)據(jù)的說明性語句,大部分的指令都有規(guī)范的標準值,適合絕大多數(shù)研究的分析使用;數(shù)據(jù)就是定性的觀察數(shù)據(jù)。3.2.2.1指令編寫指令中的分析語句可以在記事本中自行編寫,也可以利用Facets自帶的模版(在“edit”菜單下的“editfromtemplate”中)做參照進行

11、編寫。我們以Facets自帶的模版為例,講述一下指令編寫的步驟:首先點擊Facets軟件“edit”菜單下的“editfromtemplate”出現(xiàn)如下分析語句:Title=PuttheTableheadingtitlehereFacets=putnumberoffacetsherePositive=1listthepositivelyientedfacetshereNoncentered=1puttheone(usually)floa

12、tingfacethereVertical=putthecontrolfthe“rulers“inTable6hereifnotdefaultArrange=mNputthederfthemeasureTable7hereModels=...RputthemodelstatementfyourFacetshere.Labels=1nameoffacetone1=labeloffirstelementinfacetone2=2nameof

13、facettwo1=labeloffirstelementinfacettwodata=enterinfmat:elementnumberffacetoneelementnumberffacettwoobservation上面第1行的“Title”后面要寫上所做研究的題目是什么,比如,“speakingtest”等(指令為:Title=speakingtest);第2行的Facets是指你的研究要設(shè)定的幾個面,比如,“examinees

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論