項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位_第1頁(yè)
項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位_第2頁(yè)
項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位_第3頁(yè)
項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位_第4頁(yè)
項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、項(xiàng)目反應(yīng)理論在心理測(cè)量學(xué)中的地位 李黎【內(nèi)容提要】項(xiàng)目反應(yīng)理論和經(jīng)典測(cè)驗(yàn)理論在數(shù)學(xué)模式、基本假設(shè)和測(cè)驗(yàn)可靠程度的估計(jì)指標(biāo)等方面都存在著明顯的差別。與經(jīng)典測(cè)驗(yàn)理論相比,項(xiàng)目反應(yīng)理論在較強(qiáng)的前提假設(shè)下,有許多優(yōu)越性,它必將取代經(jīng)典測(cè)驗(yàn)理論取得的心理測(cè)量學(xué)的領(lǐng)導(dǎo)地位?!菊摹啃睦頊y(cè)量學(xué)是一門(mén)研究心理測(cè)驗(yàn)與評(píng)估的科學(xué)。它包含兩個(gè)有機(jī)的組成部分:一是心理測(cè)驗(yàn)的編制和應(yīng)用,二是心理測(cè)驗(yàn)資料的統(tǒng)計(jì)和評(píng)估。這兩個(gè)部分緊密相聯(lián)。心理測(cè)驗(yàn)資料的統(tǒng)計(jì)和評(píng)估在心理測(cè)量學(xué)中的地位已被心理學(xué)界所認(rèn)同。國(guó)內(nèi)有學(xué)者撰文指出:“當(dāng)實(shí)際的量表工作或測(cè)驗(yàn)編制工作達(dá)到一定水平之后,統(tǒng)計(jì)研究的不足早晚會(huì)影響到量表工作質(zhì)量的提高統(tǒng)計(jì)研究

2、的水平?jīng)Q定了心理測(cè)量水平,它在很大程度上制約著心理測(cè)量學(xué)的發(fā)展?!保惛粐?guó)、李偉明,1988。)當(dāng)今心理測(cè)量學(xué)界對(duì)心理測(cè)驗(yàn)資料的統(tǒng)計(jì)處理存在著三大學(xué)派,即經(jīng)典測(cè)驗(yàn)理論(ClassicalTestTheory,CTT)、概括化理論(GaneralizabilityTheory,GT)和項(xiàng)目反應(yīng)理論(ItemResponseTheory,IRT)。其中經(jīng)典測(cè)驗(yàn)理論和概括化理論都屬于隨機(jī)抽樣理論,它們的理論基礎(chǔ)都是建立在真實(shí)分?jǐn)?shù)模式基礎(chǔ)上的。本文試圖對(duì)經(jīng)典測(cè)驗(yàn)理論和項(xiàng)目反應(yīng)理論的基本假設(shè)、項(xiàng)目參數(shù)、基本概念等作一比較(對(duì)概括化理論則不加討論),著重闡述項(xiàng)目反應(yīng)理論在處理材料信息上獨(dú)到的見(jiàn)解和方法,從

3、而預(yù)測(cè)心理測(cè)量學(xué)的發(fā)展方向。一、項(xiàng)目反應(yīng)理論(以下簡(jiǎn)稱(chēng)IRT)和經(jīng)典測(cè)驗(yàn)理論(以下簡(jiǎn)稱(chēng)CTT)的比較(一)關(guān)于數(shù)學(xué)模式。CTT是最早的測(cè)驗(yàn)理論,它是建立在真實(shí)分?jǐn)?shù)模式基礎(chǔ)上的。所謂真實(shí)分?jǐn)?shù)模式,即是指任何測(cè)量值皆由兩部分組成,一是實(shí)際代表某個(gè)潛在特質(zhì)的“真實(shí)分?jǐn)?shù)”,二是觀(guān)察不到也不被潛在特質(zhì)所解釋到的“誤差分?jǐn)?shù)”。這兩部分之間沒(méi)有任何關(guān)聯(lián),即相互獨(dú)立。若以數(shù)學(xué)公式來(lái)表示,則是:Xte其中X代表實(shí)得分?jǐn)?shù),t代表真實(shí)分?jǐn)?shù),e代表誤差分?jǐn)?shù)。CTT依據(jù)的是一種弱勢(shì)假設(shè),被試的某種潛在特質(zhì)無(wú)法單有某次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)來(lái)表示,它必須在無(wú)數(shù)次測(cè)驗(yàn)的基礎(chǔ)上,求其平均值才能代表。IRT是以項(xiàng)目特征曲線(xiàn)和潛在特質(zhì)等

4、概念為理論架構(gòu),依據(jù)強(qiáng)勢(shì)假設(shè)來(lái)發(fā)展其理論模式。它的核心是項(xiàng)目特征曲線(xiàn)。項(xiàng)目特征曲線(xiàn)描繪了被試的某一能力水平與它可能正確回答項(xiàng)目的概率之間的關(guān)系。如圖1所示是一般化的項(xiàng)目特征曲線(xiàn)。表示能力或特質(zhì)水平,Pi()表示能力的被試回答i項(xiàng)目的正確率,與Pi()之間的關(guān)系可以用三參數(shù)logstic模型表示為:1Pi()Ci(1Ci)1expDai(bi)a、b、c三個(gè)參數(shù)可定量表示與Pi()的關(guān)系。a指曲線(xiàn)拐點(diǎn)處的斜率,b指曲線(xiàn)拐點(diǎn)上的值,c是下漸近線(xiàn),表示隨機(jī)猜測(cè)的可能性。附圖圖圖1和t都是表示被試的潛在特質(zhì)的,但兩者有一個(gè)基本不同,當(dāng)?shù)木岛头讲钋蟮靡院?,被試的就不再依?lài)特定的測(cè)量工具,以表示個(gè)體可以

5、跨不同組的測(cè)驗(yàn)項(xiàng)目進(jìn)行比較。而t是按照所回答的特定項(xiàng)目來(lái)定義的,從測(cè)量同一結(jié)構(gòu)的兩組項(xiàng)目中得到的t值是不可比的,除非項(xiàng)目組在CTT意義上是“平行的”,但事實(shí)上,在實(shí)際的測(cè)驗(yàn)情境里,“平行測(cè)驗(yàn)”的假設(shè)不合理也不可能。(二)關(guān)于基本假設(shè)。在CTT中,基本假設(shè)主要有五條:1、xte(實(shí)得分?jǐn)?shù)等于真實(shí)分?jǐn)?shù)與誤差分?jǐn)?shù)之和)。2、E(x)t(實(shí)得分?jǐn)?shù)的期望值等于真實(shí)分?jǐn)?shù))。3、te0(真實(shí)分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)系數(shù)為零)。4、ele20(不同測(cè)驗(yàn)的誤差分?jǐn)?shù)間呈零相關(guān))。5、elt20(不同測(cè)驗(yàn)的誤差分?jǐn)?shù)與真實(shí)分?jǐn)?shù)間呈零相關(guān))。在IRT中,基本假設(shè)主要有四條:1、單向度假設(shè),即測(cè)驗(yàn)中的每一個(gè)項(xiàng)目都測(cè)量到同一種

6、共同的潛在特質(zhì)。2、局部獨(dú)立性假設(shè),即被試在每一個(gè)項(xiàng)目上的反應(yīng)是獨(dú)立的,在n項(xiàng)目中觀(guān)察到的反應(yīng)并不能對(duì)n1個(gè)項(xiàng)目的反應(yīng)提供附加的信息。3、非速度測(cè)驗(yàn)假設(shè),即測(cè)驗(yàn)的進(jìn)行是在沒(méi)有時(shí)間限制的條件下完成的,被試在項(xiàng)目反應(yīng)上不理想,是由于能力不足引起的,而不是由于時(shí)間不夠所致。4、知道正確假設(shè),即被試知道某一項(xiàng)目的正確答案,他必然答對(duì),換句話(huà)說(shuō),若答錯(cuò)某一項(xiàng)目,則他必然不知道答案。(三)關(guān)于估計(jì)測(cè)驗(yàn)可靠程度的指標(biāo)。在CTT中,通常用信度來(lái)表示測(cè)量可靠程度。信度被定義為是真分?jǐn)?shù)變差與實(shí)得分?jǐn)?shù)變差之比,用公式表示即為:2,t2,x公式(1)式中,t為真分?jǐn)?shù)變差,,x為實(shí)得分?jǐn)?shù)變差。事實(shí)上,真分?jǐn)?shù)、真變差在實(shí)

7、際的心理測(cè)量中不可能直接測(cè)量到,因此信度常用兩個(gè)平行測(cè)驗(yàn)的相關(guān)來(lái)估計(jì)。根據(jù)估計(jì)的信度,就可以求出測(cè)驗(yàn)誤差變差。由公式(1)得:r2,t2,x12,e2,x公式(2)2,e為誤差變差。所以,2,e(1r)2,x公式(3)在IRT中,不使用依賴(lài)于平行測(cè)驗(yàn)的信度指標(biāo),而是深入到分析每一個(gè)項(xiàng)目所能提供的信息量的大小,分析每一個(gè)項(xiàng)目的測(cè)量誤差,并得出整個(gè)測(cè)驗(yàn)的信息函數(shù),以這些指標(biāo)對(duì)測(cè)量的可靠程度作出估計(jì)。具體說(shuō)來(lái),可以分以下幾步:首先,對(duì)于一特定水平,可以計(jì)算出項(xiàng)目提供的信息量I(),公式為:nPi()2Ii()公式(4)i=1Pi()Qi()式中Pi()是給定能力在項(xiàng)目i上的正確反應(yīng)概率,即在項(xiàng)目特征

8、曲線(xiàn)上的值,Qi()是錯(cuò)誤反應(yīng)的概率,Pi()是項(xiàng)目i的項(xiàng)目反應(yīng)曲線(xiàn)在處的導(dǎo)數(shù)(斜率),Ii()值越大,表明項(xiàng)目提供的信息越多,在水平的測(cè)量越精確。然后,把項(xiàng)目信息函數(shù)Ii()連加便得到測(cè)驗(yàn)信息函數(shù),用公式表示即為:nIi()Ii()i=1IRT中測(cè)驗(yàn)誤差被定義為與在處的信息量成反比,即:12,e公式(6)I()比較公式(3)和公式(6)可以看到,在CTT中,測(cè)量誤差是一個(gè)統(tǒng)計(jì)量,它依賴(lài)于樣本;而在IRT中,測(cè)量誤差不是一個(gè)統(tǒng)計(jì)量,它依賴(lài)于能力水平,是關(guān)于的函數(shù)。不同的,有不同的標(biāo)準(zhǔn)誤,因此在IRT中用信息函數(shù)I()來(lái)對(duì)測(cè)驗(yàn)可靠性作估計(jì)。(四)關(guān)于項(xiàng)目參數(shù)。在CTT中,難度和辨別力通常可以用數(shù)

9、學(xué)公式來(lái)計(jì)算。其中較為簡(jiǎn)單的一種方法,是分別計(jì)算高分組和低分組正確回答某一項(xiàng)目的比例,然而求其平均值,公式為:P,HP,LP公式(7)2DP,HP,L公式(8)P,H為高分組正確回答某一項(xiàng)目的比例,P,L為低分組正確回答某一項(xiàng)目的比例,P表示難度,D表示辨別力。而在IRT中,項(xiàng)目參數(shù)可由不同的數(shù)學(xué)模式來(lái)估計(jì)。如前述的三參數(shù)logistic模式中,參數(shù)b相當(dāng)于難度,參數(shù)a相當(dāng)于辨別力,可以用迭代逼近法或遞次逼近法估計(jì)。目前已有計(jì)算機(jī)程序。二、項(xiàng)目反應(yīng)理論的優(yōu)越性從上述比較可以看出,IRT與CTT是有很大差別的。在較強(qiáng)的前提假設(shè)下,IRT有許多優(yōu)越性,CTT可以得到的信息,IRT都可以在更高的層次

10、上、更可靠的意義上獲得。IRT的出現(xiàn)導(dǎo)致了心理測(cè)驗(yàn)領(lǐng)域全新的變化。有人稱(chēng)“項(xiàng)目反應(yīng)理論之與經(jīng)典測(cè)驗(yàn)理論,就好比愛(ài)因斯坦相對(duì)論之與牛頓的理論”(Warm,1978)。IRT在以下幾個(gè)方面表現(xiàn)出了較為突出的優(yōu)越性:(一)IRT在估計(jì)被試能力或潛在特質(zhì)時(shí),同時(shí)考慮被試的反應(yīng)組型,因此對(duì)于原始得分相同但反應(yīng)組型不同的個(gè)體,也往往提供不同的能力估計(jì)值,這一特性是CTT所無(wú)法比擬的。在CTT中,原始得分相同的被試,其能力估計(jì)值也相同。(二)IRT可以針對(duì)每個(gè)被試提出其能力估計(jì)值的測(cè)量誤差指標(biāo),而不是以一個(gè)籠統(tǒng)的標(biāo)準(zhǔn)誤來(lái)代表測(cè)量誤差,因此能夠比較精確地?cái)喽總€(gè)被試能力估計(jì)值的誤差范圍。(三)IRT所采用的項(xiàng)

11、目參數(shù),不依賴(lài)于被試樣本,也不依賴(lài)于項(xiàng)目庫(kù),這一點(diǎn)CTT也無(wú)法做到。(四)IRT可以由同質(zhì)性較高的分測(cè)驗(yàn)中計(jì)算出被試的能力估計(jì)值,主試在時(shí)間、精力有限的情境下,可以較快而又不失精確地獲得所需要的信息。(五)IRT提出的項(xiàng)目信息函數(shù)和測(cè)驗(yàn)信息函數(shù)的概念,可以作為評(píng)定個(gè)別項(xiàng)目或整份測(cè)驗(yàn)的測(cè)量誤差的指標(biāo),完全可以取代傳統(tǒng)的“信度”概念。三、項(xiàng)目反應(yīng)理論的發(fā)展前景IRT的理論假設(shè)是建立在嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)統(tǒng)計(jì)模式基礎(chǔ)上的,它借助于電腦科技在近一、二十年取得了突飛猛進(jìn)的進(jìn)展。在過(guò)去的十余年中,不斷有新的項(xiàng)目反應(yīng)模式誕生,有新的項(xiàng)目參數(shù)估計(jì)方法提出,國(guó)內(nèi)也有一些學(xué)者對(duì)IRT進(jìn)行了一系列的應(yīng)用研究。但總的說(shuō)來(lái),目前我國(guó)對(duì)IRT的理論和應(yīng)用研究尚處于起步階段,IRT的推廣應(yīng)用更要受到一些客觀(guān)條件的限制。IRT對(duì)模式參數(shù)的估計(jì),必須要有電腦的輔助,沒(méi)有電腦,其繁瑣的運(yùn)算過(guò)程幾乎無(wú)法完成;IRT的應(yīng)用推廣,還需要應(yīng)用者有較深厚的數(shù)學(xué)功底,或至少在數(shù)理統(tǒng)計(jì)方面訓(xùn)練有素,這是國(guó)內(nèi)一般的心理學(xué)者所缺乏的,因而推廣應(yīng)用IRT的步履相當(dāng)緩慢

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論