第四講 測(cè)量的基本理論_第1頁
第四講 測(cè)量的基本理論_第2頁
第四講 測(cè)量的基本理論_第3頁
第四講 測(cè)量的基本理論_第4頁
第四講 測(cè)量的基本理論_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四講概化理論和第四講概化理論和IRT理論理論簡(jiǎn)介簡(jiǎn)介心理測(cè)量學(xué)心理測(cè)量學(xué)1. 概化理論簡(jiǎn)介概化理論簡(jiǎn)介 n一、概化理論的發(fā)展n(一)概化理論的發(fā)展思路n概化理論(Generalizability Theory,GT)是經(jīng)典理論宏觀發(fā)展,重在研究誤差控制、研究測(cè)驗(yàn)整體設(shè)計(jì)。 心理測(cè)量學(xué)心理測(cè)量學(xué)n1、測(cè)驗(yàn)分?jǐn)?shù)方差的測(cè)量學(xué)意義n測(cè)驗(yàn)分?jǐn)?shù)方差有目標(biāo)分?jǐn)?shù)方差和誤差分?jǐn)?shù)方差之區(qū)別。如:n被試真正能力水平間的分?jǐn)?shù)方差是目標(biāo)分?jǐn)?shù)方差。n同一被試不同次測(cè)驗(yàn)分?jǐn)?shù)間的方差是誤差方差。n同一作品多個(gè)評(píng)分間的方差也是誤差方差。 心理測(cè)量學(xué)心理測(cè)量學(xué)n、誤差來源的多樣性與總分方差結(jié)構(gòu) 的復(fù)雜性n測(cè)量誤差的原因多方面,

2、誤差方差的種類多種。n總分方差結(jié)構(gòu)復(fù)雜:不同來源的誤差方差與目標(biāo)分?jǐn)?shù)方差共存。 心理測(cè)量學(xué)心理測(cè)量學(xué)n3、經(jīng)典測(cè)驗(yàn)理論處理分?jǐn)?shù)方差的辦法n 假定X = T + E,n 然后有:n 再定義信度為: 222ETX22/TX心理測(cè)量學(xué)心理測(cè)量學(xué)n優(yōu)點(diǎn):定義了隨機(jī)誤差,可設(shè)法估計(jì)其大小。n缺點(diǎn):沒有能告訴我們誤差由哪些原因造成,各種原因造成的誤差各有多大。 心理測(cè)量學(xué)心理測(cè)量學(xué)n 4、概化理論的研究目的n探清總分方差結(jié)構(gòu)、n區(qū)分誤差原因,n明確各種誤差大小,n找到最優(yōu)設(shè)計(jì)方案。 心理測(cè)量學(xué)心理測(cè)量學(xué)n(二)概化理論發(fā)展的理論與技術(shù)基礎(chǔ)n1、經(jīng)典測(cè)驗(yàn)理論 概化理論與經(jīng)典測(cè)驗(yàn)理論相比,不同之處多于相同之處

3、。n2、方差分量分析 依靠方差分量分析將總分方差分解、定性。 心理測(cè)量學(xué)心理測(cè)量學(xué)n(三)概化理論發(fā)展史n用方差分量分析研究測(cè)量誤差的歷史可以追溯到20世紀(jì)上半葉。n公認(rèn)的GT正式誕生的標(biāo)志物是克朗巴赫等的專著行為測(cè)量的可靠性的正式出版。 心理測(cè)量學(xué)心理測(cè)量學(xué)n二、概化理論基本框架n(一)概化理論的測(cè)驗(yàn)情境關(guān)系說n為了探清測(cè)驗(yàn)誤差的來源、類型、大小,必須建立一個(gè)理論模型。心理測(cè)量學(xué)心理測(cè)量學(xué)n概化理論模型的建立依賴于對(duì)測(cè)驗(yàn)情境關(guān)系的詳細(xì)調(diào)查。n測(cè)驗(yàn)情境關(guān)系是指測(cè)量目標(biāo)與各測(cè)量側(cè)面所組成的一種關(guān)系結(jié)構(gòu)。 心理測(cè)量學(xué)心理測(cè)量學(xué)n1、測(cè)量目標(biāo)n測(cè)量目標(biāo):測(cè)量者希望通過測(cè)量用測(cè)量值描繪的心理品質(zhì)。n確

4、定測(cè)量目標(biāo)的方法:?jiǎn)枴皽y(cè)誰”和“測(cè)什么”。n一般一場(chǎng)測(cè)量目標(biāo)只能一個(gè)n研究同一測(cè)量問題測(cè)量目標(biāo)一經(jīng)確定不能改變。 心理測(cè)量學(xué)心理測(cè)量學(xué)n2、測(cè)量側(cè)面n測(cè)量側(cè)面:測(cè)量的條件。n測(cè)量側(cè)面水平:測(cè)量條件的不同水平。n測(cè)量側(cè)面類型:隨機(jī)側(cè)面 固定側(cè)面心理測(cè)量學(xué)心理測(cè)量學(xué)n固定側(cè)面的優(yōu)點(diǎn): 測(cè)量的誤差會(huì)減小,測(cè)量的信度會(huì)提高。n固定側(cè)面的缺點(diǎn): 固定側(cè)面成目標(biāo)的一部分,測(cè)量結(jié)果拓廣受限。 心理測(cè)量學(xué)心理測(cè)量學(xué)n3、概化理論下的真分?jǐn)?shù)概念n經(jīng)典測(cè)驗(yàn)理論認(rèn)為個(gè)體真分?jǐn)?shù)只能有一個(gè)。n概化理論認(rèn)為在不同測(cè)量條件下會(huì)有不同的真分?jǐn)?shù)。 心理測(cè)量學(xué)心理測(cè)量學(xué)n測(cè)驗(yàn)情境關(guān)系說結(jié)論:n情境關(guān)系中的測(cè)量目標(biāo)、測(cè)量側(cè)面、側(cè)面

5、的水平變化,會(huì)引起測(cè)驗(yàn)誤差的來源,誤差的大小、真分?jǐn)?shù)的種類以及測(cè)驗(yàn)信度的變化,進(jìn)而引起測(cè)驗(yàn)分?jǐn)?shù)的解釋范圍發(fā)生變化。 心理測(cè)量學(xué)心理測(cè)量學(xué)n(二)測(cè)驗(yàn)設(shè)計(jì)的模型與種類n測(cè)驗(yàn)設(shè)計(jì)的任務(wù)(兩個(gè)方面):n(1)界定測(cè)量目標(biāo)和測(cè)量側(cè)面的個(gè)數(shù)及名稱、意義,確定各側(cè)面的水平數(shù)。n(2)設(shè)計(jì)數(shù)據(jù)采集方法。 心理測(cè)量學(xué)心理測(cè)量學(xué)n數(shù)據(jù)采集方法類型:n以側(cè)面數(shù)分: 單側(cè)面設(shè)計(jì)、 雙側(cè)面設(shè)計(jì)、 多側(cè)面設(shè)計(jì)心理測(cè)量學(xué)心理測(cè)量學(xué)n以數(shù)據(jù)結(jié)構(gòu)分:n交叉設(shè)計(jì): 測(cè)量目標(biāo)在所有側(cè)面的各個(gè)水平上被測(cè)量。n如 pI 、pir 心理測(cè)量學(xué)心理測(cè)量學(xué)n嵌套設(shè)計(jì):測(cè)量目標(biāo)在一個(gè)或多個(gè)側(cè)面的部分水平以下被測(cè)量。n如 p:r 、p:r:s

6、n混合設(shè)計(jì):既有交叉,又有嵌套的測(cè)驗(yàn)設(shè)計(jì)。n如 i(p:r) 心理測(cè)量學(xué)心理測(cè)量學(xué)n數(shù)據(jù)采集設(shè)計(jì)原則:n數(shù)據(jù)充分體現(xiàn)測(cè)量目標(biāo)與各個(gè)測(cè)量側(cè)面及各側(cè)面相互之間關(guān)系n側(cè)面數(shù)、水平數(shù)的設(shè)置要符合客觀的測(cè)驗(yàn)情境;n能獲得充分的數(shù)據(jù)信息;n簡(jiǎn)化模型、節(jié)約投入。n施測(cè)時(shí)要控制設(shè)計(jì)之外的各種無關(guān)變量。 心理測(cè)量學(xué)心理測(cè)量學(xué)n(三)G研究 G研究目的:用方差分量分析,定量估計(jì)觀察領(lǐng)域中測(cè)量目標(biāo)方差和各個(gè)測(cè)量側(cè)面方差,以及其間的交互作用的方差。 心理測(cè)量學(xué)心理測(cè)量學(xué)n方差分量分析(二步):n1、分解總體方差為測(cè)量目標(biāo)主效應(yīng)方差、各測(cè)量側(cè)面主效應(yīng)方差和各種交互效應(yīng)方差。n2、應(yīng)用樣本方差估計(jì)各種效應(yīng)的期望均方差。

7、心理測(cè)量學(xué)心理測(cè)量學(xué)n各種期望均方差性質(zhì):n測(cè)量目標(biāo)效應(yīng)期望均方差:測(cè)量目標(biāo)個(gè)體差異的描寫量;n各測(cè)量側(cè)面效應(yīng)期望均方差:各側(cè)面對(duì)目標(biāo)干擾程度描寫量,就是誤差;n各交互效應(yīng)期望均方差:各側(cè)面對(duì)目標(biāo)的交互干擾程度描寫量,也是誤差。心理測(cè)量學(xué)心理測(cè)量學(xué)n(四)D研究nD研究的目的:在G研究的基礎(chǔ)上,在原設(shè)計(jì)的測(cè)驗(yàn)情境關(guān)系范圍之內(nèi),分析比較各種可能的測(cè)驗(yàn)方案,由研究者結(jié)合實(shí)際,優(yōu)選實(shí)施方案。 心理測(cè)量學(xué)心理測(cè)量學(xué)nD研究調(diào)整原方案獲取新方案的方法:n1、固定原測(cè)驗(yàn)情境關(guān)系中的某一個(gè)或某幾個(gè)側(cè)面。n2、改變?cè)瓬y(cè)驗(yàn)情境關(guān)系中的一個(gè)或某幾個(gè)測(cè)量側(cè)面的水平數(shù)。n3、改變?cè)瓬y(cè)驗(yàn)情境關(guān)系中某些測(cè)量側(cè)面的結(jié)構(gòu)關(guān)系

8、。心理測(cè)量學(xué)心理測(cè)量學(xué)nD研究的統(tǒng)計(jì)分析步驟(兩步)n1、估計(jì)拓廣領(lǐng)域(新測(cè)驗(yàn)方案)下各種效應(yīng)期望方差。n2、估計(jì)新方案下測(cè)驗(yàn)誤差的總體指標(biāo)和測(cè)驗(yàn)質(zhì)量指標(biāo),以提供比較依據(jù)。 心理測(cè)量學(xué)心理測(cè)量學(xué)n測(cè)驗(yàn)誤差指標(biāo):n1、相對(duì)誤差指標(biāo): 所有與測(cè)量目標(biāo)有關(guān)的交互效應(yīng)方差之和,n2、絕對(duì)誤差指標(biāo): 除目標(biāo)主效應(yīng)方差之外的所有效應(yīng)方差之和。 心理測(cè)量學(xué)心理測(cè)量學(xué)n測(cè)驗(yàn)質(zhì)量綜合指標(biāo):n1、概化系數(shù)G;目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加相對(duì)誤差方差之和的比。n2、相依系數(shù):目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加絕對(duì)誤差方差之和的比。心理測(cè)量學(xué)心理測(cè)量學(xué)nD研究的最后工作:n根據(jù)綜合指標(biāo),找出最優(yōu)測(cè)驗(yàn)設(shè)計(jì)方案。 心理測(cè)量學(xué)心

9、理測(cè)量學(xué)n概化理論分析常用軟件:n GENOVAn 或mGENOVA。 心理測(cè)量學(xué)心理測(cè)量學(xué)n三、概化理論評(píng)價(jià)n優(yōu)點(diǎn):n1、概化理論是一套全新的測(cè)驗(yàn)誤差分析方法,而且非常精細(xì)。n2、概化理論引進(jìn)了測(cè)驗(yàn)設(shè)計(jì)的思想和方法。n3、概化理論具有嚴(yán)謹(jǐn)?shù)目茖W(xué)理論體系。心理測(cè)量學(xué)心理測(cè)量學(xué)n缺點(diǎn):n1、概化理論本質(zhì)上還是抽樣,研究本身會(huì)有誤差。n2、計(jì)算方法相對(duì)復(fù)雜,給應(yīng)用帶來一定困難。 2 項(xiàng)目反應(yīng)理論介紹項(xiàng)目反應(yīng)理論介紹內(nèi)容提要:n項(xiàng)目反應(yīng)理論的發(fā)展 nIRT的基本理論體系 n項(xiàng)目反應(yīng)模型 n計(jì)算機(jī)程序 nIRT的應(yīng)用、優(yōu)點(diǎn)與不足 n(一)、經(jīng)典測(cè)驗(yàn)理論一、項(xiàng)目反應(yīng)理論的發(fā)展:n(二)、項(xiàng)目反應(yīng)理論的發(fā)

10、展 1、CTT的理論體系很完善,是其他測(cè)驗(yàn)理論賴以產(chǎn)生的基石。優(yōu)點(diǎn)有:n理論方法體系相對(duì)完整n前提假設(shè)比較弱n所涉及到的數(shù)學(xué)模型以及參數(shù)的概念和估計(jì)方法易理解和掌握n標(biāo)準(zhǔn)化技術(shù)在控制測(cè)驗(yàn)誤差等方面有明顯的效果(一)、經(jīng)典測(cè)驗(yàn)理論n基本假設(shè)難以成立:真分?jǐn)?shù)與觀測(cè)分?jǐn)?shù)間存在線性關(guān)系的假定不合理;平行測(cè)驗(yàn)的假設(shè)難以成立;誤差與真分?jǐn)?shù)獨(dú)立的假設(shè)難以滿足。 2、CTT在理論體系和方法體系方面存在許多其本身難以克服的缺點(diǎn),具體表現(xiàn)為:n項(xiàng)目統(tǒng)計(jì)量嚴(yán)重依賴于測(cè)驗(yàn)所實(shí)施的被試樣組。n被試測(cè)驗(yàn)分?jǐn)?shù)依賴于所施測(cè)項(xiàng)目的難度。 n測(cè)驗(yàn)信度觀存在嚴(yán)重問題。CTT的信度是針對(duì)被試全體的,只代表平均測(cè)量精度,假設(shè)所有被試測(cè)

11、量標(biāo)準(zhǔn)誤相等,而實(shí)際上,不同能力水平的被試不可能具有同樣的測(cè)量標(biāo)準(zhǔn)誤。 n缺乏預(yù)測(cè)力n對(duì)測(cè)驗(yàn)等值、適應(yīng)性測(cè)驗(yàn)、標(biāo)準(zhǔn)參照性測(cè)驗(yàn)的編制等問題不能給以滿意的解決。n盡管存在以上缺點(diǎn),CTT仍在廣泛地應(yīng)用。CTT、IRT和概化理論是當(dāng)今最有影響的三種測(cè)驗(yàn)理論。n簡(jiǎn)單地說,IRT在處理微觀問題(即被試水平與答題目之間的實(shí)質(zhì)性關(guān)系)時(shí)優(yōu)勢(shì)明顯,CTT在處理中觀問題(如處理常見的標(biāo)準(zhǔn)化考試等)時(shí)方便易懂,GT則在處理宏觀問題(如對(duì)結(jié)果作推論)時(shí)更顯出色。n三種測(cè)驗(yàn)理論體系有內(nèi)在聯(lián)系,各有長(zhǎng)短,應(yīng)相互促進(jìn),互相補(bǔ)充。(二)、項(xiàng)目反應(yīng)理論的發(fā)展n由于項(xiàng)目特征曲線(ICC)對(duì)項(xiàng)目反應(yīng)理論的產(chǎn)生具有重要意義,所以在

12、講項(xiàng)目反應(yīng)理論的產(chǎn)生和發(fā)展問題時(shí),一般都追溯到1905年比奈和西蒙編制第一個(gè)智力量表時(shí)的工作,他們當(dāng)時(shí)所使用的作業(yè)成績(jī)隨年齡增長(zhǎng)而提高的散點(diǎn)圖與現(xiàn)在的ICC曲線十分類似。nIRT的真正創(chuàng)立者是美國心理測(cè)量學(xué)家洛德(Lord)。1952年,洛德發(fā)表博士論文一個(gè)測(cè)驗(yàn)分?jǐn)?shù)的理論,提出了IRT的第一個(gè)數(shù)學(xué)模型(Two-parameter Normal Ogive Model,雙參數(shù)正態(tài)卵形曲線模型)及其參數(shù)的估計(jì)方法,并把該模型應(yīng)用到了學(xué)業(yè)成績(jī)和態(tài)度測(cè)量工作之中。n(一)、概念n(二)、基本思想及基本思路n(三)、基本理論假設(shè)二、IRT的基本理論體系(一)、概念n項(xiàng)目反應(yīng)理論(Item Respons

13、e Theory,簡(jiǎn)稱 IRT),又稱潛在特質(zhì)理論潛在特質(zhì)理論(Latent Trait Theory)或項(xiàng)目特征項(xiàng)目特征曲線理論曲線理論(Item Characteristic Curse Theory),是為了克服經(jīng)典測(cè)驗(yàn)理論(CTT)的局限而提出的現(xiàn)代測(cè)驗(yàn)理論。n從測(cè)驗(yàn)的內(nèi)部或微觀方面入手,采取數(shù)學(xué)建模和統(tǒng)計(jì)調(diào)整的方法,重點(diǎn)討論被試的能力水平與測(cè)驗(yàn)項(xiàng)目之間的實(shí)質(zhì)性關(guān)系,測(cè)驗(yàn)的每一個(gè)項(xiàng)目都有自己的項(xiàng)目特征曲線,描述了每一個(gè)特定能力水平的被試答對(duì)或答錯(cuò)該項(xiàng)目的概率。(二)、基本思想及基本思路潛在特質(zhì):n把表現(xiàn)在一個(gè)人身上所特有的相對(duì)穩(wěn)定的行為方式稱為心理特質(zhì)(trait),由于這種心理特質(zhì)是

14、隱含于其行為之中的,所以也稱做潛在特質(zhì)。n與CTT一樣,IRT也認(rèn)為被試的潛在特質(zhì)是不能被觀察和測(cè)量的,但卻可以通過其外顯行為表現(xiàn)出來。 n不同的是,CTT是以被試對(duì)所有測(cè)驗(yàn)項(xiàng)目的反應(yīng)總和(測(cè)驗(yàn)總分)為顯變量來預(yù)測(cè)被試的潛在特質(zhì)的,并不認(rèn)為被試對(duì)單個(gè)項(xiàng)目的反應(yīng) 與其特質(zhì)間有任何有意義的聯(lián)系。nIRT則認(rèn)為被試的能力與其對(duì)某一特定項(xiàng)目的反應(yīng)(以正確或錯(cuò)誤反應(yīng)概率表示)有某種函數(shù)關(guān)系存在,確定這種關(guān)系就是IRT的基本思基本思想和出發(fā)點(diǎn)想和出發(fā)點(diǎn)。n所以IRT可以被理解為一種探討被試對(duì)項(xiàng)目的反應(yīng)與其潛在特質(zhì)間關(guān)系的概率性方法。n用表示被試的潛在特質(zhì)或能力,用Pi()表示其對(duì)項(xiàng)目i正確反應(yīng)概率,項(xiàng)目反

15、應(yīng)理論的關(guān)鍵就是確定與Pi()間的函數(shù)關(guān)系。表1 某個(gè)項(xiàng)目假設(shè)的項(xiàng)目特征曲線1.000.000.50潛在特質(zhì): 正確反應(yīng)的概率: Pi()潛在特質(zhì)空間(Latent Trait Space)n對(duì)于某一特殊行為的發(fā)展起作用的所有潛在特質(zhì)的集合。維度n在潛在特質(zhì)空間中互相獨(dú)立的潛在特質(zhì)的個(gè)數(shù)。n一個(gè)K維的潛在特質(zhì)空間可以表示為:H =(1, 2, 3,.,k)總之,潛在特質(zhì)理論是一切心理測(cè)量理論研究的基礎(chǔ)。n1、潛在特質(zhì)空間的單維性假設(shè)n2、局部獨(dú)立性假設(shè)n3、項(xiàng)目特征曲線假設(shè) n4、非速度性假設(shè)(三)、基本理論假設(shè)1、潛在特質(zhì)空間的單維性假設(shè)(unidimensionality)n潛在特質(zhì)空間

16、n單維性 n指測(cè)驗(yàn)測(cè)量的是單一的特質(zhì)而非多元特質(zhì),即被試對(duì)測(cè)驗(yàn)中任一項(xiàng)目的反應(yīng)是其單一特質(zhì)的函數(shù)。 n如何判斷是否滿足單維性假設(shè)?n因素分析的方法n當(dāng)因素分析抽取的第一個(gè)公共因素解釋的變異遠(yuǎn)大于第二個(gè)公共因素時(shí),就可認(rèn)為測(cè)驗(yàn)是單維的。n但嚴(yán)格的單維性是大多數(shù)測(cè)量工具都難以滿足的,這也是IRT受到批評(píng)的主要原因。n所以,解決測(cè)驗(yàn)的單維性問題及建立多維反應(yīng)模型是IRT將要研究的任務(wù)之一。n在項(xiàng)目反應(yīng)理論中,常用一般的統(tǒng)計(jì)依存性和統(tǒng)計(jì)獨(dú)立性概念來討論項(xiàng)目間關(guān)系。2、局部獨(dú)立性假設(shè)(local independence) nPi(+):表示正確回答第i個(gè)項(xiàng)目的概率nPi(-):表示答錯(cuò)第個(gè)i項(xiàng)目的概率

17、nPj(+):表示正確回答第j個(gè)項(xiàng)目的概率nPj(-) :表示答錯(cuò)第j個(gè)項(xiàng)目的概率nP(+,+)表示正確回答第i和第j個(gè)項(xiàng)目的概率同理,。n根據(jù)以上定義,在下列條件下,兩個(gè)項(xiàng)目得分在統(tǒng)計(jì)上是獨(dú)立的。 nP(+,+)= Pi(+) Pj(+)nP(+, -)= Pi(+) Pj(-)nP( -,+)= Pi(-) Pj(+)nP( -, -)= Pi(-) Pj(-)n如果四個(gè)等式中的任何一個(gè)不成立,則這兩個(gè)項(xiàng)目在統(tǒng)計(jì)上就是依存的。n例:如果 Pi(+)=.8 Pi(-)=.2 Pj(+)=.6 Pj(-)=.4n那么當(dāng)且僅當(dāng) P(+,+)=.48 P(+, -)=.32 P( -,+)=.12

18、 P( -, -)=.08 時(shí)兩個(gè)項(xiàng)目才獨(dú)立。n實(shí)際就是指,如果兩個(gè)項(xiàng)目的每種反應(yīng)模式的概率,僅僅根據(jù)對(duì)每個(gè)項(xiàng)目正確與不正確反應(yīng)的概率就能計(jì)算出來,那么項(xiàng)目之間便是獨(dú)立的。n如何理解局部獨(dú)立性假設(shè)呢? n由于這種獨(dú)立性是針對(duì)特定的值的被試而言的,所以稱為“局部”。n例:假設(shè)1000名能力相同的被試參加某一能力測(cè)驗(yàn),600名被試答對(duì)了項(xiàng)目i,400名答錯(cuò)了;這1000名被試對(duì)項(xiàng)目j的正確反應(yīng)概率與對(duì)項(xiàng)目i的正確反應(yīng)概率統(tǒng)計(jì)上是獨(dú)立的。n總之,同一特質(zhì)水平的被試回答某一項(xiàng)目時(shí)不受其他項(xiàng)目的影響。3、項(xiàng)目特征曲線假設(shè) nIRT假定正確反應(yīng)概率Pi()與間存在規(guī)律性的變化關(guān)系,這種關(guān)系可以用一個(gè)數(shù)學(xué)函

19、數(shù)的形式表示出來,這一函數(shù)稱為項(xiàng)目反應(yīng)函數(shù)(Item Response Function),項(xiàng)目特征曲線(ICC)就是這一函數(shù)的圖像。n大量事實(shí)證明,對(duì)兩級(jí)記分的項(xiàng)目,被試的能力水平與他對(duì)項(xiàng)目的反應(yīng)之間呈S型的曲線關(guān)系,而且這一關(guān)系具有相當(dāng)?shù)钠毡樾?。nS型ICC具有一些共同點(diǎn),即都有一條Y=1的上漸近線和一條Y=c(c0)的下漸進(jìn)線,且是嚴(yán)格單調(diào)上升的,一條ICC的形狀取決于三個(gè)變量:下漸近線的高度,曲線拐點(diǎn)的位置及拐點(diǎn)處的斜率。n這三個(gè)變量恰好相當(dāng)于三個(gè)項(xiàng)目參數(shù):猜測(cè)參數(shù)ci,難度參數(shù)bi和區(qū)分度參數(shù)ai。1.000.000.50Pi()上漸近線下漸近線c拐點(diǎn)切線b21 c(1)難度參數(shù)bi

20、n在一條ICC中,bi等于曲線在拐點(diǎn)處的值。n當(dāng)猜測(cè)參數(shù)ci=0(曲線的下漸近線為0)時(shí),bi等于Pi()=0.50時(shí)的值,因?yàn)閷?duì)一條完整的ICC,拐點(diǎn)恰好是曲線的中點(diǎn)和對(duì)稱點(diǎn)。n當(dāng)ci0時(shí), P()=(1+c)/2n在IRT中, bi表示一個(gè)項(xiàng)目的難度,其取值范圍一般在-3.0到+3.0之間。nbi越大,表示項(xiàng)目的難度越大。1.000.000.50Pi()b1b2項(xiàng)目1項(xiàng)目2n從上圖可以看出,項(xiàng)目2比項(xiàng)目1更難些,因?yàn)槟芰ο嗤耐唤M被試對(duì)項(xiàng)目1的正確反應(yīng)概率要大于對(duì)項(xiàng)目2的正確反應(yīng)概率。n在其他條件不變的情況下,增大項(xiàng)目的難度會(huì)使ICC向右平移。(2)區(qū)分度參數(shù)ain在一條ICC中,ai的

21、大小決定曲線在拐點(diǎn)bi處的陡度。nai很大時(shí),在bi附近能力的增加會(huì)導(dǎo)致正確反應(yīng)概率Pi()有很快的增長(zhǎng);nai很小時(shí),在bi附近能力的等量增加不會(huì)導(dǎo)致正確反應(yīng)概率Pi()有明顯的增長(zhǎng)。nai的取值范圍通常在0.302之間。圖圖 區(qū)分度參數(shù)區(qū)分度參數(shù)ai對(duì)正確反應(yīng)概率的影響對(duì)正確反應(yīng)概率的影響1.000.000.50Pi()b項(xiàng)目1項(xiàng)目2nai越大,曲線在bi附近就會(huì)越陡,項(xiàng)目在bi附近的區(qū)分能力就越大,但在遠(yuǎn)離bi的區(qū)域,曲線就會(huì)變得越平坦,項(xiàng)目的區(qū)分能力就越低。n也就是說,區(qū)分度參數(shù)ai大的項(xiàng)目對(duì)能力水平接近bi的被試有較大的區(qū)分能力,而對(duì)能力水平遠(yuǎn)大于或小于bi的被試區(qū)分能力小。n相反,

22、區(qū)分度參數(shù)ai小的項(xiàng)目則在能力分布更廣泛范圍內(nèi)對(duì)被試都有一定的區(qū)分能力。(3)猜測(cè)參數(shù)cin被試完全憑機(jī)遇答對(duì)項(xiàng)目i的概率即是該項(xiàng)目的猜測(cè)參數(shù)ci。注意:CTT中沒有猜測(cè)參數(shù),IRT引入此概念是為了提高對(duì)能力估計(jì)的精度。n對(duì)包含m個(gè)選擇項(xiàng)的選擇題,其猜測(cè)參數(shù)ci一般接近1/m。nci的取值范圍一般在00.50之間。n二級(jí)評(píng)分IRT模型n多級(jí)評(píng)分IRT模型n連續(xù)型IRT模型三、項(xiàng)目反應(yīng)模型(一)、正態(tài)卵形模型(Normal Ogive Model)n正態(tài)卵形模型將項(xiàng)目特征曲線視為一條S形正態(tài)累積函數(shù)曲線,相應(yīng)的數(shù)學(xué)模型即是正態(tài)累積分布函數(shù)。n可分為三參數(shù)、雙參數(shù)和單參數(shù)模型三種。(1)三參數(shù)正態(tài)

23、卵形模型表達(dá)式為:)(2221)1 ()(iibayiiidyeccp ai、bi、ci,y為正態(tài)曲線縱線的高度,dy表示對(duì)y積分,為積分符號(hào),上下角表示積分的范圍,求從z=-到z=ai(-bi)范圍內(nèi)正態(tài)曲線下的累積面積。(2)雙參數(shù)正態(tài)卵形模型當(dāng)猜測(cè)參數(shù)為0時(shí),三參數(shù)變成了雙參數(shù)。(3)單參數(shù)正態(tài)卵形模型當(dāng)ci=0,ai=1時(shí),雙參數(shù)變成了單參數(shù)。n由于正態(tài)卵形模型中的積分運(yùn)算不易進(jìn)行,伯恩鮑姆(Birnbaum,1957)在洛德正態(tài)卵形模型的基礎(chǔ)上提出了邏輯斯蒂模型。(二)、邏輯斯蒂模型(Logistic Models)n邏輯斯蒂模型避免了復(fù)雜的積分運(yùn)算,在估計(jì)能力和項(xiàng)目參數(shù)時(shí)要簡(jiǎn)便得多

24、。n邏輯斯蒂模型是使用最廣的模型,其次是正態(tài)卵形模型。n邏輯斯蒂模型也包括三參數(shù)、雙參數(shù)和單參數(shù)模型三種。(1)三參數(shù)邏輯斯蒂模型的表達(dá)式:)(7 . 111)1 ()(iibaiiieccpai、bi、ci分別為區(qū)分度參數(shù)、難度參數(shù)、猜測(cè)參數(shù),含義與正態(tài)卵形模型相同。n(2)雙參數(shù)邏輯斯蒂模型當(dāng)猜測(cè)參數(shù)ci=0時(shí),三參數(shù)就變成了雙參數(shù)模型。)(7 . 111)(iibaiepn(3)單參數(shù)邏輯斯蒂模型當(dāng)ci=0,ai=1時(shí),就得到單參數(shù)邏輯斯蒂模型。)(7 . 111)(ibiepn單參數(shù)邏輯斯蒂模型又稱拉什模型,是丹麥數(shù)學(xué)家拉什(Rasch,G.,1960)從一個(gè)不同的角度獨(dú)立提出的心理測(cè)驗(yàn)?zāi)P?。n在IRT的發(fā)展歷史上,拉什模型占

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論