第二章__教育測(cè)量的信度_第1頁(yè)
第二章__教育測(cè)量的信度_第2頁(yè)
第二章__教育測(cè)量的信度_第3頁(yè)
第二章__教育測(cè)量的信度_第4頁(yè)
第二章__教育測(cè)量的信度_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、教育測(cè)量的4個(gè)“度”n教育測(cè)量的教育測(cè)量的4 4個(gè)度是指信度、效度、難度、個(gè)度是指信度、效度、難度、區(qū)分度。區(qū)分度。n信度、效度是鑒別教育測(cè)驗(yàn)的整體測(cè)量信度、效度是鑒別教育測(cè)驗(yàn)的整體測(cè)量學(xué)屬性的指標(biāo)。學(xué)屬性的指標(biāo)。n難度、區(qū)分度是檢驗(yàn)教育測(cè)驗(yàn)各項(xiàng)目的難度、區(qū)分度是檢驗(yàn)教育測(cè)驗(yàn)各項(xiàng)目的質(zhì)量好壞的指標(biāo)。質(zhì)量好壞的指標(biāo)。第二章 教育測(cè)量與評(píng)價(jià)的信度學(xué)習(xí)目標(biāo):1 1、理解信度的概念和統(tǒng)計(jì)學(xué)含義。、理解信度的概念和統(tǒng)計(jì)學(xué)含義。2 2、掌握五種信度的定義。、掌握五種信度的定義。3 3、掌握影響信度的主要因素和提高方法。、掌握影響信度的主要因素和提高方法。4 4、能計(jì)算同質(zhì)性信度、評(píng)分者信度,以及新、能計(jì)算

2、同質(zhì)性信度、評(píng)分者信度,以及新 增題目長(zhǎng)度與新測(cè)驗(yàn)信度的關(guān)系。增題目長(zhǎng)度與新測(cè)驗(yàn)信度的關(guān)系。第一節(jié) 誤差的理論v一、誤差的定義和種類v二、誤差的來(lái)源v三、真分?jǐn)?shù) 一、誤差的定義和種類一、誤差的定義和種類 教育測(cè)量中所指的誤差就是在測(cè)量中與目的無(wú)關(guān)的因素所產(chǎn)生的不準(zhǔn)確或不一致的效應(yīng)。此定義包含兩層意思:一是誤差是由與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的因素引起的;二是誤差是不準(zhǔn)確或不一致的測(cè)量結(jié)果。v例如:我們?nèi)バ傎I(mǎi)水果,若攤主偷換了稱砣,其實(shí)測(cè)結(jié)果一定不準(zhǔn);或者 他的秤是符合要求的,但操作時(shí)故意使些手段,其實(shí)測(cè)結(jié)果也是不準(zhǔn)確的,這就是誤差,其產(chǎn)生是由那些與測(cè)量目的無(wú)關(guān)的變因所致。(修改測(cè)量工具、不正確的使用測(cè)量工

3、具)v 誤差主要有兩種類型:系統(tǒng)誤差、隨機(jī)誤差。系統(tǒng)誤差 是由與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的因子所引起的恒定的、系統(tǒng)的、有規(guī)律的變化,存在于每次測(cè)量中,故又稱常定誤差。它直接影響著測(cè)量的準(zhǔn)確性,與效度有關(guān)。因?yàn)樗鼈冊(cè)跍y(cè)驗(yàn)中不引起測(cè)量結(jié)果的不一致性,所以與信度無(wú)關(guān)。如圖所示: v從圖可看出,所有的射擊幾乎都落在靶心的同一外側(cè),射擊的偏差具有一致性、系統(tǒng)性。v如射擊過(guò)程中,盡管射手非常優(yōu)秀,每次結(jié)果都很一致,但若槍的準(zhǔn)心有點(diǎn)毛病,則其射擊結(jié)果將會(huì)產(chǎn)生穩(wěn)定的偏差;又如,數(shù)學(xué)測(cè)驗(yàn)中,如有一道10分題的標(biāo)準(zhǔn)答案給錯(cuò),則全體正確作答該題的考生成績(jī)將普遍下降10分,這也是系統(tǒng)誤差。v若是老師評(píng)分標(biāo)準(zhǔn)寬嚴(yán)不一,甚至隨心所欲

4、,則考生成績(jī)就會(huì)出現(xiàn)隨機(jī)誤差。 隨機(jī)誤差 是使用測(cè)量工具進(jìn)行心理測(cè)量所造成的誤差,又稱測(cè)量誤差、觀察誤差、偶然誤差。它是由與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的偶然因素引起,使得幾次測(cè)量結(jié)果不一致,且這種不一致是無(wú)系統(tǒng)的、隨機(jī)的。隨機(jī)誤差與信度及效度都有關(guān)系,信度則完全受隨機(jī)誤差影響。 如圖所示: v由圖可看出,所有的射擊幾乎是隨機(jī)地散落在靶心的四周,不具有一致性和規(guī)律性。v比如,在射擊中,新手往往很難控制手臂的輕微擺動(dòng),結(jié)果多次射擊成績(jī)很不一致,這種誤差就是隨機(jī)誤差。 二、誤差的來(lái)源v(一)測(cè)驗(yàn)內(nèi)部引起的誤差v(二)由施測(cè)過(guò)程引起的誤差v(三)由受測(cè)者本身引起的誤差 在教育測(cè)量中,常見(jiàn)的誤差來(lái)源于三個(gè)方面:測(cè)驗(yàn)內(nèi)

5、部、施測(cè)過(guò)程、受測(cè)者本身。 (一)測(cè)驗(yàn)內(nèi)部引起的誤差 測(cè)驗(yàn)內(nèi)部引起的誤差主要來(lái)源于題目取樣: 當(dāng)測(cè)驗(yàn)題目較少或取樣缺乏代表性時(shí),被試的反應(yīng)受機(jī)遇影響較大; 當(dāng)幾個(gè)測(cè)驗(yàn)復(fù)本不等值時(shí),接受不同的題目,就會(huì)獲得不同的分?jǐn)?shù); 測(cè)驗(yàn)題目格式不妥; 測(cè)驗(yàn)的難度過(guò)高或過(guò)低; 測(cè)題或指導(dǎo)語(yǔ)用詞不當(dāng); 測(cè)驗(yàn)時(shí)限過(guò)短。 (二)由施測(cè)過(guò)程引起的誤差 三種誤差來(lái)源中,此種誤差可能是最容易控制和檢驗(yàn)的。與施測(cè)過(guò)程有關(guān)的誤差主要有以下幾種: 1.物理環(huán)境 施測(cè)現(xiàn)場(chǎng)的溫度、光線、聲音、桌面好壞、空間闊窄等皆有影響。 2.主試者方面 主試者的年齡、性別、外表,施測(cè)時(shí)的言談舉止、表情動(dòng)作等均能影響測(cè)驗(yàn)結(jié)果。 3.意外干擾 在測(cè)

6、驗(yàn)環(huán)境復(fù)雜,特別是當(dāng)受試人數(shù)較多時(shí),容易發(fā)生意外情況,這會(huì)導(dǎo)致測(cè)驗(yàn)成績(jī)不準(zhǔn)確。 4.評(píng)分記分 評(píng)分不客觀、計(jì)分、登記分?jǐn)?shù)出錯(cuò)等也是常見(jiàn)的誤差。 (三)由受測(cè)者本身引起的誤差 即使一個(gè)測(cè)驗(yàn)經(jīng)過(guò)精心編制,題目取樣具有代表性,又有標(biāo)準(zhǔn)化的施測(cè)程序,由于受測(cè)者本身的變化,仍然會(huì)給測(cè)驗(yàn)分?jǐn)?shù)帶來(lái)誤差,這種誤差是最難控制的。主要有以下幾種: 1.應(yīng)試動(dòng)機(jī) 受測(cè)者對(duì)測(cè)驗(yàn)的動(dòng)機(jī)不同,會(huì)影響其作答態(tài)度、注意力、持久性、反應(yīng)速度等,從而影響測(cè)驗(yàn)成績(jī)。 2.測(cè)驗(yàn)焦慮 一般來(lái)說(shuō) ,適度的焦慮會(huì)使人的興奮性提高,注意力增強(qiáng),提高反應(yīng)速度,從而對(duì)測(cè)驗(yàn)成績(jī)產(chǎn)生積極的影響。過(guò)高的焦慮卻會(huì)使工作能力下降,注意分散,記憶中儲(chǔ)存的東

7、西不能提取,影響測(cè)驗(yàn)成績(jī)。 3.生理因素 生病、疲勞、失眠等生理因素會(huì)影響測(cè)驗(yàn)成績(jī)而帶來(lái)誤差。 4.學(xué)習(xí)、發(fā)展和教育 由一般學(xué)習(xí)經(jīng)驗(yàn)或發(fā)展變化所引起的測(cè)驗(yàn)分?jǐn)?shù)上的差異,在大多情況下,只構(gòu)成恒定誤差,但有時(shí)也構(gòu)成隨機(jī)誤差。 5.測(cè)驗(yàn)經(jīng)驗(yàn) 受測(cè)者對(duì)測(cè)驗(yàn)的經(jīng)驗(yàn)也會(huì)影響測(cè)驗(yàn)成績(jī),對(duì)測(cè)驗(yàn)的程序和技能熟悉程度不同,所得分?jǐn)?shù)便不能直接比較。 6.練習(xí)效應(yīng) 任何一個(gè)測(cè)驗(yàn)在第二次應(yīng)用時(shí),都會(huì)有練習(xí)效應(yīng)而使成績(jī)提高。 三、真分?jǐn)?shù) 所謂真分?jǐn)?shù)就是一個(gè)測(cè)量工具在測(cè)量沒(méi)有誤差時(shí),所得到的純正值。其操作定義是:經(jīng)過(guò)無(wú)數(shù)次測(cè)量所得到的平均值。 真分?jǐn)?shù)的定義表明,一個(gè)人在一個(gè)測(cè)驗(yàn)上所得的分?jǐn)?shù),即是它的真分?jǐn)?shù)的函數(shù),也是測(cè)量誤

8、差的函數(shù),用公式表示如下: X=T+E 這里 X為實(shí)得分?jǐn)?shù)或觀測(cè)分?jǐn)?shù),T是假設(shè)的真分?jǐn)?shù),E是測(cè)量誤差。 真分?jǐn)?shù)是一個(gè)在理論上構(gòu)想出來(lái)的抽象概念,在實(shí)際測(cè)量中是很難得到的。 在上述公式中E可能是正的,也可能是負(fù)的。即一個(gè)人的實(shí)得分?jǐn)?shù)可能大于真實(shí)量,也可能小于真實(shí)量,總是圍繞真值上下波動(dòng)。真分?jǐn)?shù)理論的三個(gè)基本假設(shè): 誤差分?jǐn)?shù)的平均數(shù)是零(由于測(cè)量誤差具有隨機(jī)性); 誤差分?jǐn)?shù)與真分?jǐn)?shù)相互獨(dú)立,即相關(guān)為零; 兩次測(cè)量的誤差分?jǐn)?shù)之間的相關(guān)為零。 根據(jù)上述假設(shè),可以推導(dǎo)出實(shí)測(cè)分?jǐn)?shù)、真分?jǐn)?shù)和測(cè)量誤差之間有如下關(guān)系: SX 2 =S T2+SE2 即實(shí)得分?jǐn)?shù)的方差等于真分?jǐn)?shù)的方差誤差的方差之和。一般地,一般地

9、,設(shè)一組樣本數(shù)據(jù)設(shè)一組樣本數(shù)據(jù) ,其平均,其平均數(shù)為數(shù)為x,x,則稱則稱nxxx,21 nxxx,21212)(1niixxns為這個(gè)樣本的為這個(gè)樣本的方差方差,其算術(shù)平方根,其算術(shù)平方根niixxns12)(1為樣本的為樣本的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差。方差越小,數(shù)據(jù)的波動(dòng)越小。方差越小,數(shù)據(jù)的波動(dòng)越小。第二節(jié) 信度的定義一、什么是信度n信度指測(cè)量結(jié)果的穩(wěn)定性、一致性程度。一個(gè)好的信度指測(cè)量結(jié)果的穩(wěn)定性、一致性程度。一個(gè)好的測(cè)量工具必須具備好的信度,也就是說(shuō)它多次測(cè)量測(cè)量工具必須具備好的信度,也就是說(shuō)它多次測(cè)量的結(jié)果應(yīng)該相對(duì)的穩(wěn)定、一致。的結(jié)果應(yīng)該相對(duì)的穩(wěn)定、一致。 n信度反映的是測(cè)量中隨機(jī)誤差的大小信度

10、反映的是測(cè)量中隨機(jī)誤差的大小。隨機(jī)誤差小,。隨機(jī)誤差小,則信度高;反之,則信度低。則信度高;反之,則信度低。n測(cè)驗(yàn)題目本身并不能提供信度的估計(jì)值,信度統(tǒng)計(jì)測(cè)驗(yàn)題目本身并不能提供信度的估計(jì)值,信度統(tǒng)計(jì)來(lái)自于測(cè)驗(yàn)分?jǐn)?shù)。也就是說(shuō),在檢驗(yàn)信度之前必須來(lái)自于測(cè)驗(yàn)分?jǐn)?shù)。也就是說(shuō),在檢驗(yàn)信度之前必須要實(shí)施教育測(cè)驗(yàn),以獲得測(cè)驗(yàn)分?jǐn)?shù)。要實(shí)施教育測(cè)驗(yàn),以獲得測(cè)驗(yàn)分?jǐn)?shù)。1 1、信度可定義為一個(gè)被測(cè)團(tuán)體的真分?jǐn)?shù)方、信度可定義為一個(gè)被測(cè)團(tuán)體的真分?jǐn)?shù)方差與觀測(cè)分?jǐn)?shù)方差之比。或者說(shuō),真分?jǐn)?shù)變異差與觀測(cè)分?jǐn)?shù)方差之比?;蛘哒f(shuō),真分?jǐn)?shù)變異能夠解釋觀測(cè)分?jǐn)?shù)變異的比例(能夠解釋觀測(cè)分?jǐn)?shù)變異的比例(理論定義理論定義) r rxxxx

11、= = s s2 2T T / s/ s2 2x x ( (r rxxxx為信度系數(shù)為信度系數(shù)) )觀測(cè)觀測(cè)分?jǐn)?shù)分?jǐn)?shù)方差方差真分?jǐn)?shù)方差二、用統(tǒng)計(jì)術(shù)語(yǔ)談信度2 2、信度系數(shù)等于一個(gè)測(cè)驗(yàn)、信度系數(shù)等于一個(gè)測(cè)驗(yàn)X X與它的任意一個(gè)平與它的任意一個(gè)平行測(cè)驗(yàn)行測(cè)驗(yàn)X X 的相關(guān)系數(shù)(的相關(guān)系數(shù)(操作定義操作定義) r rxxxx = = r rxxxx ( (r rxxxx為信度系數(shù)為信度系數(shù)) ) n考察信度系數(shù)時(shí),常常采用考察信度系數(shù)時(shí),常常采用相關(guān)系數(shù)相關(guān)系數(shù)作為信作為信度指標(biāo)。采用不同的方式計(jì)算相關(guān)系數(shù),就度指標(biāo)。采用不同的方式計(jì)算相關(guān)系數(shù),就得到不同類型的信度系數(shù)。得到不同類型的信度系數(shù)。n信

12、度值在信度值在0 01.001.00之間,當(dāng)信度系數(shù)等于之間,當(dāng)信度系數(shù)等于1.001.00時(shí),表示測(cè)驗(yàn)完全可靠;當(dāng)信度系數(shù)等于時(shí),表示測(cè)驗(yàn)完全可靠;當(dāng)信度系數(shù)等于0 0時(shí),時(shí),則表示測(cè)驗(yàn)根本不可靠。則表示測(cè)驗(yàn)根本不可靠。問(wèn)題n一個(gè)能力測(cè)驗(yàn)用于人才招聘,經(jīng)檢驗(yàn)它的信一個(gè)能力測(cè)驗(yàn)用于人才招聘,經(jīng)檢驗(yàn)它的信度為度為0.700.70 ,如何理解這個(gè)信度系數(shù)的含義?,如何理解這個(gè)信度系數(shù)的含義?n0.700.70的信度系數(shù)表明,在不同的招聘候選人的信度系數(shù)表明,在不同的招聘候選人之間進(jìn)行比較,候選人測(cè)驗(yàn)分?jǐn)?shù)的之間進(jìn)行比較,候選人測(cè)驗(yàn)分?jǐn)?shù)的70%70%差別是差別是由于個(gè)體之間真實(shí)的能力差異所導(dǎo)致的,而由

13、于個(gè)體之間真實(shí)的能力差異所導(dǎo)致的,而30%30%差別是由于隨機(jī)誤差所導(dǎo)致。差別是由于隨機(jī)誤差所導(dǎo)致。第二節(jié)第二節(jié) 信度的種類及其估計(jì)方法信度的種類及其估計(jì)方法n采用不同的方法來(lái)計(jì)算相關(guān)系數(shù),就會(huì)得到采用不同的方法來(lái)計(jì)算相關(guān)系數(shù),就會(huì)得到不同類型的信度指標(biāo):重測(cè)信度、復(fù)本信度、不同類型的信度指標(biāo):重測(cè)信度、復(fù)本信度、分半信度、同質(zhì)性信度、評(píng)分者信度。分半信度、同質(zhì)性信度、評(píng)分者信度。n五種信度的含義和計(jì)算方法各異,我們?cè)谑刮宸N信度的含義和計(jì)算方法各異,我們?cè)谑褂脮r(shí)要特別注意每一種信度的特定內(nèi)涵和適用時(shí)要特別注意每一種信度的特定內(nèi)涵和適用范圍。用范圍。一、重測(cè)信度u重測(cè)信度重測(cè)信度(Test-re

14、test Reliability)(Test-retest Reliability)指的是用指的是用同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測(cè)一致性程度,其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。u重測(cè)信度又叫再測(cè)信度,重測(cè)信度又叫再測(cè)信度,它反映的是教育測(cè)驗(yàn)它反映的是教育測(cè)驗(yàn)跨時(shí)間的一致性,是穩(wěn)定性系數(shù)??鐣r(shí)間的一致性,是穩(wěn)定性系數(shù)。相關(guān)系數(shù)施測(cè)再施測(cè)時(shí)間間隔重測(cè)信度的計(jì)算公式與使用前提 采用重測(cè)信度作為信度指標(biāo)時(shí),必須滿足以下前采用重測(cè)信度作為信度指標(biāo)時(shí),必須

15、滿足以下前提:(提:(1 1)測(cè)驗(yàn)所測(cè)的教育特質(zhì)必須是穩(wěn)定的;()測(cè)驗(yàn)所測(cè)的教育特質(zhì)必須是穩(wěn)定的;(2 2)遺忘和練習(xí)的效果基本相互抵消;(遺忘和練習(xí)的效果基本相互抵消;(3 3)在兩次施測(cè))在兩次施測(cè)的間隔期內(nèi),被試所要測(cè)查的教育特質(zhì)沒(méi)有獲得更多的間隔期內(nèi),被試所要測(cè)查的教育特質(zhì)沒(méi)有獲得更多的學(xué)習(xí)和訓(xùn)練;(的學(xué)習(xí)和訓(xùn)練;(4 4)被試有條件接受兩次相同的測(cè))被試有條件接受兩次相同的測(cè)驗(yàn),取決于時(shí)間、經(jīng)費(fèi)等因素。驗(yàn),取決于時(shí)間、經(jīng)費(fèi)等因素。22)()(/)(yyxxyyxxrxx重測(cè)信度與時(shí)間間隔n間隔時(shí)間不同,重測(cè)信度也不同。一般而言,間隔時(shí)間不同,重測(cè)信度也不同。一般而言,時(shí)間間隔越長(zhǎng),信

16、度系數(shù)越低。時(shí)間間隔越長(zhǎng),信度系數(shù)越低。n適宜的間隔時(shí)間因測(cè)驗(yàn)性質(zhì)、被試特點(diǎn)而異。適宜的間隔時(shí)間因測(cè)驗(yàn)性質(zhì)、被試特點(diǎn)而異。一般以一般以2 2周到周到4 4周較宜,最好不超過(guò)周較宜,最好不超過(guò)6 6個(gè)月。個(gè)月。n報(bào)告重測(cè)信度時(shí)要明確說(shuō)明兩次測(cè)驗(yàn)之間的時(shí)報(bào)告重測(cè)信度時(shí)要明確說(shuō)明兩次測(cè)驗(yàn)之間的時(shí)間間隔。并且,一個(gè)經(jīng)過(guò)良好評(píng)估的測(cè)驗(yàn)應(yīng)當(dāng)間間隔。并且,一個(gè)經(jīng)過(guò)良好評(píng)估的測(cè)驗(yàn)應(yīng)當(dāng)具有多個(gè)時(shí)間間隔的重測(cè)信度。具有多個(gè)時(shí)間間隔的重測(cè)信度。二、復(fù)本信度 n復(fù)本信度復(fù)本信度(Alternate-form Reliability)(Alternate-form Reliability) 指用兩個(gè)平行測(cè)驗(yàn)測(cè)量同一批被

17、試所得結(jié)果指用兩個(gè)平行測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個(gè)的一致性程度。其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。n復(fù)本信度又叫平行性信度,復(fù)本信度又叫平行性信度,它反映的是跨型式它反映的是跨型式的一致性的一致性 。施測(cè)型施測(cè)型 相關(guān)系數(shù)連續(xù)施測(cè)或間隔施測(cè)平行測(cè)驗(yàn)的概念n平行測(cè)驗(yàn)(平行測(cè)驗(yàn)(A A、B B卷)必須是真正等值的,它們卷)必須是真正等值的,它們測(cè)量的是同一特質(zhì),具有大致相當(dāng)?shù)膬?nèi)容范圍、測(cè)量的是同一特質(zhì),具有大致相當(dāng)?shù)膬?nèi)容范圍、題型、長(zhǎng)度、難度、區(qū)分度、指導(dǎo)語(yǔ)、時(shí)限等,題型、長(zhǎng)度、難度、區(qū)分

18、度、指導(dǎo)語(yǔ)、時(shí)限等,只是具體的題目不同。只是具體的題目不同。n在統(tǒng)計(jì)學(xué)上,真正的平行測(cè)驗(yàn)在測(cè)量同一批被在統(tǒng)計(jì)學(xué)上,真正的平行測(cè)驗(yàn)在測(cè)量同一批被試時(shí),應(yīng)具有相同的平均數(shù)和標(biāo)準(zhǔn)差,并且被試時(shí),應(yīng)具有相同的平均數(shù)和標(biāo)準(zhǔn)差,并且被試在分?jǐn)?shù)分布形態(tài)上相似。試在分?jǐn)?shù)分布形態(tài)上相似。n由于平行測(cè)驗(yàn)的題目不相同,所以不存在記憶由于平行測(cè)驗(yàn)的題目不相同,所以不存在記憶效應(yīng)。效應(yīng)。兩種復(fù)本信度u等值性系數(shù)等值性系數(shù):如果兩個(gè)平行測(cè)驗(yàn)連續(xù)施測(cè),如果兩個(gè)平行測(cè)驗(yàn)連續(xù)施測(cè),則這種復(fù)本信度為等值性系數(shù)。它反映的是則這種復(fù)本信度為等值性系數(shù)。它反映的是兩個(gè)平行測(cè)驗(yàn)的題目差異所帶來(lái)的變異情況。兩個(gè)平行測(cè)驗(yàn)的題目差異所帶來(lái)的變

19、異情況。u穩(wěn)定性與等值性系數(shù)穩(wěn)定性與等值性系數(shù):如果兩個(gè)平行測(cè)驗(yàn)是如果兩個(gè)平行測(cè)驗(yàn)是間隔一段時(shí)間后施測(cè),則這種復(fù)本信度為穩(wěn)間隔一段時(shí)間后施測(cè),則這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。它反映題目差異與時(shí)間定性與等值性系數(shù)。它反映題目差異與時(shí)間間隔兩方面所帶來(lái)的變異情況,影響因素更間隔兩方面所帶來(lái)的變異情況,影響因素更多。一般而言,穩(wěn)定性與等值性系數(shù)最為嚴(yán)多。一般而言,穩(wěn)定性與等值性系數(shù)最為嚴(yán)格,它的值也最低。格,它的值也最低。 采用復(fù)本信度的條件n要構(gòu)造出要構(gòu)造出2 2份或份或2 2份以上真正平行的測(cè)驗(yàn)。份以上真正平行的測(cè)驗(yàn)。n被試有條件接受兩次以上的測(cè)驗(yàn)。被試有條件接受兩次以上的測(cè)驗(yàn)。 復(fù)本信度的

20、優(yōu)缺點(diǎn)優(yōu)點(diǎn):優(yōu)點(diǎn):1、減少了記憶效應(yīng)和練習(xí)效應(yīng)。、減少了記憶效應(yīng)和練習(xí)效應(yīng)。2、適用于追蹤研究的多次測(cè)量。、適用于追蹤研究的多次測(cè)量。3、減少了輔導(dǎo)的可能性。、減少了輔導(dǎo)的可能性。缺點(diǎn):缺點(diǎn):1、編制復(fù)本測(cè)驗(yàn)的難度較大。、編制復(fù)本測(cè)驗(yàn)的難度較大。2、被試要有接受兩次以上測(cè)驗(yàn)的條件和意愿。、被試要有接受兩次以上測(cè)驗(yàn)的條件和意愿。三、分半信度n分半信度分半信度(Split-half Reliability)(Split-half Reliability)指將一指將一個(gè)測(cè)驗(yàn)分成個(gè)測(cè)驗(yàn)分成對(duì)等對(duì)等的兩半后,所有被試在這兩的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。半上所得分?jǐn)?shù)的一致性程度。n最常

21、用的分半方法是奇、偶分半,即奇號(hào)題最常用的分半方法是奇、偶分半,即奇號(hào)題組成組成“半個(gè)測(cè)驗(yàn)半個(gè)測(cè)驗(yàn)”,偶號(hào)題組成另外的,偶號(hào)題組成另外的“半半個(gè)測(cè)驗(yàn)個(gè)測(cè)驗(yàn)” ” ,計(jì)算被試團(tuán)體在這兩個(gè),計(jì)算被試團(tuán)體在這兩個(gè)“半個(gè)半個(gè)測(cè)驗(yàn)測(cè)驗(yàn)”上得分的相關(guān)系數(shù),上得分的相關(guān)系數(shù),經(jīng)校正后得到分經(jīng)校正后得到分半信度系數(shù)。半信度系數(shù)。 n分半信度所描述的是分半信度所描述的是兩半測(cè)驗(yàn)兩半測(cè)驗(yàn)?zāi)軌驕y(cè)量相同教能夠測(cè)量相同教育特質(zhì)的程度,育特質(zhì)的程度,它是內(nèi)部一致性系數(shù)的一種它是內(nèi)部一致性系數(shù)的一種(同質(zhì)性信度是內(nèi)部一致性系數(shù)的另一種)。(同質(zhì)性信度是內(nèi)部一致性系數(shù)的另一種)。n分半信度只需要一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn),分

22、半信度只需要一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn),操作起來(lái)更簡(jiǎn)便。操作起來(lái)更簡(jiǎn)便。n當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),不宜使用當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),不宜使用分半信度。分半信度。分半信度的計(jì)算方法 1 1、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差(當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差(S S2 2a a 和和S S2 2b b)相等時(shí),)相等時(shí),計(jì)計(jì)算兩個(gè)算兩個(gè)“半測(cè)驗(yàn)半測(cè)驗(yàn)”之間的皮爾遜積差相關(guān)系數(shù),然之間的皮爾遜積差相關(guān)系數(shù),然后用斯皮爾曼后用斯皮爾曼- -布朗公式校正。布朗公式校正。為何要校正?因?yàn)橹粸楹我U恳驗(yàn)橹皇前雮€(gè)測(cè)量的信度。是半個(gè)測(cè)量的信度。 r rxxxx = 2r= 2rhh hh / (1+r/ (1+r

23、hhhh) () (斯皮爾曼斯皮爾曼- -布朗公式布朗公式) ) 其中其中r rxxxx是整個(gè)測(cè)驗(yàn)的分半信度,是整個(gè)測(cè)驗(yàn)的分半信度,r rhhhh是兩個(gè)半測(cè)驗(yàn)是兩個(gè)半測(cè)驗(yàn)之間的相關(guān)系數(shù)。之間的相關(guān)系數(shù)。 練習(xí)題 假設(shè)一個(gè)測(cè)驗(yàn)中,奇數(shù)項(xiàng)題目得分與偶數(shù)項(xiàng)題假設(shè)一個(gè)測(cè)驗(yàn)中,奇數(shù)項(xiàng)題目得分與偶數(shù)項(xiàng)題目得分的方差相等,它們之間的相關(guān)系數(shù)是目得分的方差相等,它們之間的相關(guān)系數(shù)是0.80,0.80,請(qǐng)請(qǐng)問(wèn)該測(cè)驗(yàn)的分半信度是多少?問(wèn)該測(cè)驗(yàn)的分半信度是多少? r rxxxx = 2r= 2rhh hh / (1+r/ (1+rhhhh) ) = 2 = 20.800.80(1+ 0.801+ 0.80) =0.

24、89 =0.892 2、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差(當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差(S S2 2a a 和和S S2 2b b)不相等時(shí),)不相等時(shí),采用弗朗那根公式和盧侖公式。采用弗朗那根公式和盧侖公式。 弗朗那根公式:弗朗那根公式:r rxxxx = 2 1- = 2 1-( S S2 2a a + S + S2 2b b )/ S/ S2 2x x 盧侖公式盧侖公式: : r rxxxx = 1- S = 1- S2 2d d / S / S2 2x x 其中其中r rxxxx是測(cè)驗(yàn)的分半信度,是測(cè)驗(yàn)的分半信度, S S2 2a a 、 S S2 2b b表示被試表示被試在兩半測(cè)驗(yàn)上得分的方差,在兩

25、半測(cè)驗(yàn)上得分的方差,S S2 2x x表示被試在整個(gè)測(cè)驗(yàn)表示被試在整個(gè)測(cè)驗(yàn)上得分的方差,上得分的方差, S S2 2d d表示被試在兩半測(cè)驗(yàn)上得分之差表示被試在兩半測(cè)驗(yàn)上得分之差的方差。的方差。v使用條件:使用條件:v 分半信度通常只能在施測(cè)一次或沒(méi)有復(fù)本的情況下使用。而且,在使用斯皮爾曼-布朗公式時(shí),要求全體被試在兩半測(cè)驗(yàn)中得分的變異數(shù)要相等。當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等兩半時(shí),分半信度不宜使用。此外,由于將一個(gè)測(cè)驗(yàn)分成兩半的方法很多(如題號(hào)的奇偶分半,按題目的內(nèi)容分半等),所以同一個(gè)測(cè)驗(yàn)會(huì)有多個(gè)分半信度值。四、同質(zhì)性信度四、同質(zhì)性信度 u同質(zhì)性信度(同質(zhì)性信度(Homogeneity Relia

26、bilityHomogeneity Reliability)指)指測(cè)驗(yàn)內(nèi)部所有題目之間的一致性程度。測(cè)驗(yàn)內(nèi)部所有題目之間的一致性程度。u與分半信度一樣,同質(zhì)性信度也是內(nèi)部一致性與分半信度一樣,同質(zhì)性信度也是內(nèi)部一致性系數(shù)。分半信度是求系數(shù)。分半信度是求兩半測(cè)驗(yàn)之間兩半測(cè)驗(yàn)之間的一致性程的一致性程度,而同質(zhì)性信度是求度,而同質(zhì)性信度是求所有題目之間所有題目之間的一致性的一致性程度。程度。 同質(zhì)性信度的計(jì)算方法同質(zhì)性信度的計(jì)算方法1、庫(kù)德-理查德遜信度系數(shù)(僅用于0、1記分的測(cè)驗(yàn)) )1 (12XiiKKSqpKKr (KR20公式) )1 (12XKKSqpKKKr(KR21公式,各項(xiàng)目難度相當(dāng)

27、) 其中pi表示答對(duì)第i題的人數(shù)比例,qi為答錯(cuò)第i題的人數(shù)比例; 為題目的平均通過(guò)率, 為題目的平均失敗率。K為題目數(shù)。pq 某測(cè)驗(yàn)由某測(cè)驗(yàn)由1010道選擇題組成,施測(cè)于道選擇題組成,施測(cè)于1010名學(xué)生,所得結(jié)名學(xué)生,所得結(jié)果如下表所示,果如下表所示,S SX X2 2=3.0=3.0。計(jì)算該測(cè)驗(yàn)的信度。計(jì)算該測(cè)驗(yàn)的信度。被試被試 題題 目目1 2 3 4 5 6 7 8 9 10總總分分ABCDEFGHIJ1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 01 1 1 1 1 1 1 0 1 01 1 1 1 1 1 1 1 0 01 1 1 1 1 0 1 0

28、0 11 1 1 1 1 1 0 1 0 01 1 1 1 1 0 0 1 0 01 1 1 1 1 0 0 0 1 01 1 1 1 0 1 0 0 0 01 1 1 0 0 1 0 0 0 010988776654答案 解:根據(jù)題目所給條件,采用解:根據(jù)題目所給條件,采用KR20公式公式計(jì)算同質(zhì)性信度。計(jì)算同質(zhì)性信度。36. 18 . 02 . 06 . 04 . 05 . 05 . 05 . 05 . 03 . 07 . 02 . 08 . 01 . 09 . 0010101iiqp61.0)336.11(910112xiixxsqpkkr2、克龍巴赫、克龍巴赫系數(shù)(系數(shù)(可用于多重記分

29、的測(cè)驗(yàn)可用于多重記分的測(cè)驗(yàn)) = k / ( k-1) 1- s2i / s2x 其中其中k是題目數(shù),是題目數(shù), s2i表示所有被試在第表示所有被試在第i題上題上得分的方差,得分的方差, s2x是被試測(cè)驗(yàn)總分的方差。是被試測(cè)驗(yàn)總分的方差。練習(xí)題 已知某分測(cè)驗(yàn)有已知某分測(cè)驗(yàn)有5道題,所有被試在各個(gè)題道題,所有被試在各個(gè)題目上得分的方差分別是目上得分的方差分別是0.75、0.80、0.73、 0.84、0.78,測(cè)驗(yàn)總分的方差為,測(cè)驗(yàn)總分的方差為13,求這個(gè)分,求這個(gè)分測(cè)驗(yàn)的測(cè)驗(yàn)的系數(shù)。系數(shù)。= 5/(5-1) 1-(0.75 + 0.80 + 0.73 + 0.84 + 0.78)/13 = 5

30、/4(1-0.3) =0.875五、評(píng)分者信度u評(píng)分者信度(評(píng)分者信度(Scorer ReliabilityScorer Reliability)指的是)指的是多個(gè)評(píng)分者給同一批被試作答情況進(jìn)行評(píng)分多個(gè)評(píng)分者給同一批被試作答情況進(jìn)行評(píng)分的一致性程度。它主要用于主觀性作品的評(píng)的一致性程度。它主要用于主觀性作品的評(píng)價(jià)過(guò)程中,如論述題評(píng)分、作文題評(píng)分、歌價(jià)過(guò)程中,如論述題評(píng)分、作文題評(píng)分、歌唱比賽的評(píng)分、設(shè)計(jì)作品的評(píng)分等。唱比賽的評(píng)分、設(shè)計(jì)作品的評(píng)分等。 評(píng)分者信度的計(jì)算方法1、當(dāng)評(píng)分者人數(shù)為、當(dāng)評(píng)分者人數(shù)為2時(shí),評(píng)分者信度等于兩者時(shí),評(píng)分者信度等于兩者評(píng)分的相關(guān)系數(shù)(積差相關(guān)或等級(jí)相關(guān))。評(píng)分的相

31、關(guān)系數(shù)(積差相關(guān)或等級(jí)相關(guān))。2、當(dāng)評(píng)分者人數(shù)大于、當(dāng)評(píng)分者人數(shù)大于2時(shí),評(píng)分者信度采用肯時(shí),評(píng)分者信度采用肯德?tīng)柡椭C系數(shù)計(jì)算。(一般在等級(jí)評(píng)定時(shí)用)德?tīng)柡椭C系數(shù)計(jì)算。(一般在等級(jí)評(píng)定時(shí)用) W = 12 R2i (Ri)2 / N / K2 ( N3N ) 其中其中K是評(píng)分者人數(shù),是評(píng)分者人數(shù),N是被評(píng)的對(duì)象數(shù),是被評(píng)的對(duì)象數(shù),Ri是第是第i個(gè)被評(píng)對(duì)象的被評(píng)等級(jí)之和。個(gè)被評(píng)對(duì)象的被評(píng)等級(jí)之和。53學(xué)生n=6評(píng)價(jià)者 K=41234134212431332134465655124265656v例:4位教師對(duì)6位學(xué)生作文競(jìng)賽的名次排列次序如表4-12。問(wèn)4位教師評(píng)定的一致性程度如何?4 4位教師對(duì)

32、位教師對(duì)6 6位學(xué)生作文競(jìng)賽的名次排列位學(xué)生作文競(jìng)賽的名次排列54學(xué)生n=6評(píng)價(jià)者 K=4Ri1234134211010024313111213213410100465652248451242 9 8165656224848413704位教師對(duì)位教師對(duì)6位學(xué)生作文名次排列的肯德?tīng)柡椭C系數(shù)計(jì)算表位學(xué)生作文名次排列的肯德?tīng)柡椭C系數(shù)計(jì)算表 2iR肯德?tīng)柡椭C系數(shù)肯德?tīng)柡椭C系數(shù)552222137084 /6194iRiiRSSRnRR ()23231941940.11111*4 *(66)*16*1290121212RWSSrKnn總結(jié)與比較:五種信度的誤差來(lái)源u重測(cè)信度重測(cè)信度時(shí)間取樣,穩(wěn)定性系數(shù)。時(shí)

33、間取樣,穩(wěn)定性系數(shù)。u復(fù)本信度復(fù)本信度(連續(xù)測(cè)驗(yàn))內(nèi)容取樣,等值性(連續(xù)測(cè)驗(yàn))內(nèi)容取樣,等值性系數(shù);(間隔測(cè)驗(yàn))時(shí)間與內(nèi)容取樣,穩(wěn)定性系數(shù);(間隔測(cè)驗(yàn))時(shí)間與內(nèi)容取樣,穩(wěn)定性與等值性系數(shù);與等值性系數(shù);u分半信度分半信度內(nèi)容取樣,內(nèi)部一致性系數(shù);內(nèi)容取樣,內(nèi)部一致性系數(shù);u同質(zhì)性信度同質(zhì)性信度內(nèi)容取樣,內(nèi)部一致性系數(shù);內(nèi)容取樣,內(nèi)部一致性系數(shù);u評(píng)分者信度評(píng)分者信度評(píng)分者之間的一致性。評(píng)分者之間的一致性。第三節(jié) 影響信度的因素與提高方法一、影響測(cè)量信度的主要因素(一)測(cè)量工具的可能影響1 1、題目樣本的選擇不當(dāng)、題目樣本的選擇不當(dāng) 題目樣本不具代表性(偏題怪題),題目涵蓋面過(guò)于題目樣本不具代表

34、性(偏題怪題),題目涵蓋面過(guò)于狹窄,狹窄,題目具有社會(huì)稱許性題目具有社會(huì)稱許性等。等。2 2、題目含義及表達(dá)的模棱兩可、題目含義及表達(dá)的模棱兩可 題目含義不明確,語(yǔ)言表達(dá)模棱兩可,會(huì)造成被試的題目含義不明確,語(yǔ)言表達(dá)模棱兩可,會(huì)造成被試的理解歧義,從而難以測(cè)查到被試的真實(shí)情況。理解歧義,從而難以測(cè)查到被試的真實(shí)情況。3 3、要求的步驟不明確、要求的步驟不明確 指導(dǎo)語(yǔ)對(duì)于答題要求或步驟的指示不明確,使指導(dǎo)語(yǔ)對(duì)于答題要求或步驟的指示不明確,使被試按照各自的理解作答,增加隨機(jī)誤差。被試按照各自的理解作答,增加隨機(jī)誤差。4 4、題目難度過(guò)大或過(guò)小、題目難度過(guò)大或過(guò)小 難度通過(guò)影響被試的分?jǐn)?shù)分布從而間接

35、影響測(cè)難度通過(guò)影響被試的分?jǐn)?shù)分布從而間接影響測(cè)驗(yàn)信度。難度過(guò)大或過(guò)小驗(yàn)信度。難度過(guò)大或過(guò)小分?jǐn)?shù)分布窄分?jǐn)?shù)分布窄信度信度低,難度適中低,難度適中分?jǐn)?shù)分布范圍寬分?jǐn)?shù)分布范圍寬信度高。同信度高。同時(shí),太難的題目也增加被試猜測(cè)的機(jī)率,從而時(shí),太難的題目也增加被試猜測(cè)的機(jī)率,從而制造出隨機(jī)誤差。制造出隨機(jī)誤差。 5 5、測(cè)驗(yàn)長(zhǎng)度偏短、測(cè)驗(yàn)長(zhǎng)度偏短 測(cè)驗(yàn)長(zhǎng)度偏短,難以全面考察被試的特質(zhì),測(cè)驗(yàn)長(zhǎng)度偏短,難以全面考察被試的特質(zhì),增加回答問(wèn)題的隨機(jī)性,從而降低信度。增加回答問(wèn)題的隨機(jī)性,從而降低信度。 6 6、特殊題型中靠猜測(cè)答題的可能性較大、特殊題型中靠猜測(cè)答題的可能性較大 猜測(cè)性將增加測(cè)驗(yàn)得分的隨機(jī)性,從而

36、降低猜測(cè)性將增加測(cè)驗(yàn)得分的隨機(jī)性,從而降低測(cè)驗(yàn)信度。測(cè)驗(yàn)信度。(二)施測(cè)過(guò)程的可能影響(二)施測(cè)過(guò)程的可能影響1、沒(méi)有嚴(yán)格按照標(biāo)準(zhǔn)化程序施測(cè)、沒(méi)有嚴(yán)格按照標(biāo)準(zhǔn)化程序施測(cè)2、測(cè)量的準(zhǔn)備工作不充分、測(cè)量的準(zhǔn)備工作不充分3、故意制造緊張氣氛、故意制造緊張氣氛4、給予特別協(xié)助、給予特別協(xié)助5、測(cè)量時(shí)間把握不恰當(dāng)、測(cè)量時(shí)間把握不恰當(dāng)6、評(píng)分不客觀、評(píng)分不客觀(三)被試方面的可能影響1、動(dòng)機(jī)作用、動(dòng)機(jī)作用2、測(cè)驗(yàn)經(jīng)驗(yàn)、測(cè)驗(yàn)經(jīng)驗(yàn)3、測(cè)驗(yàn)焦慮、測(cè)驗(yàn)焦慮4、生理變因(身心健康、疲勞等)、生理變因(身心健康、疲勞等)5、被試團(tuán)體的異質(zhì)性程度、被試團(tuán)體的異質(zhì)性程度被試團(tuán)體的異質(zhì)性程度l被測(cè)團(tuán)體越異質(zhì),其信度系數(shù)則會(huì)

37、偏高,因?yàn)楸粶y(cè)團(tuán)體越異質(zhì),其信度系數(shù)則會(huì)偏高,因?yàn)槎啻螠y(cè)試,排名變化?。槐粶y(cè)團(tuán)體越同質(zhì),其多次測(cè)試,排名變化??;被測(cè)團(tuán)體越同質(zhì),其信度系數(shù)則會(huì)偏低,信度系數(shù)則會(huì)偏低,因?yàn)槎啻螠y(cè)驗(yàn)的排名變化因?yàn)槎啻螠y(cè)驗(yàn)的排名變化大。大。l如同一個(gè)智力測(cè)驗(yàn),在天才班與普通班施測(cè)。如同一個(gè)智力測(cè)驗(yàn),在天才班與普通班施測(cè)。問(wèn)題排除其他影響因素,如果要檢驗(yàn)一個(gè)能力測(cè)驗(yàn)排除其他影響因素,如果要檢驗(yàn)一個(gè)能力測(cè)驗(yàn)的信度,選擇的信度,選擇4 4、5 5、6 6年級(jí)的學(xué)生作為測(cè)量被年級(jí)的學(xué)生作為測(cè)量被試,與選擇試,與選擇4 4年級(jí)的學(xué)生作為測(cè)量被試,哪一種年級(jí)的學(xué)生作為測(cè)量被試,哪一種測(cè)量結(jié)果的信度水平更高?測(cè)量結(jié)果的信度水平更

38、高?(四)間隔時(shí)間 間隔時(shí)間對(duì)于重測(cè)信度和復(fù)本信度(穩(wěn)定性間隔時(shí)間對(duì)于重測(cè)信度和復(fù)本信度(穩(wěn)定性與等值性系數(shù))的大小而言都是重要的。對(duì)于與等值性系數(shù))的大小而言都是重要的。對(duì)于其他三種信度來(lái)說(shuō)不存在時(shí)間間隔問(wèn)題。其他三種信度來(lái)說(shuō)不存在時(shí)間間隔問(wèn)題。(五)估計(jì)信度的方法 采用不同的信度估算方法,得到的信度系數(shù)采用不同的信度估算方法,得到的信度系數(shù)大小也會(huì)不同。大小也會(huì)不同。二、提高測(cè)量信度的常用方法1、適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度(最直接的方法)。2、使測(cè)驗(yàn)中所有試題的難度接近正態(tài)分布,并將難度的平均值控制在中等水平。 一般比例為容易:中等:難一般比例為容易:中等:難=3=3:5 5:2 2,并,并且測(cè)驗(yàn)

39、的平均難度值保持在且測(cè)驗(yàn)的平均難度值保持在0.500.50左右。左右。 3、努力提高測(cè)驗(yàn)試題的區(qū)分度。 提高所有題目的區(qū)分度,可以有效提高測(cè)提高所有題目的區(qū)分度,可以有效提高測(cè)驗(yàn)的信度。驗(yàn)的信度。 4、選擇恰當(dāng)?shù)谋辉噲F(tuán)體。 被試團(tuán)體的異質(zhì)性程度會(huì)影響信度,因此檢被試團(tuán)體的異質(zhì)性程度會(huì)影響信度,因此檢驗(yàn)信度時(shí),一定要根據(jù)測(cè)驗(yàn)的使用目的來(lái)選驗(yàn)信度時(shí),一定要根據(jù)測(cè)驗(yàn)的使用目的來(lái)選擇被試團(tuán)體,一般選取一個(gè)與常模樣本性質(zhì)擇被試團(tuán)體,一般選取一個(gè)與常模樣本性質(zhì)相同的被試團(tuán)體施測(cè)。相同的被試團(tuán)體施測(cè)。5、嚴(yán)格實(shí)行測(cè)驗(yàn)的標(biāo)準(zhǔn)化。 標(biāo)準(zhǔn)化可以最大程度地減少與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)標(biāo)準(zhǔn)化可以最大程度地減少與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的隨

40、機(jī)誤差。的隨機(jī)誤差。新增題目數(shù)量與新測(cè)驗(yàn)信度之間的關(guān)系:xxxxxxrkkrr)1(1 其中rxx為增加題目后新測(cè)驗(yàn)的信度,rxx為原有測(cè)驗(yàn)的信度,k為新測(cè)驗(yàn)長(zhǎng)度與原測(cè)驗(yàn)長(zhǎng)度之比。 此公式與斯皮爾曼此公式與斯皮爾曼- -布朗公式有何關(guān)系?布朗公式有何關(guān)系?練習(xí)題練習(xí)題 已知某測(cè)驗(yàn)含有已知某測(cè)驗(yàn)含有4040個(gè)題目,信度系數(shù)為個(gè)題目,信度系數(shù)為0.800.80,請(qǐng)問(wèn)這個(gè)測(cè)驗(yàn)必須增加多少個(gè)題目,才能使該測(cè)請(qǐng)問(wèn)這個(gè)測(cè)驗(yàn)必須增加多少個(gè)題目,才能使該測(cè)驗(yàn)的信度系數(shù)達(dá)到驗(yàn)的信度系數(shù)達(dá)到0.900.90?r r xxxx = k = k r rxxxx / 1+ ( k-1 ) / 1+ ( k-1 ) r

41、rxxxx 0.90 =k0.90 =k0.80 / 1+0.80 / 1+(k-1k-1)0.80 0.80 求出求出k=2.25k=2.25,新測(cè)驗(yàn)的長(zhǎng)度為,新測(cè)驗(yàn)的長(zhǎng)度為2.252.2540 = 9040 = 90。也就是說(shuō),必須增加的題目數(shù)是也就是說(shuō),必須增加的題目數(shù)是90-40=5090-40=50(題)。(題)。注意的問(wèn)題1 1、增加測(cè)驗(yàn)的題目數(shù)量可有效提高測(cè)驗(yàn)信度,、增加測(cè)驗(yàn)的題目數(shù)量可有效提高測(cè)驗(yàn)信度,但所增加的項(xiàng)目必須滿足兩個(gè)條件:(但所增加的項(xiàng)目必須滿足兩個(gè)條件:(1 1)在)在性質(zhì)上與原有項(xiàng)目同質(zhì),即測(cè)量的是同一種特性質(zhì)上與原有項(xiàng)目同質(zhì),即測(cè)量的是同一種特質(zhì)。如果不同質(zhì)反

42、而會(huì)降低信度;(質(zhì)。如果不同質(zhì)反而會(huì)降低信度;(2 2)在數(shù))在數(shù)量上必須適度,并非增加的題目越多越好。報(bào)量上必須適度,并非增加的題目越多越好。報(bào)酬遞減效應(yīng)與可能的疲勞、厭倦效應(yīng)。酬遞減效應(yīng)與可能的疲勞、厭倦效應(yīng)。2 2、初始測(cè)驗(yàn)的信度越低,增加項(xiàng)目數(shù)對(duì)提高信、初始測(cè)驗(yàn)的信度越低,增加項(xiàng)目數(shù)對(duì)提高信度越顯著。如果初始測(cè)驗(yàn)的信度本來(lái)就很高,度越顯著。如果初始測(cè)驗(yàn)的信度本來(lái)就很高,那么測(cè)驗(yàn)題目的增加對(duì)提高信度的影響往往比那么測(cè)驗(yàn)題目的增加對(duì)提高信度的影響往往比較小。較小。第四節(jié) 信度的作用一、信度系數(shù)的作用 1 1、 信度是確定測(cè)驗(yàn)工具好壞的指標(biāo)之一。信度是確定測(cè)驗(yàn)工具好壞的指標(biāo)之一。2 2、 信

43、度是測(cè)量過(guò)程中控制隨機(jī)誤差大小能力的反映。信度是測(cè)量過(guò)程中控制隨機(jī)誤差大小能力的反映。3 3、 信度可以解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系,明確告知測(cè)驗(yàn)信度可以解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系,明確告知測(cè)驗(yàn) 誤差的大?。y(cè)量標(biāo)準(zhǔn)誤是測(cè)量誤差大小的客觀指標(biāo))。誤差的大?。y(cè)量標(biāo)準(zhǔn)誤是測(cè)量誤差大小的客觀指標(biāo))。4 4、下結(jié)論說(shuō)某測(cè)驗(yàn)比較可靠,必須依據(jù)情境,并經(jīng)多次證實(shí)。、下結(jié)論說(shuō)某測(cè)驗(yàn)比較可靠,必須依據(jù)情境,并經(jīng)多次證實(shí)。5 5、 信度可以解釋、預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義。信度可以解釋、預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義。 一般的原則是:當(dāng)一般的原則是:當(dāng)0.70r0.70rxxxx0.850.85時(shí),測(cè)驗(yàn)結(jié)果可用于團(tuán)時(shí),測(cè)驗(yàn)結(jié)果

44、可用于團(tuán)體比較;當(dāng)體比較;當(dāng)r rxxxx 0.85 0.85時(shí),測(cè)驗(yàn)結(jié)果才可用來(lái)鑒別或預(yù)測(cè)個(gè)人。時(shí),測(cè)驗(yàn)結(jié)果才可用來(lái)鑒別或預(yù)測(cè)個(gè)人。測(cè)量標(biāo)準(zhǔn)誤的計(jì)算n所謂測(cè)量標(biāo)準(zhǔn)誤,指的是同一批被試兩次測(cè)所謂測(cè)量標(biāo)準(zhǔn)誤,指的是同一批被試兩次測(cè)量結(jié)果的分?jǐn)?shù)之差的標(biāo)準(zhǔn)差,它可以作為測(cè)量結(jié)果的分?jǐn)?shù)之差的標(biāo)準(zhǔn)差,它可以作為測(cè)量誤差大小的客觀指標(biāo)。量誤差大小的客觀指標(biāo)。n計(jì)算公式略計(jì)算公式略二、多大的信度系數(shù)可以接受u智力測(cè)驗(yàn)、能力測(cè)驗(yàn)、成就測(cè)驗(yàn)等認(rèn)知測(cè)驗(yàn)智力測(cè)驗(yàn)、能力測(cè)驗(yàn)、成就測(cè)驗(yàn)等認(rèn)知測(cè)驗(yàn)的信度要求高一些,應(yīng)在的信度要求高一些,應(yīng)在0.900.90以上。以上。u人格測(cè)驗(yàn)、興趣測(cè)驗(yàn)、態(tài)度測(cè)驗(yàn)的信度要求人格測(cè)驗(yàn)、興趣

45、測(cè)驗(yàn)、態(tài)度測(cè)驗(yàn)的信度要求低一些,低一些,0.800.80以上即可。以上即可。u教師自編的學(xué)績(jī)測(cè)驗(yàn)的信度達(dá)到教師自編的學(xué)績(jī)測(cè)驗(yàn)的信度達(dá)到0.600.60即可。即可。u創(chuàng)造力測(cè)驗(yàn)的信度一般在創(chuàng)造力測(cè)驗(yàn)的信度一般在0.500.50左右,人格投左右,人格投射測(cè)驗(yàn)的信度在射測(cè)驗(yàn)的信度在0.200.20左右。左右。思考問(wèn)題信度是否只是教育測(cè)驗(yàn)工信度是否只是教育測(cè)驗(yàn)工具本身的特征?一個(gè)測(cè)具本身的特征?一個(gè)測(cè)驗(yàn)是否只有一個(gè)特定的驗(yàn)是否只有一個(gè)特定的信度值?信度值?nThompsonThompson :“嚴(yán)格地說(shuō),與其說(shuō)信度是測(cè)驗(yàn)嚴(yán)格地說(shuō),與其說(shuō)信度是測(cè)驗(yàn)的一個(gè)特征,不如說(shuō)它是在一個(gè)特定場(chǎng)合及特的一個(gè)特征,不如

46、說(shuō)它是在一個(gè)特定場(chǎng)合及特定條件下,對(duì)特定群體施測(cè)而獲得的分?jǐn)?shù)的一定條件下,對(duì)特定群體施測(cè)而獲得的分?jǐn)?shù)的一種屬性。種屬性?!保?9941994)n也就是說(shuō),信度不僅僅是教育測(cè)驗(yàn)本身的特征,也就是說(shuō),信度不僅僅是教育測(cè)驗(yàn)本身的特征,它還受主試、測(cè)量情境、施測(cè)過(guò)程、被試群體它還受主試、測(cè)量情境、施測(cè)過(guò)程、被試群體等因素的影響,信度是這些因素的綜合反映。等因素的影響,信度是這些因素的綜合反映?;蛘哒f(shuō),信度反映的是教育測(cè)量中控制隨機(jī)誤或者說(shuō),信度反映的是教育測(cè)量中控制隨機(jī)誤差的能力。差的能力。n我們平時(shí)習(xí)慣講我們平時(shí)習(xí)慣講“測(cè)量信度測(cè)量信度”,這實(shí)際是一種,這實(shí)際是一種簡(jiǎn)略的表示方法,準(zhǔn)確的表達(dá)應(yīng)為簡(jiǎn)略

47、的表示方法,準(zhǔn)確的表達(dá)應(yīng)為“測(cè)量結(jié)果測(cè)量結(jié)果的信度的信度”。課后作業(yè) 查閱一篇有關(guān)查閱一篇有關(guān)“心理測(cè)驗(yàn)編制或修訂心理測(cè)驗(yàn)編制或修訂”的的研究報(bào)告,討論該研究報(bào)告所采用的信度統(tǒng)計(jì)研究報(bào)告,討論該研究報(bào)告所采用的信度統(tǒng)計(jì)方法,評(píng)價(jià)它的信度是否符合測(cè)量學(xué)要求。方法,評(píng)價(jià)它的信度是否符合測(cè)量學(xué)要求。本章練習(xí)一、選擇題一、選擇題1. 1. 心理測(cè)驗(yàn)的信度是測(cè)量過(guò)程中(心理測(cè)驗(yàn)的信度是測(cè)量過(guò)程中( )大小的反映。)大小的反映。 A. A. 誤差誤差 B. B. 系統(tǒng)誤差系統(tǒng)誤差 C. C. 隨機(jī)誤差隨機(jī)誤差 D. D. 真分?jǐn)?shù)真分?jǐn)?shù)2 2、下列對(duì)信度的描述中,正確的是(、下列對(duì)信度的描述中,正確的是(

48、)。)。 A A、信度既受測(cè)量中隨機(jī)誤差的影響,也受系統(tǒng)誤差、信度既受測(cè)量中隨機(jī)誤差的影響,也受系統(tǒng)誤差 的影響。的影響。 B B、信度是被試團(tuán)體的真分?jǐn)?shù)方差與實(shí)得分、信度是被試團(tuán)體的真分?jǐn)?shù)方差與實(shí)得分 數(shù)方差之比。數(shù)方差之比。 C C、一個(gè)測(cè)驗(yàn)只可能有一個(gè)信度系數(shù)。、一個(gè)測(cè)驗(yàn)只可能有一個(gè)信度系數(shù)。 D D、測(cè)驗(yàn)的長(zhǎng)度越大,信度越高。、測(cè)驗(yàn)的長(zhǎng)度越大,信度越高。3、測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度,這、測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度,這種信度稱為(種信度稱為( )。)。 A、重測(cè)信度、重測(cè)信度 B、復(fù)本信度、復(fù)本信度 C、分半信度、分半信度 D、同質(zhì)性信度、同質(zhì)性信度4、下列屬于重測(cè)信度使用前提

49、的是(、下列屬于重測(cè)信度使用前提的是( )。)。 A、遺忘和練習(xí)的效果基本相互抵消。、遺忘和練習(xí)的效果基本相互抵消。 B、能構(gòu)造出兩份以上的平行測(cè)驗(yàn)。、能構(gòu)造出兩份以上的平行測(cè)驗(yàn)。 C、測(cè)驗(yàn)可以分成對(duì)等的兩半。、測(cè)驗(yàn)可以分成對(duì)等的兩半。 D、被試的數(shù)量規(guī)模達(dá)到、被試的數(shù)量規(guī)模達(dá)到80-100人。人。二、計(jì)算題二、計(jì)算題1、某測(cè)驗(yàn)有、某測(cè)驗(yàn)有20道測(cè)題,其信度僅為道測(cè)題,其信度僅為0.55,若把,若把測(cè)題增加到測(cè)題增加到60題,信度能達(dá)到多少?增加到題,信度能達(dá)到多少?增加到120題呢?題呢?2、某興趣測(cè)驗(yàn)共有、某興趣測(cè)驗(yàn)共有6道題,道題,6個(gè)被試在各題上得個(gè)被試在各題上得分的方差分別是分的方差

50、分別是0.80、0.81、0.79、0.78、0.80、0.82,測(cè)驗(yàn)總分的方差是,測(cè)驗(yàn)總分的方差是16.00。計(jì)算。計(jì)算該興趣測(cè)驗(yàn)的該興趣測(cè)驗(yàn)的a系數(shù)。系數(shù)。 3、已知某量表兩個(gè)半測(cè)驗(yàn)的相關(guān)系數(shù)為、已知某量表兩個(gè)半測(cè)驗(yàn)的相關(guān)系數(shù)為0.63,請(qǐng)問(wèn)分半信度為多少?請(qǐng)問(wèn)分半信度為多少?4 4、在一次作文比賽中,、在一次作文比賽中,3 3位老師給位老師給6 6篇作文的評(píng)篇作文的評(píng)分如下表所示,計(jì)算這次比賽的評(píng)分者信度。分如下表所示,計(jì)算這次比賽的評(píng)分者信度。評(píng)委評(píng)委選手選手123456A423545342832B453840413237C3842354330325 5、5050個(gè)學(xué)生參加一個(gè)智力測(cè)驗(yàn)

51、,共有個(gè)學(xué)生參加一個(gè)智力測(cè)驗(yàn),共有6 6道選擇題,答道選擇題,答題情況如下表所示。所有學(xué)生測(cè)驗(yàn)得分的方差為題情況如下表所示。所有學(xué)生測(cè)驗(yàn)得分的方差為2.82.8。求該測(cè)驗(yàn)的信度系數(shù)。求該測(cè)驗(yàn)的信度系數(shù)。項(xiàng)目項(xiàng)目答對(duì)被試數(shù)答對(duì)被試數(shù)1 12 23 34 45 56 6121241411818292930304747本章練習(xí)題答案一、選擇題答案一、選擇題答案1、C 2、B 3、D 4、A二、計(jì)算題答案二、計(jì)算題答案1、rxx=krxx / 1+(k-1)rxx =30.55 / 1+(3-1) 0.55 =0.79 rxx=0.882、= k / ( k-1) 1- (s2i ) / s2x =6

52、51-(0.80+0.81+0.79 +0.78 +0.80+0.82) 16 =1.2 (1-0.3)=0.843、 rxx = 2rhh / (1+rhh) =20.63 (1+0.63 ) =0.774、(、(1)將評(píng)分轉(zhuǎn)化為得分等級(jí))將評(píng)分轉(zhuǎn)化為得分等級(jí)評(píng)委評(píng)委選手選手123456A231465B143265C324165Ri6987181563779iR2iRW = 12 R2i (Ri)2 / N / K2 ( N3N ) =12(779-6326)32 (63 -6) =0.755、)(122XiiXKKSqpSKKr pqpq = 0.24 = 0.240.76 + 0.820.76 + 0.820.18 + 0.360.18 + 0.360.64 + 0.580.64 + 0.580.42 +0.42 + 0.60 0.600.40 +0.9

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論