項(xiàng)目反映理論與自適應(yīng)測(cè)驗(yàn)_第1頁(yè)
項(xiàng)目反映理論與自適應(yīng)測(cè)驗(yàn)_第2頁(yè)
項(xiàng)目反映理論與自適應(yīng)測(cè)驗(yàn)_第3頁(yè)
項(xiàng)目反映理論與自適應(yīng)測(cè)驗(yàn)_第4頁(yè)
項(xiàng)目反映理論與自適應(yīng)測(cè)驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,第五章 測(cè)試與測(cè)試?yán)碚?2,測(cè)試與測(cè)試?yán)碚?測(cè)量的意義與分類 教育測(cè)量一般概念及量表 測(cè)量數(shù)據(jù)的記述與處理 項(xiàng)目反應(yīng)理論 項(xiàng)目反應(yīng)理論的應(yīng)用,3,一、測(cè)量的意義和分類,狹量測(cè)試:針對(duì)具體的技能、知識(shí)、能力、適應(yīng)性等特性的測(cè)試,1、測(cè)量的分類,器具測(cè)試與筆紙測(cè)試 客觀測(cè)試與非客觀測(cè)試 綜合測(cè)試與分析測(cè)試 標(biāo)準(zhǔn)測(cè)試與非標(biāo)準(zhǔn)測(cè)試 集團(tuán)基準(zhǔn)測(cè)試與達(dá)到基準(zhǔn)測(cè)試,4,二、教育測(cè)量一般概念及量表,測(cè)量:根據(jù)一定規(guī)則用數(shù)字對(duì)事物的特性加以描述和確定的過(guò)程,測(cè)量包含,1)要明確被測(cè)量對(duì)象的屬性或性質(zhì) 2)確定能使這些屬性顯示出來(lái)并又可以被感知的一系列操作 3)制定一個(gè)程序使得結(jié)果可以量化,1、教育測(cè)量的一般

2、概念,5,參照點(diǎn)計(jì)算的起點(diǎn),有絕對(duì)零點(diǎn)和相對(duì)零點(diǎn)(人為定的參照點(diǎn))。 教育測(cè)量中的參照點(diǎn)為相對(duì)零點(diǎn),單位測(cè)量的基礎(chǔ)。理想單位的條件: 要有確定的意義;具有相等的價(jià)值,6,教育測(cè)量:根據(jù)教育目標(biāo)的要求,按一定規(guī)則用數(shù)字對(duì)教育效果加以描述和確定的過(guò)程,即,遵照教育學(xué)、心理學(xué)和測(cè)量學(xué)的理論和原則,通過(guò)各種測(cè)驗(yàn)來(lái)確定由于教育引起的學(xué)生知識(shí)、能力變化的方向和數(shù)量,7,間接測(cè)量。通過(guò)測(cè)量學(xué)生對(duì)所學(xué)知識(shí)的掌握程度來(lái)了解其智力或?qū)W業(yè)水平的現(xiàn)狀和發(fā)展情況,測(cè)量的結(jié)果是相對(duì)的。學(xué)生學(xué)業(yè)成績(jī)只有在某種標(biāo)準(zhǔn)的比較中才有意義。只有把它們和集體的平均水平比較,或者和教學(xué)計(jì)劃規(guī)定的教學(xué)內(nèi)容、教學(xué)目標(biāo)比較,才能確定測(cè)驗(yàn)分?jǐn)?shù)的

3、含義,8,2、教育測(cè)量的量表,量表測(cè)量工具。具有一定單位和參照點(diǎn)的連續(xù)體,為獲得有用的數(shù)據(jù)而設(shè)計(jì),根據(jù)精確度,1)類別(稱名)量表 2)等級(jí)(順序)量表 3)等距(間隔)量表 4)等比(比率)量表,9,1)類別量表,對(duì)被測(cè)對(duì)象進(jìn)行分類,并賦予各類以不同的符號(hào),類之間只具有“質(zhì)”的差別而不具有“量”的差別,功能,標(biāo)記 分類,適用的統(tǒng)計(jì),百分比 卡方檢驗(yàn),10,2)等級(jí)量表,數(shù)字或符號(hào)表示測(cè)量對(duì)象在某一屬性上的順序或等級(jí)關(guān)系,不表明各數(shù)字間的差距相等,不能進(jìn)行四則運(yùn)算,適用的統(tǒng)計(jì),中位數(shù) 百分位數(shù),11,3)等距量表,具有類別量表和等級(jí)量表的性質(zhì)外,還具有連續(xù)數(shù)量之間的差距相等,數(shù)值間不能進(jìn)行乘除

4、運(yùn)算,但可以進(jìn)行加減運(yùn)算。量表的數(shù)值加或減一個(gè)常數(shù)或用一個(gè)常數(shù)乘除,不會(huì)破壞原有數(shù)據(jù)間的關(guān)系,適用的統(tǒng)計(jì),均數(shù) 相關(guān)系數(shù) Ft檢驗(yàn),教育測(cè)量,12,4)等比量表,具有最高的水平量度,除了具有前三者性質(zhì)外,還具有絕對(duì)零度,可進(jìn)行四則運(yùn)算,物理測(cè)量,心理測(cè)量中,反應(yīng)時(shí)間屬于該類,教學(xué)與時(shí)間數(shù)據(jù)進(jìn)行分析即可采用等比量表,13,3、教育測(cè)量的誤差,測(cè)量誤差:在測(cè)量過(guò)程中由與目的無(wú)關(guān)的因素產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果,隨機(jī)誤差,系統(tǒng)誤差,由與測(cè)量目的無(wú)關(guān)的偶然因素引起的變化無(wú)規(guī)律的誤差,由與測(cè)量目的無(wú)關(guān)的因素引起的恒定的有規(guī)律的誤差,14,15,16,經(jīng)典測(cè)量理論關(guān)于誤差三個(gè)假設(shè),1)測(cè)驗(yàn)的觀察分?jǐn)?shù)X可

5、看作真分?jǐn)?shù)T和測(cè)驗(yàn)誤差分?jǐn)?shù)E的線性組合; 2)誤差分?jǐn)?shù)E的數(shù)學(xué)期望為0; 3)任何兩次測(cè)量所產(chǎn)生的誤差相互獨(dú)立,17,誤差的來(lái)源,1)測(cè)驗(yàn)自身所引起的誤差; 2)測(cè)驗(yàn)過(guò)程所引起的誤差; 3)被試本身所引起的誤差,18,三、測(cè)量數(shù)據(jù)的記述和處理,一)測(cè)量數(shù)據(jù)的統(tǒng)計(jì)測(cè)度,1、平均值、分散和標(biāo)準(zhǔn)偏差,19,方差(分散)S2x,測(cè)量得分的分散程度,變異數(shù),20,標(biāo)準(zhǔn)偏差Sx,21,2、協(xié)方差和相關(guān)系數(shù),協(xié)方差Sxy,22,相關(guān)系數(shù)xy,xy,Sxy,Sx,Sy,23,二)測(cè)量數(shù)據(jù)應(yīng)具備的特性,1、測(cè)量的誤差模型,xi測(cè)試值 ti 真值 ei 測(cè)量誤差,xitiei,N足夠多,24,25,若測(cè)量誤差與得

6、分真值間是完全獨(dú)立的,則,Ste,0,26,N,1,i=1,N,ti+ei,ti+e)2,S2t,S2e,2Ste,S2t,S2e,27,2、測(cè)量的信度,信度:當(dāng)一個(gè)測(cè)驗(yàn)多次測(cè)量的結(jié)果一致或穩(wěn)定時(shí),它就被認(rèn)為是可靠的。而估計(jì)測(cè)量一致性或穩(wěn)定性程度的指標(biāo),稱為信度,即指:測(cè)驗(yàn)中,被試的實(shí)得分?jǐn)?shù)與真實(shí)分?jǐn)?shù)差距越小,測(cè)驗(yàn)的分?jǐn)?shù)就越可靠,信度就越高;反之,信度就越低,28,估計(jì)信度的方法,1)再測(cè)信度 2)復(fù)本信度 3)分半信度 4)內(nèi)部一致性信度 5)評(píng)分者信度,29,1)再測(cè)信度,用同一個(gè)測(cè)驗(yàn),對(duì)同一組被試前后兩次施測(cè),兩次測(cè)驗(yàn)分?jǐn)?shù)之間的相關(guān)程度就是再測(cè)信度。 測(cè)驗(yàn)跨時(shí)間的一致性穩(wěn)定性系數(shù),30,

7、例1,假設(shè)有20個(gè)學(xué)生在1月1日接受了一個(gè)測(cè)驗(yàn),到2月1日,又再一次接受同一測(cè)驗(yàn),把1月1日的首測(cè)與2月1日的再測(cè)的分?jǐn)?shù)分別記為X1X2,測(cè)驗(yàn)結(jié)果為,31,計(jì)算得,X1X2,S2,S1,9.95,11.45,2.46,2.42,2385,0.9,32,再測(cè)信度滿足條件,所測(cè)量的特性必須是穩(wěn)定的; 遺忘與練習(xí)的效果相同; 兩次施測(cè)期間被試的學(xué)習(xí)效果沒(méi)有差別,優(yōu)點(diǎn):提供測(cè)驗(yàn)結(jié)果是否隨時(shí)間而變化的資料,可作為預(yù)測(cè)被試將來(lái)行為的依據(jù); 缺點(diǎn):易受練習(xí)和記憶的影響,適用于速度測(cè)驗(yàn),不適用于難度測(cè)驗(yàn),33,2)復(fù)本信度平行測(cè)試法,根據(jù)一組被試在兩個(gè)等值測(cè)驗(yàn)上的得分計(jì)算的相關(guān)系數(shù)即為復(fù)本信度系數(shù),反映的是兩

8、個(gè)測(cè)驗(yàn)之間的等值程度等值系數(shù),公式與穩(wěn)定性系數(shù)公式相同,即再測(cè)信度公式,優(yōu)點(diǎn):一定程度上避免了受練習(xí)和記憶的影響 缺點(diǎn):很難編制兩份等值的試卷,34,3)分半信度折半法,按正常的程序?qū)嵤y(cè)驗(yàn),然后將全部試題分成相等的兩半,被試組在這兩半測(cè)驗(yàn)上的分?jǐn)?shù)之間的相關(guān)系數(shù)即為信度系數(shù),如何分半,優(yōu)點(diǎn):分半法估計(jì)信度比再測(cè)法和副本法簡(jiǎn)便,減少了學(xué)生的疲勞、厭煩等因素; 局限:分半信度系數(shù)只能表示兩半試題的等值程度,不能提供時(shí)間穩(wěn)定性的信息,35,不采用前后分半,采用奇偶分半法,即將題目的奇數(shù)號(hào)分為一組,偶數(shù)號(hào)分為一組; 求出所有被試在奇數(shù)和偶數(shù)題上總分的相關(guān)系數(shù); 求得的信度為半個(gè)測(cè)驗(yàn)信度,整個(gè)測(cè)驗(yàn)的信度

9、需要進(jìn)行矯正,36,求得當(dāng)兩半測(cè)驗(yàn)等值時(shí),兩半測(cè)驗(yàn)分?jǐn)?shù)具有相同的平均數(shù)和標(biāo)準(zhǔn)差,可用斯皮爾曼布朗公式校正,當(dāng)兩半測(cè)驗(yàn)具不同的均值和方差時(shí),可用盧倫公式校正,37,4)內(nèi)部一致性信度,也稱同質(zhì)性,指測(cè)驗(yàn)內(nèi)部所有題目間的一致性,如果在一個(gè)測(cè)驗(yàn)中各道試題得分有較大的正相關(guān)時(shí),我們說(shuō)這個(gè)測(cè)驗(yàn)是同質(zhì)的,也就是說(shuō),在該測(cè)驗(yàn)項(xiàng)目中所有的項(xiàng)目都測(cè)量相同的特質(zhì)或程度略同的特質(zhì),38,估計(jì)測(cè)驗(yàn)內(nèi)部一致性的常用方法,庫(kù)德理查遜公式,39,例2,假設(shè)在一次有100人參加的客觀性試題的測(cè)驗(yàn)中,題量為20道,學(xué)生考試分?jǐn)?shù)的標(biāo)準(zhǔn)差為4分,各試題的答對(duì)人數(shù)如表所示,40,41,例3,假定某次考試共有105道題,學(xué)生平均分?jǐn)?shù)為

10、75分,標(biāo)準(zhǔn)差為19分,則利用kR21公式可計(jì)算得這次考試的信度是,42,庫(kù)德理查遜法只適于客觀性測(cè)驗(yàn),不適用于主觀性測(cè)驗(yàn);只適用于題目得分不為1則為0的測(cè)驗(yàn),不適用于其他判分方式的測(cè)驗(yàn),43,克倫巴赫系數(shù),可用于多重評(píng)分測(cè)驗(yàn),kk,k,k1,1,Sx2,Si2,k測(cè)驗(yàn)的題目數(shù) Si2第I道題目分?jǐn)?shù)的方差 Sx2測(cè)驗(yàn)總分的方差,與庫(kù)德理查遜法不適用于速度測(cè)驗(yàn),44,5)評(píng)分者信度,考察評(píng)分者信度的方法是隨機(jī)抽取部分試卷,由兩個(gè)或多個(gè)評(píng)分者按評(píng)分標(biāo)準(zhǔn)打分,然后求其間的相關(guān),一般認(rèn)為,當(dāng)經(jīng)過(guò)訓(xùn)練的成對(duì)評(píng)分者之間的相關(guān)系數(shù)達(dá)到0.9以上時(shí),才能認(rèn)為評(píng)分客觀。評(píng)分者之間的一致性越好,其信度也越高,45

11、,1)5)估計(jì)信度的方法,只適用于常模參照測(cè)驗(yàn),而不適用于標(biāo)準(zhǔn)參照測(cè)驗(yàn),信度系數(shù)是衡量測(cè)驗(yàn)好壞的一個(gè)重要指標(biāo)。最理想的情況是信度為,一般能力與學(xué)績(jī)測(cè)驗(yàn)的信度系數(shù)常在0.90以上,性格、興趣、態(tài)度等人格測(cè)驗(yàn)的信度系數(shù)通常在0.800.85之間,46,6)信度系數(shù)與個(gè)人測(cè)驗(yàn)真分?jǐn)?shù)的估計(jì),常通過(guò)估計(jì)測(cè)量標(biāo)準(zhǔn)誤的方法對(duì)個(gè)人真正能力作置信區(qū)間的估計(jì),測(cè)量標(biāo)準(zhǔn)誤的大小影響實(shí)得分?jǐn)?shù)對(duì)真分?jǐn)?shù)估計(jì)的精確度,其數(shù)值與信度有關(guān),兩者之間的關(guān)系,SESX(1rxx)1/2,SE測(cè)量的標(biāo)準(zhǔn)誤,SX 所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx測(cè)驗(yàn)的信度,47,個(gè)人在測(cè)驗(yàn)中所得分?jǐn)?shù)X有95的可能性落在真分?jǐn)?shù)T加減1.96個(gè)標(biāo)準(zhǔn)誤的范圍內(nèi),即

12、,X1.96SE) T (X1.96SE,48,7)影響信度的因素,被試、主試、測(cè)驗(yàn)內(nèi)容和施測(cè)環(huán)境等均能引起隨機(jī)誤差,導(dǎo)致分?jǐn)?shù)不一致,從而降低測(cè)驗(yàn)的信度,測(cè)驗(yàn)的題目數(shù)越多,則其信度越高。 題目越多,試題的取樣越適當(dāng);題目越多,測(cè)驗(yàn)分?jǐn)?shù)受猜測(cè)因素的影響越小,49,團(tuán)體的異質(zhì)程度與測(cè)驗(yàn)信度有關(guān),分?jǐn)?shù)分布的范圍越大,信度越高,50,信度系數(shù)與樣本團(tuán)體的異質(zhì)性有關(guān)。對(duì)不同的團(tuán)體需要重新確定測(cè)量的信度,測(cè)驗(yàn)難度水平使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大時(shí),測(cè)驗(yàn)的信度才會(huì)最高,51,3、測(cè)量的效度,指測(cè)量的有效性,即一個(gè)測(cè)驗(yàn)對(duì)它所要測(cè)量的特性準(zhǔn)確測(cè)量的程度。一個(gè)測(cè)驗(yàn),如果能正確地測(cè)量出所要測(cè)的東西,那么它就是高效度的測(cè)驗(yàn)

13、,效度:與測(cè)量目的有關(guān)的分?jǐn)?shù)的方差與實(shí)得分?jǐn)?shù)的方差之比,S2V/S2X,52,測(cè)驗(yàn)的效度除受隨機(jī)誤差影響外,還受系統(tǒng)誤差的影響,可信的測(cè)驗(yàn)未必有效,而有效的測(cè)驗(yàn)未必可信,測(cè)驗(yàn)本身、測(cè)驗(yàn)的實(shí)施和被試等對(duì)測(cè)驗(yàn)的信度有影響的因素對(duì)效度也有影響,53,根據(jù)考察一個(gè)測(cè)驗(yàn)有效程度的途徑,把測(cè)驗(yàn)的效度分為,1)內(nèi)容效度 2)構(gòu)想效度構(gòu)成概念效度 3)校標(biāo)關(guān)聯(lián)效度基準(zhǔn)關(guān)聯(lián)效度,54,1)內(nèi)容效度,指題目對(duì)欲測(cè)的內(nèi)容或行為范圍取樣的適當(dāng)程度,通俗地說(shuō),它就是一個(gè)測(cè)驗(yàn)的覆蓋問(wèn)題,用于測(cè)量某一范圍知識(shí)和能力的一個(gè)測(cè)驗(yàn),它所采用的那些題目是否充分代表了該范圍內(nèi)的基本知識(shí)和基本能力,55,具備較好的內(nèi)容效度必須滿足的兩

14、個(gè)條件,要有確定好的內(nèi)容范圍,并使測(cè)驗(yàn)的全部題目均落在此范圍內(nèi),測(cè)驗(yàn)題目應(yīng)是已界定的內(nèi)容范圍的代表性樣本,即選出的題目應(yīng)能包含所測(cè)的內(nèi)容范圍的主要方面,并且使各部分題目所占比例適當(dāng),56,確定內(nèi)容效度的方法,專家判斷法(定性)由專家對(duì)測(cè)驗(yàn)題目與所涉及的內(nèi)容范圍進(jìn)行符合性判斷,再測(cè)法在教學(xué)之前先將測(cè)驗(yàn)施測(cè)于被試。然后對(duì)被試進(jìn)行教學(xué)訓(xùn)練,結(jié)束時(shí)再測(cè)一次,內(nèi)容效度適合于評(píng)價(jià)教育成就測(cè)驗(yàn)和職業(yè)選拔測(cè)驗(yàn),局限:缺乏可靠的數(shù)量指標(biāo),妨礙了測(cè)驗(yàn)間的比較,57,2)構(gòu)想效度構(gòu)成概念效度,指測(cè)驗(yàn)對(duì)理論上的構(gòu)想或特質(zhì)的測(cè)量程度?;蛘哒f(shuō)測(cè)驗(yàn)所提供的數(shù)據(jù)同理論假設(shè)的符合程度,確定構(gòu)想效度的步驟,首先,從某一理論出發(fā),

15、提出關(guān)于某一心理特質(zhì)的假設(shè); 然后,設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè); 最后,對(duì)測(cè)驗(yàn)的結(jié)果采用相關(guān)或因子分析等方法進(jìn)行分析,驗(yàn)證與理論假設(shè)相符的程度,58,3)校標(biāo)關(guān)聯(lián)效度基準(zhǔn)關(guān)聯(lián)效度,對(duì)于效標(biāo)的理解,衡量測(cè)驗(yàn)有效性的一個(gè)重要方法是看根據(jù)測(cè)驗(yàn)所作出的預(yù)測(cè)是否能被證實(shí),如果一個(gè)測(cè)驗(yàn)的預(yù)測(cè)與將來(lái)實(shí)際發(fā)生的事情非常接近,那么它就是一個(gè)好測(cè)驗(yàn)。因此,被預(yù)測(cè)的行為是衡量測(cè)驗(yàn)是否有效的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo),效標(biāo)關(guān)聯(lián)效度就是考察測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系,分析測(cè)驗(yàn)對(duì)我們所感興趣的行為的預(yù)測(cè)程度,59,效標(biāo)關(guān)聯(lián)效度可以通過(guò)統(tǒng)計(jì)分析而得出一個(gè)數(shù)量指標(biāo),該指標(biāo)是一個(gè)測(cè)驗(yàn)與作為準(zhǔn)則的另一個(gè)測(cè)驗(yàn)、評(píng)定或工作成績(jī)等之間的相關(guān)系數(shù)。以此來(lái)表

16、示被衡量的測(cè)驗(yàn)變量與作為準(zhǔn)則的另一變量之間的相關(guān)強(qiáng)弱,從而反映出前者的有效性程度,60,例4,計(jì)算大學(xué)入學(xué)考試的效標(biāo)關(guān)聯(lián)效度。表中列出的僅是一組人為壓縮了容量的樣本數(shù)據(jù),實(shí)際計(jì)算效標(biāo)關(guān)聯(lián)效度時(shí),樣本容量還應(yīng)大大增加,61,4、測(cè)驗(yàn)項(xiàng)目(題目)分析,1)題目的難度,題目的難度是衡量題目難易水平的指標(biāo),通常以題目的答對(duì)比率來(lái)表示,難度的計(jì)算,二分法計(jì)分的題目,P(R/N)100,非二分法計(jì)分的題目,62,題目難度水平的確定,題目的難度是否合適取決于測(cè)驗(yàn)的目的、性質(zhì)以及題目的形式,若測(cè)驗(yàn)是為了了解被試在某方面知識(shí)技能的情況,則不必考慮難度; 若測(cè)驗(yàn)是為了測(cè)量個(gè)體之間的差別,則以選擇接近中等難度的題目

17、為好; 若測(cè)驗(yàn)用于選拔錄用人員時(shí),就應(yīng)該比較多地采用那些難度值接近錄取率的題目,63,測(cè)驗(yàn)難度對(duì)分?jǐn)?shù)分布的影響,若被試的取樣具有代表性,對(duì)于中等難度的測(cè)驗(yàn),其分?jǐn)?shù)分布應(yīng)呈正態(tài)分布,題目難度普遍較大,被試的得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài); 題目難度普遍較小,被試的得分普遍較高,使得高分端出現(xiàn)高峰,呈負(fù)偏態(tài),當(dāng)測(cè)驗(yàn)的分?jǐn)?shù)分布明顯偏態(tài)時(shí),可以通過(guò)改變不同難度題目的比例來(lái)進(jìn)行調(diào)整,64,2)題目的區(qū)分度,指題目對(duì)不同水平的被試的心理特質(zhì)的區(qū)分能力,若在某道試題上得高分的被試實(shí)際能力水平也高;得低分的被試實(shí)際能力水平也低,則該題就具有較高的區(qū)分度,65,區(qū)分度的取值范圍都介于1至1之間,絕對(duì)

18、值越大,區(qū)分的效果越好,鑒別指數(shù)法,比較測(cè)驗(yàn)總分高和總分低的兩組被試在題目通過(guò)率上的差別。計(jì)算公式如下,DPHPL,D:鑒別指數(shù) PH:高分組被試在該題上的通過(guò)率 PL:低分組被試在該題上的通過(guò)率 D值越大,題目的區(qū)分度越高,題目越有效,66,題目鑒別指數(shù)與評(píng)價(jià)標(biāo)準(zhǔn),67,方差法,題目分?jǐn)?shù)的離散程度越大,該題的區(qū)分度也越大,缺點(diǎn):當(dāng)題目滿分不同時(shí),題目之間不能比較,變異系數(shù)CV作為區(qū)分度的指標(biāo): CVS/X,68,相關(guān)法,以題目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測(cè)驗(yàn)總分的相關(guān)程度作為題目區(qū)分度的指標(biāo)。相關(guān)程度越高,題目區(qū)分度越高,相關(guān),適用于題目分?jǐn)?shù)與測(cè)驗(yàn)總分?jǐn)?shù)都是二級(jí)評(píng)分的場(chǎng)合。如,題目得分為“通過(guò)”、“未通

19、過(guò)”,測(cè)驗(yàn)總成績(jī)?yōu)椤昂细瘛?、“不合?69,對(duì)于任意兩個(gè)二分稱名變量的數(shù)據(jù)資料,之間的相關(guān)系數(shù)可用如下公式計(jì)算,r (adbc)/(ab)(cd)(ac)(bd,1/2,70,例5,45名學(xué)生參加高考,錄取情況與在某題上的通過(guò)情況如圖所示,若以錄取情況作效標(biāo),那么此題對(duì)學(xué)生是否有區(qū)分能力,合計(jì) 18 27,20 25,考取 未考取 合計(jì),未通過(guò),通過(guò),題目反應(yīng),升學(xué)情況,71,r (adbc)/(ab)(cd)(ac)(bd,132075)/(20251827)1/2,1/2,0.456,72,三)測(cè)試數(shù)據(jù)的變換,測(cè)試數(shù)據(jù)的變換多用于以相對(duì)評(píng)價(jià)為主要目的的集團(tuán)基準(zhǔn)測(cè)試(NRT,1、百分排位 2

20、、標(biāo)準(zhǔn)得分 3、正則化得分 4、多級(jí)評(píng)定值,73,1、百分排位,指被測(cè)試集團(tuán)人數(shù)為100名,從低位開(kāi)始,相當(dāng)于指定的某一位的成績(jī)是多少,或者說(shuō),從低位開(kāi)始,相當(dāng)于百分之多少位的成績(jī)是多少的一種排位方法,只能用于同一次測(cè)試中不同學(xué)生的得分進(jìn)行比較和評(píng)價(jià),74,某一被測(cè)試者的得分為x,在x分以下的被測(cè)試者的人數(shù)為參加測(cè)試總?cè)藬?shù)的P,此時(shí),稱該被測(cè)試者的得分為P百分排位,或簡(jiǎn)稱P百分位,百分排位的計(jì)算,從低位開(kāi)始,對(duì)每一個(gè)得分(或每一得分級(jí)別)求累積頻度,基于累積頻度的百分位為,75,例6,設(shè)給定的成績(jī)?yōu)?0,從低位開(kāi)始,出現(xiàn)低于80分以下的頻度為45,被測(cè)試人數(shù)為60,80分的成績(jī)對(duì)應(yīng)的百分位為,

21、76,2、線性變換與標(biāo)準(zhǔn)得分,yiaxib,Xi原始得分,yi變換得分,其中,1)線性變換,將多個(gè)測(cè)試得分變換為具有相同的平均值、標(biāo)準(zhǔn)偏差的標(biāo)準(zhǔn)分,便于對(duì)多個(gè)不同的測(cè)試進(jìn)行比較,77,易知,S2ya2S2x,則,yiaxib,78,可得,z變換中,z得分的平均值為0,標(biāo)準(zhǔn)偏差為1,79,若對(duì)z進(jìn)行如下變換,yiAziB,則得,S2yA2S2zA2,可以將原始得分變換為具有指定的平均值為B、標(biāo)準(zhǔn)偏差為A的得分,80,3、正態(tài)(則)分布與正態(tài)(則)化得分,某一測(cè)試的得分滿足正態(tài)分布,或近似于正態(tài)分布。經(jīng)線性變換后的得分仍滿足正態(tài)分布或近似于正態(tài)分布,正態(tài)分布的密度函數(shù),81,正態(tài)分布的性質(zhì),1)正態(tài)曲線位于x軸的上方,以直線x為對(duì)稱軸,為正態(tài)分布的均值,它向左向右對(duì)稱地?zé)o限延伸,且以x軸為漸近線。但始終不與x軸相交,82,標(biāo)準(zhǔn)正態(tài)分布均值為0,標(biāo)準(zhǔn)差為1時(shí)的正態(tài)分布,記作N(0,1),曲線如圖B。 位置和形狀都是確定的,z0達(dá)到最大值,f(0)0.3989;曲線Z1兩點(diǎn)是拐點(diǎn),f(1)0.2419,83,84,任何一般的正態(tài)分布都可以化為標(biāo)準(zhǔn)正態(tài)分布。 若xN( ,2),令,Z(x),則ZN(0,1),可以將各式各樣形態(tài)的正態(tài)曲線轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)曲線。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論