第四節(jié)測(cè)驗(yàn)的效度_第1頁(yè)
第四節(jié)測(cè)驗(yàn)的效度_第2頁(yè)
第四節(jié)測(cè)驗(yàn)的效度_第3頁(yè)
第四節(jié)測(cè)驗(yàn)的效度_第4頁(yè)
第四節(jié)測(cè)驗(yàn)的效度_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四節(jié) 測(cè)驗(yàn)的效度n 效度的概念效度的概念n 效度評(píng)估的方法效度評(píng)估的方法n 效度的功能效度的功能n 影響效度的因素影響效度的因素第一單元第一單元 效度的概念效度的概念n效度的概念效度的概念q是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者說是一個(gè)心理測(cè)驗(yàn)的或者說是一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性準(zhǔn)確性。n效度的性質(zhì)效度的性質(zhì)q效度具有相對(duì)性:效度具有相對(duì)性:評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。與功能。q效度是測(cè)驗(yàn)的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。效度是測(cè)驗(yàn)的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。q判斷一個(gè)測(cè)驗(yàn)是否有效要從多方面

2、搜集證據(jù)判斷一個(gè)測(cè)驗(yàn)是否有效要從多方面搜集證據(jù)第一單元第一單元 效度的概念效度的概念n效度測(cè)量學(xué)定義效度測(cè)量學(xué)定義q在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(有效方差)與總在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(有效方差)與總方差的比率。方差的比率。SX2 = ST2 + SE2 = SV2 + SI2 + SE2 SE2 :隨機(jī)誤差方差,:隨機(jī)誤差方差, SI2 :無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差);:無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差); ST2 :真分?jǐn)?shù)方差,:真分?jǐn)?shù)方差, SV2 :有效方差。:有效方差。 rXY2 = SV2/ SX2 rXY代表測(cè)量的效度系數(shù)代表測(cè)量的效度系數(shù) SV2 SI2 SE

3、2 ST2 SX2 信度和效度的關(guān)系信度和效度的關(guān)系注: SX2 = ST2 + SE2 ST2= SV2 + SI2SE2 :隨機(jī)誤差方差,:隨機(jī)誤差方差, SI2 :無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差);:無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差); ST2 :真分?jǐn)?shù)方差,:真分?jǐn)?shù)方差, SV2 :有效方差。:有效方差。 信度:信度:rXX= ST2/ SX2,效度:,效度: rXY2 = SV2/ SX2 第一單元第一單元 效度的概念效度的概念n信度和效度的關(guān)系信度和效度的關(guān)系q信度是效度的必要而非充分條件。效度是信度的充分條件。信度是效度的必要而非充分條件。效度是信度的充分條件。n效度高,信度肯定高;但信度

4、高,效度不一定高。效度高,信度肯定高;但信度高,效度不一定高。q效度是受信度制約的。效度是受信度制約的。rXY2 = SV2/ SX2 = ST2-SI2 / SX2 = rXX-SI2 / SX2 SI2 / SX20 rXY2 rXXq一個(gè)測(cè)驗(yàn)的效度不會(huì)超過它的信度的平方根,即測(cè)驗(yàn)與外一個(gè)測(cè)驗(yàn)的效度不會(huì)超過它的信度的平方根,即測(cè)驗(yàn)與外在效標(biāo)的相關(guān),不會(huì)超過與它自身相關(guān)的平方和。在效標(biāo)的相關(guān),不會(huì)超過與它自身相關(guān)的平方和。效度與信度的關(guān)系效度與信度的關(guān)系第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法一、內(nèi)容效度(邏輯效度)一、內(nèi)容效度(邏輯效度)n什么是內(nèi)容效度什么是內(nèi)容效度q是指測(cè)量中的項(xiàng)

5、目在多大程度上包含了欲測(cè)的內(nèi)容范圍。常是指測(cè)量中的項(xiàng)目在多大程度上包含了欲測(cè)的內(nèi)容范圍。常用推理判斷而非定量的方法確定。用推理判斷而非定量的方法確定。q測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。q編制測(cè)驗(yàn)過程編制測(cè)驗(yàn)過程n對(duì)測(cè)量的心理特征有個(gè)明確的概念;對(duì)測(cè)量的心理特征有個(gè)明確的概念;n測(cè)驗(yàn)題目應(yīng)是多界定的內(nèi)容范圍的代表性樣本;測(cè)驗(yàn)題目應(yīng)是多界定的內(nèi)容范圍的代表性樣本;n分測(cè)驗(yàn)內(nèi)部同質(zhì),分測(cè)驗(yàn)之間不要求同質(zhì)。分測(cè)驗(yàn)內(nèi)部同質(zhì),分測(cè)驗(yàn)之間不要求同質(zhì)。第二單元第二單元

6、 效度評(píng)估的方法效度評(píng)估的方法n內(nèi)容效度的評(píng)估方法內(nèi)容效度的評(píng)估方法q專家判斷法專家判斷法:三個(gè)步驟:三個(gè)步驟n定義好測(cè)驗(yàn)內(nèi)容的總體范圍定義好測(cè)驗(yàn)內(nèi)容的總體范圍n編制雙向細(xì)目表編制雙向細(xì)目表n制定評(píng)估量表來(lái)測(cè)驗(yàn)測(cè)驗(yàn)的整個(gè)效度。制定評(píng)估量表來(lái)測(cè)驗(yàn)測(cè)驗(yàn)的整個(gè)效度。q統(tǒng)計(jì)分析法統(tǒng)計(jì)分析法n計(jì)算兩個(gè)計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性,及評(píng)分者信度。評(píng)分者之間評(píng)定的一致性,及評(píng)分者信度。n克倫巴赫:同一組被試在獨(dú)立取自同樣內(nèi)容范圍的克倫巴赫:同一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作估計(jì)。驗(yàn)復(fù)本上得分之相關(guān)來(lái)作估計(jì)。n再測(cè)法再測(cè)法:先前測(cè),再讓被試學(xué)習(xí)新的知識(shí)或參與某種訓(xùn)練,:先前

7、測(cè),再讓被試學(xué)習(xí)新的知識(shí)或參與某種訓(xùn)練,然后再測(cè)。如果成績(jī)提高,效度高。然后再測(cè)。如果成績(jī)提高,效度高。q經(jīng)驗(yàn)推測(cè)法經(jīng)驗(yàn)推測(cè)法對(duì)一個(gè)內(nèi)容領(lǐng)域的詳細(xì)描述n要測(cè)量的領(lǐng)域:在一個(gè)標(biāo)準(zhǔn)的七年級(jí)課程中涵蓋要測(cè)量的領(lǐng)域:在一個(gè)標(biāo)準(zhǔn)的七年級(jí)課程中涵蓋的世界歷史知識(shí)。的世界歷史知識(shí)。n在這個(gè)領(lǐng)域中包括的區(qū)域:在這個(gè)領(lǐng)域中包括的區(qū)域: A、問題、問題 1、社會(huì)的、社會(huì)的 2、政治的、政治的 3、文化的、文化的 B、區(qū)域、區(qū)域 1、歐洲、歐洲 2、美國(guó)、美國(guó) 3、非洲和亞洲、非洲和亞洲 C、時(shí)間范圍、時(shí)間范圍 1、18世紀(jì)世紀(jì) 2、19世紀(jì)世紀(jì)n涵蓋區(qū)域的相對(duì)重要性涵蓋區(qū)域的相對(duì)重要性 社會(huì)的社會(huì)的政治的政治的文

8、化的文化的歐洲歐洲18世紀(jì)世紀(jì)19世紀(jì)世紀(jì)5%5%10%8%3%2%美國(guó)美國(guó)18世紀(jì)世紀(jì)19世紀(jì)世紀(jì)6%9%17%13%2%5%非洲和亞洲非洲和亞洲18世紀(jì)世紀(jì)19世紀(jì)世紀(jì)2%6%0%5%0%2%100%第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n內(nèi)容效度的特征內(nèi)容效度的特征q不是普遍適用的,測(cè)驗(yàn)分析者和使用者定義的內(nèi)容范圍相不是普遍適用的,測(cè)驗(yàn)分析者和使用者定義的內(nèi)容范圍相同,才有意義;同,才有意義;q有時(shí)間上的特定性;有時(shí)間上的特定性;q與表面效度的區(qū)別與表面效度的區(qū)別n內(nèi)容效度:由專家詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的,要考慮內(nèi)容效度:由專家詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的,要考慮

9、題目與測(cè)量目地和內(nèi)容總體之間的邏輯關(guān)系。題目與測(cè)量目地和內(nèi)容總體之間的邏輯關(guān)系。n表面效度:測(cè)驗(yàn)表面上看來(lái)好像是測(cè)量所要測(cè)的東西,只考慮了題表面效度:測(cè)驗(yàn)表面上看來(lái)好像是測(cè)量所要測(cè)的東西,只考慮了題目與測(cè)量目標(biāo)之間的明顯的、直接的關(guān)系。目與測(cè)量目標(biāo)之間的明顯的、直接的關(guān)系。n表面效度關(guān)注的是參試著感知到一個(gè)測(cè)驗(yàn)的吸引力和適用性如何。表面效度關(guān)注的是參試著感知到一個(gè)測(cè)驗(yàn)的吸引力和適用性如何。評(píng)估內(nèi)容效度n對(duì)內(nèi)容效度不存在精確地、統(tǒng)計(jì)上的測(cè)量。代表的是對(duì)一個(gè)測(cè)對(duì)內(nèi)容效度不存在精確地、統(tǒng)計(jì)上的測(cè)量。代表的是對(duì)一個(gè)測(cè)驗(yàn)提供的一個(gè)特定內(nèi)容領(lǐng)域樣本的充分程度的判斷。驗(yàn)提供的一個(gè)特定內(nèi)容領(lǐng)域樣本的充分程度的

10、判斷。n對(duì)內(nèi)容效度的判斷既不是最終的也不是絕對(duì)的。對(duì)內(nèi)容效度的判斷既不是最終的也不是絕對(duì)的。n測(cè)驗(yàn)顯示出各種水平的內(nèi)容效度,而專家對(duì)它們的判斷不是總測(cè)驗(yàn)顯示出各種水平的內(nèi)容效度,而專家對(duì)它們的判斷不是總能達(dá)成一致。能達(dá)成一致。n對(duì)內(nèi)容領(lǐng)域的界限和結(jié)構(gòu)提供的細(xì)節(jié)越多,對(duì)它的判斷就可以對(duì)內(nèi)容領(lǐng)域的界限和結(jié)構(gòu)提供的細(xì)節(jié)越多,對(duì)它的判斷就可以越自信。越自信。n一個(gè)測(cè)驗(yàn)為某個(gè)特定的領(lǐng)域提供具有代表性的樣本保證測(cè)量的一個(gè)測(cè)驗(yàn)為某個(gè)特定的領(lǐng)域提供具有代表性的樣本保證測(cè)量的有效且精確。有效且精確。第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法二、構(gòu)想效度(結(jié)構(gòu)效度)二、構(gòu)想效度(結(jié)構(gòu)效度)n什么是構(gòu)想效度什么

11、是構(gòu)想效度q是指測(cè)驗(yàn)對(duì)某種理論構(gòu)想或特質(zhì)所能體現(xiàn)測(cè)量的程度。是指測(cè)驗(yàn)對(duì)某種理論構(gòu)想或特質(zhì)所能體現(xiàn)測(cè)量的程度。即即理論構(gòu)想理論構(gòu)想是否能真實(shí)反應(yīng)實(shí)際狀況。是否能真實(shí)反應(yīng)實(shí)際狀況。q建立構(gòu)想效度的過程:建立構(gòu)想效度的過程:n從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè);從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè);n設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè);設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè);n采用相關(guān)或因素分析等實(shí)證研究的方法進(jìn)行分析,驗(yàn)證與理論假采用相關(guān)或因素分析等實(shí)證研究的方法進(jìn)行分析,驗(yàn)證與理論假設(shè)的符合程度。設(shè)的符合程度。第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n構(gòu)想效度的估計(jì)方法構(gòu)想效度的估計(jì)方法

12、q對(duì)測(cè)驗(yàn)本身的分析對(duì)測(cè)驗(yàn)本身的分析n內(nèi)容效度可作為構(gòu)想效度的證據(jù)內(nèi)容效度可作為構(gòu)想效度的證據(jù);n內(nèi)部一致性指標(biāo)內(nèi)部一致性指標(biāo)(如分半信度、(如分半信度、系數(shù)、系數(shù)、KR20KR20等)等)可以推斷測(cè)可以推斷測(cè)驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),為評(píng)估構(gòu)想效度提供證驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),為評(píng)估構(gòu)想效度提供證據(jù);據(jù);n分析被試對(duì)題目的反應(yīng)特點(diǎn)分析被試對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)想效度的證據(jù)。也可以作為構(gòu)想效度的證據(jù)。n班杜拉的自我效能感的四種來(lái)源:成功的表現(xiàn)、替代經(jīng)歷、口班杜拉的自我效能感的四種來(lái)源:成功的表現(xiàn)、替代經(jīng)歷、口頭勸說和情感激勵(lì)頭勸說和情感激勵(lì)內(nèi)容效度;測(cè)驗(yàn)問題確實(shí)反映了自我

13、效內(nèi)容效度;測(cè)驗(yàn)問題確實(shí)反映了自我效能感來(lái)源的四個(gè)方面能感來(lái)源的四個(gè)方面構(gòu)想效度;構(gòu)想效度;第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n構(gòu)想效度的估計(jì)方法構(gòu)想效度的估計(jì)方法q測(cè)驗(yàn)間的相互作用測(cè)驗(yàn)間的相互作用n相容效度相容效度(聚合效度)(聚合效度):一個(gè)測(cè)驗(yàn)與測(cè)量相同特質(zhì)的其他高效度測(cè)驗(yàn)一個(gè)測(cè)驗(yàn)與測(cè)量相同特質(zhì)的其他高效度測(cè)驗(yàn)相關(guān)的程度。(高相關(guān))相關(guān)的程度。(高相關(guān))q同時(shí)效度(校標(biāo)關(guān)聯(lián)效度的一種):提供了測(cè)驗(yàn)與校標(biāo)有高相關(guān)同時(shí)效度(校標(biāo)關(guān)聯(lián)效度的一種):提供了測(cè)驗(yàn)與校標(biāo)有高相關(guān)的依據(jù),而不是另一個(gè)測(cè)驗(yàn)。校標(biāo),是對(duì)行為主觀或客觀的測(cè)量,的依據(jù),而不是另一個(gè)測(cè)驗(yàn)。校標(biāo),是對(duì)行為主觀或客觀的測(cè)

14、量,如工作表現(xiàn)評(píng)定、課程成績(jī)和面試結(jié)果。如工作表現(xiàn)評(píng)定、課程成績(jī)和面試結(jié)果。n區(qū)分效度區(qū)分效度:一個(gè)測(cè)驗(yàn)與其他不同特質(zhì)的測(cè)驗(yàn)相區(qū)分的程度。(低相:一個(gè)測(cè)驗(yàn)與其他不同特質(zhì)的測(cè)驗(yàn)相區(qū)分的程度。(低相關(guān))關(guān))n因素分析因素分析:求量表各項(xiàng)目之因素結(jié)構(gòu)矩陣,再由結(jié)構(gòu)矩陣所表列之求量表各項(xiàng)目之因素結(jié)構(gòu)矩陣,再由結(jié)構(gòu)矩陣所表列之因素負(fù)荷量大小來(lái)判定建構(gòu)效度好壞。因素負(fù)荷量大小來(lái)判定建構(gòu)效度好壞。n多特質(zhì)多方法矩陣(多特質(zhì)多方法矩陣(HLM)HLM)第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n構(gòu)想效度的估計(jì)方法構(gòu)想效度的估計(jì)方法q校標(biāo)效度的研究證明校標(biāo)效度的研究證明n理想的校標(biāo)的性質(zhì)和種類可以作為分析測(cè)

15、驗(yàn)構(gòu)想效度的指標(biāo)。理想的校標(biāo)的性質(zhì)和種類可以作為分析測(cè)驗(yàn)構(gòu)想效度的指標(biāo)。n根據(jù)發(fā)展變化特點(diǎn)來(lái)驗(yàn)證構(gòu)想效度。僅限于發(fā)展變化特點(diǎn)的根據(jù)發(fā)展變化特點(diǎn)來(lái)驗(yàn)證構(gòu)想效度。僅限于發(fā)展變化特點(diǎn)的理論構(gòu)想。理論構(gòu)想。q實(shí)驗(yàn)法和觀察法證實(shí)實(shí)驗(yàn)法和觀察法證實(shí)n如果潛在的理論預(yù)測(cè)一些處理和訓(xùn)練將會(huì)增加或減少心理構(gòu)如果潛在的理論預(yù)測(cè)一些處理和訓(xùn)練將會(huì)增加或減少心理構(gòu)想,前測(cè)分?jǐn)?shù)和后測(cè)分?jǐn)?shù)之間的顯著差別為構(gòu)想效度提供了想,前測(cè)分?jǐn)?shù)和后測(cè)分?jǐn)?shù)之間的顯著差別為構(gòu)想效度提供了證據(jù)。證據(jù)。第二第二單元單元 效度評(píng)估的方法效度評(píng)估的方法三、校標(biāo)效度(實(shí)證效度、關(guān)聯(lián)效度)三、校標(biāo)效度(實(shí)證效度、關(guān)聯(lián)效度)n什么是校標(biāo)效度什么是校標(biāo)效

16、度q反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。q校標(biāo):被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)。常用的有:學(xué)業(yè)成校標(biāo):被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)。常用的有:學(xué)業(yè)成績(jī)、行為的等級(jí)評(píng)定、臨床診斷、實(shí)際工作表現(xiàn)、先前有效績(jī)、行為的等級(jí)評(píng)定、臨床診斷、實(shí)際工作表現(xiàn)、先前有效的測(cè)驗(yàn)、團(tuán)體對(duì)照等。的測(cè)驗(yàn)、團(tuán)體對(duì)照等。q根據(jù)測(cè)驗(yàn)?zāi)康姆诸悾焊鶕?jù)測(cè)驗(yàn)?zāi)康姆诸悾簄同時(shí)效度:測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)同時(shí)驗(yàn)證;建立了提供現(xiàn)在的獨(dú)立同時(shí)效度:測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)同時(shí)驗(yàn)證;建立了提供現(xiàn)在的獨(dú)立事件或者行為的信息的測(cè)驗(yàn)(診斷現(xiàn)狀的測(cè)驗(yàn))事件或者行為的信息的測(cè)驗(yàn)(診斷現(xiàn)狀的測(cè)驗(yàn))n預(yù)測(cè)

17、效度:校標(biāo)資料需一段時(shí)間之后才能搜集到。建立了提供預(yù)測(cè)效度:校標(biāo)資料需一段時(shí)間之后才能搜集到。建立了提供未來(lái)事件信息的測(cè)驗(yàn)(預(yù)測(cè)將來(lái))。未來(lái)事件信息的測(cè)驗(yàn)(預(yù)測(cè)將來(lái))。n 校標(biāo)效度(實(shí)證效度)兩種形式:校標(biāo)效度(實(shí)證效度)兩種形式:l 同時(shí)效度:反映測(cè)驗(yàn)?zāi)茉谑裁闯潭壬先〈?biāo)。同時(shí)效度:反映測(cè)驗(yàn)?zāi)茉谑裁闯潭壬先〈?biāo)。 例:例:以以“口袋中零用錢口袋中零用錢”( (屬測(cè)量工具屬測(cè)量工具) )衡量受訪者的衡量受訪者的“所得所得”( (屬效標(biāo)屬效標(biāo)) )高低,假如兩者相關(guān)很高,則高低,假如兩者相關(guān)很高,則“同時(shí)效度同時(shí)效度”高。又如:心理測(cè)驗(yàn)、星座、血型、行為之人格分析高。又如:心理測(cè)驗(yàn)、星座、血

18、型、行為之人格分析l 預(yù)測(cè)效度:反映測(cè)驗(yàn)?zāi)茉谑裁闯潭壬项A(yù)測(cè)效標(biāo)。預(yù)測(cè)效度:反映測(cè)驗(yàn)?zāi)茉谑裁闯潭壬项A(yù)測(cè)效標(biāo)。 例:民意調(diào)查可正確預(yù)測(cè)選舉結(jié)果例:民意調(diào)查可正確預(yù)測(cè)選舉結(jié)果第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n什么是校標(biāo)效度什么是校標(biāo)效度q好的校標(biāo)必須具有以下條件好的校標(biāo)必須具有以下條件n校標(biāo)測(cè)量本身必須有效;校標(biāo)測(cè)量本身必須有效;n校標(biāo)有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化;校標(biāo)有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化;n校標(biāo)可以客觀的測(cè)量,用數(shù)據(jù)表示。校標(biāo)可以客觀的測(cè)量,用數(shù)據(jù)表示。n校表測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。校表

19、測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n校標(biāo)效度的評(píng)估方法校標(biāo)效度的評(píng)估方法q相關(guān)法相關(guān)法:求測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)資料間的相關(guān)(效度系數(shù)):求測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)資料間的相關(guān)(效度系數(shù))n都是連續(xù)變量都是連續(xù)變量積差相關(guān)法。積差相關(guān)法。n測(cè)驗(yàn)成績(jī)是連續(xù)變量,校標(biāo)資料是二分變量測(cè)驗(yàn)成績(jī)是連續(xù)變量,校標(biāo)資料是二分變量點(diǎn)二列點(diǎn)二列相關(guān)(或二列相關(guān))相關(guān)(或二列相關(guān))n測(cè)驗(yàn)分?jǐn)?shù)是連續(xù)變量,校標(biāo)資料是等級(jí)評(píng)定測(cè)驗(yàn)分?jǐn)?shù)是連續(xù)變量,校標(biāo)資料是等級(jí)評(píng)定賈斯朋賈斯朋多系列相關(guān)公式計(jì)算。多系列相關(guān)公式計(jì)算。第二單元第二單元 效度評(píng)估的方法效度評(píng)估的方法n校標(biāo)效度的評(píng)估方法校標(biāo)效度的

20、評(píng)估方法q區(qū)分法:檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)是否有效地區(qū)分由校標(biāo)所定義區(qū)分法:檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)是否有效地區(qū)分由校標(biāo)所定義的團(tuán)體的一種方法。的團(tuán)體的一種方法。n先讓被試接受一個(gè)測(cè)驗(yàn),然后學(xué)習(xí)一段時(shí)間,根據(jù)學(xué)習(xí)成績(jī)先讓被試接受一個(gè)測(cè)驗(yàn),然后學(xué)習(xí)一段時(shí)間,根據(jù)學(xué)習(xí)成績(jī)(效標(biāo)(效標(biāo) )將其分成兩組。再分析兩組被試原來(lái)接受的測(cè)驗(yàn))將其分成兩組。再分析兩組被試原來(lái)接受的測(cè)驗(yàn)的分?jǐn)?shù)差異。的分?jǐn)?shù)差異。q命中率法命中率法:用測(cè)驗(yàn)的分?jǐn)?shù)來(lái)進(jìn)行決策,測(cè)驗(yàn)是否有效:用測(cè)驗(yàn)的分?jǐn)?shù)來(lái)進(jìn)行決策,測(cè)驗(yàn)是否有效的指標(biāo)是正確決策的比例,即命中率。的指標(biāo)是正確決策的比例,即命中率。n正確的預(yù)測(cè)(決定)為命中,不正確的預(yù)測(cè)(決定)為失誤。正確的預(yù)測(cè)(

21、決定)為命中,不正確的預(yù)測(cè)(決定)為失誤。第三單元第三單元 效度的功能效度的功能n預(yù)測(cè)誤差預(yù)測(cè)誤差q效度系數(shù)(決定性系數(shù)),即相關(guān)系數(shù)的平方,表示測(cè)驗(yàn)效度系數(shù)(決定性系數(shù)),即相關(guān)系數(shù)的平方,表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋校標(biāo)的方差占總方差的比例。正確預(yù)測(cè)或解釋校標(biāo)的方差占總方差的比例。q估計(jì)的標(biāo)準(zhǔn)誤(估計(jì)的標(biāo)準(zhǔn)誤(Sest),是指預(yù)測(cè)誤差大小的估計(jì)值,),是指預(yù)測(cè)誤差大小的估計(jì)值,是對(duì)真正分?jǐn)?shù)估計(jì)的誤差大小。是對(duì)真正分?jǐn)?shù)估計(jì)的誤差大小。 Sest2=Sy2(1-r2xy) r2xy:決定性系數(shù):決定性系數(shù) Sy為校標(biāo)成績(jī)的標(biāo)準(zhǔn)差為校標(biāo)成績(jī)的標(biāo)準(zhǔn)差 r2xy=1.00,Sest=0,測(cè)驗(yàn)分?jǐn)?shù)可完全代替

22、校標(biāo);,測(cè)驗(yàn)分?jǐn)?shù)可完全代替校標(biāo); r2xy=0.00,Sest=1,測(cè)驗(yàn)無(wú)疑于猜測(cè)。,測(cè)驗(yàn)無(wú)疑于猜測(cè)。第三單元第三單元 效度的功能效度的功能n預(yù)測(cè)誤差預(yù)測(cè)誤差n預(yù)測(cè)校標(biāo)分?jǐn)?shù)預(yù)測(cè)校標(biāo)分?jǐn)?shù)n預(yù)測(cè)效率指數(shù)預(yù)測(cè)效率指數(shù)qK2=(1-r2xy) K:無(wú)關(guān)系數(shù),無(wú)關(guān)系數(shù),K值大小表明預(yù)測(cè)源分?jǐn)?shù)與校標(biāo)值大小表明預(yù)測(cè)源分?jǐn)?shù)與校標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。分?jǐn)?shù)無(wú)關(guān)的程度。 K2=(Sest/Sy)2= (1-r2xy) qE=100(1-K) E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。少誤差。第四單元第四單元 影響效度的因素影響效度的因素n測(cè)驗(yàn)本身的因素測(cè)驗(yàn)本身的因素q材料必須對(duì)整個(gè)內(nèi)容具有代表性;材料必須對(duì)整個(gè)內(nèi)容具有代表性;q盡量避免容易引起誤差的題型(如是非題);盡量避免容易引起誤差的題型(如是非題);q難度要適中,具有較高的區(qū)分度;難度要適中,具有較高的區(qū)分度;q長(zhǎng)度要恰當(dāng),有一定的測(cè)題量;長(zhǎng)度要恰當(dāng),有一定的測(cè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論