第四節(jié) 測(cè)驗(yàn)的效度_第1頁(yè)
第四節(jié) 測(cè)驗(yàn)的效度_第2頁(yè)
第四節(jié) 測(cè)驗(yàn)的效度_第3頁(yè)
第四節(jié) 測(cè)驗(yàn)的效度_第4頁(yè)
第四節(jié) 測(cè)驗(yàn)的效度_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四節(jié)測(cè)驗(yàn)的效度

效度的概念效度評(píng)估的方法效度的功能影響效度的因素第一單元效度的概念效度的概念是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者說(shuō)是一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。效度的性質(zhì)效度具有相對(duì)性:評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。效度是測(cè)驗(yàn)的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。判斷一個(gè)測(cè)驗(yàn)是否有效要從多方面搜集證據(jù)第一單元效度的概念效度測(cè)量學(xué)定義在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(有效方差)與總方差的比率。SX2=ST2+

SE2=

SV2+SI2+

SE2SE2

:隨機(jī)誤差方差,

SI2

:無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差);

ST2

:真分?jǐn)?shù)方差,SV2

:有效方差。

rXY2=SV2/SX2

rXY代表測(cè)量的效度系數(shù)

SV2

SI2

SE2

ST2

SX2

信度和效度的關(guān)系注:SX2=ST2+

SE2ST2=

SV2+SI2SE2

:隨機(jī)誤差方差,

SI2

:無(wú)關(guān)而穩(wěn)定的方差(系統(tǒng)誤差);

ST2

:真分?jǐn)?shù)方差,SV2

:有效方差。

信度:rXX=ST2/SX2,效度:rXY2=SV2/SX2第一單元效度的概念信度和效度的關(guān)系信度是效度的必要而非充分條件。效度是信度的充分條件。效度高,信度肯定高;但信度高,效度不一定高。效度是受信度制約的。rXY2=SV2/SX2=ST2-SI2/SX2=

rXX-SI2/SX2

∵SI2/SX2≥0

∴rXY2≤

rXX一個(gè)測(cè)驗(yàn)的效度不會(huì)超過(guò)它的信度的平方根,即測(cè)驗(yàn)與外在效標(biāo)的相關(guān),不會(huì)超過(guò)與它自身相關(guān)的平方和。效度與信度的關(guān)系第二單元效度評(píng)估的方法一、內(nèi)容效度(邏輯效度)什么是內(nèi)容效度是指測(cè)量中的項(xiàng)目在多大程度上包含了欲測(cè)的內(nèi)容范圍。常用推理判斷而非定量的方法確定。測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。編制測(cè)驗(yàn)過(guò)程對(duì)測(cè)量的心理特征有個(gè)明確的概念;測(cè)驗(yàn)題目應(yīng)是多界定的內(nèi)容范圍的代表性樣本;分測(cè)驗(yàn)內(nèi)部同質(zhì),分測(cè)驗(yàn)之間不要求同質(zhì)。第二單元效度評(píng)估的方法內(nèi)容效度的評(píng)估方法專家判斷法:三個(gè)步驟定義好測(cè)驗(yàn)內(nèi)容的總體范圍編制雙向細(xì)目表制定評(píng)估量表來(lái)測(cè)驗(yàn)測(cè)驗(yàn)的整個(gè)效度。統(tǒng)計(jì)分析法計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性,及評(píng)分者信度??藗惏秃眨和唤M被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作估計(jì)。再測(cè)法:先前測(cè),再讓被試學(xué)習(xí)新的知識(shí)或參與某種訓(xùn)練,然后再測(cè)。如果成績(jī)提高,效度高。經(jīng)驗(yàn)推測(cè)法對(duì)一個(gè)內(nèi)容領(lǐng)域的詳細(xì)描述要測(cè)量的領(lǐng)域:在一個(gè)標(biāo)準(zhǔn)的七年級(jí)課程中涵蓋的世界歷史知識(shí)。在這個(gè)領(lǐng)域中包括的區(qū)域:

A、問(wèn)題1、社會(huì)的2、政治的3、文化的

B、區(qū)域1、歐洲2、美國(guó)3、非洲和亞洲

C、時(shí)間范圍1、18世紀(jì)2、19世紀(jì)涵蓋區(qū)域的相對(duì)重要性

社會(huì)的政治的文化的歐洲18世紀(jì)19世紀(jì)5%5%10%8%3%2%美國(guó)18世紀(jì)19世紀(jì)6%9%17%13%2%5%非洲和亞洲18世紀(jì)19世紀(jì)2%6%0%5%0%2%100%第二單元效度評(píng)估的方法內(nèi)容效度的特征不是普遍適用的,測(cè)驗(yàn)分析者和使用者定義的內(nèi)容范圍相同,才有意義;有時(shí)間上的特定性;與表面效度的區(qū)別內(nèi)容效度:由專家詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的,要考慮題目與測(cè)量目地和內(nèi)容總體之間的邏輯關(guān)系。表面效度:測(cè)驗(yàn)表面上看來(lái)好像是測(cè)量所要測(cè)的東西,只考慮了題目與測(cè)量目標(biāo)之間的明顯的、直接的關(guān)系。表面效度關(guān)注的是參試著感知到一個(gè)測(cè)驗(yàn)的吸引力和適用性如何。評(píng)估內(nèi)容效度對(duì)內(nèi)容效度不存在精確地、統(tǒng)計(jì)上的測(cè)量。代表的是對(duì)一個(gè)測(cè)驗(yàn)提供的一個(gè)特定內(nèi)容領(lǐng)域樣本的充分程度的判斷。對(duì)內(nèi)容效度的判斷既不是最終的也不是絕對(duì)的。測(cè)驗(yàn)顯示出各種水平的內(nèi)容效度,而專家對(duì)它們的判斷不是總能達(dá)成一致。對(duì)內(nèi)容領(lǐng)域的界限和結(jié)構(gòu)提供的細(xì)節(jié)越多,對(duì)它的判斷就可以越自信。一個(gè)測(cè)驗(yàn)為某個(gè)特定的領(lǐng)域提供具有代表性的樣本保證測(cè)量的有效且精確。第二單元效度評(píng)估的方法二、構(gòu)想效度(結(jié)構(gòu)效度)什么是構(gòu)想效度是指測(cè)驗(yàn)對(duì)某種理論構(gòu)想或特質(zhì)所能體現(xiàn)測(cè)量的程度。即理論構(gòu)想是否能真實(shí)反應(yīng)實(shí)際狀況。建立構(gòu)想效度的過(guò)程:從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè);設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè);采用相關(guān)或因素分析等實(shí)證研究的方法進(jìn)行分析,驗(yàn)證與理論假設(shè)的符合程度。第二單元效度評(píng)估的方法構(gòu)想效度的估計(jì)方法對(duì)測(cè)驗(yàn)本身的分析內(nèi)容效度可作為構(gòu)想效度的證據(jù);內(nèi)部一致性指標(biāo)(如分半信度、α系數(shù)、KR20等)可以推斷測(cè)驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),為評(píng)估構(gòu)想效度提供證據(jù);分析被試對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)想效度的證據(jù)。班杜拉的自我效能感的四種來(lái)源:成功的表現(xiàn)、替代經(jīng)歷、口頭勸說(shuō)和情感激勵(lì)——內(nèi)容效度;測(cè)驗(yàn)問(wèn)題確實(shí)反映了自我效能感來(lái)源的四個(gè)方面——構(gòu)想效度;第二單元效度評(píng)估的方法構(gòu)想效度的估計(jì)方法測(cè)驗(yàn)間的相互作用相容效度(聚合效度):一個(gè)測(cè)驗(yàn)與測(cè)量相同特質(zhì)的其他高效度測(cè)驗(yàn)相關(guān)的程度。(高相關(guān))同時(shí)效度(校標(biāo)關(guān)聯(lián)效度的一種):提供了測(cè)驗(yàn)與校標(biāo)有高相關(guān)的依據(jù),而不是另一個(gè)測(cè)驗(yàn)。校標(biāo),是對(duì)行為主觀或客觀的測(cè)量,如工作表現(xiàn)評(píng)定、課程成績(jī)和面試結(jié)果。區(qū)分效度:一個(gè)測(cè)驗(yàn)與其他不同特質(zhì)的測(cè)驗(yàn)相區(qū)分的程度。(低相關(guān))因素分析:求量表各項(xiàng)目之因素結(jié)構(gòu)矩陣,再由結(jié)構(gòu)矩陣所表列之因素負(fù)荷量大小來(lái)判定建構(gòu)效度好壞。多特質(zhì)多方法矩陣(HLM)第二單元效度評(píng)估的方法構(gòu)想效度的估計(jì)方法校標(biāo)效度的研究證明理想的校標(biāo)的性質(zhì)和種類可以作為分析測(cè)驗(yàn)構(gòu)想效度的指標(biāo)。根據(jù)發(fā)展變化特點(diǎn)來(lái)驗(yàn)證構(gòu)想效度。僅限于發(fā)展變化特點(diǎn)的理論構(gòu)想。實(shí)驗(yàn)法和觀察法證實(shí)如果潛在的理論預(yù)測(cè)一些處理和訓(xùn)練將會(huì)增加或減少心理構(gòu)想,前測(cè)分?jǐn)?shù)和后測(cè)分?jǐn)?shù)之間的顯著差別為構(gòu)想效度提供了證據(jù)。第二單元效度評(píng)估的方法三、校標(biāo)效度(實(shí)證效度、關(guān)聯(lián)效度)什么是校標(biāo)效度反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。校標(biāo):被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)。常用的有:學(xué)業(yè)成績(jī)、行為的等級(jí)評(píng)定、臨床診斷、實(shí)際工作表現(xiàn)、先前有效的測(cè)驗(yàn)、團(tuán)體對(duì)照等。根據(jù)測(cè)驗(yàn)?zāi)康姆诸悾和瑫r(shí)效度:測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)同時(shí)驗(yàn)證;建立了提供現(xiàn)在的獨(dú)立事件或者行為的信息的測(cè)驗(yàn)(診斷現(xiàn)狀的測(cè)驗(yàn))預(yù)測(cè)效度:校標(biāo)資料需一段時(shí)間之后才能搜集到。建立了提供未來(lái)事件信息的測(cè)驗(yàn)(預(yù)測(cè)將來(lái))。校標(biāo)效度(實(shí)證效度)兩種形式:同時(shí)效度:反映測(cè)驗(yàn)?zāi)茉谑裁闯潭壬先〈?biāo)。

例:以“口袋中零用錢”(屬測(cè)量工具)衡量受訪者的“所得”(屬效標(biāo))高低,假如兩者相關(guān)很高,則“同時(shí)效度”高。又如:心理測(cè)驗(yàn)、星座、血型、行為之人格分析

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論