信度和效度測量

上傳人：5*** IP屬地：湖北上傳時(shí)間：2022-03-06 格式：PPT 頁數(shù)：38 大?。?.46MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩33頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、l測量理論l信度l效度l信度與效度的關(guān)系l信度與效度的分類及Stata計(jì)算l信度與效度的影響因素l提高信度與效度的途徑正如很多教科書所說：信度是指測試方法不受隨機(jī)誤差干擾的程度，反映正如很多教科書所說：信度是指測試方法不受隨機(jī)誤差干擾的程度，反映測試結(jié)果的一致性和穩(wěn)定性測試結(jié)果的一致性和穩(wěn)定性(consistency, and stability)。它反映測試的準(zhǔn)確性它反映測試的準(zhǔn)確性( (accuracyaccuracy) )，即在多大程度上，即在多大程度上測量了想要測的內(nèi)容。測量了想要測的內(nèi)容。T可以證明：可以證明：l總而言之，信度和效度相互排斥又相互依存；沒有信度就總而言之，信度和效度相

2、互排斥又相互依存；沒有信度就不可能有效度；沒有效度，信度就毫無意義；高信度可能不可能有效度；沒有效度，信度就毫無意義；高信度可能帶來低效度；高效度也可能帶來低信度。帶來低效度；高效度也可能帶來低信度。l信度主要分為四大類：信度主要分為四大類：l重測信度重測信度(Test-retest Reliability)l復(fù)本信度復(fù)本信度(Alternate-form Reliability)l內(nèi)部一致性系數(shù)內(nèi)部一致性系數(shù)(Internal Consistency Reliability)l評(píng)分者信度評(píng)分者信度(Scorer Reliability)l重測信度反映兩次測量結(jié)果的相關(guān)程度。對(duì)于分類變量，可采

3、用Cohens kappa系數(shù)來測量：12015/ 500.725302520505050500.30.20.50.70.50.4110.5aeeaeaeaeeppK appakpppppppkp系數(shù) ：其中是兩次觀測的實(shí) 際一致率，是兩次觀測的期望一致率。以右表為例：BA好壞合計(jì)好20525壞101525合計(jì)302050將上表恢復(fù)為原始數(shù)據(jù)集后，采用Stata的kappa命令可得如下結(jié)果：Kappa 系數(shù)大于0. 75 表示重測信度很好, 在0. 4 0. 75 表示較好,而低于0. 4 表示較差。如果結(jié)果顯示某個(gè)問卷(量表)項(xiàng)目的Ka

4、ppa 系數(shù)低于0. 4 , 則要考慮修改或刪除該項(xiàng)目。l對(duì)于連續(xù)變量，可采用Ronald Fisher(1954)提出的ICC (Intraclass Correlation Coefficient )系數(shù)來測量：l兩種相關(guān)系數(shù)的本質(zhì)區(qū)別在于均值和方差計(jì)算不同。在計(jì)算連續(xù)變量的重測信度時(shí)，應(yīng)采用rFisher系數(shù)更準(zhǔn)確。12Fisher11212221211111()21()()21nipipippnpiiinnpipipiixxxxrnssxxxnsxxxxnPearson1221122111111,()11,()niiixynnixiiinniyiiixxyyrnssxx sxxnnyy

5、 syynn一般來說, ICC 大于0. 75 表示極好, ICC 在0. 6 0. 75 表示較好。通通常常的的相相關(guān)關(guān)系系數(shù)：數(shù)：Stata命令：命令：For rpearsoncorr var1 var2For rFisherloneway var1 var2l復(fù)本信度是指用母本和復(fù)本兩次等值測評(píng)結(jié)果的一致性程度。它的計(jì)算與重測信度相似，即計(jì)算母本和復(fù)本測評(píng)數(shù)據(jù)的相關(guān)性。當(dāng)測評(píng)結(jié)果為分?jǐn)?shù)或數(shù)值時(shí)，用rPearson法或rFisher計(jì)算；當(dāng)測評(píng)結(jié)果為等級(jí)或名次時(shí)，用斯皮爾曼等級(jí)相關(guān)系數(shù) (Spearman Rank Correlation)。這些方法的適用性和差異見下表：l從表中數(shù)字可以看

6、出，工人的考試成績愈高其產(chǎn)量也愈高，二者之間的聯(lián)系程度較一致，rPearson=0.691；并不算太高，這可能由于它們之間的關(guān)系并不是線性的。l如果分別按考試成績和產(chǎn)量高低變換成等級(jí)(見上表第3、4列)，則可以計(jì)算它們之間的斯皮爾曼等級(jí)相關(guān)系數(shù)為1。計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)可以將數(shù)據(jù)變換成等級(jí)以后用原有的相關(guān)系數(shù)公式計(jì)算，也可以先算出每一對(duì)樣本的等級(jí)之差di，結(jié)合樣本量n；再用下列公式計(jì)算： 21Spearman Rank261(1)niidrn n 上例中由于等級(jí)完全一致，所有di = 0，所以r-spearman rank =1 。Stata命令：命令：For r-spearman ran

7、k spearman var1 var2()(),21hhSpearman BrownhrrrrFlanagan 內(nèi)部一致性系數(shù)反映調(diào)查問卷量表各個(gè)問項(xiàng) 項(xiàng)目間相關(guān)的程度這些問項(xiàng)應(yīng)該反映同一獨(dú)立概念的不同側(cè)面。它通常采用折半信度測量。具體辦法是：將問卷（量表）中所有項(xiàng)目分為對(duì)等的兩部分，然后計(jì)算兩部分的相關(guān)系數(shù),即折半信度。然后，據(jù)此推算整個(gè)問卷(量表)信度：通常地，前半部分問卷和后半部分問卷的方差不相等，將其拓2222222 1()abFlanagana baba bssrssss展為：其中，，分別為前半部分、后半部分和整個(gè)問卷量表的方差。21222()Cronbach(

8、),:11 j; kjjmXjXXXskksss 當(dāng)問卷(量表)的問項(xiàng) 項(xiàng)目總數(shù)為奇數(shù)，無法分成為對(duì)等的兩部分時(shí),則用的系數(shù)，它表示問卷量表測量結(jié)果總變異中由不同被試者導(dǎo)致的比例占多少即其中，為所有受訪者第問項(xiàng)答案的方差為所有受訪者、所有問項(xiàng)答案的方差為問項(xiàng)題目總數(shù)。Cronbachs 系數(shù)越大表示問卷項(xiàng)目間相關(guān)性越好, 內(nèi)部一致性信度越高。一般而言,大于0. 8 表示內(nèi)部一致性極好,在0. 6 0. 8 表示較好,而低于0. 6 表示內(nèi)部一致性較差。在實(shí)際應(yīng)用上,Cronbachs 值至少要大于0. 5 ,最好能大于0. 7 (Nunnally ,1978) 。Stata命令：命

9、令：For rCronbach alpha var1 var2l當(dāng)評(píng)分者為兩人時(shí)，評(píng)分者信度是通過對(duì)同一組被試測評(píng)分?jǐn)?shù)之間的相關(guān)系數(shù)來鑒定，可使用積差相關(guān)(rPearson,rFisher) 法或等級(jí)相關(guān)法(rspearman rank)。l當(dāng)評(píng)分者為兩人以上，并用等級(jí)計(jì)分(其他形式的分?jǐn)?shù)要轉(zhuǎn)化為等級(jí))，則用肯德爾和諧系數(shù)來測量評(píng)分者信度。2211kandall-1232211kandall-2233111()1()121()1()()12, ,nniiiiinniiiiknijijjiinrknnknrknnkttn k(1)同一評(píng)價(jià)者對(duì)各被評(píng)對(duì)象：為每個(gè)被評(píng)對(duì)象所得到的等級(jí)之和；n為被評(píng)價(jià)

10、對(duì)象數(shù)量；為評(píng)價(jià)者數(shù)量。(2)同一評(píng)價(jià)者對(duì)各被評(píng)對(duì)象：與上無相同等級(jí)評(píng)定時(shí)有相同等級(jí)評(píng)定時(shí)jijt面相同；為第個(gè)評(píng)價(jià)者對(duì)第i個(gè)被評(píng)對(duì)象所評(píng)結(jié)果中的相同等級(jí)數(shù)量。Stata命令：命令：For rKendall ktau var1 var2i2i應(yīng)聘者評(píng)等級(jí)面試官一二三四五六A312546B213456C321546D412635E312645F421536198113123343616412196152911566621122211kandall-12323126;319211()319212660.8711()6 (66)1212iiiinniiiinrknn根據(jù)右表可知：n=6,k=6

11、例題： 6名面試考官對(duì)6名應(yīng)聘者的綜合素質(zhì)進(jìn)行了測評(píng)，評(píng)分經(jīng)等級(jí)轉(zhuǎn)換如下表所示，試分析評(píng)分者信度。i2i應(yīng)聘者評(píng)等級(jí)面試官ABCDEF甲142.5562.5乙231564丙1.531.545.55.54.51051417.51220.2510025196306.2514462112211kandall-22331122333363;791.51()1()()121791.5636 0.8513(66) 3(22) (22) (22)12niiiinniiiiknijijjinrk nnktt 根據(jù)右表可知：n=6,k=3例題： 3名面試考官對(duì)6名應(yīng)聘者的綜合素質(zhì)進(jìn)行了測評(píng)，評(píng)分經(jīng)等級(jí)轉(zhuǎn)換如下表

12、所示，試分析評(píng)分者信度。l信度主要分為三大類：信度主要分為三大類：l內(nèi)容效度內(nèi)容效度(Content Validity) 抽樣效度(Sampling Validity) 表面效度(Face Validity)l效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度(Criterion-Related Validity) 同時(shí)效度(Concurrent Validity) 預(yù)測效度(Predictive Validity)l構(gòu)思效度構(gòu)思效度(Construct Validity) 收斂效度(Convergent Validity) 區(qū)分效度(Discriminant Validity)l在招聘和甄選過程中，通常涉及內(nèi)容效度和

13、效標(biāo)關(guān)聯(lián)效度。內(nèi)容效度是指測評(píng)內(nèi)容反映測量目標(biāo)(如知識(shí)、技能和行為等)的程度。一個(gè)測驗(yàn)要具備較好的內(nèi)容效度必須滿足以下兩個(gè)條件：一、要確定好內(nèi)容范圍，并使測驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)(抽樣效度)。它既可以是具體知識(shí)或技能，也可以是復(fù)雜行為。二、測驗(yàn)項(xiàng)目應(yīng)是已界定的內(nèi)容范圍的代表性樣本(表面效度)。也即選出的項(xiàng)目能包含所測的內(nèi)容范圍的主要方面，并且使各部分項(xiàng)目所占比例適當(dāng)。 l確定測驗(yàn)內(nèi)容效度常用的方法是由專家對(duì)測驗(yàn)項(xiàng)目與所涉及的內(nèi)容范圍進(jìn)行符合性判斷，這是一種定性分析的方法。l這個(gè)效度產(chǎn)生的過程是：首先進(jìn)行職務(wù)分析，確定完成該職位任務(wù)所需進(jìn)行的工作，需具備的技能和能力；其次，確定衡量這些特征

14、的測試題目。最后，請(qǐng)相關(guān)領(lǐng)域?qū)＜揖瓦@些測試題目是否涵蓋了有效地內(nèi)容進(jìn)行評(píng)估和篩選。l效標(biāo)關(guān)聯(lián)效度是指問卷(量表)測量結(jié)果和效度標(biāo)準(zhǔn)(被假設(shè)或定義為有效的某種外在標(biāo)準(zhǔn))之間的一致程度。l根據(jù)效度標(biāo)準(zhǔn)獲取的時(shí)間可分為:同時(shí)效度和預(yù)測效度。同時(shí)效度和預(yù)測效度的大小直接反映了問卷(量表)效標(biāo)關(guān)聯(lián)效度的高低。l(1)同時(shí)效度(Concurrent Validity) ,即同時(shí)在研究對(duì)象中進(jìn)行測評(píng)和效度標(biāo)準(zhǔn)測量得到的結(jié)果之間的相關(guān)程度,其效度系數(shù)通常較低,多在0. 200. 60之間,很少超過0. 70 ,一般以0. 40. 8 之間較理想。l例如：在招聘應(yīng)屆畢業(yè)生時(shí)，可將應(yīng)聘大學(xué)生的面試和筆試綜合分?jǐn)?shù)與

15、其在校綜合測評(píng)成績(效標(biāo))進(jìn)行相關(guān)性分析。l(2)預(yù)測效度(Predictive Validity) ,它是指問卷(量表)測量結(jié)果經(jīng)過一段時(shí)間后與未來實(shí)際結(jié)果予以相關(guān)性分析,兩者之間的吻合程度。l例如：對(duì)于被錄用者，可以將招聘測試分?jǐn)?shù)與一段時(shí)間(半年或一年)之后的工作業(yè)績考核結(jié)果進(jìn)行比較。若這些人的工作績效和招聘測試分?jǐn)?shù)呈現(xiàn)密切相關(guān)關(guān)系時(shí)，說明招聘方法是有效的，可以推廣到人員甄選與選拔中去。l分析效標(biāo)關(guān)聯(lián)效度的通常作法是對(duì)問卷(量表)測量結(jié)果與有效標(biāo)準(zhǔn)進(jìn)行相關(guān)分析,相關(guān)系數(shù)越大表示問卷(量表)的效標(biāo)關(guān)聯(lián)效度越好,一般認(rèn)為相關(guān)系數(shù)在0. 40. 8 比較理想。l若為連續(xù)型變量，計(jì)算Pearson

16、或Fisher相關(guān)系數(shù),若為分類變量，則計(jì)算Kendall 或Spearman 等級(jí)相關(guān)系數(shù)。一般而言, 相關(guān)系數(shù)在0. 40. 8 比較理想。l常被翻譯為：架構(gòu)效度，構(gòu)想效度和結(jié)構(gòu)效度等等。它是指測評(píng)所能衡量到理論上期望的特征的程度,即問卷(量表)所要測量的概念能顯示出科學(xué)的意義并符合理論上的設(shè)想,它是通過與理論假設(shè)相比較來檢驗(yàn)的,因此也被稱為理論效度。構(gòu)思效度比較復(fù)雜，超出了本科生人力資源管理專業(yè)學(xué)生的學(xué)習(xí)范圍，故省略之。l被試方面l主試方面l施測情景方面l測量工具方面l兩次施測的時(shí)間間隔l適當(dāng)增加測驗(yàn)的長度。l使測試題難度分布接近正態(tài)分布，并控制在中等水平。l努力提高測驗(yàn)試題的區(qū)分度。l選取適當(dāng)?shù)谋辉噲F(tuán)體，提高測驗(yàn)在同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。l主試嚴(yán)格執(zhí)行實(shí)測規(guī)程，評(píng)分者嚴(yán)格按標(biāo)準(zhǔn)給分。l實(shí)測場地按測驗(yàn)手冊(cè)要求布置，減少無關(guān)因素的干擾。l測驗(yàn)的構(gòu)成l測驗(yàn)的實(shí)施過程l接受測驗(yàn)的被試l精心編制測驗(yàn)量表，避免出現(xiàn)較大的系統(tǒng)誤差。l妥善組織測驗(yàn)，控制隨機(jī)誤差。l創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情景，讓每個(gè)被試都能充分發(fā)揮正常水平。l選擇正確的效標(biāo)，定好恰當(dāng)?shù)男?biāo)測量，正確地使用

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

信度和效度測量

文檔簡介

溫馨提示

最新文檔

評(píng)論

信度和效度測量

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔