估計信度的方法_第1頁
估計信度的方法_第2頁
估計信度的方法_第3頁
估計信度的方法_第4頁
估計信度的方法_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二節(jié)估計信度的方法前面已經(jīng)提出了信度的概念,但只是一個理論上的構(gòu)想,實際測量過程中,無法對真分?jǐn)?shù)和誤差分?jǐn)?shù)進行測量,在實際應(yīng)用中,通常以同一樣本得到的兩組資料的相關(guān),作為測量一致性的指標(biāo)。估計信度有不同的方法,常用的估計的方法有再測信度、復(fù)本信度、等值穩(wěn)定性系數(shù)、內(nèi)部一致性系數(shù)、評分者信度等。、再測信度(Test-RetestReliability)再測信度,也叫重測信度,也叫穩(wěn)定性系數(shù)。用同一個測驗,對同一組被試前后施測兩次,對兩次測驗分?jǐn)?shù)求相關(guān),其相關(guān)系數(shù)就叫再測信度。其計算公式(皮爾遜積差相關(guān)公式的變式)為:xxXX12XX12SS12公式56)式中x、x為同一被試的兩次測驗分?jǐn)?shù),X、

2、可為全體被試兩次測驗的平1212均數(shù),SI、S2為兩次測驗的標(biāo)準(zhǔn)差(樣組標(biāo)準(zhǔn)差,參見金瑜的書P183),N為被試人數(shù)。再測法的模式是:施測適當(dāng)時距再施測例2:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測于10名學(xué)生,時間間隔為半年,結(jié)果如表所示,求該測驗的重測信度。(為了便于理解和計算,本章估計信度的例子都是小樣組,實際應(yīng)用時應(yīng)采用大樣組。)表51某幸福感調(diào)查表的兩次測試結(jié)果測驗1234被試5678910X116151313111010987X21616141211911867解:用計算器算出S=2.82,S=3.38,X二11.20,X二11.00,,XX=1324121212把以上數(shù)據(jù)代入公式

3、56,可得rxx=0.97132410-11.20 x11.002.82x3.38此題可用計算機社會科學(xué)統(tǒng)計軟件做,求皮爾遜積差相關(guān)。在測驗手冊上報告的再測信度,一般要注明被試樣本的性質(zhì)、大小,以及間隔多長時間等,以便使使用者了解樣本及時間因素對測驗穩(wěn)定性的影響。計算再測信度必須注意幾個問題:(1)所測量的特性必須是穩(wěn)定的。當(dāng)然絕對的穩(wěn)定是不可能的,但應(yīng)該是比較穩(wěn)定的。所欲測的如果是智力、人格、興趣等心理特質(zhì),則可以采用再測法;如果是知識、情緒等心理特質(zhì)就不能使用再測法,因為這些心理特質(zhì)是不穩(wěn)定的。xx(2)遺忘和練習(xí)的效果基本上相互抵消。在做第一次測驗時,被試可能會獲得某種技巧,但只要間隔時

4、間適度,這種練習(xí)的效果會基本上被遺忘掉。因此,再測信度要考慮時間間隔的問題。到底多長合適呢?一般來說,相隔時間越長,穩(wěn)定系數(shù)越低。最適宜的時距隨測驗的目的、性質(zhì)及被試的特點而異。對于年幼兒童,兩次施測的時間間隔應(yīng)比年紀(jì)較大的被試短些,這是因為在個體發(fā)展的早期變化較快。一般來說,無論對于那種被試,初測與再測的間隔最好不要超過六個月。另外,還有一種情況,例如,我們可能在間隔許多年后對被試施測同一個智力測驗,此時我們的目的主要是考察智力隨年齡的發(fā)展變化,而不是用來估計測驗的信度。(3)再測法適用于速度測驗而不適用于難度測驗。速度測驗題目較多,時間較緊,被試無法記住測驗內(nèi)容,所以受第一次測驗的影響小,

5、記憶效果可以忽略不計。(4)應(yīng)注意提高被試者的積極性。由于再測法是把原測驗原封不動地重測一次,所以被試者容易興趣索然,采取不積極合作的態(tài)度,使第二次測驗的質(zhì)量下降。所以,提高被試者的積極性,使他們?nèi)缤谝淮文菢诱J(rèn)真負(fù)責(zé)地完成測驗,這是再測法計算信度能夠成功的一個重要條件。由于測驗的再測信度受時間和其它多種因素的影響,故任何一個測驗就可有不止一個再測信度系數(shù)。所以在測驗手冊中報告此種信度時應(yīng)說明時間間隔以及在此間隔中被試的經(jīng)歷,如有無受過何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷二、復(fù)本信度復(fù)本信度(AlternateFormReliability),也稱等值性系數(shù)(CoefficientofEqu

6、ivalence)。用兩個平行(等值)的測驗對同一組被試施測,得到兩組測驗分?jǐn)?shù),求這兩組測驗分?jǐn)?shù)的相關(guān)系數(shù),這就是復(fù)本信度。因為這反應(yīng)了兩個測驗的等值程度,因此又稱等值性系數(shù)。計算方法與再測法是一樣的。復(fù)本信度的模式是:復(fù)本A最短時距復(fù)本B例3:假設(shè)用A、B兩型創(chuàng)造力復(fù)本測驗對初中一年級10個學(xué)生施測。結(jié)果見表52。(此題可以讓學(xué)生自己計算)表52某創(chuàng)造力復(fù)本測驗測試結(jié)果測驗被試12345678910X120191918171614131210X22020181615171211139解:先用計算器計算得出以下值:VX15.8,X15.1,S3.22,S=3.22,乙XX=2494121212

7、代入公式56,得2494-15.8,15.1r100.943.22,3.59復(fù)本信度應(yīng)用時應(yīng)注意以下幾點:(1)復(fù)本信度的關(guān)鍵在于兩個量表必須等值,即必須具有相同的難度、區(qū)分度、長度、題型等。只有達到這一要求,根據(jù)兩次測驗分?jǐn)?shù)求出的復(fù)本信度才有意義。施測過程中的條件當(dāng)然應(yīng)該一致。(2)兩次測驗的時距應(yīng)盡可能短促,以便避免知識的積累、練習(xí)效應(yīng)等因素的影響。最短的時距時在一次測驗中先后用兩個量表施測被試。(3)由于量表的兩個復(fù)份在許多方面近似,所以信度系數(shù)有稍稍偏高的傾向。(4)被試易出現(xiàn)疲勞、失去積極性等反應(yīng),還會出現(xiàn)遷移(由于第二個測驗只改變了題目的具體內(nèi)容,已經(jīng)掌握的解題原則很容易遷移到同類

8、問題)。這些稱為順序效應(yīng),為了抵消順序效應(yīng),可隨機分配一半被試先做復(fù)本A再做復(fù)本B,另一半被試先做復(fù)本B再做復(fù)本A,以平衡順序效應(yīng)。(5)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。(6)對于許多測驗來說,建立復(fù)本是相當(dāng)困難的。一般來說,成就測驗、特殊能力測驗容易建立復(fù)本,因為較容易出題,但對于一些不易測量的特質(zhì),如人格、動機等,則不易找到等值的測題,復(fù)本的編制較困難。同再測信度一樣,在報告復(fù)本信度時,也應(yīng)說明兩次測驗的時間間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。三、等值穩(wěn)定性系數(shù)等值穩(wěn)定性系數(shù)是用兩個平行的(等值的)測驗,間隔適當(dāng)時距施測于同一組被試得到兩組測驗分?jǐn)?shù),求這兩組測驗分?jǐn)?shù)的相關(guān),其

9、相關(guān)系數(shù)就是等值穩(wěn)定性系數(shù)。等值穩(wěn)定性系數(shù)的模式是:測驗A適當(dāng)時距測驗B計算方法同穩(wěn)定性系數(shù)和等值性等值穩(wěn)定性系數(shù)也是采用復(fù)本對被試施測,但等值性系數(shù)的測驗要求兩次測驗的時間間隔盡可能短,而計算等值穩(wěn)定性系數(shù)的兩次測驗卻要求有一個適當(dāng)?shù)臅r距。時距的規(guī)定可參照穩(wěn)定性系數(shù)。優(yōu)點:(1)因兩次測試有適當(dāng)?shù)臅r間間隔,減少了復(fù)本法中的練習(xí)、疲勞效應(yīng)。(2)只要時間間隔適當(dāng),可用于計算穩(wěn)定性不高的心理特質(zhì)的測驗的信度。如,對學(xué)生所學(xué)知識的測驗,穩(wěn)定性較差,遺忘或通過學(xué)習(xí)知識的增長。此時,可以盡量縮短時間間隔,減少這些不穩(wěn)定的效應(yīng)。等值穩(wěn)定性信度系數(shù)的值一般要比等值性系數(shù)和穩(wěn)定性系數(shù)要低。因為,時間因素會引

10、起我們所要測量的心理特質(zhì)的變化以及測題的取樣不同會影響兩次測驗分?jǐn)?shù)的一致性。因此,等值穩(wěn)定性系數(shù)是測驗信度的最嚴(yán)格的考察,得到的是信度系數(shù)的下限。四、內(nèi)部一致性系數(shù)前面所講的估計信度的方法,都必須對被試測驗兩次,然后計算兩次測驗得分的相關(guān)系數(shù)。但是,有的測驗沒有復(fù)份,如人格測驗,等值的測題很難編,編制復(fù)本很難。有的測驗在施行一次以后,由于被試流動或不易召集,再測一次比較困難。因此,我們還要設(shè)法利用一次測驗所獲得的資料來計算信度系數(shù)。這樣計算出來的信度系數(shù)反應(yīng)的是測驗內(nèi)部的一致性,即測驗項目的同質(zhì)性,也就是測驗內(nèi)部所以題目間的一致性,叫做內(nèi)部一致性系數(shù)或同質(zhì)性系數(shù)或同質(zhì)性信度。計算內(nèi)部一致性系數(shù)

11、的方法有兩種,下面逐一介紹。(一)分半法(分半信度)分半信度(Split-halfreliability):分半信度就是將測驗題目分成等值的兩半,分半求出量表題目的總分,再計算兩部分總分的相關(guān)系數(shù)。分半法實際上是一種特殊的復(fù)本法。可以把對等的兩半測驗看成是在最短的時間內(nèi)施測的兩個平行的測驗。分半的方法很多,常見的方法是把一個量表按題目番號分為兩半,一半是奇數(shù)題,另一半數(shù)偶數(shù)題。求出每個人的奇數(shù)題的總得分和偶數(shù)題的總得分,然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù),最后對相關(guān)系數(shù)進行校正。為什么要進行校正呢?因為,分半以后,我們實際上計算的是測驗的一般題目的信度,而非整個測驗的信度,也就是說我

12、們把一個完整的測驗分成了兩個等值的復(fù)本,所計算的只是其中一個復(fù)本的信度,這就會造成對整個測驗的信度的低估,因為信度會隨著測驗長度的增加而提高。所以,要對求出的相關(guān)系數(shù)進行校正。校正公式有:(1)斯皮爾曼一布朗(Spearman-Brown)公式r=h(公式57)xx1rhh式中,r是兩半測驗分?jǐn)?shù)的相關(guān)系數(shù),r為整個測驗的信度估計值。hhxx采用斯皮爾曼一布朗(Spearman-Brown)公式進行校正時,假定兩半測驗等值,亦即兩半測驗具有相同的平均數(shù)和標(biāo)準(zhǔn)差。當(dāng)假定不能滿足時,可以采用下面兩個公式來估計信度。弗朗那根公式:S2S2abS2x公式58)式中,S2、S2b分別為兩半測驗分?jǐn)?shù)的變異數(shù)

13、,S2為測驗總分的變異數(shù)。abxr為信度值。S2盧倫公式:r=1-d(公式59)S2x式中,S2d為兩半測驗分?jǐn)?shù)之差的變異數(shù),S2為測驗總分的變異數(shù)。r為信dx度值。例4:有一個由100題構(gòu)成的量表施測于10個高三學(xué)生。測驗一次后,應(yīng)試者即畢業(yè)離?!,F(xiàn)在怎樣評介測驗結(jié)果的信度?解:因不能再次測驗,只能求分半信度。步驟:(1)計算出每個應(yīng)試者的奇數(shù)題總分(X)和偶數(shù)題總分(X),見表53。得分被試12345678910X138373841403638394035X237373639393438393936解:用計算器求得(也可以用計算機做):X38.2,X37.4,S=1.78,S=1.62,S

14、=3.26,S=0.98,1212xd斯皮爾曼一布朗(Spearman-Brown)公式(平均數(shù)和標(biāo)準(zhǔn)差差異顯著性檢驗略)工XX1431112rhh143口1一丸0 x37.4二0.84(r可以通過計算機計算得到)1.78,1.62hhr蘭空0.91xx10.84(2)弗朗那根公式:r21-S2S2)ab_S2丿x3.262丿0.91S2(3)盧倫公式:r1-dS2x0.9823.2620.91采用分半信度應(yīng)注意以下幾個問題:(1)若用分半法時,以按奇數(shù)題和偶數(shù)題分半為宜。若把整個測驗分成前后兩半,一方面前半部分題目和后半部分題目未必等值,另一方面可能會因疲勞、厭倦等原因而影響回答質(zhì)量,以致前

15、后反應(yīng)不一致而影響信度。在使用斯皮爾曼布朗公式時要求全體被試在兩半測驗上的得分的變異數(shù)相等。當(dāng)一個測驗不宜分成對等的兩半時分半信度不宜采用。當(dāng)試卷中存在任選題時,不宜采用分半法。速度測驗也不宜采用分半法。因為速度測驗中試題的難度低,被試得分的多少主要是看答題的多少,分半法易使得分相同,從而夸大分半法的信度估計。如遇到有牽連的項目或一組解決同一問題的項目時,這些項目應(yīng)放在同一半,否則會高估信度的值。將一個測驗分成兩半的方法很多(如,按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),因此,一個測驗可以有多個分半信度值。提供分半信度值時,要說明分半的方法。(二)其它計算內(nèi)部一致性系數(shù)的方法

16、分半法實際上是對測驗內(nèi)部一致性的一個粗略估計。但對于同一個測驗分半的方法是很多的,而且用不同的分半方法求出的分半信度都不一樣,因此分半信度不是最好的內(nèi)部一致性的估計。為了彌補分半法的不足,可以采用其它的方法。1庫德一理查遜公式(KR公式)20庫德(Kuder)、理查遜(Richardson)針對分半法的不足,提出以項目統(tǒng)計量為轉(zhuǎn)移,利用項目統(tǒng)計量來計算信度。稱為K-R公式。201乙pqi,S2x丿r=KR20K,K1公式510)丿式中k表示構(gòu)成測驗的題目數(shù),p為通過第i題的人數(shù)比例,q為未通過第iii題的人數(shù)比例,S2為測驗總分的變異數(shù)。X如果對測驗的結(jié)果已經(jīng)做了項目分析,已經(jīng)知道了各個項目的

17、難度,那么采用上述公式計算信度較為方便。例5:有一種包含6個問題的測驗,10個應(yīng)試者的得分如表54(答對得1分,答錯得0分),試估計應(yīng)試者反應(yīng)的一致性程度。被試題目得分123456工X110000012100100230000112411100035010011361110003711110048111100491101115101111116工X875544P0.80.70.50.50.40.4q0.20.30.50.50.60.6pq0.160.210.250.250.240.24工pq=1.35解:用計算器算出下列統(tǒng)計量(也可以用計算機算)K=6,工pq=1.35,S2=2.01,X二3

18、.3將這些統(tǒng)計量代入公式,得KR206,1.352.01二0.39庫德一理查遜另一公式(KR公式)當(dāng)測驗項目難度接近時可以采用庫德一理查遜提出的簡便公式,稱為KR21公式。這一公式以各個應(yīng)試者總分的平均數(shù)和方差為基礎(chǔ)進行計算,無需提供各題的難度信息,計算起來較為方便。但必須保證各項目的難度接近,如果難度相差較大,就可能有低估的傾向。KR公式為:21KS2xKR21(K-ik2公式511)式中k表示構(gòu)成測驗的題目數(shù),X為測驗總分的平均數(shù),S2為測驗總分的X變異數(shù)。.、如上例用KRi公式計算為:6x2.01-3.3(6-3.3)r-0.31KR216-1丿x2.01rr,因為各個項目難度不是接近,

19、所以用KR公式估計難度出現(xiàn)KR21KR2021低估傾向??藗惏秃眨–ronbach)的。系數(shù)庫德理查遜公式只適用于兩級記分的測驗,而對多級記分的測驗,則可以采用克倫巴赫(Cronbach)的a系數(shù),克倫巴赫的a系數(shù)對兩級記分的測驗也是適用的。其計算公式為:K(工S2)=1L(公式511)K-1S2x丿式中,K為測驗的題目數(shù),S2i為某一測驗題目分?jǐn)?shù)的變異數(shù),S2為測驗ix總分的變異數(shù)。例6:有一種包含6個論文式題目的測驗,對5個應(yīng)試者施行,得分見下表55,試求該測驗的信度。題號被試S2iABCDE1711811113.042697891.3636106892.5648116836.965711

20、811113.046711811113.04工4062415452工S2=18.65i解:(1)求每題各應(yīng)試者得分的方差S2.、方差和工S2.=18.65ii(2)求測驗總分各應(yīng)試者得分的方差(即求40、62、41、54、52的方差)S2T=68.96(3)代入公式求信度系數(shù)二1.2x0.72二0.875L18.65)1(68.96丿五、評分者信度(ScorerReliability)客觀性測驗不存在評分者之間不一致的情況,因此無需計算評分者信度,但在涉及主觀性測驗的題目中,評分者的不同會造成測驗分?jǐn)?shù)的差異,從而導(dǎo)致測驗誤差,此時,要計算評分者信度。如,心理測量中的投射測驗、教育測驗中的作文考

21、題、職業(yè)選拔中的面試等。評分者信度:隨機抽取部分試卷,由兩個或多個評分者獨立按評分標(biāo)準(zhǔn)打分,然后求其間的相關(guān),所得的相關(guān)系數(shù)即為評分者信度。評分者信度的計算:1.評分者為兩個人時若是連續(xù)變量的評分,且分布是正態(tài)則計算皮爾遜積差相關(guān)系數(shù)(可用計算機直接計算),若是等級評定或雖是等距或等比的數(shù)據(jù)但分布非正態(tài),則計算斯皮爾曼等級相關(guān)。斯皮爾曼等級相關(guān)公式:6D2r=1,)(公式512)RNN21丿式中D為各對偶等級之差,D2是各D平方之和,N為等級數(shù)目。當(dāng)有相同的等級出現(xiàn)時,計算斯皮爾曼等級相關(guān)的公式為:rRCiX2+y2,D22x2y2,N3-N_c,Cnn2-112xx12N3-N,C,Cnn2

22、-1912yy公式513)式中,N為成對數(shù)據(jù)數(shù)目,例7:甲乙兩位教師評閱n為相等等級數(shù)目。10份試卷,他們對每一試卷各自所評的分?jǐn)?shù)列入表56,問這兩位教師評分的一致性如何?試卷得分名次等級之差DD2甲評分乙評分甲評分乙評分A94931100B909222.5-0.50.25C86923.52.511D86703.57-3.512.25E72825411F707665.50.50.25G686579-24H667685.52.56.25I64689811J6160101000解:C,x口,0.5,12x2,10-10-0.5,82122乞1丿,1,1212y2,忖-1,81.5D2,2682+81.5-26r,Rc,0.842x82x81.5評分信度系數(shù)為0.84,甲乙兩位老師的評分一致性尚可。如果是兩個評分者,一般認(rèn)為經(jīng)過訓(xùn)練的成對評分者之間的一致性達0.90以上,評分才是客觀的。2.評分者為多個時采用肯德爾和諧系數(shù)(Kendallcoefficientofconcordance)來估計信度系數(shù)RiR2-W,一(公式514)12TOC o 1-5 h z式中,W為和諧系數(shù),K為評分者人數(shù),N為被評對象數(shù),R為每一對象被評的等級之和。i出現(xiàn)相同等級時采用下面的公式:R)乙R2-W,IN,T,巴二(公式515)K2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論