心理測量學真分數(shù)與信度和效度PPT課件_第1頁
心理測量學真分數(shù)與信度和效度PPT課件_第2頁
心理測量學真分數(shù)與信度和效度PPT課件_第3頁
心理測量學真分數(shù)與信度和效度PPT課件_第4頁
心理測量學真分數(shù)與信度和效度PPT課件_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1 真分數(shù)與信度/效度 上傳 劉景波(snr5aliu) 目的 僅用于學習交流 2 心理測量的誤差種類 誤差定義,誤差是由測量中與目的無關(guān)的因 素引起的不準確或不一致的效應(yīng)。 心理學研究中的誤差按其性質(zhì)可分為三類, 隨機誤差系統(tǒng)誤差過失誤差 (恒定誤差) 3 心理學研究中的三類誤差 n 隨機誤差隨機誤差 又稱偶然誤差。由實驗中一些偶然因素引起又不可控制的誤差。隨機又稱偶然誤差。由實驗中一些偶然因素引起又不可控制的誤差。隨機 誤差產(chǎn)生的原因十分復雜誤差產(chǎn)生的原因十分復雜,但其存在是絕對的。但其存在是絕對的。 隨著實驗觀測次數(shù)的增加隨著實驗觀測次數(shù)的增加,隨機誤差的變化會呈現(xiàn)一定的規(guī)律性隨機誤差的

2、變化會呈現(xiàn)一定的規(guī)律性 它總是圍繞被觀測的真正值它總是圍繞被觀測的真正值(又稱真分數(shù)又稱真分數(shù),一般用多次觀測的平均值來表一般用多次觀測的平均值來表 示,真正值是無法測量到的示,真正值是無法測量到的)波動波動,隨機誤差的算術(shù)平均數(shù)隨著觀測次數(shù)隨機誤差的算術(shù)平均數(shù)隨著觀測次數(shù) 的增加而逐漸減少以至于趨近于零。的增加而逐漸減少以至于趨近于零。 n 系統(tǒng)誤差系統(tǒng)誤差 就是觀測過程中服從確定規(guī)律性的誤差。由于實驗條件不同就是觀測過程中服從確定規(guī)律性的誤差。由于實驗條件不同,造成不造成不 同的有一定規(guī)律性的誤差屬于這類誤差。心理學實驗中同的有一定規(guī)律性的誤差屬于這類誤差。心理學實驗中,不同的實驗方法、不

3、同的實驗方法、 不同的被試樣本等都會對實驗結(jié)果產(chǎn)生規(guī)律性的影響。這類誤差不能通不同的被試樣本等都會對實驗結(jié)果產(chǎn)生規(guī)律性的影響。這類誤差不能通 過增加實驗次數(shù)消除。如果需要可以通過實驗設(shè)計加以消除過增加實驗次數(shù)消除。如果需要可以通過實驗設(shè)計加以消除,這一問題我這一問題我 們將在后邊的變量處理和實驗設(shè)計中討論。們將在后邊的變量處理和實驗設(shè)計中討論。 n 過失誤差過失誤差 一般把明顯歪曲實驗結(jié)果的誤差成為過失誤差一般把明顯歪曲實驗結(jié)果的誤差成為過失誤差,它是由于實驗觀測過它是由于實驗觀測過 程中的過失造成的。這些錯誤有測錯、傳錯、記錯、儀器失靈、取樣錯程中的過失造成的。這些錯誤有測錯、傳錯、記錯、儀

4、器失靈、取樣錯 誤。在實驗數(shù)據(jù)整理過程中必須鑒別、舍棄這些含有過失誤差的數(shù)據(jù)誤。在實驗數(shù)據(jù)整理過程中必須鑒別、舍棄這些含有過失誤差的數(shù)據(jù)(又又 稱異常點稱異常點),否則會嚴重影響實驗結(jié)果的準確性否則會嚴重影響實驗結(jié)果的準確性,得出不正確的結(jié)論。得出不正確的結(jié)論。 4 心理測量誤差的三方面來源 在心理測量中,常見的誤差來源于三個方 面: 測驗內(nèi)部,施測過程,受測者本身。 5 1測驗內(nèi)部引起的誤差 測驗內(nèi)部的誤差主要來源于題目取樣: 、當測驗題目較少或取樣缺乏代表性時,被試 的反應(yīng)受機遇影響較大(譬如一次考試碰巧準備到 或沒有準備到某題);當幾個測驗復本不等值時, 接受不同的題目,就會獲得不同的分

5、數(shù)。 、除題目取樣不當可引起誤差外,其他一些因 素,如題目用詞的模棱兩可,對反應(yīng)步驟說得不清 楚;題目過難引起猜測;時限短使被試倉促做答等, 也可能成為誤差的來源。 6 2由施測過程引起的誤差 在三種誤差來源中,與施測過程有關(guān)的誤差可能是最容易控制和檢驗的。測驗的標準 化水平越來越高,大部分施測條件能夠得到控制。但由于心理現(xiàn)象的復雜性,許多意想不 到的偶然因素仍可能影響測驗分數(shù),使人防不勝防。 、物理環(huán)境 施測現(xiàn)場的溫度、光線、聲音、桌面好壞、空間闊窄等皆具有影響。 、主試者方面 主試者的年齡、性別、外表,施測時的言談舉止、表情動作等均能影響測驗結(jié)果。倘 若不存在按照規(guī)定實施測驗,如制造緊張氣

6、氛,給予特別協(xié)助貨暗示,以及計時錯誤等, 都會帶來較大誤差。特別是當測驗具有復雜步驟和說明,或測驗題目本身是模糊不確定的 形式時;當主試者在安排測驗條件上有較多余地(例如個別實施)測時;當測驗是對幼兒、 有情緒困擾者以及對測驗程序不熟悉的人施測時,主試者的影響更大。 、意外干擾 在測驗環(huán)境復雜,特別是當受試人數(shù)較多時,容易發(fā)生出乎意料的干擾或分心事件。 例如:停電、有人生病、有人作弊、計時表停了、臨時發(fā)現(xiàn)題目或作答紙張印刷不清或裝 訂錯誤等,無論哪種情況都會引起不安和擾亂,導致成績不準確、不一致。 、評分計分 評分不客觀以及計算登記分數(shù)出錯也是常見的誤差。一般選擇題的評分教為客觀。而 問答題、

7、論文題等自由反應(yīng)型的題目,評分標準很難掌握,加之閱卷者的偏好個不相同, 因而難以保證分數(shù)的一致性。不僅各教師間有此差異,即使是同一教師一次評許多卷,受 情緒疲勞、外界干擾、卷面整潔、考試前后位置引起的對比效應(yīng)以及對學生成見的影響, 標準也可能不統(tǒng)一,甚至同一張試卷隔一段事件再評,前后給分也可能不一致。至于學校 間、地區(qū)間的差別就更大了。 為了控制與施測過程有關(guān)的誤差,主試者必須嚴格遵循標準化程序施測和評分,不得 任意改動和發(fā)揮,同時要機智地處理各種意外情況。 7 真分數(shù)理論 真分數(shù)是一個在理論上構(gòu)想出來的概念真分數(shù)是一個在理論上構(gòu)想出來的概念 真分數(shù)真分數(shù):一個測量工具在沒有測量誤差時,所得到

8、的真正值。:一個測量工具在沒有測量誤差時,所得到的真正值。 真分數(shù)的操作定義真分數(shù)的操作定義:經(jīng)過無數(shù)次測量所得的平均值。:經(jīng)過無數(shù)次測量所得的平均值。 真分數(shù)的定義表明,一個人在一個測驗上所得的分數(shù),是他真分數(shù)的定義表明,一個人在一個測驗上所得的分數(shù),是他 的真分數(shù)的函數(shù),也是測量誤差的函數(shù),用公式表示如下:的真分數(shù)的函數(shù),也是測量誤差的函數(shù),用公式表示如下: X=T+E 這里這里X為實得分數(shù)或觀測分數(shù),為實得分數(shù)或觀測分數(shù),T是假設(shè)的真分數(shù),是假設(shè)的真分數(shù),E 是測量誤差。是測量誤差。 8 X=T+E 這里X為實得分數(shù)或觀測分數(shù), T是假設(shè)的真分數(shù),E是測量誤差。 E僅指隨機誤差,不包括系

9、統(tǒng)誤差(I),后 者不引起分數(shù)的改變,因而包含在真值中。 即,T=V+I V I E X 圖 4-8 實得分數(shù)、真分數(shù)和誤差的關(guān)系 T 9 誤差與真分數(shù)、和實得分數(shù)的關(guān)系 在公式在公式3-1中,中,E可能是正的,也可能是負的。這就是說,一個人的實得可能是正的,也可能是負的。這就是說,一個人的實得 分數(shù)可能大于真實量,也可能小于真實量,總是圍繞著真值上下波動。分數(shù)可能大于真實量,也可能小于真實量,總是圍繞著真值上下波動。 關(guān)于測量誤差(關(guān)于測量誤差(E)有以下假設(shè):)有以下假設(shè): (1)如果對一個人測量無數(shù)次,其平均誤差為)如果對一個人測量無數(shù)次,其平均誤差為0, 即即E0 (2)真分數(shù)和測量誤

10、差是相互獨立的,)真分數(shù)和測量誤差是相互獨立的, 即即 rTE0 (3)誤差分數(shù)和實得分數(shù)的相關(guān)為)誤差分數(shù)和實得分數(shù)的相關(guān)為0, 即即 rXE0 10 真分數(shù)理論 與 信度 效度 11 實得分數(shù)(X)中的變異 (SX2)實得分數(shù)變異實得分數(shù)變異 (ST2)真分數(shù)的變異真分數(shù)的變異 (SV2)有效變異數(shù)有效變異數(shù) (SE2)隨機誤差變異隨機誤差變異 (SI2)系統(tǒng)誤差變異系統(tǒng)誤差變異 (ST2SX2)測驗的信度測驗的信度 (SV2SX2)測驗的效度測驗的效度 12 效度和效度的定義 信度信度在心理測量理論中被定義為在心理測量理論中被定義為: 在一列測量數(shù)據(jù)中,在一列測量數(shù)據(jù)中,真分數(shù)真分數(shù)變異

11、變異( 2 T )在在總變異總變異( 2 X )中中 占占的的比例比例。真分數(shù)變異在總變異中占的比例越大,說明隨機誤真分數(shù)變異在總變異中占的比例越大,說明隨機誤 差對差對測量結(jié)果的測量結(jié)果的影響越小,則測量工具的信度越高影響越小,則測量工具的信度越高。 2 2 X T XX r 效度在心理測量理論中被定義為效度在心理測量理論中被定義為: 在一列測量數(shù)據(jù)中,與測量目的有在一列測量數(shù)據(jù)中,與測量目的有關(guān)的真實變異關(guān)的真實變異( 2 V )與與 總變異的比率。總變異的比率。 2 2 X V XY r 一個測驗的效度表明,在一組測驗分數(shù)中,有多一個測驗的效度表明,在一組測驗分數(shù)中,有多大大比例的變比例

12、的變 異是異是由由測驗所要測量的因素引起的。測驗所要測量的因素引起的。 13 信度和效度的關(guān)系 信度信度(S(ST T2 2S SX X2 2) 當隨機誤差的變異當隨機誤差的變異(SE2)減減 少時,真分數(shù)的變異少時,真分數(shù)的變異(ST2)增加,測增加,測 驗的信度隨之提高。驗的信度隨之提高。 效度效度( (SV2 S SX X2 2) n信度的提高只給有效變異信度的提高只給有效變異 數(shù)數(shù)(SV2)的增加提供可能。的增加提供可能。 n至于是否能提高效度,還至于是否能提高效度,還 要看系統(tǒng)誤差要看系統(tǒng)誤差(SI2)的大小。的大小。 n可見,信度高不一定效度可見,信度高不一定效度 高。但一個測驗要

13、想效度高,高。但一個測驗要想效度高, 真分數(shù)的變異必須占較大的真分數(shù)的變異必須占較大的 比重,即測驗的信度必須高。比重,即測驗的信度必須高。 14 信度效度關(guān)系的數(shù)學表達 xxxy rr rXY表示實得效度系數(shù)表示實得效度系數(shù)(程序程序X 得分與外部效標得分與外部效標Y分數(shù)之間的相分數(shù)之間的相 關(guān)關(guān)),rXX表示測量程序的信度。表示測量程序的信度。 式中顯示:信度是效度的極限值式中顯示:信度是效度的極限值 或或上限上限。換言之,由于測量的不。換言之,由于測量的不 可信而降低了效度??尚哦档土诵Ф?。 yy xy xt r r r 但是,在一些效標或預測因子中存在 某種程度的不可信是不可避免的。

14、 當效標的信度已知,可以用左面的 公式在統(tǒng)計上對這種不可信進行校 正: 15 3信度指數(shù)和信度系數(shù)信度指數(shù)和信度系數(shù) 信度信度指數(shù)指數(shù)(reliability index) :) :在心理測量理論中,在心理測量理論中,某某一一測測 驗的驗的真真分數(shù)與實得分數(shù)間的相關(guān)系數(shù)為測驗的信度指數(shù)。分數(shù)與實得分數(shù)間的相關(guān)系數(shù)為測驗的信度指數(shù)。變異變異 數(shù)與總變數(shù)與總變異數(shù)(實得變異)的比率。即異數(shù)(實得變異)的比率。即: TX XT N xt r 根據(jù)真分數(shù)和誤差的性質(zhì),可推導出根據(jù)真分數(shù)和誤差的性質(zhì),可推導出 X T XT r 式中:式中: XT r 代表信度代表信度指數(shù)指數(shù); T 真分數(shù)的標準差;真分

15、數(shù)的標準差; X 實得分數(shù)實得分數(shù)(觀測分數(shù)觀測分數(shù))的標準差。的標準差。 16 信度系數(shù)信度系數(shù)(reliability coefficient) :可定義為平行測驗分數(shù)) :可定義為平行測驗分數(shù) 之間的相關(guān)系數(shù)。 如果用之間的相關(guān)系數(shù)。 如果用 1 x和和 2 x分別表示一組受測者在兩套平行分別表示一組受測者在兩套平行 測驗中所得的離差分數(shù),則:測驗中所得的離差分數(shù),則: 21 21 21 XX XX N xx r 根據(jù)真分數(shù)和誤差的性質(zhì),可推導出根據(jù)真分數(shù)和誤差的性質(zhì),可推導出 2 2 21 X T XX r 則則 2 21 XTXX rr 2 T 代表真分數(shù)的變異;代表真分數(shù)的變異;

16、2 X 代表實得分數(shù)的變異, 即代表實得分數(shù)的變異, 即 總變異。總變異。 由此,由此,我們可以看出,信度系數(shù)可以用數(shù)學語言定義為:真我們可以看出,信度系數(shù)可以用數(shù)學語言定義為:真 分數(shù)方差與觀測分數(shù)方差的比率分數(shù)方差與觀測分數(shù)方差的比率,或者是信度指數(shù)的平方?;蛘呤切哦戎笖?shù)的平方。 17 4 4信度信度信息的解釋信息的解釋 要解釋信度信息,須作以下區(qū)別:要解釋信度信息,須作以下區(qū)別: (1) 21X X r 觀測分數(shù)變異中可歸因于受測者真分數(shù)觀測分數(shù)變異中可歸因于受測者真分數(shù) 中變動的比例部分中變動的比例部分 (2)( 21X X r )2一份平行測驗上所得的觀測分數(shù)變異一份平行測驗上所得的

17、觀測分數(shù)變異 中能用另一份平行測驗的觀測分數(shù)的變異預測的比中能用另一份平行測驗的觀測分數(shù)的變異預測的比例部分例部分 (3) XT r 真分數(shù)和觀測分數(shù)的相關(guān)真分數(shù)和觀測分數(shù)的相關(guān) 18 假設(shè)一份測驗手冊報告信度系數(shù)假設(shè)一份測驗手冊報告信度系數(shù)2 1X X r = =0 0.81.81,那么那么 我們我們可以作如下可以作如下解釋解釋: 第一,觀測分數(shù)方差的第一,觀測分數(shù)方差的 8l歸因于該受測者組的真分數(shù)歸因于該受測者組的真分數(shù) 的方差的方差(即,(即, 2 T =0.81 2 X ) ;) ;如果觀測分數(shù)的標準差為如果觀測分數(shù)的標準差為 4, 我們可以預測,不可觀測的真分數(shù)分布的標準差應(yīng)該為我

18、們可以預測,不可觀測的真分數(shù)分布的標準差應(yīng)該為 T =1681. 0 =3.6。 第二,我們可以說,第二次測驗觀測分數(shù)的方差的第二,我們可以說,第二次測驗觀測分數(shù)的方差的 65 的部分能夠用第一次測驗的觀測分數(shù)方差預測的部分能夠用第一次測驗的觀測分數(shù)方差預測(即,(即, 0.812) 。 第三,第三,我們可以認為,對這些受測者來說這些觀測分數(shù)我們可以認為,對這些受測者來說這些觀測分數(shù) 和真分數(shù)之間的相關(guān)為和真分數(shù)之間的相關(guān)為 81. 0 或或 0.90。 2 2 X T XX r 式中:式中:XX r 代表信度代表信度指數(shù)指數(shù); 2 T 代表真分數(shù)的變異;代表真分數(shù)的變異; 2 X 代表實得分數(shù)的變異,即總變異。代表實得分數(shù)的變異,即總變異。 19 需要注意的是,真分數(shù)是不能直接測量的,因此,需要注意的是,真分數(shù)是不能直接測量的,因此,心理心理 測驗的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論