心理學中的各種信度和效度.doc_第1頁
心理學中的各種信度和效度.doc_第2頁
心理學中的各種信度和效度.doc_第3頁
心理學中的各種信度和效度.doc_第4頁
心理學中的各種信度和效度.doc_第5頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

心理學中的各種信度和效度一、信度所謂信度,指的是測量結果的穩(wěn)定性程度,其操作定義是,信度乃是一個測驗X與它的任意一個“平行測驗X的相關系數(shù)。無關因素、測驗的長度、測驗試題的區(qū)分度、被試團體的代表性都會影響信度。(一)重測信度1、定義:利用同一量表,讓同一被試群體在不同時間兩次施測之后的相關值。這一信度值表示的是測驗結果的穩(wěn)定性,故也稱之為穩(wěn)定性系數(shù)。2、形式:施測經(jīng)過適當時間再施測3、舉例:假設有一份主觀幸福感調查表,先后兩次施測于10名學生,時間間隔為半年,結果如下表所示,求該測驗的重測信度。4、使用的前提條件(1)所測量的心理特質必須是穩(wěn)定的。(2)遺忘和練習的效果基本上互相抵消。(3)在兩次施測的間隔期內,被試在所要測查的心理特質方面沒有更多的學習和訓練。5、注意事項(1)有些測驗不宜采用重測法估計信度,如測量推理和創(chuàng)造力的測驗。那些不易受重復使用影響的測驗才能用再測法估計信度。如感覺運動測驗、人格測驗。(2)兩次測驗間隔的時間要適當,并注意提高被試的積極性(3)測驗手冊中報告重測信度時應說明兩次施測的間隔,以及在此期間內被試的有關經(jīng)歷(4)時間間隔的把握:適宜時間間隔依照測驗目的、性質及被試特點而定,可以是幾分鐘甚至幾年。例如對于年幼兒童的間隔要??;年長群體的間隔可大。但智力測驗的間隔不能太短,成就測驗的間隔不能太長。 一般間隔時間不超過六個月,既不能讓被試記住上一次測驗的內容,又不能讓其特質發(fā)生變化,或對所學知識產生遺忘。6、重測信度的評價:(1)優(yōu)點:能夠提供有關測驗結果是否隨時間而變異的資料,可作為預測受測者將來行為表現(xiàn)的依據(jù)。(2)缺點:易受練習和記憶的影響,前后兩次施測間隔的長短必須要適度。(二)復本信度1、什么是復本:任何測驗只是所有可能題目中的一份取樣,所以可編制許多平行的等值測驗,叫做復本。復本等值要符合下列條件:(1)各份測驗測量的是同一種心理特性。(2)各份測驗具有相同的內容和形式。(3)各份測驗的題目不應重復。(4)各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。(5)各份測驗的分數(shù)分布(平均數(shù)和標準差)大致相等。(6)復本編好后,應再測一次,以確保各份測驗的等值。2、復本信度定義:兩個復本施測同一被試群體,求其相關。(1)等值性系數(shù):同時連續(xù)施測,反映內容變異。形式:復本A同時復本B(2)穩(wěn)定與等值性系數(shù)是對信度最嚴格的檢驗,反映的是“內容變異時間變異”的共同作用效果。形式為:復本A適當時間復本B 3、使用前提條件:構造出兩份或兩份以上真正平行的測驗,被試要有條件接受兩個測驗。4、復本信度的評價(1)優(yōu)點:可以在一定程度上避免重測法的缺點(2)缺點只能減少而不能排除練習和記憶的影響。第二個測驗只改變了測驗的具體內容,已經(jīng)掌握的解題原則容易遷移到同類問題。對于許多測驗來說,建立復本十分困難。(三)分半信度1、定義:在測驗沒有復本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù)被試在這兩半測驗中所得的分數(shù)計算相關系數(shù),即得分半信度。計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。有時為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數(shù)和偶數(shù)序號將項目分半。要注意使那些性質相同、聯(lián)系緊密的項目分在相同的一半,否則會使信度值偏高。2、校正:分半信度只是半個測驗的信度,須用斯皮爾曼-布朗公式校正: rxx=2rhh/(1+rhh) 且兩半測驗分數(shù)的變異數(shù)相等時才能使用。(四)同質性信度(內部一致性信度)1、定義:同質性指測驗的所有題目測量的是同一種心理特質,表現(xiàn)為各個題目得分之間有較高的相關,相關越高則同質性越強。 同質性信度也叫內部一致性系數(shù),是指測驗內部所有題目間的一致性程度,一個測驗所測內容或特質的相同程度。2、注意事項:同質測驗分數(shù)的意義比較明確,但是,單獨的同質性測驗不能預測一個異質的行為或心理特性。現(xiàn)行的許多心理測驗都是異質的,不過它們多半是由若干個相對同質的分測驗或分量表所組成,每個分測驗或分量表只測量一個方面的特征。這樣,當把分數(shù)組合起來后便可以做出明確的解釋。3、使用范圍:學績測驗可不考慮同質性。同質性信度與結構效度密切相關。4、計算方式:一般采用數(shù)據(jù)統(tǒng)計軟件,克隆巴赫系數(shù)最為常用。(五)評分者信度1、定義評分者信度是指不同評分者之間在測驗結果計分上的一致性。在心理測驗中,評分者信度的計算,通常是隨機抽取若干份試卷,由至少兩位受過訓練的評分者按計分規(guī)則分別判分,然后計算它們的相關。幾個評分者的評分越一致,評分者信度越高。2、計算方法:最簡單的估計方法就是隨機抽取若干份答卷,由兩個獨立的評分者打分,再求每份答卷兩個評判分數(shù)的相關系數(shù)。這種相關系數(shù)的計算可以用積差相關方法,也可以采用斯皮爾曼等級相關方法。如果評分者在二人以上,而且又采用等級記分時,就需要用肯德爾和諧系數(shù)來求評分者信度。(六)對信度系數(shù)計算的評價1、在一般情況下,間隔施測的復本信度最低,因為很多因素有機會影響到分數(shù)。2、校正過的分半相關,因為影響的因素少,所得的信度估計為最高。3、穩(wěn)定與等值性系數(shù)是對信度最嚴格的檢驗,反映的是“內容變異時間變異”的共同作用效果。(七)信度的影響因素和提高信度的方法1、影響因素:被試、主試者方面、施測情景方面、測量工具方面、兩次施測得間隔時間;2、提高信度的方法(1)適當增加測驗的長度:雖然增加題目可以提高信度,但并非多多益善。增加測驗長度的效果遵循報酬遞減率,測驗過長是得不償失的,有時還會引起被試的疲勞和反感而降低可靠性,還要注意一點的是,只有當新題目是與原題目選自同一總體,即新題目與原題目具有同質性時,增長測驗才能改進信度。(2)使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平。(3)努力提高測驗試題的區(qū)分度(4)選取恰當?shù)谋辉噲F體,提高測驗在各同質性較強的亞團體上的信度。(5)減少無關因素的影響。二、效度所謂效度,指一個測驗或量表實際能測出其所要測的心理特質的程度。(一)內部效度:在研究的自變量和因變量之間存在一定關系的密切程度。成熟、歷史、被試選擇偏差、被試缺失、前測、實驗程序、統(tǒng)計回歸以及多種條件的交互作用都可影響內部效度。(二)外部效度:是指研究結果能夠一般化和普通化到樣本來自的總體和其他變量條件、時間和背景中的程度,即研究結果所代表的普遍性和適用性。被試的代表性、操作定義的準確性、研究的反作用、前測對實驗的影響、被試多重處理、實驗者效應、研究和實際情境的差異大小、被試與實驗的交互作用會影響外部效度。(三)內容效度1、定義:一個測驗實際測得的內容與所要測得的內容之間的吻合程度。主要應用于成就測驗、選拔和分類的職業(yè)測驗,但不適用于能力傾向測驗和人格測量。注意要與表面效度相區(qū)分,是指某個外行人對某個測驗表面上看好像是測某種心理特質的一種現(xiàn)象,假如這個外行人能夠有效的的測得某種心理特質時,該測驗就可以說是有較高的表面效度。一般來講,最高行為測驗往往表面效度高,而其他的測驗則希望表面效度低。2、確定方法:首先要明確預測內容的范圍,其次確定每個題目所測的內容,并與測驗編制者所列的雙向細目表進行比對,最后制定評定量表,考察題目是否能夠反映所要測定內容。此外,還可以測量復本信度,或者采用再測法(前測后測比較)。3、評價(1)優(yōu)點:不但是評價學績測驗的最適合的方法,而且編制任何測驗都要加以考慮的方面;(2)缺點:缺乏理想的數(shù)量指標,因而妨礙了信息交流和各測驗間的相互比較。(四)結構效度1、定義:也叫構思效度、構念效度,旨在以心理學的理論概念來說明并分析測驗分數(shù)的意義,即從心理學的理論觀點,就測驗的結果加以詮釋和探討,亦即根據(jù)心理學理論上的構想來編制測驗的內容或選擇試題。2、確定方法:可以通過測驗內部尋找證據(jù)法、測驗之間尋找證據(jù)法、考察實證效度法以及多種特質多種方法矩陣法。測量之間尋找證據(jù)法需要注意聚合效度和區(qū)別效度,所謂聚合效度,是指當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在;所謂區(qū)別效度(分歧效度),是與聚合效度相反,此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。3、多種特質多種方法矩陣法:如圖表所示(1)主對角線數(shù)值:同樣方法測相同特質所得相關,是信度指標;(2)虛線三角形之間的兩條對角線的數(shù)值:不同方法測相同特質的相關,是效度指標;(3)實線三角形內的數(shù)值:同樣方法測不同特質的數(shù)值;(4)虛線三角形內的數(shù)值:不同方法測不同特質的數(shù)值。(五)實證效度1、定義:也稱效標關聯(lián)效度,是指一個測驗對處于特定情境中的個體的行為進行估計的有效程度,一個測驗是否有效,應該以實踐的效果來作為檢驗的標準。效標是衡量一個測驗是否有效的外在標準,獨立于測驗并且可以從實踐中直接獲得我們感興趣的行為。因此,作為效標來講,應該具有多樣性、復雜性、特殊性和時間性,一般常用的效標有學業(yè)成就、等級評定、臨床診斷、實際工作表現(xiàn)、某個訓練成績等。2、實證效度的確定方法(1)相關法:求測驗分數(shù)與效標測量間的相關,是最常用的方法;(2)區(qū)分法t檢驗:比較高低分組的差異;(3)命中率法:分為總命中率和正命中率法,如下表所示A、總命中率法:B、正命中率法:(六)統(tǒng)計結論效度:是檢驗研究結果的數(shù)據(jù)分析程序與方法的一種有效性指標。若數(shù)據(jù)的質量差、違反統(tǒng)計檢驗的假設、統(tǒng)計檢驗能力低,則統(tǒng)計結論效度就差。(七)提高效度的方法測驗的構成、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論