




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
測量的信度和效度你如何解釋下述現(xiàn)象?
一個很聰明的孩子,測得智商是80分一個學(xué)習(xí)很好的學(xué)生,考試成績?yōu)?0分一個人緣很好的人,人際關(guān)系測量低于常模值誤差的含義在測量中與目的無關(guān)的因素所引起的不準(zhǔn)確或不一致效應(yīng)。不準(zhǔn)確、不一致不準(zhǔn)確、一致準(zhǔn)確、一致測量的誤差系統(tǒng)誤差(systemerror)由與測量無關(guān)的變量引起的一種恒定而有規(guī)律的誤差。測量誤差的種類
隨機(jī)誤差(randomerror)由與測量無關(guān)的變量引起的一種無規(guī)律的誤差,不易控制心理測量誤差的來源測驗本身測驗題目取樣不當(dāng);測驗題目格式不妥;測題的難度過高或過低;測題的指導(dǎo)語用詞不當(dāng);測驗時限過短。測驗實施
物理環(huán)境;主試方面;意外干擾;評分不客觀,計算、登記分?jǐn)?shù)出錯。被試應(yīng)試動機(jī);焦慮;生理因素;學(xué)習(xí)、發(fā)展和教育;測驗經(jīng)驗;反應(yīng)傾向;生理變因。兩種誤差的關(guān)系系統(tǒng)誤差只影響測值的準(zhǔn)確性,與效度有關(guān)隨機(jī)誤差既影響準(zhǔn)確性,又影響一致性。與效度和信度都有關(guān)。測量誤差的關(guān)系經(jīng)典測量理論:真分?jǐn)?shù)理論測驗分?jǐn)?shù)=真分?jǐn)?shù)+誤差(X=T+E)
真分?jǐn)?shù)T:被試不受任何因素影響的條件下應(yīng)該得到的測驗分?jǐn)?shù),不可直接測量;在統(tǒng)計上用無數(shù)次測量的平均值代替。誤差E:引起測量結(jié)果不一致的偶然誤差,可正可負(fù)。例:學(xué)績測驗得分=真實掌握程度或能力+隨機(jī)誤差(猜測、身體狀況、動機(jī)水平、考試焦慮、環(huán)境影響、手表看錯等)信度的概念信度(可靠性):測量的一致性程度
一個好的測量工具必須穩(wěn)定可靠,即多次測量的結(jié)果要保持一致。信度只受隨機(jī)誤差影響,系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響測量工具的信度。信度的操作性定義測量理論中,信度被定義為:一組測量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實得變異數(shù))的比率,即:ST2:真分?jǐn)?shù)的變異數(shù);SX2:測驗分?jǐn)?shù)的變異數(shù)。SX2=ST2+SE2
ST2=SV2+SI2
(與測量目的有關(guān)的變異,與測量目的無關(guān)的變異)
SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2
信度的性質(zhì)信度:一組測驗分?jǐn)?shù)或一列測量的特性,不是個人分?jǐn)?shù)的特性;真分?jǐn)?shù)的變異數(shù)不能直接測量,是理論上構(gòu)想的概念,只能根據(jù)一組實得分?jǐn)?shù)得出估計。估計信度的方法重測信度復(fù)本信度內(nèi)在一致性信度(同質(zhì)性信度)評分者信度重測信度(Test-RetestReliability)定義:同一量表,同一被試群體,在不同時間,兩次施測,求其相關(guān)。實質(zhì):表示測驗結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability)
形式:施測—適當(dāng)時間—再施測時間間隔的把握間隔時間越長,穩(wěn)定性系數(shù)越低。適宜時間間隔依照測驗?zāi)康摹⑿再|(zhì)及被試特點(diǎn)而定。幾分鐘至幾年。年幼兒童,間隔要?。荒觊L群體,間隔可大。智力測驗的間隔不能太短,成就測驗的間隔不能太長。一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內(nèi)容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘)復(fù)本信度(Alternate-formraliability)因為任何測驗只是所有可能題目中的一份取樣(行為樣本),所以可編制許多平行的等值測驗,叫做復(fù)本。復(fù)本等值要符合下列條件:各份測驗測量的是同一種心理特性。各份測驗具有相同的內(nèi)容和形式。各份測驗的題目不應(yīng)重復(fù)。各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。各份測驗的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。A卷:你是一個喜歡熱鬧的人嗎?1=絕對是2=是3=不一定4=不是5=絕對不是B卷:你是一個喜歡安靜的人嗎?1=絕對是2=是3=不一定4=不是5=絕對不是定義:兩個復(fù)本施測同一被試群體,求其相關(guān)。等值性系數(shù):同時連續(xù)施測,反映內(nèi)容變異。形式:復(fù)本A—最短時間—復(fù)本B穩(wěn)定性與等值性系數(shù):時間間隔施測,內(nèi)容變異+重測信度誤差形式:復(fù)本A—適當(dāng)時間—復(fù)本B
分半信度(Split-HalfReliability)定義:在測驗沒有復(fù)本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù)被試在這兩半測驗中所得的分?jǐn)?shù)計算相關(guān)系數(shù),即得分半信度。計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。分半信度(Split-HalfReliability)為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數(shù)和偶數(shù)序號將項目分半。要注意使那些性質(zhì)相同、聯(lián)系緊密的項目分在相同的一半,否則會使信度值偏高。由于分半信度實際上只是半個測驗的信度,測驗越長、項目越多,兩半分?jǐn)?shù)的相關(guān)就越高。因此,對長度不同的測驗,要用校正公式。斯皮爾曼-布朗校正公式
rx1x2表示兩半測驗分?jǐn)?shù)的相關(guān)系數(shù)分半信度的估計如果兩半測驗不等值,亦即兩半測驗分?jǐn)?shù)沒有相同的平均數(shù)和標(biāo)準(zhǔn)差弗朗那根公式:
Sa2
和Sb2
:兩個半測驗分?jǐn)?shù)的變異數(shù);Sx2:測驗總分的變異數(shù)。盧龍公式:
Sd2:兩半測驗分?jǐn)?shù)之差的變異數(shù),
Sx2:測驗總分的變異數(shù)。同質(zhì)性信度(HomogeneityReliability)同質(zhì)性指測驗的所有題目測量的是同一種心理特質(zhì),表現(xiàn)為各個題目得分之間有較高的相關(guān),相關(guān)越高則同質(zhì)性越強(qiáng)。同質(zhì)性信度的估計(1)測量同質(zhì)性信度基本公式
K:構(gòu)成測驗項目數(shù),:相關(guān)系數(shù)平均數(shù),
Rkk:同質(zhì)性信度值。同質(zhì)性信度的估計(2)庫德-理查遜公式(K-R20公式)
K:構(gòu)成測驗的題目數(shù);
pi:通過第i題的人數(shù)比例;
qi:未通過第i題的人數(shù)比例;
Sx2:測驗總分的方差。
同質(zhì)性信度的估計(3)庫德-理查遜公式(K-R21公式)K-R20/21公式僅適用于答對一題得一分、答錯無分的測驗;
同質(zhì)性信度的估計(4)克倫巴赫系數(shù)對于多重記分的測驗,用Alpha系數(shù)估計:
K:測驗的題目數(shù);
Si2:某一題目分?jǐn)?shù)的變異數(shù);
Sx2:測驗總分的變異數(shù)。
評分者信度(ScorerReliability)評分者信度是指不同評分者之間在測驗結(jié)果計分上的一致性。在心理測驗中,評分者信度的計算,通常是隨機(jī)抽取若干份試卷,由至少兩位受過訓(xùn)練的評分者按計分規(guī)則分別判分,然后計算它們的相關(guān)。幾個評分者的評分越一致,評分者信度越高。
評分者信度(ScorerReliability)最簡單的估計方法就是隨機(jī)抽取若干份答卷,由兩個獨(dú)立的評分者打分,再求每份答卷兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級相關(guān)方法。如果評分者在三人以上,而且又采用等級記分時,就需要用肯德爾和諧系數(shù)來求評分者信度。評分者信度:K個評價者對N件被評價的事物評定一致性程度的度量(肯德爾W系數(shù)):Ri:每一件被評價事物的K個等級之和;N:被評價事物的件數(shù)即等級數(shù);K:評價者的數(shù)目或等級變量的列數(shù)。評分者信度(ScorerReliability)信度系數(shù)的類型誤差變異的來源計算公式施測次數(shù)所需復(fù)本數(shù)目重測信度時間取樣積差相關(guān)系數(shù)21復(fù)本信度(連續(xù)施測)內(nèi)容取樣積差相關(guān)系數(shù)12復(fù)本信度(間隔施測)時間取樣、內(nèi)容取樣積差相關(guān)系數(shù)22分半信度內(nèi)容取樣積差相關(guān)系數(shù)(需校正,常用斯-布公式)11同質(zhì)性信度內(nèi)容的異質(zhì)性α系數(shù)(非二分法)11評分者信度評分者間的差異積差相關(guān)系數(shù)斯皮爾曼等級相關(guān)系數(shù),肯德爾和諧系數(shù)11在一般情況下,間隔施測的復(fù)本信度最低,因為很多因素有機(jī)會影響到分?jǐn)?shù)。相反,校正過的分半相關(guān),因為影響的因素少,所得的信度估計為最高。樣本團(tuán)體的性質(zhì)相關(guān)系數(shù)受到團(tuán)體中分?jǐn)?shù)分布的影響信度系數(shù)受到團(tuán)體異質(zhì)性的影響不同團(tuán)體間能力水平的影響
測驗的長度測驗越長,則試題取樣或內(nèi)容取樣越恰當(dāng)測驗越長,測驗結(jié)果越不易受猜測的影響測驗的難度信度影響因素被試的同質(zhì)性信度系數(shù)的應(yīng)用信度系數(shù)主要用途:(一)評價測驗
一般能力和學(xué)績測驗0.9
個性、價值觀.75-.85<.7時,不能用測驗來對個人做評價,也不能在團(tuán)體間做比較。
>.75時,可用于團(tuán)體間的比較。
>.85時,可用于鑒別個人。信度系數(shù)的應(yīng)用信度系數(shù)主要用途:(二)解釋分?jǐn)?shù)
1.解釋個人測驗分?jǐn)?shù):謹(jǐn)防過分重視單一的數(shù)字分?jǐn)?shù)
SE為測量標(biāo)準(zhǔn)誤:一個人無數(shù)次重復(fù)施測一個測驗所得到的標(biāo)準(zhǔn)差rXX為測驗的信度,SX為測驗分?jǐn)?shù)的方差信度系數(shù)的應(yīng)用若某智力測驗信度為0.95,標(biāo)準(zhǔn)差為15,某兒童得分為120分,就可以估計其真分?jǐn)?shù)的范圍了。
SE=15×1-0.95=3.35
則他的真實智力測驗分?jǐn)?shù)的95%的置信區(qū)間為(113.4T126.6)。即他的智力測驗分?jǐn)?shù)有95%的可能是在113.4和126.6之間。如果要提高估計的把握度,則可求出99%的置信區(qū)間。效度的定義效度指的是測量的有效性,即一個測驗對它所要測量特質(zhì)準(zhǔn)確測量的程度。在測量學(xué)中,效度被定義為與測量目的有關(guān)的變異(有效變異)與實測變異之比(Sv2/Sx2)。測量的效度除受隨機(jī)誤差影響外,還受系統(tǒng)誤差影響??尚诺臏y驗未必有效,而有效測驗必定可信。信度是效度的必要條件。SX2=ST2+SE2
ST2=SV2+SI2
(與測量目的有關(guān)的變異,與測量目的無關(guān)的變異)
SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2
系統(tǒng)誤差的影響系統(tǒng)誤差可能是由以下幾方面原因造成的:1)所要測量的特質(zhì)有多方面的含義,而量表本身未能全部包含這些方面;2)測驗題目中包含了與所測特質(zhì)無關(guān)的題目;3)計分方面的問題,如選擇題的備選答案是不全面的,即沒有完全體現(xiàn)被試情況的差異,因此答案就不是足夠準(zhǔn)確的,而且各題目得分是簡單累加而未經(jīng)加權(quán)處理,不同題目的重要性程度就沒有得到區(qū)分。效度的分類弗蘭士和米希爾提出的分類方法:(1)內(nèi)容效度(2)構(gòu)想效度(3)效標(biāo)效度內(nèi)容效度(專家效度)-效度1定義內(nèi)容效度是指項目對欲測的內(nèi)容或行為范圍取樣的適當(dāng)程度。條件:(1)確定好內(nèi)容范圍,并使測驗的全部項目均在此范圍內(nèi);(2)測驗項目應(yīng)是已界定的內(nèi)容范圍的代表性樣本,即選出的項目能包含所測的內(nèi)容范圍的主要方面,并使各部分項目所占比例適當(dāng)。內(nèi)容效度-效度1內(nèi)容效度的應(yīng)用適合于測驗所要測量的內(nèi)容總體能夠明確界定的情況:評價教育成就測驗和職業(yè)選拔測驗主要缺點(diǎn)缺乏可靠的數(shù)量指標(biāo)妨礙各測驗間的相互比較構(gòu)想效度-效度2定義構(gòu)念:心理學(xué)家為更好地描述人的具有內(nèi)在一致性的行為和心理現(xiàn)象而構(gòu)想出的抽象概念。比如,智力、創(chuàng)造力、內(nèi)外向、成就動機(jī)、抑郁、焦慮等心理學(xué)的構(gòu)念都是非常抽象的,但通過對一些外顯行為的觀察,將其擁有這種特質(zhì)的程度數(shù)量化。對同一心理構(gòu)念有不同有測量方法。但無論怎樣去測量,對一種特質(zhì)的測量結(jié)果必須與該特質(zhì)的理論解釋相符合。測驗對理論上的構(gòu)想或特質(zhì)的測量程度;測驗結(jié)果能夠反映所要測量的心理構(gòu)念的程度例子:智力測驗的構(gòu)想效度檢驗對智力的構(gòu)念,目前較為流行的觀點(diǎn)認(rèn)為智力代表了一個人獲得、保持知識的能力,推理能力及適應(yīng)環(huán)境的能力
根據(jù)智力的定義,可以推演出以下幾點(diǎn)假設(shè),1)智力不同于后天獲得的知識,因此與遺傳因素有關(guān),且更為穩(wěn)定,2)智力會隨著人的生理變化而發(fā)展變化,3)智力會影響人的學(xué)習(xí)成績和事業(yè)成功。為驗證以上假設(shè),可以從三方面著手:1)計算同卵雙生子、異卵雙生子、其他同胞、非同胞間智商的相關(guān),看相關(guān)系數(shù)是否依次降低;2)看智商與學(xué)業(yè)成績間是否有高相關(guān);3)智商是否隨著年齡的增長而逐漸提高,在某一個階段又是相對穩(wěn)定的。如果以上假設(shè)都得到了證實,則說明所編的智力測驗是有效的,如果假設(shè)得不到證實,則說明測驗的效度不高。構(gòu)想效度的評價優(yōu)勢:促使研究者把著眼點(diǎn)放在提出假設(shè)、檢驗假設(shè)上,使得測驗成為理論研究的重要工具;主要缺點(diǎn):有些構(gòu)想概念模糊,沒有一致的定義;確定效度時沒有明確的操作步驟;沒有單一的數(shù)量指標(biāo)來描述有效程度。效標(biāo)效度-效度3衡量測驗有效性的一個重要方法:根據(jù)測驗所作出的預(yù)測能否證實效標(biāo):被預(yù)測的行為,衡量測驗是否有效的標(biāo)準(zhǔn)效標(biāo)效度:考察測驗分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 兩部門要求做好“三區(qū)”人才支持計劃教師專項計劃工作
- 醫(yī)美運(yùn)營合同范本
- 仁懷酒廠收購合同范本
- 廚師勞務(wù)合同范本單位
- 出售恒安小區(qū)房子合同范本
- 個人買賣狗狗合同范本
- 廠區(qū)門面房租賃合同范例
- 《荷葉圓圓》說課稿
- 叉車 吊車合同范本
- 農(nóng)村私房承建合同范本
- 院前急救技術(shù)-止血包扎固定搬運(yùn)課件
- 中國煤炭地質(zhì)總局公開招聘報名表
- 電子商務(wù)數(shù)據(jù)分析基礎(chǔ)(第二版) 課件 模塊1、2 電子商務(wù)數(shù)據(jù)分析概述、基礎(chǔ)數(shù)據(jù)采集
- YB-T+4190-2018工程用機(jī)編鋼絲網(wǎng)及組合體
- 高大模板安全施工施工安全保證措施
- 地連墻鋼筋籠吊裝安全施工T及T吊裝驗算及設(shè)備選定
- 委托辦理報廢汽車協(xié)議書
- 蘇教版(SJ)《四年級下冊數(shù)學(xué)》補(bǔ)充習(xí)題
- 體育足球籃球排球體操教案
- 保管錢財協(xié)議書的范本
- 湖北省武漢市二月調(diào)考讀后續(xù)寫解析+課件
評論
0/150
提交評論