心理測(cè)量課件(中科院word版)_第1頁(yè)
心理測(cè)量課件(中科院word版)_第2頁(yè)
心理測(cè)量課件(中科院word版)_第3頁(yè)
心理測(cè)量課件(中科院word版)_第4頁(yè)
心理測(cè)量課件(中科院word版)_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE6心理測(cè)量學(xué)第一章緒論第一節(jié)心理測(cè)量的歷史一、國(guó)外心理測(cè)量的歷史(一)測(cè)量產(chǎn)生于實(shí)際社會(huì)的需要

法國(guó)醫(yī)生沈干(Seguin)訓(xùn)練智力落后兒童(1837年)

法國(guó)醫(yī)生艾斯克羅爾(Esqurol)對(duì)智力落后和精神病人的區(qū)分(一個(gè)人駕駛語(yǔ)言的能力,是他智力水平的最可靠的標(biāo)志);(二)馮特的實(shí)驗(yàn)心理學(xué)

馮特建立第一個(gè)心理學(xué)實(shí)驗(yàn)室(1879年);

觀察的個(gè)體差異:格林威治天文臺(tái)觀察員的遭遇(1796);(三)高爾頓的遺傳理論測(cè)量達(dá)爾文的表兄弟,皮爾遜(Pearson)的老師,《遺傳的天才》,人類(lèi)測(cè)量實(shí)驗(yàn)室,高爾頓棒,高爾頓笛高爾頓發(fā)現(xiàn),白癡對(duì)于熱、冷、痛鑒別能力較低。他還說(shuō):感覺(jué)辨別力“基本上是心智能力中最高的能力?!?/p>

(四)卡特爾的個(gè)別差異研究馮特的學(xué)生,高爾頓的朋友。首次提出“心理測(cè)驗(yàn)”(mentaltest)這一術(shù)語(yǔ);《心理測(cè)驗(yàn)與測(cè)量》(五)比納和比納-西蒙智力量表的產(chǎn)生第一個(gè)智力測(cè)驗(yàn)量表——比內(nèi)-西蒙量表(1905年量表)—1908年量表—1911年量表美國(guó)心理學(xué)家Pintner說(shuō):“在心理學(xué)史上,假使我們稱(chēng)馮特為實(shí)驗(yàn)心理學(xué)的鼻祖,我們不得不稱(chēng)比奈為心理智力測(cè)量的鼻祖?!辈终f(shuō):“19世紀(jì)80年代是高爾頓的10年,90年代是卡特爾的10年,20世紀(jì)頭10年則是比內(nèi)的10年?!保┬睦頊y(cè)量的蓬勃發(fā)展與應(yīng)用1.智力測(cè)驗(yàn)的發(fā)展比內(nèi)-西蒙量表——斯坦福-比內(nèi)量表(比率智商)

葉克斯(Yerkes):陸軍甲種測(cè)驗(yàn)、陸軍乙種測(cè)驗(yàn)(1917~1919)——20年代智力測(cè)驗(yàn)運(yùn)動(dòng)的狂熱

斯皮爾曼的因素分析法和“二因素理論”——瑞文推理測(cè)驗(yàn)(30年代)韋氏智力量表(40年代~60年代)(離差智商)2.能力傾向測(cè)驗(yàn)的發(fā)展:特殊能力測(cè)驗(yàn)(音樂(lè)、文書(shū)、機(jī)械、美術(shù))3.成就測(cè)驗(yàn)的發(fā)展桑代克編制了第一個(gè)標(biāo)準(zhǔn)化的教育成就測(cè)驗(yàn),因此被認(rèn)為是教育測(cè)驗(yàn)的鼻祖。(20世紀(jì)初)斯坦福成就測(cè)驗(yàn)(1923)ETS(EducationalTestingService)教育測(cè)驗(yàn)服務(wù)中心4.人格測(cè)驗(yàn)的發(fā)展最早進(jìn)行人格測(cè)量——克雷培林(Kraepelin)用自由聯(lián)想法診斷精神病人。最早的人格問(wèn)卷——武德沃斯的“個(gè)人資料調(diào)查表”(診斷士兵神經(jīng)癥)“卡特爾16種人格問(wèn)卷”(16PF)“艾森克人格問(wèn)卷”(EPQ)“明尼蘇達(dá)多項(xiàng)人格調(diào)查表”(MMPI)羅夏墨跡測(cè)驗(yàn)主題統(tǒng)覺(jué)測(cè)驗(yàn)(TAT)美國(guó)心理測(cè)驗(yàn)的三個(gè)發(fā)展期

1904~1915,Thorndike出版《精神與社會(huì)測(cè)驗(yàn)學(xué)導(dǎo)論》:“凡是存在的東西都有數(shù)量;凡是有數(shù)量的東西都可測(cè)量”(數(shù)量化,客觀化和標(biāo)準(zhǔn)化)。

1915~1930,學(xué)歷測(cè)驗(yàn),智力測(cè)驗(yàn)(IQ),和人格測(cè)驗(yàn)大量出現(xiàn)。

1930~1940,從單純測(cè)驗(yàn)法向心理評(píng)估和教育評(píng)價(jià)過(guò)渡(綜合應(yīng)用評(píng)定法;問(wèn)卷法;交談法;軼事記錄法等)心理測(cè)量的歷史發(fā)展趨勢(shì)1先是以解剖生理特征為根據(jù),而后轉(zhuǎn)向?qū)π闹腔顒?dòng)的測(cè)量;2由測(cè)量簡(jiǎn)單的感知能力,發(fā)展到測(cè)量復(fù)雜的認(rèn)知能力;3由籠統(tǒng)的單一量數(shù)轉(zhuǎn)變?yōu)橐远鄠€(gè)量數(shù)來(lái)評(píng)定個(gè)別差異,4心理測(cè)量與實(shí)驗(yàn)心理學(xué)由合到分,又到合。心理測(cè)量的當(dāng)代趨勢(shì)信息加工測(cè)驗(yàn)的產(chǎn)生;計(jì)算機(jī)化測(cè)驗(yàn)的產(chǎn)生;項(xiàng)目反應(yīng)理論和概化理論的興起。二、我國(guó)心理測(cè)量發(fā)展的歷史(一)我國(guó)古代的心理測(cè)量能力測(cè)量孔子:中上之人、中人、中下之人董仲舒:一手畫(huà)方,一手畫(huà)圓(分心測(cè)驗(yàn))劉邵:12種人才類(lèi)型抓周七巧板、九連環(huán)人格測(cè)量孔子:狂者、狷者、中行劉邵:12種性格類(lèi)型教育測(cè)量西周:小成,大成漢代:太學(xué)考試(口試、策試、射策)隋朝:科舉考試對(duì)測(cè)驗(yàn)理論的最初探索劉邵:九征,八觀,五視“居,視其所安;達(dá),視其所舉;富,視其所與;窮,視其所為;貧,視其所取。”中國(guó)古代心理測(cè)量思想的特點(diǎn):

描述性

分類(lèi)式

注重整體評(píng)價(jià),和人的道德品質(zhì)聯(lián)系起來(lái)

實(shí)用性(二)中國(guó)心理測(cè)驗(yàn)簡(jiǎn)史(解放前)

1914年,Creighton比較中美兒童智力差異(廣州,500人)

1917年,樊炳清介紹“比內(nèi)-西蒙智力量表”

1918年,Walcott用推孟修正量表施測(cè)(清華)

1918年,俞子夷編制“小學(xué)生毛筆書(shū)法量表”

1920年,廖世承、陳鶴琴在南京開(kāi)設(shè)測(cè)驗(yàn)課

1921年,廖世承、陳鶴琴合作出版《心理測(cè)驗(yàn)法》一書(shū)

1921年,費(fèi)培杰將比內(nèi)智力測(cè)驗(yàn)翻成中文

1922年,張耀翔在北京將心理測(cè)驗(yàn)列為入學(xué)考試科目

1924年,陸志偉發(fā)表《訂正比內(nèi)西蒙智力測(cè)驗(yàn)說(shuō)明書(shū)》;

1931年6月,在南京成立中國(guó)測(cè)驗(yàn)學(xué)會(huì)

1932年,《測(cè)驗(yàn)》雜志創(chuàng)刊。

1935年,沈有乾用“朋洛德人格問(wèn)卷”測(cè)量中國(guó)學(xué)生。

1936年,陸志偉和吳天敏進(jìn)行第二次修訂比內(nèi)西蒙智力測(cè)驗(yàn)。

1937年,周先庚使用“塞斯頓情緒穩(wěn)定性測(cè)驗(yàn)”

1943年,林傳鼎試用“普萊西X-O測(cè)驗(yàn)”

1948年,劉范試用“羅夏克墨跡測(cè)驗(yàn)”。(三)中國(guó)心理測(cè)驗(yàn)簡(jiǎn)史(解放后)

1979年,林傳鼎,吳天敏,張厚粲在武漢舉辦全國(guó)測(cè)驗(yàn)培訓(xùn)班;

1979年,龔耀先主持修訂“韋克斯勒成人智力量表”;

1979年,林傳鼎、張厚粲編制“少年兒童學(xué)習(xí)能力測(cè)驗(yàn)”;

1980年,林傳鼎、張厚粲主持修訂“韋克斯勒兒童智力量表”;

1980年,北師大開(kāi)設(shè)心理測(cè)驗(yàn)課;

1980年,張厚粲開(kāi)始對(duì)高考試卷做系統(tǒng)分析;

1981年,劉紹衣修訂“卡特爾16種人格因素問(wèn)卷”;

1982年,吳天敏第三次修訂中國(guó)比內(nèi)測(cè)驗(yàn);

1982年,宋維真修訂“明尼蘇達(dá)多相人格調(diào)查表”

1992年,宋維真編制“心理健康調(diào)查表”;

1992年,沙毓英等編制“學(xué)生性格量表”;

1993年,宋維真等編制“中國(guó)人個(gè)性測(cè)量表”(CPAI);

80年代,編制超常、弱智兒童篩查量表;0~3(6)歲兒童發(fā)育、發(fā)展量表;CPM領(lǐng)導(dǎo)行為評(píng)價(jià)量表MMPI-2第二節(jié)心理測(cè)量的性質(zhì)一、測(cè)量的基本概念(一)測(cè)量的定義測(cè)量就是依據(jù)一定的法則,使用量具對(duì)事物的特征進(jìn)行定量描述的過(guò)程。

一定的法則

事物的特征

量具

定量描述測(cè)量精確度的影響因素:測(cè)量對(duì)象的性質(zhì):確定型、隨機(jī)型、模糊型測(cè)量工具的精密性測(cè)量的類(lèi)型:物理測(cè)量、生理測(cè)量、社會(huì)測(cè)量、心理測(cè)量(二)測(cè)量的基本要素1參照點(diǎn)絕對(duì)參照點(diǎn)(絕對(duì)零點(diǎn))相對(duì)參照點(diǎn)2單位好的單位須符合兩個(gè)條件:確定的意義,即同一單位對(duì)所有人來(lái)說(shuō)意義相同。相等的價(jià)值,即第一單位與第二單位之間的距離等于第二單位與第三單位之間的距離。(三)測(cè)量的量表使事物的特征數(shù)量化的數(shù)字的連續(xù)體就是量表(scale)。Stevens將量表從低到高分為4個(gè)等級(jí)。1命名量表(NominalScale)用數(shù)字來(lái)代表事物或?qū)κ挛镞M(jìn)行分類(lèi)。代號(hào)類(lèi)別數(shù)字只是一種名稱(chēng)的替代物。不同的個(gè)體用不同的數(shù)字標(biāo)志。如球員的號(hào)碼,各種分類(lèi)標(biāo)志(男或女;正常或異常,等)2順序量表(OrderScale)給個(gè)體賦值,使數(shù)值的大小次序與個(gè)體在所測(cè)量的心理特性上的多少、大小、高低等的次序相符合。次序量表在心理和教育中十分常見(jiàn)(如競(jìng)賽成績(jī)排名等)3等距量表(IntervalScale)給個(gè)體賦值,使數(shù)值間的差不僅能夠反映出對(duì)應(yīng)個(gè)體在所測(cè)量心理特性上的排序,而且能夠反映出對(duì)應(yīng)個(gè)體在該特性上的差異程度。(如溫度計(jì),偏愛(ài)程度等)但建構(gòu)間距量表不是容易的事,常常只能做到次序量表。4比率量表(RatioScale)給個(gè)體賦值,使數(shù)值間的比率能夠反映對(duì)應(yīng)個(gè)體在測(cè)量心理特性上比率。(如身高、體重、速度等)。但在心理學(xué)中是極少見(jiàn)的。心理測(cè)量通常都是次序量表,為方便比較,通常把次序量表轉(zhuǎn)換為等距量表。測(cè)量量表的等級(jí)(功用)

命名量表:識(shí)別、區(qū)別個(gè)體;

次序量表:識(shí)別、區(qū)別個(gè)體;按特性排序個(gè)體;

間距量表:識(shí)別、區(qū)別個(gè)體;按特性排序個(gè)體;指出個(gè)體特性的差異;

比率量表:

識(shí)別、區(qū)別個(gè)體;按特性排序個(gè)體;指出個(gè)體特性間的差異;指出個(gè)體特性間的比率。二、心理測(cè)量的基本概念(一)心理測(cè)量的理論基礎(chǔ)

孟子說(shuō)“權(quán),然后知輕重;度,然后知長(zhǎng)短;物皆然,心為甚。”

Thorndike:“凡客觀存在的事物都有其數(shù)量?!?/p>

McCall:“凡有數(shù)量的東西都可以測(cè)量?!毙睦頊y(cè)量的準(zhǔn)確性、可靠性、精確度還有待提高,但測(cè)量不準(zhǔn)不等于不能測(cè)量,現(xiàn)在測(cè)量不準(zhǔn)也不意味著將來(lái)永遠(yuǎn)測(cè)不準(zhǔn)。(二)心理測(cè)量的定義

心理特質(zhì)具有內(nèi)隱性,只能通過(guò)人的外顯行為來(lái)推斷。Anastasi:“心理測(cè)驗(yàn)實(shí)質(zhì)上是對(duì)行為樣本的客觀的和標(biāo)準(zhǔn)化的測(cè)量。”Brown:測(cè)驗(yàn)是“測(cè)量一個(gè)行為樣本的系統(tǒng)程序?!睍?shū)本:依據(jù)一定的心理學(xué)理論,使用測(cè)驗(yàn)對(duì)人的心理特質(zhì)進(jìn)行定量描述的過(guò)程。鄭日昌:心理測(cè)驗(yàn)就是通過(guò)觀察人的少數(shù)有代表性的行為,對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。1行為樣本從總體行為中抽取出來(lái)的、能夠反映個(gè)人特定心理特質(zhì)的一組行為,作為直接的測(cè)量對(duì)象。

取樣研究的有效與否,關(guān)鍵在于樣本的代表性,即不是任何部分都可代表全體。

構(gòu)成樣本的行為應(yīng)當(dāng)是系統(tǒng)的,有理論思考的;

不可能包括所有可用來(lái)測(cè)量或定義某種心理特性的具體行為;

因此,心理測(cè)驗(yàn)質(zhì)量的高低很大程度上決定于行為樣本的代表性。

只有在全部了解行為樣本的意義以后,才能正確使用心理測(cè)驗(yàn)。心理測(cè)量的最終目標(biāo)不是對(duì)行為樣本的測(cè)量,而是通過(guò)行為樣本的測(cè)量來(lái)預(yù)測(cè)被試以后將會(huì)出現(xiàn)的行為。行為樣本與所要預(yù)測(cè)的行為并不一定相似,可以相似,也可以完全不同。如投射測(cè)驗(yàn)和能力傾向測(cè)驗(yàn),其測(cè)查的行為與將來(lái)要預(yù)測(cè)的行為有很大的差異,但兩者之間有必然的聯(lián)系(相關(guān))。2標(biāo)準(zhǔn)化測(cè)驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化施測(cè)條件的標(biāo)準(zhǔn)化測(cè)驗(yàn)情境、指導(dǎo)語(yǔ)、測(cè)驗(yàn)時(shí)限評(píng)分規(guī)則的標(biāo)準(zhǔn)化測(cè)驗(yàn)常模的標(biāo)準(zhǔn)化3難度或通俗性4信度和效度(三)按測(cè)驗(yàn)材料分類(lèi)1.文字(紙筆)測(cè)驗(yàn)2.非文字(操作)測(cè)驗(yàn)文化公平測(cè)驗(yàn)(四)按測(cè)驗(yàn)的目的分類(lèi)1.描述測(cè)驗(yàn)2.診斷測(cè)驗(yàn)3.預(yù)示性測(cè)驗(yàn)第三節(jié)心理測(cè)驗(yàn)的種類(lèi)和功能一、心理測(cè)驗(yàn)的種類(lèi)(一)按測(cè)量的功能分類(lèi)1.能力測(cè)驗(yàn)智力測(cè)驗(yàn)、特殊能力測(cè)驗(yàn)、能力傾向測(cè)驗(yàn)2.學(xué)績(jī)測(cè)驗(yàn)已獲得的學(xué)業(yè)成就3.人格測(cè)驗(yàn)興趣、態(tài)度、動(dòng)機(jī)、氣質(zhì)、性格(二)按測(cè)量的對(duì)象分類(lèi)1.個(gè)別測(cè)驗(yàn)優(yōu)點(diǎn):獲得的信息多;容易建立融洽的合作關(guān)系;特殊被試(幼兒、盲人)缺點(diǎn):費(fèi)時(shí)、復(fù)雜、對(duì)主試要求高。2.團(tuán)體測(cè)驗(yàn)優(yōu)點(diǎn):缺點(diǎn):(三)按測(cè)驗(yàn)材料分類(lèi)1.文字(紙筆)測(cè)驗(yàn)2.非文字(操作)測(cè)驗(yàn)文化公平測(cè)驗(yàn)(四)按測(cè)驗(yàn)的目的分類(lèi)1.描述測(cè)驗(yàn)2.診斷測(cè)驗(yàn)3.預(yù)示性測(cè)驗(yàn)(五)按測(cè)驗(yàn)的難度和時(shí)限分類(lèi)1.難度測(cè)驗(yàn)2.與速度測(cè)驗(yàn)

(六)按測(cè)驗(yàn)的要求分類(lèi)1.最高行為測(cè)驗(yàn)2.典型行為測(cè)驗(yàn)(七)按測(cè)驗(yàn)的性質(zhì)分類(lèi)1.構(gòu)造性測(cè)驗(yàn)2.投射性測(cè)驗(yàn)(八)按測(cè)驗(yàn)的應(yīng)用分類(lèi)1.教育測(cè)驗(yàn)2.職業(yè)測(cè)驗(yàn)3.臨床測(cè)驗(yàn)(九)按評(píng)價(jià)所參照的標(biāo)準(zhǔn)分類(lèi)1.常模參照測(cè)驗(yàn)2.標(biāo)準(zhǔn)參照測(cè)驗(yàn)內(nèi)容參照測(cè)驗(yàn)結(jié)果參照測(cè)驗(yàn)二、心理測(cè)驗(yàn)的功能雙刃劍(一)理論研究功能1.收集研究資料

2.建立和檢驗(yàn)理論假設(shè)3.實(shí)驗(yàn)分組二)實(shí)際應(yīng)用功能1.選拔人才2.人員安置3.心理診斷4.描述評(píng)價(jià)5.心理咨詢第四節(jié)心理測(cè)量工作者的素質(zhì)要求及道德準(zhǔn)則一、心理測(cè)量工作者的素質(zhì)要求(一)心理測(cè)量工作的知識(shí)結(jié)構(gòu)基礎(chǔ)知識(shí):專(zhuān)業(yè)知識(shí):(二)對(duì)心理測(cè)驗(yàn)的科學(xué)態(tài)度錯(cuò)誤觀念:萬(wàn)能論無(wú)用論心理測(cè)驗(yàn)就是智力測(cè)驗(yàn)(心理測(cè)驗(yàn)=智力測(cè)驗(yàn)=智商=遺傳決定論)對(duì)待測(cè)驗(yàn)的正確態(tài)度:心理測(cè)驗(yàn)是研究心理學(xué)的重要方法之一,是決策的輔助工具;心理測(cè)驗(yàn)作為研究方法和測(cè)量工具尚不完善;防止亂編和濫用心理測(cè)驗(yàn)。二、心理測(cè)量工作者的道德準(zhǔn)則(一)測(cè)驗(yàn)的保密和控制使用測(cè)驗(yàn)信息和樣題的公布

有助于消除公眾對(duì)心理測(cè)驗(yàn)的神秘感及誤解有關(guān)測(cè)驗(yàn)的技術(shù)程序以及信度、效度和其他測(cè)驗(yàn)屬性應(yīng)向所有人公開(kāi)

讓受測(cè)者熟悉測(cè)驗(yàn),以消除焦慮,保證測(cè)驗(yàn)結(jié)果的準(zhǔn)確性

對(duì)測(cè)驗(yàn)結(jié)果的反饋(二)測(cè)驗(yàn)中個(gè)人隱私的保護(hù)第二章心理測(cè)驗(yàn)的編制第一節(jié)編制心理測(cè)驗(yàn)的基本程序一、確定測(cè)驗(yàn)?zāi)康模ㄒ唬┟鞔_測(cè)量對(duì)象

年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等。(二)明確測(cè)量目標(biāo)

心理變量或行為特征。必須有操作定義,目標(biāo)要非常具體。(三)明確測(cè)量用途

用于描述、還是診斷,或用于預(yù)測(cè)二、制定編題計(jì)劃通常是一張雙向細(xì)目表,指出測(cè)驗(yàn)所包含的內(nèi)容和要測(cè)定的各種技能,以及對(duì)每一個(gè)內(nèi)容和技能的相對(duì)重視程度。例:小學(xué)自然常識(shí)測(cè)驗(yàn)編題計(jì)劃三、編輯測(cè)驗(yàn)項(xiàng)目(一)收集測(cè)驗(yàn)資料(1)資料要豐富(2)資料要有普遍性(3)資料要有趣味性(二)選擇項(xiàng)目形式

紙筆測(cè)驗(yàn)還是操作測(cè)驗(yàn)?是客觀題還是主觀題?概念和原理的記憶——簡(jiǎn)答題辨別和判斷——選擇題綜合運(yùn)用——論文題幼兒——口頭測(cè)驗(yàn)文盲、半文盲、聾啞——操作測(cè)驗(yàn)人多、經(jīng)費(fèi)有限——團(tuán)體測(cè)驗(yàn)人少——個(gè)體測(cè)驗(yàn)(三)編寫(xiě)測(cè)驗(yàn)項(xiàng)目題目范圍要與雙向細(xì)目表一致;題目數(shù)量要比最終所需要的數(shù)量多,以便篩選或編制復(fù)本;題目的難度應(yīng)有一定的分布范圍;用詞力求清楚明白。四、試測(cè)與項(xiàng)目分析試測(cè)取樣施測(cè)過(guò)程與施測(cè)情景時(shí)限可稍寬一些項(xiàng)目分析質(zhì)的分析:內(nèi)容取樣、題目的思想性、表達(dá)是否清楚量的分析:難度、區(qū)分度、備選項(xiàng)分析五、合成測(cè)驗(yàn)(一)測(cè)驗(yàn)項(xiàng)目的選擇指標(biāo)有三:要選擇那些能夠測(cè)量所要測(cè)量的東西的項(xiàng)目;難度區(qū)分度(二)測(cè)驗(yàn)項(xiàng)目的編排

并列直進(jìn)式混合螺旋式(三)編制復(fù)本

各份復(fù)本必須等值。等值要符合下列條件:各份測(cè)驗(yàn)測(cè)量的是同一種心理特性。各份測(cè)驗(yàn)具有相同的內(nèi)容和形式。各份測(cè)驗(yàn)的題目不應(yīng)重復(fù)。各份測(cè)驗(yàn)題目數(shù)量相等,難度和區(qū)分度大體相同。各份測(cè)驗(yàn)的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測(cè)一次,以確保各份測(cè)驗(yàn)的等值。六、測(cè)驗(yàn)標(biāo)準(zhǔn)化測(cè)驗(yàn)的標(biāo)準(zhǔn)化是指測(cè)驗(yàn)的編制、實(shí)施、評(píng)分以及分?jǐn)?shù)解釋都有統(tǒng)一的標(biāo)準(zhǔn),以減少無(wú)關(guān)因素對(duì)測(cè)驗(yàn)的影響。(一)測(cè)驗(yàn)內(nèi)容指測(cè)驗(yàn)內(nèi)容對(duì)所有被試都一樣。(二)施測(cè)過(guò)程測(cè)驗(yàn)情景指導(dǎo)語(yǔ)時(shí)限(三)測(cè)驗(yàn)評(píng)分為使評(píng)分盡可能客觀,有三點(diǎn)要求:對(duì)被試反應(yīng)的及時(shí)和清楚的記錄。特別是對(duì)口試和操作測(cè)驗(yàn)。要有一張標(biāo)準(zhǔn)答案或正確反應(yīng)的表格,即計(jì)分鍵。將被試的反應(yīng)和計(jì)分鍵比較,對(duì)反應(yīng)進(jìn)行分類(lèi)。(四)測(cè)驗(yàn)分?jǐn)?shù)的解釋常模參照標(biāo)準(zhǔn)參照:內(nèi)容參照,結(jié)果參照七、鑒定測(cè)驗(yàn)(一)信度(二)效度(三)測(cè)驗(yàn)量表與常模八、編寫(xiě)測(cè)驗(yàn)說(shuō)明書(shū)測(cè)驗(yàn)的目的和功用;編制測(cè)驗(yàn)的理論背景以及選擇題目的根據(jù)和測(cè)驗(yàn)的構(gòu)成;測(cè)驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng);測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和評(píng)分方法;測(cè)驗(yàn)的信度和效度資料;常模資料。第二節(jié)測(cè)驗(yàn)題目的編制技術(shù)一、命題的一般原則試題要符合測(cè)驗(yàn)的目的。內(nèi)容取樣要有代表性。題目格式不要使被試產(chǎn)生誤解。文句要簡(jiǎn)明扼要,既排除與解題無(wú)關(guān)的因素,又不可遺漏解題所依據(jù)的必要條件。要避免使用艱深的字詞。應(yīng)有不致引起爭(zhēng)論的確定答案(創(chuàng)造力測(cè)驗(yàn)、人格測(cè)驗(yàn)除外)。各個(gè)題目必須彼此獨(dú)立,不可互相牽連,不要使一個(gè)題目的回答影響另一個(gè)題目的回答。題目中不可含有暗示本題或其他題正確答案的線索。題目?jī)?nèi)容不要超出受測(cè)團(tuán)體的知識(shí)和能力。所提問(wèn)題應(yīng)避免涉及社會(huì)禁忌與個(gè)人隱私。施測(cè)與評(píng)分省時(shí)。二、測(cè)題的種類(lèi)及編制固定應(yīng)答型題目,即客觀題,包括:選擇題、是非題、匹配題等。自由應(yīng)答型題目,即主觀題,包括:填充題、簡(jiǎn)答題、應(yīng)用題、論文題、聯(lián)想題、操作題等。(一)選擇題題干+選項(xiàng)(正確選項(xiàng)與誘答選項(xiàng))多項(xiàng)條件選擇題:例如:已知小明的心理年齡是8歲4個(gè)月,實(shí)際年齡是9歲,其智商是多少?(a)85(b)90(c)92(d)92.6(e)100類(lèi)別選擇題例如:艾森克是著名的_______心理學(xué)家。(a)兒童(b)工程(c)管理(d)人格(e)社會(huì)異類(lèi)選擇題例如:下面哪位與其他人不屬于同一類(lèi)人?(a)小布什(b)普京(c)胡錦濤(d)希拉克(e)科爾多項(xiàng)是非選擇題例如:下面兩個(gè)陳述哪一個(gè)正確?(1)2008年奧運(yùn)會(huì)在北京舉行。(2)美國(guó)首都是費(fèi)城。(a)1和2都對(duì)(b)1對(duì)2錯(cuò)(c)1錯(cuò)2對(duì)(d)都錯(cuò)因果條件選擇題例如:如果測(cè)驗(yàn)的真方差增加,但誤差方差不變,結(jié)果是:(a)測(cè)驗(yàn)信度增加(b)測(cè)驗(yàn)信度下降(c)測(cè)驗(yàn)總方差減小(d)測(cè)驗(yàn)的信度和總方差不變選擇題的優(yōu)點(diǎn):適用范圍廣;計(jì)分客觀;題意明確。缺點(diǎn):編制誘答選項(xiàng)較難;答案固定,測(cè)量范圍有限。編寫(xiě)選擇題的原則:題干所提的問(wèn)題必須明確選項(xiàng)要簡(jiǎn)短,必要的敘述或相同的修飾語(yǔ)應(yīng)放在題干中;每個(gè)選項(xiàng)的性質(zhì)要一致;選項(xiàng)最好按邏輯順序排列;選項(xiàng)之間不應(yīng)有重疊;誘答選項(xiàng)的錯(cuò)誤不要太明顯;不要把選項(xiàng)夾在題干中間;每題只能?chē)@一個(gè)中心,不能有歧義。(二)是非題每題只包含一個(gè)概念,避免兩個(gè)以上的概念在同一題中出現(xiàn),造成題目似是而非,或半對(duì)半錯(cuò)。避免使用具有暗示性的特殊詞語(yǔ),如“絕對(duì)”、“完全”、“有時(shí)”、“可能”等。盡量采用正面肯定的敘述,避免反面陳述或雙重否定的句子。如“生物沒(méi)有不是由細(xì)胞組成的。”“是”與“非”的題數(shù)應(yīng)大致相等,且隨機(jī)排列。(三)論文題對(duì)答題有時(shí)間限制;不要有任選的題目,因?yàn)閮深}很難做到等值;客觀、統(tǒng)一的評(píng)分細(xì)則。第三章測(cè)驗(yàn)的實(shí)施和計(jì)分第一節(jié)測(cè)驗(yàn)的實(shí)施一、測(cè)驗(yàn)實(shí)施前的準(zhǔn)備工作向被試預(yù)告測(cè)驗(yàn):測(cè)驗(yàn)的時(shí)間、地點(diǎn)、內(nèi)容,讓被試做好心理準(zhǔn)備。熟悉測(cè)驗(yàn)程序:測(cè)驗(yàn)內(nèi)容、施測(cè)步驟、記分方法、分?jǐn)?shù)解釋。準(zhǔn)備測(cè)驗(yàn)材料。準(zhǔn)備測(cè)驗(yàn)環(huán)境:通風(fēng)、采光、噪聲、桌椅高度、桌面大小、掛牌以防止意外干擾等。熟悉測(cè)驗(yàn)的指導(dǎo)語(yǔ):告訴被試如何選擇反應(yīng)形式(劃勾還是涂黑),說(shuō)明時(shí)間限制,例題演示,有時(shí)告知被試測(cè)驗(yàn)?zāi)康?。二、測(cè)驗(yàn)的具體實(shí)施按測(cè)驗(yàn)手冊(cè)要求實(shí)施測(cè)驗(yàn)??刂茰y(cè)驗(yàn)焦慮,不講威嚇被試的話。與被試建立良好的協(xié)調(diào)關(guān)系(rapport)。及時(shí)和清楚地記錄被試的反應(yīng)。對(duì)特殊問(wèn)題有所準(zhǔn)備(如作弊、被試不配合等)。第二節(jié)測(cè)驗(yàn)的計(jì)分和分?jǐn)?shù)的合成一、計(jì)分的一般程序(一)計(jì)分的基本步驟1及時(shí)和清楚地記錄被試的反應(yīng)2制作標(biāo)準(zhǔn)答案,也稱(chēng)計(jì)分鍵3將反應(yīng)和計(jì)分鍵相比較,給反應(yīng)歸類(lèi)或賦予分?jǐn)?shù)值(二)論文題計(jì)分盲審多個(gè)主試評(píng)分細(xì)分計(jì)分標(biāo)準(zhǔn)(三)客觀題計(jì)分人工計(jì)分和機(jī)器計(jì)分猜測(cè)校正公式S=R-W/(K-1)

S—校正后的分?jǐn)?shù);R—被試答對(duì)的題目數(shù);W—被試答錯(cuò)的題目數(shù);K—選擇項(xiàng)目數(shù)是否需要對(duì)猜測(cè)進(jìn)行校正?贊成的理由:反對(duì)的理由:(二)測(cè)驗(yàn)分?jǐn)?shù)的合成1分?jǐn)?shù)合成的種類(lèi)(1)項(xiàng)目的組合把各個(gè)題目得分相加,得到量表分或分測(cè)驗(yàn)分。分等量加權(quán)和不等量加權(quán)。(2)分測(cè)驗(yàn)或量表的組合把各個(gè)分測(cè)驗(yàn)得分相加,得到量表總分。(3)測(cè)驗(yàn)或預(yù)測(cè)源的組合

同時(shí)運(yùn)用多個(gè)測(cè)驗(yàn)得分進(jìn)行預(yù)測(cè)2分?jǐn)?shù)合成的方法(1)臨床診斷——直覺(jué)合成

從整體上進(jìn)行的定性分析,靈活性強(qiáng),有針對(duì)性。(2)加權(quán)求和合成單位加權(quán):各原始分相加X(jué)c=X1+X2+X3+……+Xn等量加權(quán):如果各個(gè)分?jǐn)?shù)重要性相等,用標(biāo)準(zhǔn)分相加即可;Zc=Z1+Z2+Z3+……+Zn如果各個(gè)分?jǐn)?shù)的重要性不一樣,就要根據(jù)重要性不同,賦予不同的權(quán)重,即加權(quán)系數(shù)。Zc=W1Z1+W2Z2+W3Z3+……+WnZn(3)多重回歸用多種預(yù)測(cè)源分?jǐn)?shù)(測(cè)驗(yàn)分?jǐn)?shù))來(lái)預(yù)測(cè)未來(lái)結(jié)果。?=a+b1x1+b2x2+b3x3+……+bnxn

(4)多重分段高中畢業(yè)合格→政審合格→體檢合格→高考合格→錄取不合格不合格不合格不合格↓↓↓↓淘汰淘汰淘汰淘汰(5)輪廓分析(剖面圖分析)在MMPI中,如果在量表2和量表7上分?jǐn)?shù)高,即27/72,說(shuō)明抑郁、焦慮不安,有神經(jīng)癥。第四章測(cè)驗(yàn)結(jié)果的解釋原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)原始分?jǐn)?shù)(rawscore):將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測(cè)驗(yàn)分?jǐn)?shù)。原始分?jǐn)?shù)本身沒(méi)有多大意義。導(dǎo)出分?jǐn)?shù)(derivedscore):按照一定的規(guī)則,針對(duì)原始分進(jìn)行統(tǒng)計(jì)處理后獲得的分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù)具有一定參照點(diǎn)和單位,可以相互比較。根據(jù)解釋分?jǐn)?shù)時(shí)的參照標(biāo)準(zhǔn)不同,可以將導(dǎo)出分?jǐn)?shù)分為兩大類(lèi):常模參照分?jǐn)?shù)標(biāo)準(zhǔn)參照分?jǐn)?shù):包括內(nèi)容參照分?jǐn)?shù),結(jié)果參照分?jǐn)?shù)。第一節(jié)參照常模的分?jǐn)?shù)解釋參照常模解釋分?jǐn)?shù),通常是將被試的分?jǐn)?shù)直接或間接地以在某個(gè)團(tuán)體中的相對(duì)等級(jí)或相對(duì)位置來(lái)表示。這個(gè)用來(lái)比較的參照?qǐng)F(tuán)體,稱(chēng)為常模團(tuán)體(normgroup)。常模團(tuán)體的分?jǐn)?shù)分布,就是常模(norm)。一、常模團(tuán)體的組成(一)常模團(tuán)體的性質(zhì)由具有共同特征的人所組成的一組群體,或是該群體的一個(gè)樣本。任何一個(gè)測(cè)驗(yàn),都有許多可能的常模團(tuán)體。在制定常模時(shí),首先要確定常模團(tuán)體。在對(duì)常模參照分?jǐn)?shù)做解釋時(shí),也必須首先考慮常模團(tuán)體的組成。(二)確定常模團(tuán)體的注意事項(xiàng)1群體構(gòu)成的界限必須明確對(duì)每個(gè)常模團(tuán)體的性質(zhì)和特征的簡(jiǎn)短且明確的描述。2常模團(tuán)體必須是所測(cè)群體的代表性樣本克服取樣偏差,采用正確的取樣方法:隨機(jī)取樣,系統(tǒng)抽樣,分層取樣。3取樣的過(guò)程必須明確且有詳盡的描述在測(cè)驗(yàn)手冊(cè)中,有關(guān)取樣的大小、取樣方法、取樣時(shí)間等的說(shuō)明和描述,越明確、越詳盡越好。4樣本大小要適當(dāng)從統(tǒng)計(jì)學(xué)原理上說(shuō),樣本是越大越好,但考慮到經(jīng)濟(jì)、實(shí)用,樣本數(shù)量也不能無(wú)限擴(kuò)大。樣本大小可以根據(jù)以下幾方面來(lái)確定:常模總體的數(shù)目??傮w數(shù)目小,則樣本數(shù)目也??;總體數(shù)目大,樣本數(shù)目也應(yīng)大。一般來(lái)說(shuō),樣本最好應(yīng)有30~100人;如果是全國(guó)性常模,一般應(yīng)有2000~3000人為宜??傮w性質(zhì)。總體性質(zhì)越復(fù)雜,樣本容量就越大。測(cè)驗(yàn)結(jié)果的精確度。精確度要求越高,樣本量就越大。5常模團(tuán)體必須是近時(shí)的。6注意一般常模與特殊常模的結(jié)合二、常模參照分?jǐn)?shù)(normreferencedscore)主要有:發(fā)展量表、商數(shù)、百分位、標(biāo)準(zhǔn)分?jǐn)?shù)四大類(lèi)。(一)發(fā)展量表1.心理年齡(mentalage)(智力年齡)指被試智力發(fā)展水平的年齡。單位是年(或歲)和12個(gè)等距的月。年齡量表最基本的假設(shè)是,隨年齡的增長(zhǎng),所測(cè)量的特質(zhì)有系統(tǒng)的改變。因此,不適用于成人。年齡量表的基本要素:(1)題目:可區(qū)分不同年齡組;(2)常模團(tuán)體:由各個(gè)年齡被試組成的有代表性樣本;(3)常模表2.年級(jí)當(dāng)量(gradeequivalents)即年級(jí)常模,用年級(jí)代替年齡,指把學(xué)生的測(cè)驗(yàn)成績(jī)與各年級(jí)學(xué)生的平均成績(jī)比較,看他相當(dāng)于幾年級(jí)的水平。年級(jí)常模的單位通常為10個(gè)月間隔。如5年級(jí)的分布為5-0到5-9。年級(jí)當(dāng)量只適用于一般課程,不適合只學(xué)1~2年的課程。年級(jí)當(dāng)量只適用于解釋本學(xué)年的水平,不適用于跨學(xué)年的。如一個(gè)五年級(jí)學(xué)生的年級(jí)當(dāng)量為8,并不能說(shuō)他已經(jīng)掌握了8年級(jí)的課程。3.發(fā)展順序量表(ordinalscales)格塞爾發(fā)展順序量表格塞爾認(rèn)為,嬰幼兒的行為系統(tǒng)的建立是一個(gè)有次序的過(guò)程,反映了神經(jīng)系統(tǒng)的不斷成長(zhǎng)和功能的分化,因而可以把每個(gè)成熟階段的行為模式作為智能診斷的依據(jù)。4周不能控制頭部,仰臥姿勢(shì)左右不對(duì)稱(chēng)16周頸可豎直,頭微搖動(dòng),仰臥姿勢(shì)左右對(duì)稱(chēng)28周扶起獨(dú)坐,身體前傾40周可獨(dú)坐,爬行,扶著物件站立52周攙一手行走,搖擺皮亞杰量表用特定的任務(wù)來(lái)揭示兒童發(fā)展處于哪個(gè)階段。發(fā)展量表的優(yōu)點(diǎn):以年齡或年級(jí)當(dāng)量為單位來(lái)報(bào)告分?jǐn)?shù),易于被人理解??膳c同輩團(tuán)體做直接比較。為個(gè)人內(nèi)比較與縱向研究提供了基礎(chǔ)。缺點(diǎn):只適用于隨年齡發(fā)生系統(tǒng)變化的心理特質(zhì)的測(cè)量,對(duì)成人不合適。只適用于在典型環(huán)境下成長(zhǎng)的兒童。發(fā)展量表的單位在各年齡、各年級(jí)并不相等,無(wú)法做代數(shù)運(yùn)算。獲得同樣的年齡或年級(jí)當(dāng)量分?jǐn)?shù),并不一定具有相同的智力或?qū)W業(yè)成就。(二)商數(shù)(quotient)1.比率智商IQ=100(MA/CA)缺點(diǎn):實(shí)齡是等距的,而智齡不等距(智力發(fā)展不是直線的)計(jì)算成人智商時(shí),以多大實(shí)齡作為除數(shù)?智力生長(zhǎng)何時(shí)達(dá)到頂點(diǎn)?不同年齡組,比率智商分?jǐn)?shù)具有不同的標(biāo)準(zhǔn)差,因而相同的比率智商對(duì)于不同年齡具有不同的意義。2.教育商數(shù)

EQ=100(EA/CA)兒童所受的教育相當(dāng)于某個(gè)年齡兒童所受教育的平均水平,則他的教育年齡就是幾歲。3.成就商數(shù)AQ=100(EQ/IQ)用于說(shuō)明智力發(fā)展與教育發(fā)展是否同步。(三)百分位1百分等級(jí)(percentilerank)概念某個(gè)分?jǐn)?shù)的百分等級(jí)就是得分低于這個(gè)分?jǐn)?shù)的人數(shù)的百分比。百分等級(jí)指示個(gè)體在常模團(tuán)體中的相對(duì)位置。百分等級(jí)越低,個(gè)體所處的地位越低。計(jì)算(1)未分組分?jǐn)?shù)資料PR=100-(100R-50)/N(2)分組分?jǐn)?shù)資料PR=100/N[(X-L)f/i+Fb]2百分點(diǎn)相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。3十分位百分點(diǎn)將分?jǐn)?shù)分布分成100個(gè)等份。十分位是將分?jǐn)?shù)分成10個(gè)等份。十分位提供一個(gè)10級(jí)的等級(jí)量表,每一級(jí)包括10%的分?jǐn)?shù)。百分位的評(píng)價(jià)優(yōu)點(diǎn):容易計(jì)算,容易解釋。對(duì)于各種被試和各種測(cè)驗(yàn)普遍適用。缺點(diǎn):缺少相等單位,屬于順序量表,不能做加減乘除運(yùn)算。(四)標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)1Z分?jǐn)?shù)。Z=(X-X)/S不僅具有可比性,還具有可加性。Z=0SZ=1,-3~+3之間,約占總體的99.73%除了Z分?jǐn)?shù)外,還可以把Z分?jǐn)?shù)轉(zhuǎn)換成T分?jǐn)?shù)、標(biāo)準(zhǔn)九、離差智商等。轉(zhuǎn)換方法:線性轉(zhuǎn)換:從正態(tài)到正態(tài)非線性轉(zhuǎn)換:從偏態(tài)到正態(tài)(通過(guò)百分等級(jí))2T分?jǐn)?shù)紀(jì)念Terman和Thorndike。

T=10?Z+50平均數(shù)為50,標(biāo)準(zhǔn)差為103標(biāo)準(zhǔn)九(stanine)標(biāo)準(zhǔn)化九級(jí)分制標(biāo)準(zhǔn)九=5+2Z,即平均數(shù)為5,標(biāo)準(zhǔn)差為24離差智商(deviationIQ)IQ=100+15Z5CEEB分?jǐn)?shù)(CollegeEntranceExaminationBoard)美國(guó)大學(xué)入學(xué)考試委員會(huì)分?jǐn)?shù)

CEEB分?jǐn)?shù)=500+100Z6EPT分?jǐn)?shù)

EPT分?jǐn)?shù)=90+20Z標(biāo)準(zhǔn)分?jǐn)?shù)變式的評(píng)價(jià)優(yōu)點(diǎn):轉(zhuǎn)換成等距量表,使進(jìn)一步統(tǒng)計(jì)分析成為可能。都可以轉(zhuǎn)換成百分等級(jí),使得不同分?jǐn)?shù)之間可以進(jìn)行比較。缺點(diǎn):外行難以理解;如果非正態(tài)分布,不同變式的分?jǐn)?shù)之間無(wú)法比較與求和。三、呈現(xiàn)常模資料的方法(一)轉(zhuǎn)化表轉(zhuǎn)化表的3個(gè)基本要素:原始分、導(dǎo)出分、常模團(tuán)體的特征描述。1.簡(jiǎn)單轉(zhuǎn)化表2.復(fù)雜轉(zhuǎn)化表(二)剖析圖三)常態(tài)百分位圖表分?jǐn)?shù)以百分等級(jí)來(lái)表示,而分?jǐn)?shù)軸的距離以標(biāo)準(zhǔn)分?jǐn)?shù)為單位。把百分等級(jí)與標(biāo)準(zhǔn)分結(jié)合起來(lái)使用,具有雙重優(yōu)點(diǎn)。第二節(jié)參照標(biāo)準(zhǔn)的分?jǐn)?shù)解釋一、內(nèi)容參照分?jǐn)?shù)(contentreferencedsocre)內(nèi)容參照又叫范圍參照,是看被試對(duì)指定范圍中的內(nèi)容和技能掌握得如何。1掌握分?jǐn)?shù)(masteryscore)要想知道被試對(duì)一些基本的知識(shí)和技能是否掌握,需要制定一個(gè)最低的掌握標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)就是掌握分?jǐn)?shù)。如果一個(gè)人達(dá)到了這個(gè)分?jǐn)?shù),就說(shuō)明他已經(jīng)掌握了這種知識(shí)和技能。一般以80%~90%的正確回答作為最低標(biāo)準(zhǔn)。掌握測(cè)驗(yàn)只分掌握(通過(guò))和未掌握(未通過(guò)),沒(méi)有具體的得分。2正確百分?jǐn)?shù)如果需要了解被試對(duì)知識(shí)和技能的掌握程度,就需要報(bào)告被試在測(cè)驗(yàn)中的正確百分?jǐn)?shù)。正確百分?jǐn)?shù)=100?(答對(duì)題目數(shù)/總題目數(shù))3等級(jí)評(píng)定量表有些知識(shí)和技能是無(wú)法通過(guò)回答問(wèn)題來(lái)確定其水平,需要主試對(duì)被試的知識(shí)或技能進(jìn)行等級(jí)評(píng)定。如書(shū)法、繪畫(huà)、體育等。二、結(jié)果參照分?jǐn)?shù)(outcomereferencedscore)也叫效標(biāo)參照分?jǐn)?shù),即用效標(biāo)行為的水準(zhǔn)來(lái)表示的分?jǐn)?shù),用來(lái)對(duì)被試未來(lái)行為的預(yù)測(cè)。1期望結(jié)果的概率通過(guò)原始分或標(biāo)準(zhǔn)分來(lái)推測(cè)將來(lái)成功或失敗的概率。期望表期望圖2預(yù)期的效標(biāo)分?jǐn)?shù)回歸方程:GPA=0.11ACT-0.35第三節(jié)被試測(cè)驗(yàn)分?jǐn)?shù)的具體解釋測(cè)驗(yàn)分?jǐn)?shù)解釋的類(lèi)型:描述的解釋溯因的解釋預(yù)測(cè)的解釋評(píng)價(jià)的解釋分?jǐn)?shù)解釋的基本原則主試應(yīng)充分了解測(cè)驗(yàn)的性質(zhì)與功能。對(duì)導(dǎo)致測(cè)驗(yàn)結(jié)果的原因(遺傳、經(jīng)驗(yàn)、測(cè)驗(yàn)情景)的解釋要慎重,謹(jǐn)防片面極端。必須充分估計(jì)測(cè)驗(yàn)的常模和效度的局限性。解釋分?jǐn)?shù)應(yīng)參考其它有關(guān)資料(受教育經(jīng)歷、文化背景、面談內(nèi)容、習(xí)慣、態(tài)度、興趣、動(dòng)機(jī)、健康、言語(yǔ)能力以及其他測(cè)驗(yàn)資料)。對(duì)測(cè)驗(yàn)分?jǐn)?shù)應(yīng)以“一段分?jǐn)?shù)”來(lái)解釋?zhuān)粦?yīng)以“特定的數(shù)值”來(lái)解釋。對(duì)來(lái)自不同測(cè)驗(yàn)的分?jǐn)?shù)不能直接加以比較如何向受測(cè)者報(bào)告測(cè)驗(yàn)分?jǐn)?shù)使用當(dāng)事人所理解的語(yǔ)言。要保證當(dāng)事人知道這個(gè)測(cè)驗(yàn)測(cè)量或預(yù)測(cè)什么,但并不需要作詳細(xì)的技術(shù)性解釋。如果分?jǐn)?shù)是以常模為參照的,就要使當(dāng)事人知道他是和什么團(tuán)體在進(jìn)行比較。要使當(dāng)事人認(rèn)識(shí)到分?jǐn)?shù)只是一個(gè)估計(jì)。要使當(dāng)事人知道如何運(yùn)用他的分?jǐn)?shù)。要考慮測(cè)驗(yàn)分?jǐn)?shù)將給受測(cè)者帶來(lái)什么影響。測(cè)驗(yàn)結(jié)果應(yīng)向無(wú)關(guān)的人員保密。對(duì)低分者的解釋?xiě)?yīng)謹(jǐn)慎小心。報(bào)告測(cè)驗(yàn)分?jǐn)?shù)時(shí)應(yīng)設(shè)法了解當(dāng)事人的心理感受,并采取適當(dāng)?shù)拇胧┘右砸龑?dǎo)。第五章經(jīng)典測(cè)驗(yàn)理論的基本假設(shè)第一節(jié)心理特質(zhì)及其可測(cè)性假設(shè)一、心理特質(zhì)的含義心理特質(zhì)就是表現(xiàn)在一個(gè)人身上所特有的相對(duì)穩(wěn)定的行為方式。

一組內(nèi)部相關(guān)的行為的概括,如善良、聰明;

比較穩(wěn)定,對(duì)不同的刺激做相同的反應(yīng);

通過(guò)特質(zhì)可以對(duì)人的行為作出預(yù)測(cè);

特質(zhì)可以分為多個(gè)層次,智力可以分語(yǔ)言和操作,語(yǔ)言可以分為詞匯和文法。二、心理特質(zhì)的可測(cè)性

Thorndike“凡客觀存在的事物都有其數(shù)量?!?/p>

McCall“凡有數(shù)量的東西都可以測(cè)量?!钡诙?jié)測(cè)量誤差及其來(lái)源一、測(cè)量誤差的含義測(cè)量值與實(shí)際值的差異二、測(cè)量誤差的種類(lèi)系統(tǒng)誤差:測(cè)量工具本身引起的誤差(穩(wěn)定);隨機(jī)誤差:由不穩(wěn)定因素引起的誤差(不穩(wěn)定)。三、測(cè)量誤差的來(lái)源(一)測(cè)量工具(測(cè)驗(yàn)內(nèi)部)引起的誤差1題目取樣2指導(dǎo)語(yǔ)3難度4時(shí)限5測(cè)驗(yàn)復(fù)本不等值(二)由測(cè)量對(duì)象引起的誤差1測(cè)驗(yàn)的經(jīng)驗(yàn)2練習(xí)因素3應(yīng)試動(dòng)機(jī)4測(cè)驗(yàn)焦慮5反應(yīng)定勢(shì)6生理因素(三)由施測(cè)過(guò)程引起的誤差1物理環(huán)境2主試者方面3意外干擾4評(píng)分計(jì)分第三節(jié)真分?jǐn)?shù)及其有關(guān)的假設(shè)一、真分?jǐn)?shù)的含義真分?jǐn)?shù)(TrueScore):一個(gè)測(cè)量工具在沒(méi)有測(cè)量誤差時(shí),所得到的純正值。操作定義:經(jīng)過(guò)無(wú)數(shù)次測(cè)量所得到的平均值。觀察分?jǐn)?shù)(ObservedScore):二、數(shù)學(xué)模型及其假設(shè)X=T+E

測(cè)量誤差的假設(shè):Σ(X)=T或Σ(E)=0ρ(T,E)=0ρ(E1,E2)=0SX2=ST2+SE2ST2=SV2+SI2SX2=SV2+SI2+SE2第六章測(cè)量的信度第一節(jié)信度概述一、什么是信度?信度(reliability)是指測(cè)量結(jié)果的穩(wěn)定性程度,也叫測(cè)量的可靠性。操作定義:rxx=ST2/SE2

rXX=ρTX2

rXX=ρXX’注意:(1)信度指的是一組測(cè)驗(yàn)分?jǐn)?shù)或一系列測(cè)量的特性,而不是個(gè)人分?jǐn)?shù)的特性;(2)真分?jǐn)?shù)的變異數(shù)是不能直接測(cè)量的,因此信度是一個(gè)理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)作出估計(jì)。二、信度系數(shù)與信度指數(shù)信度指數(shù):相關(guān)系數(shù)信度系數(shù):相關(guān)系數(shù)的平方注意:(1)信度系數(shù)有多種。(2)同一種信度系數(shù)也會(huì)因樣本、測(cè)查時(shí)間不同而有多個(gè)。(3)信度系數(shù)只是對(duì)測(cè)量分?jǐn)?shù)一致性的估計(jì),但并沒(méi)有指出不一致的原因。(4)獲得較高的信度只是測(cè)驗(yàn)有效的必要條件。三、信度的作用信度是測(cè)量過(guò)程中所存在的隨機(jī)誤差大小的反映1.信度可以用來(lái)解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義SE=SX√1-rXX真分?jǐn)?shù)的置信區(qū)間(95%)=X±1.96SE2.信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較第二節(jié)信度的估計(jì)方法一、重測(cè)信度1.含義和計(jì)算重測(cè)信度(test-retestreliability)是指用同一量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)誤差來(lái)源:測(cè)量時(shí)間不同所帶來(lái)的隨機(jī)誤差2.使用的前提條件所測(cè)量的心理特質(zhì)必須是穩(wěn)定的;練習(xí)和遺忘的效果基本上相互抵消;在兩次施測(cè)的間隔時(shí)期內(nèi),被試在所要測(cè)查的心理特質(zhì)方面沒(méi)有獲得更多的學(xué)習(xí)和訓(xùn)練。二、復(fù)本信度1.含義和計(jì)算復(fù)本信度(Alternate-formreliability)是指兩個(gè)平行的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)等值性系數(shù):兩個(gè)復(fù)本測(cè)驗(yàn)是同時(shí)連續(xù)施測(cè)的穩(wěn)定等值系數(shù)(重測(cè)復(fù)本信度):兩個(gè)復(fù)本測(cè)驗(yàn)是相距一段時(shí)間分兩次施測(cè)的。2.使用的前提條件

兩測(cè)驗(yàn)真正平行;

被試要有條件接受兩個(gè)測(cè)驗(yàn)三、分半信度1.含義和計(jì)算分半信度(split-halfreliability)是指將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。校正后的皮爾遜積差相關(guān)系數(shù)校正公式:斯皮爾曼-布朗公式rxx=2rhh/(1+rhh常見(jiàn)的分半方法是按測(cè)題序號(hào)奇偶分半:

測(cè)驗(yàn)題目按某種順序(如難度)排列;

如果是隨機(jī)排列的題目,則必須是所有題目是平等的(要么難度相等,要么性質(zhì)一致,是測(cè)同一個(gè)心理特質(zhì)的);

如果測(cè)驗(yàn)有多個(gè)分量表,應(yīng)在分量表內(nèi)部排好順序,再把各分量表的兩半組合起來(lái)求相關(guān)。弗朗那根公式:rxx=2[1-(Sa2+Sb2)/Sx2]盧侖公式:rxx=1-Sd2/Sx2

2.使用的前提條件一個(gè)測(cè)驗(yàn)可以分為對(duì)等的兩半時(shí)四、同質(zhì)性信度1.含義同質(zhì)性信度(homogeneityreliability),也叫內(nèi)部一致性系數(shù),是指測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。2.計(jì)算及適用范圍rxx=K/rij[1+(K-1)rij]KR20公式:rxx=[K/(K-1)][1-(Σpiqi)/Sx2]pi為答對(duì)第i題的人數(shù)的比例;qi為答錯(cuò)第i題的人數(shù)的比例。K為題目數(shù),Sx2為測(cè)驗(yàn)總分的變異。KR21公式:rxx=[K/(K-1)][1-(Kpq)/Sx2]克龍巴赫α系數(shù):α=[K/(K-1)][1-(ΣSi2)/Sx2]菏伊特信度:rxx=1-MS人×題/MS人因素分析一般用于預(yù)測(cè)的測(cè)驗(yàn)或?qū)W績(jī)測(cè)驗(yàn)可不考慮同質(zhì)性。而驗(yàn)證理論構(gòu)想時(shí)必須考慮同質(zhì)性。因此,同質(zhì)性不但與信度有關(guān),還與效度有關(guān)。五、評(píng)分者信度1.含義和計(jì)算評(píng)分者信度(scorerreliability)是指多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。2人時(shí):相關(guān)系數(shù)多人時(shí):肯德?tīng)柡椭C系數(shù)W=12[ΣRi2-(ΣRi)2/N]/[K2(N3-N)](評(píng)分者人數(shù)K=3~20;被評(píng)者人數(shù)N=3~7時(shí),查W表檢驗(yàn))RI為第i個(gè)被試被評(píng)的水平等級(jí)之和若N>7,用χ2檢驗(yàn)。χ2=K(N-1)W,df=N-1若評(píng)分中有相同等級(jí)時(shí),需校正:W=12[ΣRi2-(ΣRi)2/N]/[K2(N2-N)-KΣΣ(n3-n)/12]第三節(jié)提高測(cè)量信度的方法一、影響測(cè)量信度的主要因素(一)被試方面被試團(tuán)體同質(zhì)性越高(個(gè)體差異越?。孟嚓P(guān)系數(shù)(信度)就越低。被試團(tuán)體異質(zhì)性越高(個(gè)體差異越大),所得相關(guān)系數(shù)(信度)就越高。

(二)主試方面

指導(dǎo)語(yǔ)、態(tài)度、期望、評(píng)分主觀等(三)施測(cè)情境四)測(cè)量工具測(cè)驗(yàn)長(zhǎng)度:測(cè)驗(yàn)越長(zhǎng),信度越高。測(cè)驗(yàn)難度:過(guò)難或過(guò)易都會(huì)使個(gè)體間得分差異減小,降低信度。測(cè)驗(yàn)內(nèi)容:試題取樣不當(dāng),內(nèi)部一致性低,題意模糊,信度則低。(五)兩次施測(cè)的間隔時(shí)間間隔時(shí)間越短,信度越高;間隔時(shí)間越長(zhǎng),信度越低。二、提高測(cè)量信度的常用方法1.適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度2.使測(cè)驗(yàn)中所有試題的難度接近正態(tài)分布,并控制在中等水平3.努力提高測(cè)驗(yàn)試題的區(qū)分度4.選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測(cè)驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度5.主試者嚴(yán)格執(zhí)行施測(cè)規(guī)程,評(píng)分者嚴(yán)格按照標(biāo)準(zhǔn)給分,施測(cè)場(chǎng)地按測(cè)驗(yàn)手冊(cè)的要求進(jìn)行布置,減少無(wú)關(guān)因素的干擾第四節(jié)信度的特殊問(wèn)題一、速度測(cè)驗(yàn)的信度問(wèn)題因?yàn)樗俣葴y(cè)驗(yàn)的題目難度都很低,所以不能用奇偶分半求分半信度;可以將測(cè)驗(yàn)分兩半來(lái)施測(cè)。因?yàn)閹缀醪豢赡馨杨}目做完,所以同質(zhì)性信度不適用??梢杂弥販y(cè)信度和復(fù)本信度。二、標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度問(wèn)題總體越同質(zhì),相關(guān)系數(shù)越低。所以,用通常的方法來(lái)算標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度是不適當(dāng)?shù)???梢杂脧?fù)本,通過(guò)人數(shù)的百分比差別越小,信度越高。三、分測(cè)驗(yàn)的信度除整個(gè)測(cè)驗(yàn)的信度外,各個(gè)分測(cè)驗(yàn)也應(yīng)有信度,否則,從分測(cè)驗(yàn)得分來(lái)做推論就會(huì)出問(wèn)題。四、差異的信度比較兩門(mén)課成績(jī)的差異,若兩門(mén)課的信度都不可靠時(shí),二者的差別更不可靠。五、行為改變(變遷)的測(cè)量行為改變:要求測(cè)驗(yàn)對(duì)分?jǐn)?shù)的差異越敏感越好信度:二者的矛盾難以調(diào)和信度好壞的判斷標(biāo)準(zhǔn)標(biāo)準(zhǔn)化能力或?qū)W績(jī)測(cè)驗(yàn):>0.90人格測(cè)驗(yàn):>0.80教師自編學(xué)績(jī)測(cè)驗(yàn):>0.60測(cè)驗(yàn)使用時(shí)的信度標(biāo)準(zhǔn)一般來(lái)說(shuō),當(dāng)信度<0.70,測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)與預(yù)測(cè),而且不能作團(tuán)體間比較;當(dāng)0.70≤信度<0.85時(shí),可用于團(tuán)體比較;當(dāng)信度≥0.85時(shí),才能用來(lái)鑒別或預(yù)測(cè)個(gè)人成績(jī)。第七章測(cè)量的效度第一節(jié)效度概述一、什么是效度效度(validity)是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度。(1)效度是一個(gè)相對(duì)的概念:每個(gè)測(cè)量工具都有自己的目的;內(nèi)隱特質(zhì)是通過(guò)外顯行為間接測(cè)得的。(2)效度是測(cè)量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。(3)判斷一個(gè)測(cè)量是否有效要從多方面收集證據(jù)操作定義:效度=SV2/SX2=rXY2二、效度與信度的關(guān)系(一)信度高是效度高的必要而非充分的條件一個(gè)測(cè)驗(yàn)效度高,其信度也必然高;但一個(gè)測(cè)驗(yàn)信度高,其效度不一定高。(二)測(cè)驗(yàn)的效度受它的信度制約rXY≤rXX一個(gè)測(cè)驗(yàn)的信度必然比效度高,至少相等。第二節(jié)內(nèi)容效度一、內(nèi)容效度的性質(zhì)內(nèi)容效度(contentvalidity)是指測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適當(dāng)程度,即一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程度。因此,一個(gè)測(cè)驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件:(1)要有定義完好的內(nèi)容范圍(2)測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。二、內(nèi)容效度的確定方法(一)邏輯分析法:專(zhuān)家判斷根據(jù)自己的知識(shí)經(jīng)驗(yàn)對(duì)量表的有效性(邏輯性)作出判斷,也稱(chēng)邏輯效度。為使內(nèi)容效度的判斷過(guò)程更客觀,一般采用下列步驟:①確定測(cè)驗(yàn)內(nèi)容的總體范圍;②編制雙向細(xì)目表;③編制評(píng)定量表,從測(cè)驗(yàn)內(nèi)容所測(cè)的技能、題目對(duì)所定義的范圍的覆蓋率、各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式的適當(dāng)性等方面,對(duì)測(cè)驗(yàn)作出總的評(píng)價(jià)。(二)統(tǒng)計(jì)方法:用兩個(gè)測(cè)驗(yàn)復(fù)本來(lái)測(cè)同一批被試,若相關(guān)高,則內(nèi)容效度可能高,但若相關(guān)低,則說(shuō)明必有一個(gè)測(cè)驗(yàn)缺乏內(nèi)容效度。

(三)經(jīng)驗(yàn)法:再測(cè)法前測(cè)→教學(xué)→后測(cè)如果后測(cè)成績(jī)優(yōu)于前測(cè)成績(jī),說(shuō)明該測(cè)驗(yàn)具有一定的內(nèi)容效度。三、內(nèi)容效度的特點(diǎn)和評(píng)價(jià)1.適用范圍:內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn),也適合于某些用于選拔和分類(lèi)的職業(yè)測(cè)驗(yàn)。但不適用于能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)。時(shí)間性2.缺乏理想的數(shù)量指標(biāo)3.內(nèi)容效度不是表面效度表面效度(surfacevalidity):外行人對(duì)某個(gè)測(cè)驗(yàn)從表面上看好像是測(cè)某種心理特質(zhì)的程度。并不是一種真正的效度。人格測(cè)驗(yàn)要求表面效度不宜過(guò)高。第三節(jié)結(jié)構(gòu)效度一、構(gòu)想效度的定義結(jié)構(gòu)效度(structurevalidity)是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說(shuō)測(cè)驗(yàn)分?jǐn)?shù)能夠說(shuō)明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。

特點(diǎn):(1)具有不同理論構(gòu)思的測(cè)驗(yàn),其結(jié)構(gòu)效度是無(wú)法進(jìn)行比較的;(2)結(jié)構(gòu)效度有時(shí)很難獲得;(3)結(jié)構(gòu)效度沒(méi)有單一的指標(biāo),是由各方面的證據(jù)累積起來(lái)進(jìn)行評(píng)價(jià)的。二、結(jié)構(gòu)效度的確定方法結(jié)構(gòu)效度確立的一般步驟:(1)提出理論框架;(2)依據(jù)理論框架推演出有關(guān)測(cè)驗(yàn)成績(jī)的假設(shè);(3)用邏輯或?qū)嵶C的方法來(lái)證明假設(shè)。具體方法:(1)測(cè)驗(yàn)內(nèi)部尋找證據(jù)法分析測(cè)驗(yàn)的內(nèi)容效度:若內(nèi)容效度高,說(shuō)明其結(jié)構(gòu)效度也高;分析被試對(duì)題目反應(yīng)的特點(diǎn):有無(wú)社會(huì)稱(chēng)許性的題目,如“當(dāng)事情不順我意時(shí),我時(shí)常動(dòng)怒?!睂?duì)該題的回答,也許反映不了要測(cè)的性格。計(jì)算測(cè)驗(yàn)的同質(zhì)性信度:分半信度、α系數(shù)、KR20、KR21(2)測(cè)驗(yàn)之間尋找證據(jù)法

相容效度:新老測(cè)驗(yàn)之間的相關(guān)(兩測(cè)驗(yàn)測(cè)的是同一心理特質(zhì))。若相關(guān)高,則說(shuō)明新測(cè)驗(yàn)可能有較高的效度。

區(qū)分效度:新老測(cè)驗(yàn)之間的相關(guān)(兩測(cè)驗(yàn)測(cè)的不是同一心理特質(zhì)),若相關(guān)低,則說(shuō)明新測(cè)驗(yàn)可能有較高的效度。

因素分析法:得出的因素符合理論的構(gòu)思,說(shuō)明效度高。(3)考察測(cè)驗(yàn)的實(shí)證效度法

根據(jù)效標(biāo)把被試分組,考察其得分差異。根據(jù)測(cè)驗(yàn)得分差異把被試分組,考察其所測(cè)特質(zhì)(行為表現(xiàn))的差異。(4)多種特質(zhì)-多種方法矩陣法方法:1、2、3特質(zhì):A、B、C(5)搜集某些變異上的證據(jù)智力隨年齡變化而變化三、對(duì)構(gòu)想效度的評(píng)價(jià)1.有些構(gòu)想概念模糊,缺乏一致的定義2.沒(méi)有明確的操作步驟與程序3.沒(méi)有單一的數(shù)量指標(biāo)第四節(jié)實(shí)證效度一、實(shí)證效度的定義實(shí)證效度是指一個(gè)測(cè)驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。被估計(jì)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱(chēng)效標(biāo)。所以,實(shí)證效度又稱(chēng)效標(biāo)關(guān)聯(lián)效度(criterion-relatedvalidity)。同時(shí)效度(concurrentvalidity):測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料是同時(shí)收集的。預(yù)測(cè)效度(predictivevalidity):先獲得測(cè)驗(yàn)分?jǐn)?shù),隔一段時(shí)間后,再收集效標(biāo)資料。二、效標(biāo)(1)效標(biāo)與效標(biāo)測(cè)量效標(biāo)(criterion)就是衡量一個(gè)測(cè)驗(yàn)是否有效的外在標(biāo)準(zhǔn)。觀念效標(biāo):理論定義,如“大學(xué)的成功”效標(biāo)測(cè)量:操作定義,如大學(xué)成績(jī)

常用的效標(biāo):學(xué)業(yè)成就、臨床診斷、實(shí)際工作表現(xiàn)、特殊訓(xùn)練成績(jī)、不同團(tuán)體的總體表現(xiàn)、先前有效的測(cè)驗(yàn)、等級(jí)評(píng)定。(2)效標(biāo)的特性a.多樣性:一個(gè)測(cè)驗(yàn)可能有不同的觀念效標(biāo),同一個(gè)觀念效標(biāo)又可能有不同的效標(biāo)測(cè)量。b.復(fù)雜性:幾乎每一種效標(biāo)行為都由多種特質(zhì)構(gòu)成,包含復(fù)雜的成分。c.特殊性:即使一個(gè)普通的效標(biāo),在應(yīng)用時(shí)也有特殊性。d.時(shí)間性:近期效標(biāo)與最后效標(biāo)(3)效標(biāo)測(cè)量的條件a.有效性:效標(biāo)測(cè)量能真正反映觀念效標(biāo)。b.可靠性:有較高的信度c.客觀性:效標(biāo)測(cè)量必須能真正反映觀念效標(biāo),防止效標(biāo)污染。

效標(biāo)污染(criterioncontamination)是指評(píng)定者知道被試的測(cè)驗(yàn)分?jǐn)?shù),因而影響到對(duì)效標(biāo)的客觀評(píng)定。d.實(shí)用性:經(jīng)濟(jì)實(shí)用三、實(shí)證效度的確定方法(1)相關(guān)法測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量之間的相關(guān)系數(shù)。(2)區(qū)分法測(cè)驗(yàn)→工作→效標(biāo)測(cè)量(工作成績(jī))按工作成績(jī)分高低兩組,如工作成績(jī)高,測(cè)驗(yàn)得分也高;工作成績(jī)低,測(cè)驗(yàn)得分也低,說(shuō)明該測(cè)驗(yàn)是有一定效度的。4)功利率對(duì)使用測(cè)驗(yàn)所需的費(fèi)用和所得到的收益進(jìn)行比較,看是否利大于弊。一個(gè)測(cè)驗(yàn)如果簡(jiǎn)單易行,省時(shí)省錢(qián),不經(jīng)過(guò)特殊訓(xùn)練的人也能掌握,又適合于團(tuán)體施測(cè),那么,即使效度低一些,也會(huì)有人使用。反之,只有效度極高,能給人帶來(lái)很大好處時(shí),才會(huì)使用。第五節(jié)提高測(cè)量效度的方法一、影響測(cè)量效度的因素1.測(cè)驗(yàn)的構(gòu)成測(cè)驗(yàn)長(zhǎng)度與效度的關(guān)系:

r(Kx)y=Krxy/√K(1-rxx+Krxx)2.測(cè)驗(yàn)的實(shí)施過(guò)程3.接受測(cè)驗(yàn)的被試常模團(tuán)體的同質(zhì)性影響到對(duì)被試測(cè)驗(yàn)得分的解釋?zhuān)M(jìn)而影響到測(cè)驗(yàn)的效度。測(cè)驗(yàn)偏倚(testbias)是指用不適用于被試的標(biāo)準(zhǔn)來(lái)解釋被試的測(cè)驗(yàn)得分,因而造成解釋的偏差。4.所選效標(biāo)的性質(zhì)測(cè)量行為與所選效標(biāo)的相似性越高,效度越高。測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)行為之間是否是線性關(guān)系,如果不是線性關(guān)系,求皮爾遜相關(guān)就會(huì)低估效度。效標(biāo)本身的測(cè)量越可靠,效度就可能越高。5.測(cè)量的信度二、提高測(cè)量效度的方法(1)精心編制測(cè)驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差(2)妥善組織測(cè)驗(yàn),控制隨機(jī)誤差(3)創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個(gè)被試都能發(fā)揮正常的水平(4)選好正確的效標(biāo),定好恰當(dāng)?shù)男?biāo)測(cè)量,正確地使用有關(guān)公式第六節(jié)效度資料的概化所謂概化,是指在一定條件下得出的結(jié)論能否適用于其他情況。測(cè)驗(yàn)的效度和信度一樣,都與特定情境有關(guān),只有在具體情境下的效度,而沒(méi)有籠統(tǒng)談?wù)撃骋粶y(cè)驗(yàn)的效度。一、效度概化的幾個(gè)方面1預(yù)測(cè)源的概化使用同一測(cè)驗(yàn)的不同復(fù)本是否同樣有效?同一測(cè)驗(yàn)對(duì)不同分?jǐn)?shù)水平的人的預(yù)測(cè)是否同樣有效?2效標(biāo)的概化采用不同種類(lèi)或不同時(shí)距的效標(biāo),測(cè)驗(yàn)是否同樣有效?對(duì)于效標(biāo)的不同分?jǐn)?shù)水平是否預(yù)測(cè)得一樣好?3施測(cè)情境的概化不同的施測(cè)者、不同的施測(cè)條件以及在不同的指導(dǎo)語(yǔ)或心向下做測(cè)驗(yàn)是否同樣有效?4被試團(tuán)體的概化測(cè)驗(yàn)對(duì)于取自同一總體的另一樣本是否同樣有效?測(cè)驗(yàn)對(duì)于不同性別、不同年齡、不同教育水平、不同社會(huì)經(jīng)濟(jì)地位、不同地區(qū)、不同民族、不同學(xué)校、不同職業(yè)的被試是否同樣有效?5建立效度方法的概化用不同方法得到的效度指標(biāo)是否一致?不同的效度之間是否有矛盾?二、交叉效度分析交叉效度分析是考察效度概化能力的一種方法,只涉及被試樣本的概化。這種方法是對(duì)兩個(gè)獨(dú)立取自同一總體的樣本分別建立預(yù)測(cè)源-效標(biāo)關(guān)系,看從一個(gè)樣本中得到的效度資料是否適用于另一樣本。計(jì)算測(cè)驗(yàn)效度所依據(jù)的樣本必須與選擇項(xiàng)目所依據(jù)的被試樣本不同。如果使用同一樣本,則會(huì)使效度系數(shù)假性的高。實(shí)質(zhì)是循環(huán)論證。第八章測(cè)驗(yàn)的項(xiàng)目分析項(xiàng)目分析包括定性分析和定量分析。定性分析包括考慮內(nèi)容效度、題目編寫(xiě)的恰當(dāng)性和有效性等;定量分析主要是指題目難度和區(qū)分度的測(cè)量。對(duì)項(xiàng)目進(jìn)行篩選和修訂,可以提高測(cè)驗(yàn)的信度和效度。第一節(jié)測(cè)驗(yàn)的難度一、難度(difficulty)的意義難度,指項(xiàng)目的難易程度。在最高作為測(cè)驗(yàn)中,稱(chēng)為“難度”,而在典型作為測(cè)驗(yàn)中,則指“通俗性”。兩者都是指在總體中,能夠正確或確切回答某項(xiàng)目的人數(shù)。二、難度的計(jì)算(一)二分法記分項(xiàng)目的難度1.通過(guò)率

P=R/N

2.極端分組法(上下27%)

P=(PH+PL)/2(二)非二分法記分項(xiàng)目的難度

P=X/XmaxX為所有被試在該項(xiàng)目上的平均得分,Xmax為該項(xiàng)目的滿分。三、測(cè)驗(yàn)難度水平的確定效標(biāo)參照測(cè)驗(yàn)、掌握測(cè)驗(yàn):不考慮難度;選拔測(cè)驗(yàn):難度=錄取率;

對(duì)于選擇題來(lái)說(shuō),難度一般應(yīng)大于猜測(cè)概率;無(wú)論是速度測(cè)驗(yàn),還是難度測(cè)驗(yàn),一般都應(yīng)防止被試得滿分,因?yàn)闈M分的意義是不明確的。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論