戴海崎心理與教育測量第4版課后習(xí)題答案_第1頁
戴海崎心理與教育測量第4版課后習(xí)題答案_第2頁
戴海崎心理與教育測量第4版課后習(xí)題答案_第3頁
戴海崎心理與教育測量第4版課后習(xí)題答案_第4頁
戴海崎心理與教育測量第4版課后習(xí)題答案_第5頁
已閱讀5頁,還剩72頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1章心理與教育測量概論1.掌握以下基本概念和術(shù)語:(1)測量答:測量是指依據(jù)一定的法則使用量尺對事物的屬性進(jìn)行定量描述的過程?!耙欢ǖ姆▌t”是指任何測量都要建立在某種科學(xué)規(guī)則和科學(xué)原理基礎(chǔ)之上,并通過科學(xué)的方法和程序完成測量過程?!笆挛锏膶傩浴笔侵杆獪y量的客體或事件的特定特征。“量尺”是指測量中所使用的度量工具?!岸棵枋觥笔侵笢y量的結(jié)果總是對事物屬性的量的確定。(2)心理測量答:心理測量是指依據(jù)一定的心理學(xué)理論在測驗(yàn)上對人的心理特質(zhì)進(jìn)行定量描述的過程。心理測量依據(jù)的法則在相當(dāng)程度上是一種理論,很難達(dá)到如同物理測量依據(jù)的法則那樣普遍被研究者共同接受的科學(xué)水平。心理測量的對象是人的心理特質(zhì)。心理測量的量尺是由有關(guān)領(lǐng)域的專家經(jīng)過長期的編制、試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測驗(yàn),它的編制是一項(xiàng)高度專門化的系統(tǒng)工作,要達(dá)到科學(xué)所要求的水平絕非易事。心理測量的目標(biāo)雖然是對人的心理特質(zhì)進(jìn)行定量分析,但這種定量分析的精確度遠(yuǎn)不及物理測量的精確度。(3)絕對參照點(diǎn)答:測量的參照點(diǎn)是指在測量工作中,測量前測量對象的數(shù)量的固定原點(diǎn)。參照點(diǎn)可分為絕對參照點(diǎn)和相對參照點(diǎn)。絕對參照點(diǎn)以絕對的零點(diǎn)作為測量的起點(diǎn)。絕對參照點(diǎn)是最為理想的測量參照點(diǎn),因?yàn)樗囊饬x最為明確。(4)相對參照點(diǎn)答:測量的參照點(diǎn)是指在測量工作中,測量前測量對象的數(shù)量的固定原點(diǎn)。參照點(diǎn)可分為絕對參照點(diǎn)和相對參照點(diǎn)。相對參照點(diǎn)以人為確定的零點(diǎn)作為測量的起點(diǎn)。最為理想的測量參照點(diǎn)當(dāng)然是絕對參照點(diǎn),因?yàn)樗囊饬x最為明確。在人們難以找到絕對參照點(diǎn)的情況下,就必須改用相對參照點(diǎn)。這種情況是很常見的。(5)稱名量表答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表、順序量表、等距量表和比率量表。其中稱名量表只是用數(shù)字代表事物的成分或用數(shù)字對事物進(jìn)行分類。稱名量表又可細(xì)分為兩種形式:一是命名量表;二是類別量表。適合對稱名量表進(jìn)行統(tǒng)計(jì)分析的統(tǒng)計(jì)方法有百分比、次數(shù)、眾數(shù)和χ2檢驗(yàn)。(6)順序量表答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表、順序量表、等距量表和比率量表。其中順序量表中的數(shù)字與實(shí)數(shù)軸中的數(shù)值具有相同的順序性,即不同的數(shù)字可表示測量對象的等級(jí)、大小和程度的差異,但它既沒有相等距離的單位,也沒有固定的測量原點(diǎn)。換言之,它既不表示事物特征的真正數(shù)量,也不表示絕對的數(shù)值,因此不能進(jìn)行代數(shù)運(yùn)算。適合于對順序量表進(jìn)行統(tǒng)計(jì)分析的統(tǒng)計(jì)方法有中位數(shù)、百分位數(shù)、等級(jí)相關(guān)系數(shù)和肯德爾和諧系數(shù)等。(7)等距量表答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表、順序量表、等距量表和比率量表。其中等距量表不僅能夠指代事物的類別和等級(jí),而且具有相等距離的測量單位。等距量表的數(shù)字是一個(gè)真正的數(shù)量,這個(gè)數(shù)量中各個(gè)部分的單位是相等的,因此就可以對其進(jìn)行加減運(yùn)算。等距量表沒有絕對的零點(diǎn),它的零點(diǎn)是人為假定的相對零點(diǎn)。適合于對等距量表進(jìn)行統(tǒng)計(jì)分析的統(tǒng)計(jì)方法有平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)、等級(jí)相關(guān)系數(shù)以及t檢驗(yàn)和F檢驗(yàn)。(8)比率量表答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表、順序量表、等距量表和比率量表。其中比率量表是最完善的測量量表,因?yàn)樗司哂蓄悇e、等級(jí)和等距的特征外,還具有絕對的零點(diǎn)或固定的原點(diǎn)。適合于對比率量表進(jìn)行統(tǒng)計(jì)分析的統(tǒng)計(jì)方法除了與等距量表相同的之外,還有幾何平均數(shù)、變異系數(shù)等。(9)標(biāo)準(zhǔn)化測驗(yàn)答:標(biāo)準(zhǔn)化是編制測驗(yàn)的一個(gè)重要步驟,也是測驗(yàn)的重要條件。為了使接受測量的不同個(gè)人所獲得的分?jǐn)?shù)有比較的可能性,測驗(yàn)的條件必須對所有的個(gè)人都是相同的。測驗(yàn)的標(biāo)準(zhǔn)化就是指測驗(yàn)的編制、實(shí)施、記分以及測量分?jǐn)?shù)的解釋的程序的一致性。測驗(yàn)的標(biāo)準(zhǔn)化需要具備下列要件:測驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化、施測條件的標(biāo)準(zhǔn)化、評(píng)分規(guī)則的標(biāo)準(zhǔn)化、測驗(yàn)常模的標(biāo)準(zhǔn)化。2.心理測量的精度受哪些因素的影響?為什么心理測量的精度遠(yuǎn)不如物理測量的精度高?答:(1)測量精度影響因素測量的精確度既與測量對象的性質(zhì)有關(guān),也同測量時(shí)所用的工具有關(guān)。①測量的精確度決定于測量對象本身的性質(zhì)??筛鶕?jù)測量對象的性質(zhì)把它分為三種類型:確定型、隨機(jī)型、模糊型。②測量的精確度決定于測量工具(量尺)的精密性。盡可能使用精密的測量工具,是保證測量精確度的重要條件。(2)心理測量的精度遠(yuǎn)不如物理測量的精度高的原因①心理與教育測量的對象是人的心理特質(zhì)和教育成就。由于心理特質(zhì)不能直接測量,研究者只能通過觀測人的外部行為的差異測量出人的心理特質(zhì)的差異。這注定了心理測量的精度不如物理測量的精度高。②心理與教育測量的量尺是由有關(guān)領(lǐng)域的專家經(jīng)過長期的編制、試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測驗(yàn),它的編制是一項(xiàng)高度專門化的系統(tǒng)工作,要達(dá)到科學(xué)所要求的水平絕非易事。3.斯蒂文斯(Stevens)區(qū)分測量量表的依據(jù)是什么?為什么對于基于等距量表的測量分?jǐn)?shù)不能進(jìn)行四則混合運(yùn)算?答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表,順序量表,等距量表和比率量表。其中等距量表不僅能夠指代事物的類別和等級(jí),而且具有相等距離的測量單位。等距量表的數(shù)字是一個(gè)真正的數(shù)量,這個(gè)數(shù)量中各個(gè)部分的單位是相等的,因此就可以對其進(jìn)行加減運(yùn)算。但等距量表沒有絕對的零點(diǎn),它的零點(diǎn)是人為假定的相對零點(diǎn),所以不能對其進(jìn)行乘除運(yùn)算。因而也就不能對其進(jìn)行四則混合運(yùn)算。4.在同物理測量的比較中闡明心理測量的特點(diǎn)。答:與物理測量相比較,心理測量的特點(diǎn)主要包括以下幾點(diǎn):(1)心理測量具有相對性。心理測量依據(jù)的法則在很大程度上只是一種理論,很難達(dá)到如同物理測量依據(jù)的法則那樣普遍被人們接受的水平。從一種智力測驗(yàn)上得到的測量分?jǐn)?shù)與從另一種智力測驗(yàn)上得到的測量分?jǐn)?shù)可能具有不同的意義,這種情況在人格測量領(lǐng)域表現(xiàn)得更加明顯。(2)心理測量具有間接性。心理測量的對象是人的心理特質(zhì)。心理特質(zhì)具有內(nèi)隱性,只能通過測量個(gè)人在特定情境中的外顯行為來推斷他的心理特質(zhì),不可能像物理測量中測量重量或長度那樣直接測量人的心理特質(zhì)的量,這就決定了心理測量只能是一種間接測量。(3)心理測量具有客觀性。心理測量的量具是由有關(guān)領(lǐng)域的專家編制,經(jīng)過長期的試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測驗(yàn)。(4)心理測量的目標(biāo)雖然是對人的心理特質(zhì)進(jìn)行定量分析,但這種定量分析的精確度遠(yuǎn)不及物理測量的精確度高。5.為什么說心理與教育測驗(yàn)的分?jǐn)?shù)本質(zhì)上是基于順序量表的分?jǐn)?shù)?答:量表是指能夠使事物的特征數(shù)量化的數(shù)字連續(xù)體。斯蒂文斯根據(jù)測量中使用的不同參照點(diǎn)和單位,區(qū)分出四種不同水平的測量量表:稱名量表,順序量表,等距量表和比率量表。其中順序量表中的數(shù)字與實(shí)數(shù)軸中的數(shù)值具有相同的順序性,即不同的數(shù)字可表示測量對象的等級(jí)、大小和程度的差異,但它既沒有相等距離的單位.也沒有固定的測量原點(diǎn)。換言之,它既不表示事物特征的真正數(shù)量,也不表示絕對的數(shù)值,因此不能進(jìn)行代數(shù)運(yùn)算。從本質(zhì)上講,心理與教育測量的量表屬于順序量表。這是因?yàn)椋?)教育測量和心理測量領(lǐng)域的參照點(diǎn)均為相對參照點(diǎn)。例如,在學(xué)期末的學(xué)科考試中,通常的做法是把學(xué)生的成績確定在0~100分之間。顯然,這個(gè)“0”是命題人人為假定的測量起點(diǎn)。因?yàn)榧词鼓成谠撛嚲砩系昧?分,也不能說該生在本學(xué)期內(nèi)沒有學(xué)到任何知識(shí),或者說該生的知識(shí)水平為“零”。(2)教育與心理測量的單位遠(yuǎn)沒有其他測量的單位成熟和完善。①心理與教育測量所使用的單位意義不太明確。例如,在各種形式的考試中,雖然使用的單位都是“分”,但實(shí)際上,數(shù)學(xué)考試中的“分”和語文考試中的“分”意義是不相同的。學(xué)生在不同學(xué)科上的考試成績所反映的不是同一個(gè)領(lǐng)域的知識(shí)水平。②心理與教育測量中的單位常常不等值。例如,同一次數(shù)學(xué)考試,學(xué)生做對一道較簡單的題目,得到1分,同樣做對一道較復(fù)雜的題目,也得到1分。從表面上看,前者的1分和后者的1分是等值的,但實(shí)際上,它們所反映的學(xué)生的知識(shí)水平是不相等的。6.為什么人們不像接受物理測量那樣容易接受心理測量?如何才能證明心理測量的必要性和可能性?答:(1)人們不像對物理測量那樣容易接受心理測量,究其原因在于心理測量有太多的不確定性:①心理測量依據(jù)的法則在很大程度上只是一種理論,很難達(dá)到如同物理測量依據(jù)的法則那樣普遍被人們接受的水平。②心理測量的對象是人的心理特質(zhì),而心理特質(zhì)的含義比較模糊,不能給出一個(gè)清晰的界定,具有內(nèi)隱性,只能通過個(gè)體的外在行為表現(xiàn)來予以測量,而重量和長度是客觀存在的,可以通過工具直接測量。③心理與教育測量的量具是由有關(guān)領(lǐng)域的專家編制,經(jīng)過長期的試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測驗(yàn)。它的編制是一項(xiàng)高度專門化的系統(tǒng)工作,要達(dá)到科學(xué)所要求的水平絕非易事。④心理測量的目標(biāo)雖然是對人的心理特質(zhì)進(jìn)行定量分析,但這種定量分析的精確度遠(yuǎn)不及物理測量的精確度高。基于上述原因,人們對心理測量的接受程度不如物理測量,盡管如此,心理測量的存在具有必要性與可能性。(2)以下觀點(diǎn)可以證明心理測量的必要性和可能性:①必要性a.人的心理現(xiàn)象和知識(shí)水平如同其他一切物理現(xiàn)象一樣是有差異的,這種差異不僅包含質(zhì)的方面,也包含量的方面。因?yàn)橛胁町悾杂斜匾獪y定差異的數(shù)量,描述差異的程度。b.心理與教育測量的準(zhǔn)確性、可靠性和精確度如同其他一切測量技術(shù)一樣是相對的,也同其他一切測量技術(shù)一樣必然隨著科學(xué)技術(shù)的進(jìn)步和發(fā)展而逐步提高。②可能性a.1918年,桑代克曾提出,“凡客觀存在的事物都有其數(shù)量”。1939年,麥柯爾進(jìn)一步指出,“凡有其數(shù)量的事物都可以測量”。這兩個(gè)命題被公認(rèn)為是心理與教育測量的理論基礎(chǔ)。b.任何事物都是質(zhì)和量的統(tǒng)一,事物的質(zhì)的差異是分類的前提,而事物的量的差異則是測量的前提。這里的“事物”不僅指外在的客觀現(xiàn)象,也指人內(nèi)在的主觀現(xiàn)象。c.心理特質(zhì)和知識(shí)水平雖然不能直接測量,卻必然要表現(xiàn)于人的外部行為之中,并調(diào)節(jié)著人的外部行為。因此,通過觀測人的外部行為的差異就有可能測量出人的心理特質(zhì)和知識(shí)水平的差異。7.什么是測驗(yàn)?測驗(yàn)標(biāo)準(zhǔn)化包括哪些要素?分別舉出三種以上有關(guān)學(xué)業(yè)成就、能力和人格領(lǐng)域的著名的標(biāo)準(zhǔn)化測驗(yàn)的名稱,并說明其理由。答:(1)測驗(yàn)的定義美國心理測量學(xué)家安娜斯塔西認(rèn)為,“心理測驗(yàn)實(shí)質(zhì)上是對行為樣本的客觀的和標(biāo)準(zhǔn)化的測量?!保?)測驗(yàn)標(biāo)準(zhǔn)化要素測驗(yàn)的標(biāo)準(zhǔn)化就是指測驗(yàn)的編制、實(shí)施、記分以及測量分?jǐn)?shù)的解釋的程序的一致性。測驗(yàn)的標(biāo)準(zhǔn)化需要具備下列要素:①測驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化的首要前提,是對所有接受測量的個(gè)人實(shí)施相同的或等值的測驗(yàn)內(nèi)容。測驗(yàn)內(nèi)容不同,所測得的結(jié)果便沒有可比較的基礎(chǔ)。②施測條件的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化的第二個(gè)條件,是對所有接受測量的個(gè)人必須在相同的施測條件下實(shí)施測驗(yàn)。其中包括:相同的測驗(yàn)情境;相同的指導(dǎo)語;相同的測驗(yàn)時(shí)限。③評(píng)分規(guī)則的標(biāo)準(zhǔn)化評(píng)分規(guī)則的標(biāo)準(zhǔn)化要求評(píng)分結(jié)果的客觀性,只有當(dāng)評(píng)分結(jié)果客觀時(shí),才能將測量分?jǐn)?shù)的差異歸于個(gè)人心理特質(zhì)和知識(shí)水平的差異。為此,測驗(yàn)中所制定的評(píng)分規(guī)則要足以使不同評(píng)分人的評(píng)分結(jié)果保持最大限度的一致。④測驗(yàn)常模的標(biāo)準(zhǔn)化。常模是一組有代表性的被試群體的平均測驗(yàn)分?jǐn)?shù),那么編制測驗(yàn)常模的關(guān)鍵是要抽取有代表性的被試樣本,它要求按照抽樣原則抽取樣本中的每一個(gè)個(gè)體。(3)舉例①斯坦福成就測驗(yàn)斯坦福成就測驗(yàn)屬于綜合性學(xué)績考查測驗(yàn),也是一種供團(tuán)體使用的常模參照性測驗(yàn)。該學(xué)績測驗(yàn)是一種組合式測驗(yàn),縱向可分成六個(gè)不同的級(jí)別水平,適用于1~9年級(jí)學(xué)生。橫向包括11個(gè)方面的科目內(nèi)容,分別為詞匯、閱讀理解、拼字、聽理解、詞匯學(xué)習(xí)技能、語言、數(shù)學(xué)概念、數(shù)學(xué)計(jì)算、數(shù)學(xué)應(yīng)用、社會(huì)科學(xué)常識(shí)和自然科學(xué)常識(shí)。這些科目內(nèi)容又分別組合成不同的分測驗(yàn)供實(shí)際使用。②瑞文推理測驗(yàn)瑞文推理測驗(yàn)是由英國心理學(xué)家瑞文編制的一種團(tuán)體智力測驗(yàn),又稱瑞文漸進(jìn)圖陣。它是非文字型的圖形測驗(yàn),分為三個(gè)水平:瑞文標(biāo)準(zhǔn)推理測驗(yàn);瑞文采圖推理測驗(yàn);瑞文高級(jí)推理測驗(yàn)。瑞文推理測驗(yàn)的測驗(yàn)對象不受文化、種族與語言等條件的限制,適用的年齡范圍從5歲半直至老年,而且不排除一些生理缺陷者。測驗(yàn)既可個(gè)別進(jìn)行,也可團(tuán)體實(shí)施,使用方便,省時(shí)省力,結(jié)果以百分等級(jí)常模解釋,直觀易懂。③卡特爾16種人格因素量表簡介卡特爾16種人格因素量表(簡稱16PF)是由美國伊利諾州立大學(xué)教授雷蒙德·卡特爾經(jīng)過系統(tǒng)觀察,科學(xué)實(shí)驗(yàn)以及因素分析統(tǒng)計(jì)后逐漸形成的。這一量表能在約45分鐘的時(shí)間內(nèi)測量出16種主要的人格特質(zhì)。初中以上文化程度的人均可接受本量表的測試。8.為什么說既不能高估也不能低估心理測量的作用?答:人們對心理與教育測驗(yàn)的爭論自測驗(yàn)問世以來就從未間斷。其極端看法要么高估測驗(yàn)的作用,把它奉為神明;要么貶低測驗(yàn)的作用,把它視為江湖騙術(shù)。這兩種態(tài)度都是極其錯(cuò)誤和不科學(xué)的。我們既不能高估也不能低估心理測量的作用。(1)不能低估的原因從心理學(xué)的發(fā)展歷史來看,心理測驗(yàn)是在心理學(xué)由思辨科學(xué)轉(zhuǎn)向?qū)嶒?yàn)科學(xué)后出現(xiàn)的。心理測驗(yàn)方法受到心理實(shí)驗(yàn)方法的影響,是對實(shí)驗(yàn)方法的有益補(bǔ)充,尤其是在研究人的較為復(fù)雜和高級(jí)的心理現(xiàn)象(如智力和人格)中,測驗(yàn)方法起到了實(shí)驗(yàn)方法所無法替代的作用。測驗(yàn)方法在客觀上為心理學(xué)的發(fā)展和進(jìn)步作出了重要貢獻(xiàn),并在眾多的應(yīng)用領(lǐng)域發(fā)揮了它的實(shí)際作用。(2)不能高估的原因心理與教育測驗(yàn)無論在理論上還是技術(shù)上都存在不少問題。一方面,測量技術(shù)的發(fā)展受理論研究水平的制約;另一方面,測量技術(shù)的應(yīng)用反過來促進(jìn)了理論研究的擴(kuò)展和深化。在心理學(xué)領(lǐng)域,智力測驗(yàn)的發(fā)展深化了對智力本質(zhì)及其結(jié)構(gòu)的認(rèn)識(shí),這也是人們公認(rèn)的客觀事實(shí)。因此,心理與教育測量工作者一方面要認(rèn)識(shí)到心理與教育測驗(yàn)既是從事心理學(xué)與教育學(xué)研究的一種重要方法,也是解決實(shí)際應(yīng)用問題的一種重要的輔助工具;另一方面也要充分考慮到目前的心理與教育測驗(yàn)的科學(xué)性還不夠高,有待在使用過程中進(jìn)一步改進(jìn)和完善。如同心理學(xué)的任何其他研究方法一樣,測驗(yàn)方法既有它的長處,又有它的不足。只有根據(jù)研究工作的需要將各種研究方法結(jié)合起來,才能對人的心理現(xiàn)象獲得相對全面的認(rèn)識(shí)。在運(yùn)用測驗(yàn)解決實(shí)際問題時(shí),使用者應(yīng)當(dāng)記住測量結(jié)果(分?jǐn)?shù))只是對人的智力和人格的相對估計(jì),而不是一個(gè)十分精確的數(shù)值。在解釋個(gè)人測量分?jǐn)?shù)并以此分?jǐn)?shù)為依據(jù)對個(gè)人的未來作預(yù)測時(shí)應(yīng)當(dāng)特別小心謹(jǐn)慎。9.為什么要控制使用心理測驗(yàn)?控制使用心理測驗(yàn)的主要要求是什么?答:所謂對測驗(yàn)的控制使用,是指并非所有的人都可以接觸和使用測驗(yàn),測驗(yàn)的使用者必須是經(jīng)過專業(yè)訓(xùn)練和具有一定資格的人員。(1)控制使用心理測驗(yàn)的原因?qū)y驗(yàn)之所以要控制使用,是為了保證測驗(yàn)的實(shí)施,對測驗(yàn)分?jǐn)?shù)的解釋既做到合乎科學(xué),又對受測者未來的成長有益。在測驗(yàn)工作中,人們也常碰到類似這樣的情況:一個(gè)女青年愁眉苦臉地來找心理咨詢工作者訴說:“有人給我作了一個(gè)人格測驗(yàn),說我的神經(jīng)質(zhì)分?jǐn)?shù)高。此后,我就經(jīng)常心神不寧,寢食不安?!憋@然,這是由于測驗(yàn)人員缺乏專業(yè)知識(shí),對測驗(yàn)結(jié)果解釋不當(dāng)而給受測者造成心理負(fù)擔(dān)。(2)控制使用心理測驗(yàn)的主要要求①為了保證對測驗(yàn)的控制使用,《心理測驗(yàn)管理?xiàng)l例》對測驗(yàn)使用人員的資格作了規(guī)定:“測驗(yàn)使用人員的資格證書分為甲、乙、丙三種。甲種證書僅授予主要從事心理測量研究與教學(xué)工作的高級(jí)專業(yè)人員,持此種證書者具有心理測驗(yàn)的培訓(xùn)資格。乙種證書授予經(jīng)過心理測量系統(tǒng)理論培訓(xùn)并通過考試,具有一定使用經(jīng)驗(yàn)的人。丙種證書為特定心理測驗(yàn)的使用資格證書,此種證書需注明所培訓(xùn)使用的測驗(yàn)名稱,只證明持有者具有使用該測驗(yàn)的資格?!保ǖ?2條)“申請獲得甲種證書應(yīng)具有副高以上職稱和5年以上心理測驗(yàn)實(shí)踐經(jīng)驗(yàn),需由本人提出申請,經(jīng)2名心理學(xué)教授推薦,由中國心理學(xué)會(huì)心理測量專業(yè)委員會(huì)統(tǒng)一審查核發(fā)?!保ǖ?3條)“申請獲得乙種和丙種證書需滿足以下條件之一:①心理專業(yè)本科以上畢業(yè);②具有大專以上(含)學(xué)歷,接受過中國心理學(xué)會(huì)心理測量專業(yè)委員會(huì)備案并認(rèn)可的心理測量培訓(xùn)班培訓(xùn),且考核合格?!保ǖ?4條)②同時(shí),《心理測驗(yàn)工作者職業(yè)道德規(guī)范》對測驗(yàn)分?jǐn)?shù)的解釋原則也作了規(guī)定:“使用心理測驗(yàn)需要充分考慮測驗(yàn)結(jié)果的局限性和可能的偏差,謹(jǐn)慎解釋測驗(yàn)的結(jié)果和效能,既要考慮測驗(yàn)的目的,也要考慮影響測驗(yàn)結(jié)果和效能的多方面因素,如環(huán)境、語言、文化、受測者個(gè)人特征、狀態(tài)等”(第6條);“應(yīng)以正確的方式將測驗(yàn)結(jié)果告知受測者。應(yīng)充分考慮到測驗(yàn)結(jié)果可能造成的傷害和不良后果,保護(hù)受測者或相關(guān)人免受傷害”(第7條);“評(píng)分和解釋要采取合理的步驟確保受測者得到真實(shí)準(zhǔn)確的信息,避免作出無充分根據(jù)的斷言”(第8條)。10.為什么在測驗(yàn)中要保護(hù)個(gè)人隱私?如何在測驗(yàn)中保護(hù)個(gè)人隱私?答:(1)保護(hù)個(gè)人隱私的原因在測驗(yàn)工作中,尤其是人格測驗(yàn)工作中經(jīng)常遇到的一個(gè)不可忽視的問題是侵犯受測者的個(gè)人隱私問題。例如,在編制關(guān)于情緒、動(dòng)機(jī)或態(tài)度等測驗(yàn)時(shí),其中有的內(nèi)容會(huì)涉及人們的家庭關(guān)系、內(nèi)心沖突、私人生活等問題。在日常生活中,人們一般不愿意向他人透露這些事情,而在測驗(yàn)條件下,為了尋求幫助,或配合測驗(yàn),很可能表露出來。這種情況在能力測驗(yàn)中同樣存在。因?yàn)槿魏沃橇Φ摹⒛芰Φ幕虺删偷臏y驗(yàn)都會(huì)顯示出一個(gè)人的某種限度和缺陷,而在一般情況下,人們是不愿意透露這些缺陷的。即使在測驗(yàn)條件下,受測者也會(huì)產(chǎn)生顧慮。在這種情況下,保護(hù)受測者的個(gè)人隱私就成為測驗(yàn)工作者的一項(xiàng)重要責(zé)任。(2)保護(hù)個(gè)人隱私的措施①只有在必要的情況下,測驗(yàn)工作者才能詢問個(gè)人隱私,凡是與測驗(yàn)?zāi)康臒o關(guān)的方面就不應(yīng)涉及;②保證為受測者保密,并在實(shí)際上為受測者嚴(yán)守秘密;③凡必須涉及個(gè)人隱私的測驗(yàn)應(yīng)事先征得受測者本人或其他有關(guān)人員的同意。第2章心理與教育測量簡史1.簡述古代中國心理與教育測量思想的特點(diǎn)及其貢獻(xiàn)。答:(1)古代中國社會(huì)心理與教育測量的特點(diǎn)①中國古代社會(huì)的心理與教育測量思想都是描述性的,而非定量的。這當(dāng)然和當(dāng)時(shí)的整個(gè)科學(xué)技術(shù)水平是相適應(yīng)的。②中國古代社會(huì)的心理與教育測量是分類式的。就能力測量和成就測量而言,是分成高、中、低幾個(gè)層次;就性格測量而言,是分成若干種類型。③在中國古代社會(huì)的心理與教育測量思想中注重對人作整體的鑒定和評(píng)價(jià),并傾向于和人的道德品質(zhì)聯(lián)系起來。④中國古代社會(huì)的心理與教育測量思想與教育中的因材施教及人才使用有著密切的聯(lián)系,它一開始就具有強(qiáng)烈的應(yīng)用性質(zhì)。(2)古代中國對心理與教育測量的貢獻(xiàn)①在測量實(shí)踐方面a.能力測量孔子在教育實(shí)踐中憑借自己的經(jīng)驗(yàn)觀察首先評(píng)定學(xué)生能力的個(gè)別差異,并將人的智力分成三個(gè)等級(jí)。漢代學(xué)者董仲舒已論及注意測驗(yàn):“一手畫方,一手畫圓,莫能成。”三國時(shí)期劉邵的《人物志》可以認(rèn)為是一部研究能力的專門著作。6世紀(jì)中葉,中國江南就有了“周歲試兒”習(xí)俗。出現(xiàn)于清代的益智圖(俗稱七巧板)、九連環(huán)可以認(rèn)為是最早的創(chuàng)造力測驗(yàn)。b.人格測量孔子也提出了性格類型的觀點(diǎn):“不得中行而與之,必也狂狷乎?狂者進(jìn)取,狷者有所不為也?!卑讶朔殖?種:狂者、狷者和中行者。劉邵根據(jù)陰陽、五行和形體的關(guān)系及其人的行為表現(xiàn),把人的性格劃分成12種類型。c.教育測量據(jù)迄今可考的史料分析,世界上最早的教育測量出現(xiàn)于中國西周奴隸制時(shí)期(公元前1100~前771年)。漢代在考試制度、考試類型和考試功能方面都作了重要的發(fā)展。取士制度自漢以來的發(fā)展,客觀上也對我國的古代乃至于西方的教育測量發(fā)展起了促進(jìn)作用。②在測量理論方面a.大思想家孟子指出了測量人類心理的必要性和可能性:“權(quán),然后知輕重;度,然后知長短。物皆然,心為甚?!眀.劉邵曾對人才鑒定的意義、可能、困難和方法作了系統(tǒng)的論述。2.從認(rèn)知心理學(xué)的觀點(diǎn)說明漢代董仲舒關(guān)于“一手畫方,一手畫圓,莫能成”的記述是注意分配測驗(yàn)。答:分配性注意是個(gè)體在同一時(shí)間對兩種或兩種以上的刺激進(jìn)行注意,或?qū)⒆⒁夥峙涞讲煌幕顒?dòng)中。注意分配的一個(gè)基本條件,就是同時(shí)進(jìn)行的幾種活動(dòng)的熟練程度或自動(dòng)化程度。如果人們對這幾種活動(dòng)都比較熟悉,其中有的活動(dòng)接近于自動(dòng)地進(jìn)行,那么注意的分配就較容易;相反,如果人們對要分配注意的幾種活動(dòng)都不熟悉,或者這些活動(dòng)都較復(fù)雜,那么分配注意就比較困難了。另外,注意的分配也和同時(shí)進(jìn)行的幾種活動(dòng)的性質(zhì)有關(guān)。一般來說,把注意同時(shí)分配在幾種動(dòng)作技能上比較容易,而把注意同時(shí)分配在幾種智力活動(dòng)上就難得多了。研究分配性注意最常用的方法是雙作業(yè)操作,即讓被試同時(shí)完成兩種作業(yè),觀察他們完成作業(yè)的情況。“一手畫方,一手畫圓”是兩種任務(wù),被試需要把注意力放到這兩種任務(wù)上。從認(rèn)知心理學(xué)的觀點(diǎn)來看,注意是一組對刺激進(jìn)行歸類和識(shí)別的認(rèn)知資源或認(rèn)知能力。對刺激的識(shí)別需要占用認(rèn)知資源,刺激或加工任務(wù)越復(fù)雜,占用的認(rèn)知資源就越多。認(rèn)知資源是有限的,當(dāng)認(rèn)知資源完全被占用時(shí),新的刺激將得不到加工(未被注意),也就是本題中的“莫能成”。3.為什么說益智圖和九連環(huán)是世界上最早的智力和創(chuàng)造力測驗(yàn)?答:(1)益智圖是將一塊正方形薄板截成形狀和大小不同的七塊小薄板,然后利用這七塊小薄板組置拼排成上百種不同的動(dòng)植物圖案和其他實(shí)物圖案。例如,可以將七巧板拼排成“心”字、跑步狀、騎馬狀、帆船、鵝等。這種圖案組合方法既是一種兒童娛樂工具,也是一種非文字的智力測驗(yàn),與現(xiàn)在的發(fā)散思維測驗(yàn)完全一致。(2)九連環(huán)是由九個(gè)金屬絲環(huán)組成,套在條形橫板或各種框架上,形成一劍形框柄,九個(gè)絲環(huán)可合可分,用于檢測一個(gè)人思維的創(chuàng)造性、靈活性、敏捷性等品質(zhì),以及動(dòng)作技巧的熟練程度。后來,劉湛恩用英文撰寫了《中國人用的非文字智力測驗(yàn)》一文,將七巧板、九連環(huán)介紹到國外。美國心理學(xué)家武德沃斯(Woodworth)對九連環(huán)極為贊賞,把它視為“中國式的迷津”。19世紀(jì)20年代,美國哥倫比亞大學(xué)心理學(xué)教授魯格爾(Ruger)將九連環(huán)作為心理實(shí)驗(yàn)項(xiàng)目,并撰寫了《中國連環(huán)的解脫》(TheChineseRingPuzzles)一書。所以說益智圖和九連環(huán)是世界上最早的智力和創(chuàng)造力測驗(yàn)。4.如何理解孔子關(guān)于“不得中行而與之,必也狂狷乎?狂者進(jìn)取,狷者有所不為也”的言論是人格類型思想的最早雛形?答:“不得中行而與之,必也狂狷乎?狂者進(jìn)取,狷者有所不為也。”這是孔子提出的關(guān)于性格類型的觀點(diǎn)。這里,孔子顯然把人分成三種:狂者(以積極進(jìn)取、敢作敢為為特征)、狷者(以拘謹(jǐn)膽怯、唯唯諾諾為特征)和中行者(介于狂者與狷者之間,不偏不倚)。很明顯,孔子的“狂者”相當(dāng)于之后提出的外傾型,“狷者”相當(dāng)于內(nèi)傾型,而“中行者”相當(dāng)于中間型。5.從卡特爾到比內(nèi)的發(fā)展過程中可以看出心理與教育測量有何特點(diǎn)?答:(1)心理與教育測量從卡特爾到比內(nèi)的發(fā)展過程①卡特爾是美國心理學(xué)家,首次提出了“心理測驗(yàn)”這個(gè)術(shù)語。卡特爾認(rèn)為,心理學(xué)只有立足于實(shí)驗(yàn)與測量,才能達(dá)到如同自然科學(xué)的準(zhǔn)確性;心理測驗(yàn)只有建立普遍的統(tǒng)一標(biāo)準(zhǔn),并要與常模相比較,才能充分地實(shí)現(xiàn)其科學(xué)價(jià)值和實(shí)用價(jià)值。這些觀點(diǎn)都已成為測量學(xué)上的重要觀念。②比內(nèi)認(rèn)為,測量比較復(fù)雜的心理功能,不必苛求精確度,因?yàn)檫@些功能的個(gè)別差異較大。他認(rèn)為智力是高級(jí)心理過程,包括推理、判斷以及動(dòng)用已知知識(shí)解決新問題的能力。比內(nèi)與其助手西蒙合作完成了世界上第一個(gè)智力測驗(yàn)量表——比內(nèi)-西蒙量表,史稱1905年量表,可用來測量各種能力,特別是判斷、理解和推理能力。(2)特點(diǎn)心理與教育測量從卡特爾到比內(nèi)的發(fā)展過程中表現(xiàn)出以下特點(diǎn):①測量對象逐漸擴(kuò)大和復(fù)雜化??ㄌ貭柕臏y量對象主要是肌肉力量等一些低級(jí)的機(jī)能,而比內(nèi)開始涉足高級(jí)的心理機(jī)能比如人的智力等。②測驗(yàn)法開始系統(tǒng)化??ㄌ貭栕钤缣岢觥靶睦頊y驗(yàn)”這一概念,但是比內(nèi)的測驗(yàn)法已有系統(tǒng)的、精密的設(shè)計(jì)。比內(nèi)的智力測驗(yàn)出現(xiàn)了以后,測驗(yàn)法才真正完善起來。6.推孟和韋克斯勒在智力測驗(yàn)發(fā)展過程中各有什么貢獻(xiàn)?答:(1)推孟是美國心理學(xué)家,他在智力測驗(yàn)方面的最重要貢獻(xiàn)如下:美國斯坦福大學(xué)推孟于1916年修訂完成斯坦福-比內(nèi)量表。其中影響最為深遠(yuǎn)的變動(dòng)是推孟采用了比率智商的概念來表示智力水平的高低,從此智商一詞風(fēng)靡全世界。(2)韋克斯勒也是美國心理學(xué)家,他在智力測驗(yàn)方面的最重要貢獻(xiàn)如下:①從20世紀(jì)40年代末開始,韋克斯勒相繼編制了“韋氏兒童智力量表”(1949)、“韋氏成人智力量表”(1955)和“韋氏幼兒智力量表”(1967)。②韋克斯勒舍棄了比率智商,而用離差智商代之,從而克服了比率智商的局限。③韋克斯勒編制的智力量表分為言語量表和操作量表兩部分,不僅能夠獲得總體智力水平的信息,而且可以獲得受測者智力優(yōu)勢的信息。7.相對于自陳人格問卷,投射測驗(yàn)和主題統(tǒng)覺測驗(yàn)有何特點(diǎn)?答:(1)自陳人格問卷、投射測驗(yàn)和主題統(tǒng)覺測驗(yàn)的定義①自陳人格測量就是根據(jù)要測量的人格特質(zhì),編制許多有關(guān)的問題,要求受測者根據(jù)自己的實(shí)際情況逐一回答這些問題,然后根據(jù)受測者的答案,去衡量受測者在這種人格特質(zhì)上表現(xiàn)的程度。②而投射測驗(yàn)的基本方式是向受測者提供預(yù)先編制的一些未經(jīng)組織的、意義模糊的標(biāo)準(zhǔn)化刺激情境,讓受測者在不受任何限制的情況下,自由地對刺激情境作出反應(yīng),然后通過分析受測者的反應(yīng),推斷受測者的人格特征。按照這種技術(shù)編制的最為著名的人格測驗(yàn)是羅夏克墨跡測驗(yàn)和莫瑞主題統(tǒng)覺測驗(yàn)。③其中主題統(tǒng)覺測驗(yàn)(簡稱TAT)是一種窺探受測者的主要需要、動(dòng)機(jī)、情緒、情操和人格特征的方法。它的基本原理是向受測者呈現(xiàn)一系列意義相對模糊的圖卡,并鼓勵(lì)他按照圖卡不加思索地編述故事。(2)投射測驗(yàn)和主題統(tǒng)覺測驗(yàn)的特點(diǎn)①編制自陳人格量表的第一項(xiàng)任務(wù)是確定所要測量的人格特質(zhì),并明確給出該特質(zhì)的操作性定義,然后圍繞著該特質(zhì)選擇能夠表現(xiàn)該特質(zhì)的行為情境和反應(yīng)。但投射測驗(yàn)材料沒有明確的結(jié)構(gòu)和確切的意義。②自陳人格問卷題目的呈現(xiàn)方式有以下幾種:是否式、二擇一式、是否折中式、文字等級(jí)式、數(shù)字等級(jí)式。但投射測驗(yàn)中的受測者對測驗(yàn)材料的反應(yīng)不受限制。③投射測驗(yàn)的目的相比于自陳測驗(yàn)具有明顯的隱蔽性。④對測驗(yàn)結(jié)果的解釋重在對受測者的人格特征獲得整體性的了解。⑤投射測驗(yàn)的內(nèi)容多為無明確意義的圖片,在測驗(yàn)時(shí)不受語言文字的限制。⑥相對于自陳量表,投射測驗(yàn)的最大局限是計(jì)分上的困難。8.民國時(shí)期主要的心理測驗(yàn)家有哪些?他們各自做了哪些重要的工作?答:(1)20世紀(jì)20年代初心理與教育測量的發(fā)展①1917年,樊炳清首先向同仁介紹了比內(nèi)-西蒙智力量表。②1918年,俞子夷編制的小學(xué)生毛筆書法量表可視為我國最早的新式教育測驗(yàn)。③1920年,廖世承和陳鶴琴在南京高等師范學(xué)校率先開設(shè)心理測驗(yàn)課程。1921年,廖、陳二人出版《心理測驗(yàn)法》。④1921年,費(fèi)培杰將比內(nèi)-西蒙智力量表譯成中文。⑤1921年,中華教育改進(jìn)社邀請美國測量學(xué)家麥柯爾來華講學(xué),并指導(dǎo)師生編制測驗(yàn)。(2)在智力測驗(yàn)方面①1924年,陸志韋根據(jù)中國南方的測驗(yàn)結(jié)果發(fā)表了《訂正比內(nèi)-西蒙智力測驗(yàn)說明書》。②1936年,陸志韋和吳天敏合作,將測驗(yàn)范圍擴(kuò)大到北方,作了第二次修訂。③廖世承編制了團(tuán)體智力測驗(yàn),陳鶴琴編制了圖形智力測驗(yàn),劉湛恩編制了非文字智力測驗(yàn),均有一定影響。(3)在人格測驗(yàn)方面①肖孝嶸曾修訂了武德沃斯個(gè)人資料記錄表。②1935年,浙江的沈有乾用朋洛德人格問卷測量中國學(xué)生。③1937年,周先庚用瑟斯頓情緒穩(wěn)定性測驗(yàn)測量中國學(xué)生。④1943年,林傳鼎試用普萊西X-O測驗(yàn)測試青少年的情緒成熟度的發(fā)育。⑤1948年,劉范曾試用羅夏克墨跡測驗(yàn)。(4)在教育測驗(yàn)方面艾偉曾編制小學(xué)兒童各科學(xué)績測驗(yàn)10多種。9.比較中華人民共和國成立前后以及改革開放以來心理與教育測量的發(fā)展,能得出什么結(jié)論?答:(1)現(xiàn)代心理與教育測量在中國建國前的發(fā)展①在智力測驗(yàn)方面1917年,樊炳清首先介紹了比內(nèi)-西蒙智力量表。1920年,廖世承和陳鶴琴在南京高等師范學(xué)校率先開設(shè)心理測驗(yàn)課程。1921年,廖、陳二人出版《心理測驗(yàn)法》。1921年中華教育改進(jìn)社邀請美國測量學(xué)家麥柯爾來華講學(xué),并指導(dǎo)北京師范大學(xué)、北京大學(xué)、燕京大學(xué)、北京女子高等師范大學(xué)、東南大學(xué)的師生編制測驗(yàn),各地編成測驗(yàn)40多種,等等。②在人格測驗(yàn)方面肖孝榮曾修訂了“武德沃斯個(gè)人資料記錄表”,并編制有9~15歲的常模。1937年,周先庚用“瑟斯頓情緒穩(wěn)定性測驗(yàn)”測量中國學(xué)生,也發(fā)現(xiàn)中國學(xué)生的情緒適應(yīng)性較差。1948年,劉范曾試用“羅夏克墨跡測驗(yàn)”。③在教育測驗(yàn)方面艾偉曾編制小學(xué)兒童各科學(xué)績測驗(yàn)10多種。特別是他對中學(xué)生閱讀能力和理解能力的研究,為當(dāng)時(shí)的語文教學(xué)改革提供了科學(xué)依據(jù)。(2)現(xiàn)代心理與教育測量在建國后的發(fā)展①智力測驗(yàn)1979年,中國心理學(xué)會(huì)醫(yī)學(xué)心理專業(yè)委員會(huì)在天津成立心理測驗(yàn)協(xié)作組,決定由龔耀先主持修訂“韋克斯勒成人智力量表”,于1982年完成修訂工作。1986年,龔耀先又主持修訂了“韋克斯勒幼兒智力量表”。1992年,戴忠恒修訂了“一般能力傾向測驗(yàn)”,等等。②人格測驗(yàn)1982年,由宋維真主持修訂“明尼蘇達(dá)多相人格調(diào)查表”,于1985年完成修訂工作。1981年,李紹衣等修訂了“卡特爾16種人格因素問卷”,制定了遼寧省的常模,后于1988年由戴忠恒、祝蓓里主持制定出全國常模。吳文源等于1990年修訂了“癥狀自評(píng)量表(SCL-90)”等。1988年,洪德厚等編制了“中國少年非智力個(gè)性特征問卷”。1992年,宋維真等人在借鑒“明尼蘇達(dá)多相人格調(diào)查表”的基礎(chǔ)上,編制出“心理健康測查表”,1993年,他們同香港學(xué)者合作編制出“中國人個(gè)性測量表”。1992年,沙毓英、張鋒等人編制出“學(xué)生性格量表(11~18歲)”,并于1995年在張鋒的主持下制定了云南省城市、農(nóng)村及少數(shù)民族學(xué)生的常模。③教育測驗(yàn)1979年,林傳鼎、張厚粲等人編制“少年兒童學(xué)習(xí)能力測驗(yàn)”,用于測量小學(xué)畢業(yè)生的普通能力。1980年開始,在張厚粲的主持下,北京師范大學(xué)高考研究組對每年的高考試卷作了系統(tǒng)的統(tǒng)計(jì)分析。1986年,羅黎輝、施良方等對教育目標(biāo)分類理論進(jìn)行了研究,并將布盧姆的《教育目標(biāo)分類學(xué)》系統(tǒng)地介紹到中國,等等。④組織建設(shè)和人才培養(yǎng)組織建設(shè):1984年,中國心理學(xué)會(huì)組建心理測驗(yàn)工作委員會(huì),后進(jìn)一步擴(kuò)建為心理測量專業(yè)委員會(huì)。該專業(yè)委員會(huì)定期組織召開全國性的學(xué)術(shù)會(huì)議。制定了《心理測驗(yàn)管理?xiàng)l例》和《心理測驗(yàn)工作者的道德準(zhǔn)則》兩個(gè)文件,由《心理學(xué)報(bào)》公開頒布。教育學(xué)界也成立了教育統(tǒng)計(jì)與測量學(xué)會(huì),開展有關(guān)工作。人才培養(yǎng):繼1980年北京師范大學(xué)心理系率先開設(shè)“心理測量”課程以來,各大學(xué)有關(guān)系科都已先后開設(shè)了“心理與教育測量”課程。一些大學(xué)招收碩士和博士研究生,為該學(xué)科培養(yǎng)高層次學(xué)術(shù)人才。心理測量專業(yè)委員會(huì)以及一些大學(xué)還多次舉辦心理測量技術(shù)培訓(xùn)班,培養(yǎng)了一批應(yīng)用型人才。⑤學(xué)科建設(shè)80年代以來,國內(nèi)不僅發(fā)表了大量有關(guān)心理與教育測量的研究論文,而且出版了多種教材與專著。(3)比較比較建國前和建國后的心理測量學(xué)的發(fā)展,可以發(fā)現(xiàn):①心理測量學(xué)的健康發(fā)展需要有穩(wěn)定的政治環(huán)境。解放后,心理測量學(xué)無論從規(guī)模,還是從層次,都比解放前有了一個(gè)很大的提高。②中國的心理測量學(xué)開始走上一條快速發(fā)展的道路。中國人從開始的介紹國外的先進(jìn)的心理測量學(xué)知識(shí)和測驗(yàn),到開始設(shè)立學(xué)科和專業(yè),并且通過幾代人不懈的努力,已經(jīng)初見成效了。心理測量學(xué)在中國有著光明的前途。10.20世紀(jì)80年代以來,中國主要從事心理測驗(yàn)研究的代表性心理學(xué)家有哪些?他們各自做了哪些重要的工作?答:(1)智力測驗(yàn)方面①龔耀先主持修訂韋克斯勒成人智力量表,于1982年完成修訂工作。②林傳鼎、張厚粲主持修訂韋克斯勒兒童智力量表,于1986年完成修訂工作。③1982年,吳天敏對中國比內(nèi)測驗(yàn)進(jìn)行了第三次修訂。④1986年,龔耀先主持修訂了韋克斯勒幼兒智力量表。⑤1985年,張厚粲主持修訂了瑞文標(biāo)準(zhǔn)推理測驗(yàn)。⑥1989年,李丹主持修訂瑞文測驗(yàn)(聯(lián)合型)。⑦1992年,戴忠恒修訂了一般能力傾向測驗(yàn)。⑧張厚粲、周容等編制了中國兒童發(fā)展量表等。(2)人格測驗(yàn)方面一開始,我國學(xué)者主要修訂和引進(jìn)外來量表。①1982年,由宋維真主持修訂明尼蘇達(dá)多相人格調(diào)查表,于1985年完成修訂工作。②1981年,李紹衣等修訂了卡特爾16種人格因素問卷,制定了遼寧省的常模,后于1988年由戴忠恒、祝蓓里主持制定出全國常模。③1983年,龔耀先主持修訂了艾森克人格問卷,同時(shí)陳仲庚也在北方作了修訂。④在臨床心理學(xué)領(lǐng)域,也修訂了多種涉及心理健康評(píng)估的量表,如張明園于1987年修訂了生活事件量表。吳文源等于1990年修訂了癥狀自評(píng)量表(SCL-90)等。20世紀(jì)80年代末90年代初,中國心理學(xué)家在繼續(xù)引進(jìn)修訂國外人格量表的同時(shí),開始編制中國人自己的人格量表:①1988年,洪德厚等編制了中國少年非智力個(gè)性特征問卷。②1992年,宋維真等人在借鑒明尼蘇達(dá)多相人格調(diào)查表的基礎(chǔ)上,編制出心理健康測查表,1993年,他們同香港學(xué)者合作編制出中國人個(gè)性測量表。③為了準(zhǔn)確把握中國人的心理健康狀況,促進(jìn)人們的心理健康發(fā)展,近年來中國的心理學(xué)家致力于研發(fā)適合中國社會(huì)生活實(shí)際的心理健康素質(zhì)測評(píng)工具,其中由天津師范大學(xué)心理學(xué)家沈德立等人組織研發(fā)編制的《青少年心理健康素質(zhì)調(diào)查表》和《中國成人心理健康素質(zhì)測評(píng)系統(tǒng)》最為系統(tǒng)。(3)教育測驗(yàn)方面①1979年,林傳鼎、張厚粲等人編制少年兒童學(xué)習(xí)能力測驗(yàn),用于測量小學(xué)畢業(yè)生的普通能力。②1980年開始,在張厚粲的主持下,北京師范大學(xué)高考研究組對每年的高考試卷作了系統(tǒng)的統(tǒng)計(jì)分析,獲得了有關(guān)試卷信度、效度、難度、區(qū)分度等有意義的信息。他們還對高考試卷評(píng)分的客觀性、考試科目的合理設(shè)置及各科分?jǐn)?shù)的合理組合作了研究。在此基礎(chǔ)上對我國高考制度的進(jìn)一步改革提出了一系列重要的意見和建議。③1984年,我國正式加入世界上最有影響力的“國際教育成就評(píng)價(jià)協(xié)會(huì)”(IEA),并與“國際教育成就評(píng)價(jià)協(xié)會(huì)”合作,在我國進(jìn)行了全國規(guī)模的教育測量抽樣研究。④1986年,羅黎輝、施良方等對教育目標(biāo)分類理論進(jìn)行了研究,并將布盧姆的《教育目標(biāo)分類學(xué)》系統(tǒng)地介紹到中國,產(chǎn)生了廣泛而積極的影響。⑤20世紀(jì)80年代,張敏強(qiáng)、張厚粲對經(jīng)典測量理論和項(xiàng)目反應(yīng)理論在考試制度改革中的應(yīng)用情況作了比較研究。第3章經(jīng)典測驗(yàn)理論的基本假設(shè)1.簡述“心理特質(zhì)”的含義。答:心理特質(zhì)是指表現(xiàn)在一個(gè)人身上所特有的相對穩(wěn)定的行為方式。對這一概念,可以從以下幾個(gè)方面來理解:(1)心理特質(zhì)是一組具有內(nèi)部相關(guān)的行為的概括,具有一定的抽象性。(2)心理特質(zhì)是一種一般的神經(jīng)心理系統(tǒng),它可以綜合不同的刺激,使人對這些刺激作出相同的反應(yīng)。(3)心理特質(zhì)是一個(gè)人身上比較穩(wěn)定的特點(diǎn)。人的心理活動(dòng)是十分豐富的,并不是他的每一種心理活動(dòng)都會(huì)表現(xiàn)為一種特質(zhì),而是那些經(jīng)常出現(xiàn)的比較穩(wěn)定的心理特征才稱得上特質(zhì)。(4)一個(gè)人的精神面貌(人格)是由多種特質(zhì)分多個(gè)層次有機(jī)組合而成的。不同的人往往具有不同的特質(zhì)組合,即使其特質(zhì)類型相同,其特質(zhì)水平往往也會(huì)有高低之分。(5)心理特質(zhì)可以決定一個(gè)人對特定刺激的反應(yīng)傾向,可以對人的行為進(jìn)行某種預(yù)測。2.心理測量的誤差來源主要包括哪些?答:心理測量誤差是指在心理測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng),分為系統(tǒng)誤差和隨機(jī)誤差兩種。其來源主要包括三個(gè)方面,即測量工具、被測對象和施測過程。(1)在測量工具方面,心理測量工具通常是一套以測驗(yàn)(問卷)為核心的刺激反應(yīng)系統(tǒng)(通常稱作量表)。心理測量量表是否穩(wěn)定、是否真正測到了所要測的東西是測量工具造成誤差的兩種主要原因。(2)在被測對象方面,造成測量誤差的主要原因是受測者真正水平是否得到正常發(fā)揮。一般地,受測者的某種心理特質(zhì)水平是相對穩(wěn)定的,但是他在接受測量時(shí)的生理和心理狀態(tài)會(huì)影響其水平的正常發(fā)揮。(3)在施測過程方面,產(chǎn)生測量誤差的原因主要是一些偶然因素。比如,物理環(huán)境、主試、評(píng)分記分環(huán)節(jié)、意外干擾等。3.CTT模型及其假設(shè)的主要內(nèi)容是什么?答:(1)CTT模型經(jīng)典測驗(yàn)理論(CTT)假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記之為E)。即:X=T+E,這就是CTT的數(shù)學(xué)模型。(2)CTT模型假設(shè)的內(nèi)容根據(jù)CTT模型,可以引申出三個(gè)相關(guān)聯(lián)的假設(shè)公理:①若一個(gè)人的某種心理特質(zhì)可以用平行的測驗(yàn)反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù),即:ε(X)=T;②真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零,即:ρET=0;③各平行測驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零,即:其中,第②、第③條假設(shè)意在說明E是個(gè)隨機(jī)誤差,沒有包含系統(tǒng)誤差在內(nèi),第①條假設(shè)則在于說明E是個(gè)服從均值為零的正態(tài)分布的隨機(jī)變量。4.什么是平行測驗(yàn)?答:平行測驗(yàn)的含義是:對于測驗(yàn)總體中的任意一個(gè)被試而言,若他在兩個(gè)測驗(yàn)上的觀察分?jǐn)?shù)(X和X′)同時(shí)滿足CTT的數(shù)學(xué)模型和三大假設(shè),并且具有相等的真分?jǐn)?shù)(T=T′)和相等的誤差標(biāo)準(zhǔn)差(),則這兩個(gè)測驗(yàn)被稱為嚴(yán)格平行的測驗(yàn)。通俗地說,如果兩個(gè)題目不同的測驗(yàn)測得的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度以及測驗(yàn)得分的分布都是一致的,則這兩個(gè)測驗(yàn)被稱作彼此平行的測驗(yàn)。與此類似,對于測驗(yàn)總體中的任意一個(gè)被試而言,若他在兩個(gè)測驗(yàn)上的觀察分?jǐn)?shù)(X1和X2)同時(shí)滿足CTT的數(shù)學(xué)模型和三大假設(shè),并且其真分?jǐn)?shù)(T1=T2+c12)之間僅相差一個(gè)常數(shù)(c12),則這兩個(gè)測驗(yàn)被稱為基本(T)等價(jià)的測驗(yàn)(essentiallyT-equivalenttests)。5.根據(jù)CTT的數(shù)學(xué)模型及其假設(shè),推導(dǎo)關(guān)系式(3.2)()。答:(1)CTT模型及其假設(shè)經(jīng)典測驗(yàn)理論(CTT)假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記之為E)。即:X=T+E,這就是CTT的數(shù)學(xué)模型。根據(jù)這一模型,可以引申出三個(gè)相關(guān)聯(lián)的假設(shè)公理:①若一個(gè)人的某種心理特質(zhì)可以用平行的測驗(yàn)反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即:ε(X)=T。②真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。即:ρET=0。③各平行測驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零。即:(2)推導(dǎo)過程關(guān)系式(3.2)為:根據(jù)CTT的數(shù)學(xué)模型及其假設(shè),推導(dǎo)關(guān)系式(3.2)的過程如下:∵X=T+E∴∵真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為0;∴,即∴∴即:6.假設(shè)某專家編寫了10道開放式題目考查高中生的語文運(yùn)用能力,其中1題為文字推理題目,需要用到概率論中的貝葉斯原理。請問,這次測驗(yàn)的總分是否可以用CTT的模型進(jìn)行解讀?為什么?答:不能。經(jīng)典測驗(yàn)理論(CTT)假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記為E)。即X=T+E。因此,我們知道:(1)在問題的研究范圍之內(nèi),反映個(gè)體某種心理特質(zhì)水平的真分?jǐn)?shù)假定是不會(huì)變的,測量任務(wù)就是估計(jì)這一真分?jǐn)?shù)的大小。(2)觀察分?jǐn)?shù)被假定等于真分?jǐn)?shù)與誤差分?jǐn)?shù)之和,即假定觀察分?jǐn)?shù)與真分?jǐn)?shù)之間是線性關(guān)系,而不是其他關(guān)系。(3)測量誤差是完全隨機(jī)的,并服從均值為零的正態(tài)分布。這就是說,測量誤差不會(huì)因?yàn)檎娣謹(jǐn)?shù)的高低而呈現(xiàn)出有規(guī)律的都為正數(shù)或都為負(fù)數(shù)的情況。測量誤差不僅獨(dú)立于所測特質(zhì)的真分?jǐn)?shù),而且獨(dú)立于所測特質(zhì)以外的其他任何變量。但那道文字推理題目由于需要用到概率論中的貝葉斯原理,考察到了數(shù)學(xué)能力,也就是說測量誤差不是完全隨機(jī)的,而是包括了一部分穩(wěn)定的系統(tǒng)誤差。即觀察分?jǐn)?shù)不等于真分?jǐn)?shù)與誤差分?jǐn)?shù)之和,觀察分?jǐn)?shù)與真分?jǐn)?shù)之間不是線性關(guān)系。這不符合CTT的假設(shè)。所以不能用CTT來解釋這次測驗(yàn)總分。7.某次滿分為60分的作文考試完成后,試卷由若干個(gè)老師獨(dú)立評(píng)判,結(jié)果發(fā)現(xiàn)30萬考生中有大約82%的人獲得的分?jǐn)?shù)在40~50分之間,35分以下幾乎沒人,50分以上也不到2%。有的考生被不同老師評(píng)卷所得分?jǐn)?shù)之差竟然高達(dá)30多分。請問,這次考試測量誤差的主要來源有哪些?如何減小測量誤差?答:(1)心理測量的誤差來源①在測量工具方面心理測量工具通常是一套以測驗(yàn)(問卷)為核心的刺激反應(yīng)系統(tǒng)(通常稱作量表)。心理測量量表不穩(wěn)定、沒有真正測到研究者所要測的東西是測量工具造成誤差的兩種主要原因。有可能這次考試并未測試到考生的寫作能力。②在被測對象方面造成測量誤差的主要原因是受測者真正水平未得到正常發(fā)揮。一般地,受測者的某種心理特質(zhì)水平是相對穩(wěn)定的,但是他在接受測量時(shí)的生理和心理狀態(tài)會(huì)影響其水平的正常發(fā)揮。③在施測過程方面產(chǎn)生測量誤差的原因主要是一些偶然因素。④評(píng)分者方面對于沒有標(biāo)準(zhǔn)答案的試題,評(píng)分者是一個(gè)重要的誤差來源。不同評(píng)分者對于不同的答卷有著不同的判斷。(2)減小測量誤差的措施①在測量工具方面盡可能編制具有較高信效度的測驗(yàn)。②在測量對象方面在被試參加測驗(yàn)前,主試對其做一些心理建設(shè),確保他保持最佳狀態(tài)。③在施測過程方面利用一些方法,比如恒定法、消除法等,盡可能控制偶然誤差。④評(píng)分者方面對于沒有標(biāo)準(zhǔn)答案的試題,可以設(shè)置一些關(guān)于試卷評(píng)分的標(biāo)準(zhǔn),讓評(píng)分者按照評(píng)分標(biāo)準(zhǔn)給分,不可主觀評(píng)定。8.民間經(jīng)常有些算命先生,宣稱可以根據(jù)人的外貌、談吐或者生辰八字等,預(yù)測人的前程、財(cái)運(yùn)、婚姻,等等。試從CTT模型的角度分析這種現(xiàn)象。答:(1)經(jīng)典測驗(yàn)理論(CTT)及其假設(shè)公理經(jīng)典測驗(yàn)理論假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記之為E)。即:X=T+E。這就是CTT的數(shù)學(xué)模型。根據(jù)這一模型,可以引申出三個(gè)相關(guān)聯(lián)的假設(shè)公理:①若一個(gè)人的某種心理特質(zhì)可以用平行的測驗(yàn)反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù),即:ε(X)=T;②真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零,即:ρET=0;③各平行測驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零,即:(2)對CTT的這一數(shù)學(xué)模型及其假設(shè)公理,可以從以下三個(gè)方面進(jìn)行理解:①在問題的研究范圍之內(nèi),反映個(gè)體某種心理特質(zhì)水平的真分?jǐn)?shù)是假定不會(huì)變的,測量的任務(wù)就是估計(jì)這一真分?jǐn)?shù)的大小。②觀察分?jǐn)?shù)被假定等于真分?jǐn)?shù)與誤差分?jǐn)?shù)之和。③測量誤差是完全隨機(jī)的,并服從均值為零的正態(tài)分布。而算命先生的推測由于并無科學(xué)標(biāo)準(zhǔn),同一個(gè)人多次算命所得的結(jié)論是不一樣的,也就不會(huì)得到CTT中的“真分?jǐn)?shù)”。而且算命中包含的誤差也不只是隨機(jī)誤差,還有由算命先生主觀判斷引起的系統(tǒng)誤差。9.有專家指出,大數(shù)據(jù)技術(shù)或許能使得人才測評(píng)工作更加科學(xué)和有效。試從CTT的模型出發(fā),通過文獻(xiàn)閱讀等手段,闡述應(yīng)用大數(shù)據(jù)技術(shù)預(yù)測人的行為的具體條件、途徑和可能的風(fēng)險(xiǎn)。答:(1)理論概述①經(jīng)典測量理論(ClassicalTestTheory,CTT),也稱真分?jǐn)?shù)理論,是最早實(shí)現(xiàn)數(shù)學(xué)形式化的測量理論。經(jīng)典測驗(yàn)理論假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記為E),即X=T+E。CTT以弱假設(shè)為基礎(chǔ),這些弱假設(shè)條件容易被絕大多數(shù)測驗(yàn)數(shù)據(jù)資料所滿足。因此,CTT在實(shí)際中有著很廣泛的應(yīng)用。②人才測評(píng)實(shí)際上是要通過一定的技術(shù)和方法,對被測評(píng)對象進(jìn)行結(jié)構(gòu)性觀察并獲得行為采樣,從而對其整體能力水平及特定能力結(jié)構(gòu)做出預(yù)測和判斷,最終提高人才使用及開發(fā)的效能。人才測評(píng)的信效度至少與三個(gè)環(huán)節(jié)有關(guān):行為樣本的采集范圍是否覆蓋完全、行為數(shù)據(jù)采集量是否足夠大以及對這些數(shù)據(jù)的挖掘及處理是否有效。③大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的特點(diǎn)主要表現(xiàn)在數(shù)據(jù)規(guī)模大、數(shù)據(jù)類別復(fù)雜、數(shù)據(jù)處理速度快、數(shù)據(jù)真實(shí)性高、數(shù)據(jù)蘊(yùn)藏價(jià)值5個(gè)方面。將大數(shù)據(jù)思維引入到人才測評(píng)中,可以:將采樣范圍從單一或簡單視角轉(zhuǎn)變?yōu)槎嗑S度視角;采集所有可收集的行為樣本,最大限度地?cái)U(kuò)展行為數(shù)據(jù)采集量;數(shù)據(jù)處理上從簡單統(tǒng)計(jì)(均值)轉(zhuǎn)變?yōu)楦唠A統(tǒng)計(jì)分析(相關(guān)分析、差異檢驗(yàn)、因素分析等)。大數(shù)據(jù)式人才測評(píng),就是要通過數(shù)據(jù)的多維性、海量性以及數(shù)據(jù)挖掘能力,系統(tǒng)提高人才測評(píng)的有效性。(2)大數(shù)據(jù)技術(shù)預(yù)測人的行為的具體條件①在大數(shù)據(jù)時(shí)代,信息爆炸是一個(gè)典型的特征。在這種背景下,企業(yè)關(guān)于員工的信息來源多樣化,比如社交網(wǎng)站和平時(shí)的上網(wǎng)記錄;信息成本來源低廉,大多數(shù)信息都是以電子的形式進(jìn)行存儲(chǔ),信息的讀取和利用都遠(yuǎn)比整理紙質(zhì)檔案更加便捷;信息的真實(shí)性和可靠性更好,員工對于信息的隱藏或造假能力很低;信息的關(guān)聯(lián)性和相關(guān)性被予以重視,由此可以產(chǎn)生大量幫助企業(yè)決策的信息。②“大數(shù)據(jù)”立足于對大量數(shù)據(jù)的深度挖掘與科學(xué)分析,尋求數(shù)據(jù)背后的隱含關(guān)系與價(jià)值,使得人們可以從基于小樣本數(shù)據(jù)的推測或基于感性的偏好性選擇轉(zhuǎn)向基于數(shù)據(jù)分析與理性證據(jù)的決策。(3)大數(shù)據(jù)技術(shù)預(yù)測人的行為的途徑①構(gòu)建崗位勝任力指標(biāo)體系由于大數(shù)據(jù)式人才測評(píng)依托網(wǎng)絡(luò)平臺(tái),部分傳統(tǒng)測評(píng)方法不再使用,根據(jù)人機(jī)測評(píng)特點(diǎn)和崗位勝任力指標(biāo)體系,調(diào)整大數(shù)據(jù)式人才測評(píng)方法。標(biāo)準(zhǔn)化心理測驗(yàn)量表涉及指標(biāo)眾多,甄選和改進(jìn)測評(píng)量表的依據(jù)是員工所處崗位勝任力指標(biāo)體系,分析指標(biāo)體系中一級(jí)指標(biāo)內(nèi)涵并分解成二級(jí)指標(biāo),形成二級(jí)指標(biāo)和關(guān)鍵詞庫,并嵌入人機(jī)交互平臺(tái),利用語音識(shí)別系統(tǒng),設(shè)定相應(yīng)的評(píng)價(jià)標(biāo)準(zhǔn)和反饋機(jī)制,適用方法主要為評(píng)價(jià)中心技術(shù)和情景綜合測評(píng)技術(shù)。②收集員工的碎片化數(shù)據(jù)大數(shù)據(jù)具有海量性,采用長期碎片化收集方式,收集和分析海量數(shù)據(jù),雖然少量數(shù)據(jù)不真實(shí),但對最終結(jié)果分析的影響微乎其微。從測評(píng)的信效度角度看,測驗(yàn)環(huán)境影響到結(jié)果的準(zhǔn)確性,包括被試者的心理環(huán)境和物理環(huán)境,測驗(yàn)對被試者環(huán)境的要求過高,尤其是招聘類和選撥性測驗(yàn),員工的測驗(yàn)結(jié)果出現(xiàn)一定的偏差。大數(shù)據(jù)式人才測評(píng)發(fā)生于員工日常的工作生活,被試者處于放松而穩(wěn)定的環(huán)境中,即保證了碎片化收集的離散數(shù)據(jù)是相對真實(shí)的。③測量量表與趣味測評(píng)相結(jié)合大數(shù)據(jù)式的人才測評(píng)內(nèi)容需要多維配置,各方面交叉、相互佐證,普通的人才測評(píng)內(nèi)容并不滿足大數(shù)據(jù)收集需求。大數(shù)據(jù)式的人才測評(píng)是多維度的,測評(píng)內(nèi)容不再是單一的心理學(xué)成熟量表,非傳統(tǒng)的測評(píng)量表得到廣泛的應(yīng)用。以趣味測評(píng)為例,企業(yè)員工年齡分布趨于年輕化,以輕松趣味為主題的測評(píng)方式更受員工青睞,該類型測評(píng)表現(xiàn)形式為輕松趣味,實(shí)則測評(píng)內(nèi)容與指標(biāo)相關(guān)聯(lián)。既是增加員工測評(píng)粘性的方式,減少員工的心理防衛(wèi),也營造了良好的測評(píng)環(huán)境。測評(píng)的難度和長度影響測評(píng)的信度效度,輕松趣味的測評(píng)量表內(nèi)容少,測評(píng)需要時(shí)間短,以“量少次多”的原則,采集與指標(biāo)體系相關(guān)的可靠性數(shù)據(jù)。在數(shù)據(jù)統(tǒng)計(jì)分析時(shí),傳統(tǒng)測評(píng)量表與輕松趣味測評(píng)量表分析結(jié)果相互對比、相互佐證,多維度交叉,最終形成客觀全面的測評(píng)報(bào)告和測評(píng)軌跡(王迎冬,2019)。(4)可能的風(fēng)險(xiǎn)①數(shù)據(jù)主導(dǎo)一切,員工隱私存在著被侵犯的可能性,而且個(gè)人心理感受不舒適,影響其在團(tuán)隊(duì)組織中的行為表現(xiàn),個(gè)人數(shù)據(jù)在促進(jìn)人才測評(píng)的同時(shí)也變成一種數(shù)據(jù)困擾。②以自由提取為特征的信息管理,出現(xiàn)了過度控制和放任責(zé)任的情形。③一些中小型企業(yè)盲目跟風(fēng),急切地將大數(shù)據(jù)引入到人才測評(píng)中,認(rèn)為擁有大數(shù)據(jù)就可以對人才測評(píng)系統(tǒng)產(chǎn)生質(zhì)的提升,但卻消耗了大量的財(cái)力建造基于數(shù)據(jù)的信息管理系統(tǒng),并對其進(jìn)行維護(hù),完全忽視了收益與成本的關(guān)系,有可能得不償失,容易造成人力資源管理系統(tǒng)的癱瘓。④人力資源的共享與安全問題。基于大數(shù)據(jù)的人力資源開發(fā)和管理創(chuàng)新不僅可以促進(jìn)經(jīng)濟(jì)發(fā)展,也能促進(jìn)科技、社會(huì)文化和環(huán)境發(fā)展。特別是跨國公司,他們的創(chuàng)新在制定人力資源管理模式中起到重要作用。那么如果此類公司在人力資源管理中引入大數(shù)據(jù),這些關(guān)于應(yīng)聘者和員工的種種數(shù)據(jù)歸屬于哪一方,被訪問的權(quán)限如何設(shè)置,其與企業(yè)競爭情報(bào)的關(guān)系,數(shù)據(jù)泄露、丟失等安全問題如何保障就成了主要的發(fā)展問題之一。10.在綜合素質(zhì)評(píng)價(jià)工作中,最難的內(nèi)容可能是人的思想品德。試從CTT的理論假設(shè)出發(fā),闡述解決這一問題的建議。答:經(jīng)典測驗(yàn)理論假定,觀察分?jǐn)?shù)(記為X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個(gè)隨機(jī)誤差(記之為E)。即:X=T+E。這就是CTT的數(shù)學(xué)模型。根據(jù)這一模型,可以引申出三個(gè)相關(guān)聯(lián)的假設(shè)公理:(1)若一個(gè)人的某種心理特質(zhì)可以用平行的測驗(yàn)反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù),即:ε(X)=T。因此在評(píng)價(jià)一個(gè)人的思想品德時(shí),一定要多次多階段多人評(píng)價(jià),從而找到人的思想品德的“真分?jǐn)?shù)”。(2)真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零,即:ρET=0。(3)各平行測驗(yàn)上的誤差分?jǐn)?shù)之間相關(guān)為零,即:。因此在評(píng)價(jià)一個(gè)人的思想品德時(shí),不要被個(gè)人成就、家庭背景等無關(guān)因素影響。第4章測量信度1.指出各種信度系數(shù)所對應(yīng)的誤差來源。答:信度主要包括重測信度、復(fù)本信度、分半信度、同質(zhì)性信度、評(píng)分者信度,各種信度系數(shù)所對應(yīng)的誤差來源如下:(1)重測信度系數(shù)對應(yīng)的誤差來源重測信度是指用同一個(gè)量表對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。除去主試、施測環(huán)境和被試等方面的誤差,它的獨(dú)特誤差來源主要有:①施測過程中所產(chǎn)生的遺忘和練習(xí)效應(yīng);②在兩次施測的間隔時(shí)間內(nèi),被試在所要測查的心理特質(zhì)方面獲得了學(xué)習(xí)機(jī)會(huì)。(2)復(fù)本信度系數(shù)對應(yīng)的誤差來源復(fù)本信度是指兩個(gè)平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個(gè)復(fù)本測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。它的誤差來源有:①不能獲得嚴(yán)格意義上的平行測驗(yàn);②施測過程中產(chǎn)生的順序效應(yīng)和遷移效應(yīng);③在兩次施測的間隔時(shí)間內(nèi),被試在所測量的心理特質(zhì)上獲得了學(xué)習(xí)機(jī)會(huì)。(3)分半信度系數(shù)對應(yīng)的誤差來源分半信度是指將一個(gè)測驗(yàn)分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。它的誤差來源是:不同的分半方法的分半信度不同,可能是由于將測驗(yàn)分為相平行的兩半的方法不同而產(chǎn)生誤差。(4)同質(zhì)性信度系數(shù)對應(yīng)的誤差來源同質(zhì)性信度也稱內(nèi)部一致性系數(shù),它是指測驗(yàn)內(nèi)部所有題目之間的一致性程度??寺“秃咋林颠€是所有可能的分半信度的平均值,它只是測量信度的下界的一個(gè)估計(jì)值。即α值大,必有測量信度高;α值小時(shí),卻不能斷定測量信度不高。它的誤差來源產(chǎn)生于題目是否同質(zhì),這包括兩個(gè)方面:①所有題目都測的是同一種心理特質(zhì);②所有題目得分之間都具有較高的正相關(guān)。(5)評(píng)分者信度系數(shù)對應(yīng)的誤差來源評(píng)分者信度是指多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。在心理與教育測量工作中,客觀題的評(píng)分很少出現(xiàn)誤差,但主觀題的評(píng)分常常會(huì)造成誤差。它的誤差來源主要是多個(gè)評(píng)分者之間的個(gè)體差異,對相同答案的不同評(píng)定,這種個(gè)體差異不可能完全消除,只能最大程度地依賴正規(guī)的測查程序和統(tǒng)計(jì)方法來減小它。2.已知16人參加一次測驗(yàn)后在奇數(shù)題和偶數(shù)題上的得分情況,試用兩種以上的方法估計(jì)測量信度。答:由題目可得,題目中涉及的信度是分半信度,可以采用分半信度來求解。由于被試在奇數(shù)題和偶數(shù)題上得分的標(biāo)準(zhǔn)差不同,所以不能采用斯皮爾曼-布朗公式,分半信度可以用弗朗那根公式和盧侖公式。具體算法如下:(1)弗朗那根公式式中和分別表示所有被試在兩半測驗(yàn)上得分的變異數(shù),表示全體被試在整個(gè)測驗(yàn)上的總得分的變異數(shù)。Sa=5.48;Sb=5.58;Sx=10.76代入數(shù)值得,rxx=0.943。(2)盧侖公式式中表示同一組被試在兩半測驗(yàn)上得分之差的變異數(shù),其他符號(hào)的含義與弗朗那根公式中的含義相同。Sd=2.56;Sx=10.76代入數(shù)值得,rxx=0.943。3.已知某態(tài)度量表有6道題,被試在各題上得分的方差分別是0.80、0.81、0.79、0.78、0.80、0.82,測驗(yàn)總分的方差為16.00,求α值。答:根據(jù)題意,代入數(shù)據(jù)得:因此,α值為0.84。4.某次滿分為60分的作文考試,由兩個(gè)老師進(jìn)行評(píng)分,所評(píng)分?jǐn)?shù)如下,試估計(jì)評(píng)分者信度。答:由于評(píng)分者只有兩人,評(píng)分者信度等于兩個(gè)評(píng)分者給同一批被試的答卷所給分?jǐn)?shù)的相關(guān)系數(shù)。又因?yàn)榉謹(jǐn)?shù)為等級(jí)數(shù)據(jù),且只有16對數(shù)據(jù),所以應(yīng)使用相關(guān)系數(shù)中的等級(jí)相關(guān)。由于出現(xiàn)了相同等級(jí),所以使用公式∑D2=214,rRC=0.68。5.如何估計(jì)速度測驗(yàn)的測量信度?答:(1)重測信度重測信度是指用同一個(gè)量表對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。(式中x及是第一次測量的實(shí)得分及實(shí)得分的平均值,y及是第二次測量的實(shí)得分及實(shí)得分的平均值,rxx是重測信度)當(dāng)信度值較大時(shí),說明前、后兩次測量的結(jié)果比較一致,測量工具比較穩(wěn)定,被試的心理特質(zhì)受被試狀態(tài)和環(huán)境變化的影響較小。(2)復(fù)本信度復(fù)本信度是指兩個(gè)平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個(gè)復(fù)本測驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。兩個(gè)復(fù)本測驗(yàn)實(shí)施的時(shí)間不同,復(fù)本信度所表達(dá)的含義略有不同:①如果兩個(gè)復(fù)本測驗(yàn)是同時(shí)連續(xù)施測的,則稱這種復(fù)本信度為等值性系數(shù)。等值性系數(shù)的大小主要反映著兩個(gè)復(fù)本測驗(yàn)的題目差別所帶來的變異情況。②如果兩個(gè)復(fù)本測驗(yàn)是相距一段時(shí)間分兩次施測的,則稱這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。穩(wěn)定性與等值性系數(shù)是對信度的最嚴(yán)格的檢驗(yàn),與其他信度系數(shù)相比,此種復(fù)本信度最小。6.不同能力水平的人在接受同一測驗(yàn)時(shí),為什么會(huì)出現(xiàn)測量誤差?答:就被試團(tuán)體而言,整個(gè)團(tuán)體內(nèi)部水平的離散程度以及團(tuán)體的平均水平都會(huì)影響測量信度,如果被試的能力水平相差很大時(shí),此時(shí)的測量誤差就會(huì)偏大。這是因?yàn)?,所?jì)算的信息估計(jì)值大都是以相關(guān)為基礎(chǔ)的,而相關(guān)系數(shù)的大小往往取決于全體被試得分的分布情況。(1)當(dāng)被試團(tuán)體異質(zhì)(即團(tuán)體內(nèi)能力水平彼此差異大)時(shí),全體被試的總分分布必然較廣,那么分布位于兩個(gè)端點(diǎn)的值可能相互抵消,以相關(guān)為基礎(chǔ)計(jì)算出來的信度值必然會(huì)大。這就很有可能高估實(shí)際的信度值而產(chǎn)生測量誤差。(2)當(dāng)團(tuán)體內(nèi)部水平相差不大(即能力水平差不多的被試位于同一水平)時(shí),其得分分布必定會(huì)較窄,以相關(guān)為基礎(chǔ)計(jì)算出來的信度值必然會(huì)小。這時(shí)又有可能低估真正的信度值而產(chǎn)生測量誤差。(3)若團(tuán)體的平均水平太高或太低,同樣會(huì)使測驗(yàn)總分的分布變窄,低估測量的真正信度而產(chǎn)生測量誤差。7.試證信度三個(gè)定義的等價(jià)性。答:略。8.怎樣提高測量信度?答:提高測量信度的常用方法有以下幾種:(1)適當(dāng)增加測驗(yàn)的長度提高測量信度的一個(gè)常用方法是增加一些與原測驗(yàn)中項(xiàng)目具有較好的同質(zhì)性的項(xiàng)目,增大測驗(yàn)長度。但是增加測驗(yàn)長度時(shí)應(yīng)當(dāng)注意:①新增項(xiàng)目必須與試卷中原有項(xiàng)目同質(zhì);②新增項(xiàng)目的數(shù)量必須適度,避免出現(xiàn)報(bào)酬遞減的效應(yīng)。(2)使測驗(yàn)中所有試題的難度接近正態(tài)分布,并控制在中等水平。(3)努力提高測驗(yàn)試題的區(qū)分度。(4)選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。(5)主試者嚴(yán)格執(zhí)行實(shí)測規(guī)程,評(píng)分者嚴(yán)格按標(biāo)準(zhǔn)給分,實(shí)測場地按測驗(yàn)手冊的要求進(jìn)行布置,減少無關(guān)因素的干擾。第5章測量效度1.什么是測量效度?它與信度的關(guān)系怎樣?答:(1)測量效度效度是指一個(gè)測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度,是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。一組測驗(yàn)分?jǐn)?shù)的總變異包括三部分:①真實(shí)的(穩(wěn)定的)、與測量目的有關(guān)的變異;②真實(shí)的、但出自無關(guān)來源的變異;③隨機(jī)誤差的變異。在測量理論中,效度被定義為:在一列測量中,與測量目的有關(guān)的真實(shí)變異數(shù)(由所要測量的變因引起的有效變異)與總變異數(shù)(實(shí)得變異數(shù))的比率,即:這里rxy代表測量的效度系數(shù),代表有效變異數(shù),代表總變異數(shù)。(2)測量效度與信度的主要關(guān)系①信度高是效度高的必要而非充分的條件;②測驗(yàn)的效度受它的信度制約。2.什么是內(nèi)容效度?測驗(yàn)編制者和使用者應(yīng)分別從哪幾個(gè)方面來把握內(nèi)容效度?答:內(nèi)容效度是指一個(gè)測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。估計(jì)一個(gè)測驗(yàn)的內(nèi)容效度就是去確定該測驗(yàn)在多大程度上代表了所要測量的行為領(lǐng)域。內(nèi)容效度主要應(yīng)用于成就測驗(yàn),用來測量被試掌握某種技能或?qū)W習(xí)某門課程所達(dá)到的程度。在這種測驗(yàn)中,題目取樣的代表性問題是內(nèi)容效度的主要考察方面。內(nèi)容效度也適合于某些用于選拔和分類的職業(yè)測驗(yàn)。這種測驗(yàn)所要測的內(nèi)容就是實(shí)際工作所需的知識(shí)和技能,編制這種測驗(yàn)應(yīng)首先對實(shí)際工作作較細(xì)的分析。內(nèi)容效度不適合用于能力傾向測驗(yàn)和人格測驗(yàn)。其確定方法有:(1)邏輯分析法內(nèi)容效度的確定方法主要是邏輯分析法,其工作思路是請有關(guān)專家對測驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。其具體步驟是:①明確欲測內(nèi)容的范圍,包括知識(shí)范圍和能力要求兩個(gè)方面。②確定每個(gè)題目所測的內(nèi)容,并與測驗(yàn)編制者所列的雙向細(xì)目表(考試藍(lán)圖)對照,逐題比較自己的分類與制卷者的分類,并做記錄。③制定評(píng)定量表,考察題目對所定義的內(nèi)容范圍的覆蓋率、判斷題目難度與能力要求之間的差異,還要考察各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式對內(nèi)容的適當(dāng)性等,對整個(gè)測驗(yàn)的有效性作出總的評(píng)價(jià)。(2)統(tǒng)計(jì)分析法克隆巴赫還提出過內(nèi)容效度的統(tǒng)計(jì)分析方法。其具體方法是:從同一個(gè)教學(xué)內(nèi)容總體中抽取兩套獨(dú)立的平行測驗(yàn),用這兩個(gè)測驗(yàn)來測同一批被試,求其相關(guān)。若相關(guān)低,則兩個(gè)測驗(yàn)中至少有一個(gè)缺乏內(nèi)容效度;若相關(guān)高,則測驗(yàn)可能有較高的內(nèi)容效度。(3)再測法這種方法的操作過程是:在被試學(xué)習(xí)某種知識(shí)之前做一次測驗(yàn),在學(xué)過該知識(shí)后再做同樣的測驗(yàn)。這時(shí),若后測成績顯著地優(yōu)于前測成績,則說明所測內(nèi)容正是被試新近所學(xué)內(nèi)容,進(jìn)而證明該測驗(yàn)對這部分內(nèi)容而言具有較高的內(nèi)容效度。3.什么是結(jié)構(gòu)效度?測驗(yàn)編制者和使用者分別應(yīng)怎樣把握結(jié)構(gòu)效度?答:結(jié)構(gòu)效度是指一個(gè)測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,即測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。結(jié)構(gòu)效度主要應(yīng)用于智力測驗(yàn)、人格測驗(yàn)等一些心理測驗(yàn)方面。(1)結(jié)構(gòu)效度的確立步驟①提出理論假設(shè),并把這一假設(shè)分解成一些細(xì)小的綱目,以解釋被試在測驗(yàn)上的表現(xiàn)。②依據(jù)理論框架,推演出有關(guān)測驗(yàn)成績的假設(shè)。③用邏輯的和實(shí)證的方法來驗(yàn)證假設(shè)。(2)結(jié)構(gòu)效度的估計(jì)方法①測驗(yàn)內(nèi)部尋找證據(jù)法a.可以考察該測驗(yàn)的內(nèi)容效度。b.可以分析被試的答題過程。c.可以通過計(jì)算測驗(yàn)的同質(zhì)性信度的方法來檢測結(jié)構(gòu)效度。②測驗(yàn)之間尋找證據(jù)法a.可以去考察新編測驗(yàn)與某個(gè)已知的能有效測量相同特質(zhì)的舊測驗(yàn)之間的相關(guān)。b.也可以去考察新編測驗(yàn)與某個(gè)已知的能有效測量不同特質(zhì)的舊測驗(yàn)間的相關(guān)。c.通過因素分析的方法來了解測驗(yàn)的結(jié)構(gòu)效度。③考察測驗(yàn)的實(shí)證效度法如果一個(gè)測驗(yàn)有實(shí)證效度,則可以拿該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)與種類作為該測驗(yàn)的結(jié)構(gòu)效度指標(biāo)來推論測量的結(jié)構(gòu)效度。這里有兩種做法:a.根據(jù)效標(biāo)把人分成兩類,考察其得分的差異。b.根據(jù)測驗(yàn)得分把人分成高分組和低分組,考察這兩組人在所測特質(zhì)方面是否確有差異。若兩組人在所測特質(zhì)方面差異顯著,則說明該測驗(yàn)有效,具有較高的結(jié)構(gòu)效度。此外,對于一些被認(rèn)為是較穩(wěn)定的特質(zhì),若在短期內(nèi)兩次施測的結(jié)果差異不太大,則說明該測驗(yàn)符合理論構(gòu)想。④多種特質(zhì)——多種方法矩陣法該方法實(shí)質(zhì)是相容效度和區(qū)分效度法的綜合運(yùn)用,其原理是若用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高(用極為相似的方法測量不同特質(zhì)相關(guān)很低),則說明測量效度較高。⑤因素分析法:在測驗(yàn)研發(fā)之前,研究者可根據(jù)理論或?qū)嶒?yàn)研究,對所測驗(yàn)的結(jié)構(gòu)設(shè)計(jì)較為詳細(xì)的方案。在實(shí)測之后,可以分別采用探索性因素分析(EFA)和驗(yàn)證性因素分析(CFA)兩種方法研究測驗(yàn)的結(jié)構(gòu)效度。4.什么是實(shí)證效度?它與內(nèi)容效度和結(jié)構(gòu)效度有何異同?答:(1)實(shí)證效度實(shí)證效度是指一個(gè)測驗(yàn)對處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。即一個(gè)測驗(yàn)是否有效,應(yīng)該以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn)。被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn),簡稱為效標(biāo)。根據(jù)效標(biāo)資料搜集的時(shí)間差異,實(shí)證效度可以分成同時(shí)效度和預(yù)測效度兩種。①同時(shí)效度:效標(biāo)資料是與測驗(yàn)分?jǐn)?shù)同時(shí)搜集的。同時(shí)效度主要用于診斷現(xiàn)狀,在于用更簡單、更省時(shí)、更廉價(jià)和更有效的測驗(yàn)分?jǐn)?shù)來取代不易搜集的效標(biāo)資料。②預(yù)測效度:效標(biāo)資料是在測驗(yàn)之后根據(jù)實(shí)際工作成績來確定的。預(yù)測效度的作用在于預(yù)測某個(gè)個(gè)體將來的行為。(2)與內(nèi)容效度和結(jié)構(gòu)效度的異同①相同點(diǎn)這三種效度都是從不同角度來衡量測驗(yàn)的效度,相互補(bǔ)充,共同驗(yàn)證測驗(yàn)的有效性。②不同點(diǎn)a.它們是估計(jì)測驗(yàn)效度的不同方面:內(nèi)容效度是確定測驗(yàn)在多大程度上代表了所要測量的行為領(lǐng)域,結(jié)構(gòu)效度是確定測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,實(shí)證效度是對于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。b.它們的應(yīng)用范圍不同。內(nèi)容效度主要應(yīng)用于成就測驗(yàn),結(jié)構(gòu)效度主要用于智力測驗(yàn)和人格測驗(yàn),實(shí)證效度主要應(yīng)用于能力傾向測驗(yàn)。c.確定它們的方法也不同。確定內(nèi)容效度的主要方法是邏輯分析法,確定結(jié)構(gòu)效度的方法包括測驗(yàn)內(nèi)部尋找證據(jù)法、測驗(yàn)之間尋找證據(jù)法等,實(shí)證效度的確定方法包括相關(guān)法、區(qū)分法和命中率法。5.什么是效標(biāo)和效標(biāo)測量?效標(biāo)測量有何不足?答:(1)效標(biāo)就是衡量一個(gè)測驗(yàn)是否有效的外在標(biāo)準(zhǔn),它是獨(dú)立于測驗(yàn)并可以從實(shí)踐中直接獲得的人們所感興趣的行為。(2)人們所感興趣的行為往往是一個(gè)觀念上的東西(觀念效標(biāo)),它必須用一個(gè)數(shù)字或等級(jí)來進(jìn)行表達(dá)(效標(biāo)測量)。效標(biāo)測量要想較好地體現(xiàn)觀念效標(biāo),效標(biāo)測量本身就必須是有效的和可靠的,而且還必須客觀、實(shí)用。如果一個(gè)測驗(yàn)有實(shí)證效度,則可以拿該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)與種類作為該測驗(yàn)的結(jié)構(gòu)效度指標(biāo)來推論測量的結(jié)構(gòu)效度。這里有兩種做法:①根據(jù)效標(biāo)把人分成兩類,考察其得分的差異。②根據(jù)測驗(yàn)得分把人分成高分組和低分組,考察這兩組人在所測特質(zhì)方面是否確有差異。若兩組人在所測特質(zhì)方面差異顯著,則說明該測驗(yàn)有效,具有較高的結(jié)構(gòu)效度。此外,對于一些被認(rèn)為是較穩(wěn)定的特質(zhì),若在短期內(nèi)兩次施測的結(jié)果差異不太大,則說明該測驗(yàn)符合理論構(gòu)想。(3)效標(biāo)測量的不足①效標(biāo)測量具有多樣性和復(fù)雜性。同一個(gè)觀念效標(biāo)可以有多個(gè)效標(biāo)測量,而且每一種效標(biāo)行為往往都是由多種特質(zhì)構(gòu)成的,因此,效標(biāo)測量是件極為復(fù)雜的事。②效標(biāo)測量具有特殊性和時(shí)間性。由于效標(biāo)測量多種多樣,所以有些效標(biāo)測量只可以反映測驗(yàn)在某一特殊方面的有效性程度,即在一種情況下有效的測量,在另一種情況下未必有效。這就要求測驗(yàn)的編制者和使用者特別小心。③一般來說,如果效標(biāo)測量要想較好地體現(xiàn)觀念效標(biāo),效標(biāo)測量本身就必須是有效的和可靠的,而且必須客觀和實(shí)用。6.已知rxx=0.31,rxy=0.42,若希望把效度系數(shù)提高到0.65和0.70,則測驗(yàn)長度要增加幾倍?答:測驗(yàn)長度與效度的公式如下:整理得:當(dāng)時(shí),當(dāng)時(shí),所以,要想把效度系數(shù)提高到0.65,測驗(yàn)長度需要增加6.42倍;要提高到0.70,測驗(yàn)長度需要增加13.80倍。7.復(fù)習(xí)有關(guān)教育與心理統(tǒng)計(jì)知識(shí),弄清各種相關(guān)系數(shù)的計(jì)算方法與使用條件。答:(1)Pearson相關(guān)Pearson相關(guān)是最常用的相關(guān),主要用于測量兩個(gè)變量間線性相關(guān)的程度和方向,一般用于等距或等比的數(shù)據(jù)。Pearson相關(guān)系數(shù)用r來表示,它的計(jì)算方法如下:其中,表示x和y的協(xié)方差,即兩者共變的程度,用原始數(shù)據(jù)表示為:SSxSSy表示x和y各自方差的乘積。(2)Spearman相關(guān)Spearman相關(guān)的顯著性檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法。一般在兩種情況下會(huì)用到Spearman相關(guān)的顯著性檢驗(yàn):①當(dāng)研究考查的變量為順序型數(shù)據(jù)時(shí);②當(dāng)研究考查的變量為線性、不考慮分?jǐn)?shù)分布是否正態(tài)的數(shù)據(jù)時(shí)。它的計(jì)算方法為:在計(jì)算Spearman相關(guān)系數(shù)時(shí),首先要保證X和Y是順序型數(shù)據(jù),無論它們原始的值就是順序型的,還是經(jīng)過等級(jí)轉(zhuǎn)換而成的。在進(jìn)行等級(jí)轉(zhuǎn)換的時(shí)候,最小的值等級(jí)為1,第二小的等級(jí)為2,依此類推。之后,使用Pearson相關(guān)公式對順序型數(shù)據(jù)進(jìn)行計(jì)算,即可得到Spearman相關(guān)系數(shù),該系數(shù)用rR表示。其中,D為同一個(gè)個(gè)體的X和Y各自排序后等級(jí)的差。(3)點(diǎn)二列相關(guān)點(diǎn)二列相關(guān)用于一列數(shù)據(jù)為正態(tài)等距或等比變量,另一列為二分命名變量的情況下,考查兩個(gè)變量之間的關(guān)系。點(diǎn)二列相關(guān)的相關(guān)系數(shù)記為rpb,其公式如下:其中,是與二分命名變量的一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù),是與二分命名變量的另一個(gè)值對應(yīng)的連續(xù)變量的平均數(shù),p是指二分命名變量中某一個(gè)值的比例,而q則指另一個(gè)值的比例。St表示等距或等比數(shù)據(jù)的標(biāo)準(zhǔn)差。(4)Kendall和諧系數(shù)Kendall和諧系數(shù)就是用來表示多列等級(jí)變量相關(guān)程度的指標(biāo),最為常見的應(yīng)用情況就是K個(gè)評(píng)定者對N個(gè)事物進(jìn)行等級(jí)評(píng)定,考查這K個(gè)評(píng)定者之間評(píng)分的一致性。可見,Kendall和諧系數(shù)也是等級(jí)相關(guān)系數(shù)的一種。Kendall和諧系數(shù)的公式如下:其中,Ri為每一個(gè)被評(píng)價(jià)事物的K個(gè)等級(jí)之和,K為評(píng)定者的個(gè)數(shù),N為被評(píng)價(jià)的事物的個(gè)數(shù)。8.假設(shè)某學(xué)者自編了一套神經(jīng)類型測驗(yàn),并且在幾十萬人中進(jìn)行了試用。試問:該測驗(yàn)是否一定有效?答:測驗(yàn)的有效性,即測驗(yàn)的效度,是指一個(gè)測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度。分為內(nèi)容效度、結(jié)構(gòu)效度和實(shí)證效度等,可以分別從這三個(gè)方面來探討一下該測驗(yàn)是否有效:(1)從內(nèi)容效度方面來看內(nèi)容效度是指一個(gè)測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。通常來講,內(nèi)容效度的確定方法是:專家評(píng)定法和統(tǒng)計(jì)分析法。①明確欲測內(nèi)容的范圍,包括知識(shí)范圍和能力要求兩個(gè)方面。這種范圍的確定必須具體、詳細(xì),并要根據(jù)一定目的規(guī)定好各綱目的比例。②確定每個(gè)題目所測的內(nèi)容,并與測驗(yàn)編制者所列的雙向細(xì)目表(考試藍(lán)圖)對照,逐題比較自己的分類與制卷者的分類,并做記錄。③制定評(píng)定量表,考察題目對所定義的內(nèi)容范圍的覆蓋率、判斷題目難度與能力要求之間的差異,還要考察各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式對內(nèi)容的適當(dāng)性等,對整個(gè)測驗(yàn)的有效性作出總的評(píng)價(jià)。④克隆巴赫還提出過內(nèi)容效度的統(tǒng)計(jì)分析方法。其具體方法是:a.從同一個(gè)教學(xué)內(nèi)容總體中抽取兩套獨(dú)立的平行測驗(yàn),用這兩個(gè)測驗(yàn)來測同一批被試,求其相關(guān)。若相關(guān)低,則兩個(gè)測驗(yàn)中至少有一個(gè)缺乏內(nèi)容效度;若相關(guān)高,則測驗(yàn)可能有較高的內(nèi)容效度(除非兩個(gè)測驗(yàn)取樣偏向同一個(gè)方面)。b.第二種判斷內(nèi)容效度的方法是再測法。這種方法的操作過程是:在被試學(xué)習(xí)某種知識(shí)之前做一次測驗(yàn),在學(xué)過該知識(shí)后再做同樣的測驗(yàn)。這時(shí),若后測成績顯著地優(yōu)于前測成績,則說明所測內(nèi)容正是被試新近所學(xué)內(nèi)容,進(jìn)而證明該測驗(yàn)對這部分內(nèi)容而言具有較高的內(nèi)容效度。從題目看來,這種測驗(yàn)是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論