版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
心理與教育測量第一章.心理與教育測量概論測量的概述測量:就是依據(jù)一定的法則使用量具對事物的特征進(jìn)行定量描述的過程。對測量精確度的影響:測量對象的性質(zhì)(確定型、隨機(jī)型、模糊型)和測量工具的精密性。測量分類:物理測量、生理測量、社會測量、心理測量?;疽兀簠⒄拯c和單位。參照點即測量的起點,可以分為絕對參照點和相對參照點。絕對參照點以絕對的零點作為測量的起點,相對參照點以人為確定的零點作為測量的起點。心理測量都為相對參照點。理想的單位具備的兩個條件:確定的意義、相等的價值。心理測量的單位既無同一單位也不符合等距的要求。量表:能使事物的特征數(shù)量化的數(shù)字的連續(xù)體,即具有參照點和單位的連續(xù)體。量表的種類:根據(jù)測量中使用的不同參照點和單位以及測量的不同水平,斯蒂文斯將量表分成:命名量表、順序量表、等距量表、等比量表。命名量表:用數(shù)字代表事物或用數(shù)字對事物進(jìn)行分類。命名量表中的數(shù)字沒有任何意義,不能做數(shù)量化分析。無參照點和單位,無法進(jìn)行任何數(shù)學(xué)運算。順序量表:表明類別的大小或某種屬性的多少。數(shù)字僅表示等級并不表示某種屬性的真正量和絕對值,無參照點和單位,無法進(jìn)行數(shù)學(xué)運算。等距量表:存在大小關(guān)系,無絕對參照點,但有相對參照點,有相等單位,可以進(jìn)行加減運算。等比量表:是最精確的測量,大多數(shù)是物理量表。心理量表最好只能達(dá)到等距量表水平??梢灾朗挛锬程攸c上相差多少和它們之間的倍數(shù)關(guān)系,有相等單位和絕對零點。心理與教育測量定義:依據(jù)一定的心理學(xué)和教育學(xué)理論,使用測驗對人的心理特質(zhì)和教育成就進(jìn)行定量描述的過程。著名心理學(xué)測量學(xué)家安娜斯泰西的定義:心理測驗實質(zhì)上是行為樣本的客觀和標(biāo)準(zhǔn)化的測量。根據(jù)這一定義,測驗應(yīng)當(dāng)具備四個基本條件:行為樣本(即找有代表性的少數(shù)行為作為全部行為的樣本)、標(biāo)準(zhǔn)化(測驗編制、實施、評分和分?jǐn)?shù)解釋的程序的一致性)、難度或應(yīng)答率、信度和效度。心理測驗的性質(zhì):相對性、間接性、客觀性心理測驗的種類:(內(nèi)容)智力測驗、能力傾向測驗、學(xué)績測驗、人格測驗(對象)團(tuán)體測驗和個別測驗(測驗表現(xiàn)形式)文字測驗和非文字測驗(目的)描述、診斷、預(yù)測(時間限制)速度測驗和難度測驗(測驗要求)最高行為測驗和典型行為測驗。前者要求被試盡可能做出最好的回答,有正確答案,后者要求被試按日常習(xí)慣回答,無正確答案。心理測驗的功能:從理論研究角度:收集研究資料、建立和檢驗理論假設(shè)、實驗分組從實際應(yīng)用角度:選拔人才、人員安置、心理診斷、描述評價、心理咨詢第二章.心理與教育測量發(fā)展歷史1、中國古代心理測量簡述:公元六世紀(jì)初,南朝人劉勰的著作《新論?專學(xué)》中提到了類似現(xiàn)代“分心測驗”的思想。(2)在中國古代,“七巧板”是很常見的一種兒童玩具,其實它可以作為創(chuàng)造力測量的工具。(3)中國古代心理測量的思想中包含著典型的東方文化特點:定性描述及帶有道德判斷色彩。(3)三國時劉劭著的《人物志》一書,1937年美國人把它譯成英文,書名為《人類能力的研究》。2、中國近代心理測量的出現(xiàn):(1)1916年,樊炳清先生首先介紹了比內(nèi)-西蒙智力量表。(2)1920年,北京高等師范學(xué)校和南京師范學(xué)校建立了我國最早的兩個心理學(xué)實驗室,廖世承和陳鶴琴先生在南京高等師范學(xué)校開設(shè)心理測驗課。1921年,他倆正式出版《心理測驗法》一書。(3)1922年夏天,中華教育改進(jìn)社聘請美國教育心理測驗專家麥柯爾來華講學(xué)。(4)1924年,陸志韋先生發(fā)表了《訂正比內(nèi)西蒙智力測驗說明書》,30年代又與吳天敏再次做了修訂。(5)1931年由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織并成立了中國測驗學(xué)會。(6)1932年《測驗》雜志創(chuàng)刊。(7)至抗戰(zhàn)前夕,由我國心理學(xué)工作者制定或編制出的合乎標(biāo)準(zhǔn)的智力測驗和人格測驗約20種,教育測驗50多種。3、中國現(xiàn)代心理測量的發(fā)展:(1)1936年,蘇聯(lián)在批判“兒童學(xué)”時擴(kuò)大化,心理測驗也被一概禁止。(2)從1978年北京大學(xué)首建心理系開始,心理測驗才重新得到恢復(fù)。(3)1979年,林傳鼎、張厚等以國外資料為參考,編制了少年兒童學(xué)習(xí)能力測驗。(4)1980年初,北師大心理系開設(shè)了心理測量課。1984年,在北京召開的第五屆全國心理學(xué)年會上,成立了心理測驗工作委員會,加強(qiáng)了測驗工作的指導(dǎo)和監(jiān)督。4、科學(xué)心理測驗的產(chǎn)生:心理測驗的產(chǎn)生,是出于實際需要。最初,人們用測驗,是因為要治療智力落后者和精神病病人。(1)法國的醫(yī)生艾斯克羅爾第一個把智力落后與精神病分開。他認(rèn)為,精神病以情緒障礙為標(biāo)志,不一定伴隨智力落后,而智力落后則是以出生時或嬰兒期表現(xiàn)出來的智力缺陷為主要標(biāo)志。(2)50多年后,法國的心理學(xué)家比內(nèi)提出應(yīng)該從正常學(xué)校學(xué)習(xí)的兒童中篩選出不適應(yīng)的兒童,安排在特殊的班級里學(xué)習(xí)和教育。此舉動導(dǎo)致了心理測驗史上重大事件的發(fā)生--第一個智力測驗的誕生。(3)實驗心理學(xué)的誕生是心理測驗產(chǎn)生的另一個重要原因。實驗心理學(xué)的誕生和發(fā)展,還給心理測量帶來了另一個副產(chǎn)品:嚴(yán)格的標(biāo)準(zhǔn)化程序。標(biāo)準(zhǔn)化是現(xiàn)代心理測驗的重要評價指標(biāo)。5、西方早期的心理測驗嘗試:(1)弗蘭西斯?高爾頓是第一個倡導(dǎo)心理測驗的人。他于1884年在倫敦國際博覽會上專門設(shè)立了一個“人類測量實驗室”。他的這一舉動是心理測驗史上第一個大規(guī)模系統(tǒng)地測量個體差異的嘗試。(2)高爾頓還是使用評定量表和問卷法的先驅(qū)。并且他發(fā)展了分析個體差異資料的統(tǒng)計方法,不僅擴(kuò)充了古特列特的百分位法,而且創(chuàng)造了粗淺的相關(guān)計算法。(3)美國心理學(xué)家卡特爾1980年發(fā)表《心理測驗與測量》一文于《心理》雜志上,這是在心理學(xué)文獻(xiàn)中首次出現(xiàn)“心理測驗”一詞。6、比內(nèi)-西蒙量表的誕生及心理測驗的發(fā)展:(1)1904年比內(nèi)為了鑒別弱智兒童,他與西蒙合作編制成了世界上第一個科學(xué)的智力測驗--比內(nèi)-西蒙量表。1905年,他在《心理學(xué)年報》上發(fā)表了文章《診斷異常兒童的新方法》,介紹了該量表,歷史上稱為“1905量表”。從此,比內(nèi)-西蒙量表宣告誕生。(2)比內(nèi)-西蒙量表自1905年發(fā)表后,比內(nèi)和西蒙親自主持過兩次修訂,一次在1908年,一次在1911年,此時比內(nèi)已不幸去世。(3)1905年量表主要強(qiáng)調(diào)的是判斷、理解和推理能力,也就是比內(nèi)認(rèn)為的智力的基本組成成分。1908年版的量表刪掉了1905年版中不合適的題目,增加了新題目,題目總數(shù)大59個。所有測驗題目按年齡分組,從3-13歲。測驗的結(jié)果用“智力水平”來表示。人們常叫它為“智力年齡”。它表示一個兒童能完成何種年齡水平的兒童所能完成的測驗。(4)最有名的是1918年出版的美國斯坦福大學(xué)的推孟教授修訂的“斯坦福-比內(nèi)量表”這一量表首次使用了“智力商數(shù)”的概念,簡稱為IQ,是心理年齡和實際年齡的比值。(5)比較有名的幾個測驗。1智力測驗:推孟的研究生歐提斯編制的團(tuán)體智力測驗,而后在次基礎(chǔ)上發(fā)展出美國陸軍用甲、乙兩種測驗。有基于因素分析理論編制的測量多項能力的韋克斯勒的兒童智力量表。還有桑代克編制的標(biāo)準(zhǔn)化教育測驗。2人格測驗:1917年武德沃斯設(shè)計的“個人資料調(diào)查表”。1912年問世的羅夏克墨跡圖測驗(RIT)和于1943年首次出版,由哈撒韋和麥金利編制的目前影響最大的MMPI-明尼蘇達(dá)多相人格調(diào)查表。第三章.經(jīng)典測驗理論的基本假設(shè)經(jīng)典測驗理論模型心理特質(zhì):表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式。具有概括抽象性、綜合不同刺激、穩(wěn)定性、多層次有機(jī)組合、預(yù)測性的特點。CTT心理特質(zhì)的可測性假設(shè):凡客觀存在的事物都有其數(shù)量(桑代克)、凡有數(shù)量的東西都可以測量(麥柯爾)。數(shù)學(xué)模型:X=T+E,即經(jīng)典測驗理論假定,觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)之間有一種線性關(guān)系,并只相差一個隨機(jī)誤差(E)。據(jù)此,引申出三個相關(guān)聯(lián)的假設(shè)公理:(1)若一個人的某種心理特質(zhì)可以用平行的測驗反復(fù)測量足夠多次,則其觀察分?jǐn)?shù)的平均值會接近與真分?jǐn)?shù)。即E的分布是平均數(shù)為零的正態(tài)分布。(2)真分?jǐn)?shù)與誤差分?jǐn)?shù)之間的相關(guān)為零。(3)個平行測驗上的誤差分?jǐn)?shù)之間相關(guān)為零。即E是隨機(jī)誤差。注:用許多個平行測驗反復(fù)測量同一個人的同一種心理特質(zhì)的做法很難實現(xiàn),所有用一個測驗來同時測量許多被試,團(tuán)體的觀察分?jǐn)?shù)的均值會接近于該團(tuán)體真分?jǐn)?shù)的均值。推導(dǎo)公式:Sx2=St2+Se2,而St2=Sv2+S「測量的誤差及其來源測量誤差:在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng)。分類:隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差:就是那些由與測量目的無關(guān)的、偶然因素引起的而又不易控制的誤差。系統(tǒng)誤差:那些由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。誤差來源:測量工具、測量對象、施測過程。(1)測量工具:信效度(即是否穩(wěn)定和有效)、難度、長度、指導(dǎo)語、題目形式等。(2)測量對象(被試):被試誤差可分為:應(yīng)試技巧與練習(xí)、動機(jī)和焦慮、反應(yīng)定勢。應(yīng)試技巧與練習(xí):速度測驗比難度測驗更易受練習(xí)的影響。動機(jī)與焦慮:一般來說,適度的測驗焦慮會使人提高興奮水平,促進(jìn)注意力,反應(yīng)加快,有利于智力測驗、成就測驗和能力傾向類的測驗。但焦慮水平過高過低都不利于測驗。反應(yīng)定勢:即反應(yīng)風(fēng)格。是被試的一種反應(yīng)傾向,與測驗內(nèi)容無關(guān)。簡言之,即被試的答題習(xí)慣。定勢的種類:求“快”定勢、求“精確”定勢、喜好正面敘述的定勢、位置定勢、長選項定勢、猜測定勢。(3)施測過程:物理環(huán)境:施測現(xiàn)場的溫度、光線、聲音、桌面好壞、空間闊窄等。主試者:主試者的生理物理因素、主試在施測時偏離規(guī)定程序、主試的態(tài)度動機(jī)(例如羅森塔爾效應(yīng))注:有幾種狀況主試能產(chǎn)生較大影響:測驗步驟復(fù)雜,指導(dǎo)語冗長繁瑣。測驗題目本身模糊不定,靈活多變。安排的施測條件寬裕,有較多靈活機(jī)動的余地。被試屬幼兒或情緒困擾者。第四章.測量信度一?信度概述信度:測量結(jié)果的一致性和穩(wěn)定性程度。即統(tǒng)一測量工具反復(fù)測量某人的同一心理品質(zhì),多次結(jié)果的一致性程度。三種信度定義:定義一:信度系數(shù)乃是一個被測團(tuán)體真實分?jǐn)?shù)與實得分?jǐn)?shù)的變異數(shù)之比。定義二:信度系數(shù)乃是一個被測團(tuán)體真分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān)系數(shù)的平方。定義三:信度溪水乃是兩個平行測驗的相關(guān)系數(shù)。注:信度的表示方法有信度系數(shù)和信度指數(shù)。信度指數(shù)即信度系數(shù)的平方根。測量的標(biāo)準(zhǔn)誤:SE=Sx"1-rxx分別代表測量的標(biāo)準(zhǔn)誤、實得分?jǐn)?shù)的標(biāo)準(zhǔn)差、信度系數(shù)。信度的意義:*信度系數(shù)可以解釋為樣本測驗分?jǐn)?shù)的總方差中有多少比例是真分?jǐn)?shù)方差,它直接告訴我們測量的誤差有多大(即sE)。測量的標(biāo)準(zhǔn)誤可以告訴我們有多大可能性真實分?jǐn)?shù)在某一分?jǐn)?shù)范圍內(nèi),并且可以預(yù)測實得分?jǐn)?shù)再測時的可能變化情況。信度的作用:信度是測量過程中所存在的隨機(jī)誤差大小的反映。信度可以用來解釋個人測驗分?jǐn)?shù)的意義。信度可以幫助進(jìn)行不同測驗分?jǐn)?shù)的比較。注:它是確定測驗好壞的一個指標(biāo)。一般的原則是:a當(dāng)rxxV0.70時,測驗不能用于對個人作出評價或預(yù)測,而且不能做團(tuán)體間比較。b當(dāng)0.70WrxxV0.85時,可用于團(tuán)體比較。c當(dāng)rxxN0.85時,才可以用來鑒別或預(yù)測個人成績或作用二.信度的分類和估計方法(根據(jù)誤差來源)重測信度:也叫穩(wěn)定性信度,誤差來源是時間取樣。即同一量表對同一組被試施測兩次所得結(jié)果的一致性程度。采集數(shù)據(jù):對同一組被試間隔一段時間重復(fù)測量一次。計算方法:皮爾遜積差相關(guān)使用條件:a.所測的心理特性必須是穩(wěn)定的。b.遺忘和練習(xí)的效應(yīng)基本上相互抵消。c.在間隔期內(nèi),所測心理特質(zhì)沒有得到更多的學(xué)習(xí)和訓(xùn)練。重測信度的時間間隔選擇依測驗性質(zhì)和目的而定,如果測驗是用于長期預(yù)測,則測量間隔長一些。對兒童的智力測驗一般是兩周到四周為宜。對成年人,間隔可到半年,很少超過6個月。復(fù)本信度:也叫等值性系數(shù),誤差來源是內(nèi)容取樣。即兩個平行的測驗測量同一組被試所得結(jié)果的一致性程度。采集數(shù)據(jù):對同一組被試施測內(nèi)容等值但題目不同的平行測驗。計算方法:皮爾遜積差相關(guān)使用條件:a.要構(gòu)造出兩份真正的平行測驗。b.被是要有條件接受兩個測驗。復(fù)本信度的高低反映了兩個互為復(fù)本的測驗等價的程度,而不是反映一個測驗本身受隨機(jī)誤差影響的大小。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗的選擇,因而是題目取樣問題,或者說是測驗的內(nèi)容取樣問題。復(fù)本信度優(yōu)于重測信度的地方是:a.避免了重測帶來的記憶效應(yīng)和練習(xí)效應(yīng)。b.可用于長期追蹤研究前后測量。c.減少了作弊的可能性。復(fù)本信度的缺點:a.有些測驗的復(fù)本很難找到。b.一些解題的策略技巧可能產(chǎn)生遷移效應(yīng)。如測量的內(nèi)容很容易受練習(xí)的影響,復(fù)本信度也無法清除這種練習(xí)效應(yīng)。重測復(fù)本信度,即再不同的時間里施測兩個等值的測驗(復(fù)本),得到的相關(guān)就是重測復(fù)本信度,也叫穩(wěn)定等值系數(shù)。它比單一的重測信度或復(fù)本信度都要嚴(yán)格、全面一些。分半信度:即將一個測驗分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。誤差來源也是內(nèi)容取樣,它與復(fù)本信度的差別是:分半信度考查一個測驗內(nèi)容的兩半題目測量的是否是同一個心理特質(zhì)。采集數(shù)據(jù):將一個測驗分成兩半(如按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半),求同一組被試在兩半上得分的相關(guān)系數(shù)。計算方法:a.皮爾遜積差相關(guān),后用斯皮爾曼布朗公式校正。b.弗朗那根公式。c.盧侖公式。內(nèi)部一致性信度(同質(zhì)性信度):即測驗內(nèi)部所有題目的一致性程度。測量單一特質(zhì)是同質(zhì)性高的必要條件。計算方法:a.KR20,僅適合于二分法記分的測驗題目。b.KR21當(dāng)所有題目難度接近時才適用。c.克龍巴赫a系數(shù)。d.荷伊特信度。從同質(zhì)性信度的含義我們不難看出,分半信度是求測驗兩半之間的一致性或同質(zhì)性,而同質(zhì)性是求所有題目間的一致性。因此分半信度實際上是同質(zhì)性信度的一種,可以作為測驗同質(zhì)性評價的粗略估計指標(biāo)。因為可以根據(jù)測驗得分來推論或驗證某種概念或理論構(gòu)思,因此同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度,它實際上介于信度與效度之間。評分者信度:指的是多個評分者給同一批人的答案進(jìn)行評分的一致性程度。誤差來源是評分者之間的差異。計算方法:a.評分者兩人時,積差相關(guān)或等級相關(guān)。b.多于兩人時,肯德爾和諧系數(shù)。提高測驗信度的方法影響測驗信度的主要因素:被試:單個:身心健康狀況、應(yīng)試動機(jī)、注意力、耐力、求勝心、作答態(tài)度。團(tuán)體:團(tuán)體內(nèi)部水平的離散程度和團(tuán)體的平均水平。注:樣本團(tuán)體異質(zhì)性的影響:樣本團(tuán)體異質(zhì)的話,測驗分?jǐn)?shù)的分布就比同質(zhì)樣本的要廣,分?jǐn)?shù)的離差就大,樣本的方差就大,信度就高。實際上,高信度可能是假性高信度,是由樣本團(tuán)體的異質(zhì)造成的。但如果常??傮w要求各種各樣的人,則異質(zhì)的信度樣本求得的信度就是真信度。這時,相反的情況就需要校正信度。主試:施測者:若不按指導(dǎo)手冊中的規(guī)定施測,或故意制造緊張氣氛,或給予考生一定的暗示、協(xié)助,信度低。評分者:評分標(biāo)準(zhǔn)掌握不一,或前松后緊,甚至隨心所欲,信度低。實測情境:安靜與否、光線、通風(fēng)、設(shè)備是否齊全、桌面是否合要求、空間闊窄等。測量工具:試題的取樣、試題之間的同質(zhì)性程度、試題的難度、兩次施測的時間間隔(針對重測信度和穩(wěn)定等值性系數(shù))。提高測驗信度的方法:適當(dāng)增加試題長度。使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平。努力提高試題的區(qū)分度。選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測驗在同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度。主試者嚴(yán)格執(zhí)行施測規(guī)程,評分者嚴(yán)格按標(biāo)準(zhǔn)給分,施測場地按測驗手冊的要求進(jìn)行布置,減少無關(guān)因素的干擾。第五章.測量效度效度概述效度:指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。即測量的準(zhǔn)確性。注:a.相對性。b.是隨機(jī)誤差和系統(tǒng)誤差的綜合反映。c.判斷一個測驗是否有效要從多方面搜集證據(jù)。與信度的關(guān)系:a.信度高是效度高的必要而非充分條件。b.測驗的效度收到它的信度制約。公式:rxy2=SV2/SX2效度的指標(biāo):效度系數(shù)、統(tǒng)計推斷參數(shù)、預(yù)期表等。其中效度系數(shù)是最常用的,效度系數(shù)的實際意義用決定性系數(shù)來表示,即rxy2效度的分類與計算內(nèi)容效度:一個測驗實際測到的內(nèi)容與所要測的內(nèi)容之間的吻合程度,即測驗題目對有關(guān)內(nèi)容或行為總體取樣的適當(dāng)性程度。條件:a.內(nèi)容范圍或行為總體必須界定明確。b.測驗題目必須是所界定的內(nèi)容范圍或行為總體的代表性樣本。確定方法:a.專家評定法(邏輯分析法)。b.統(tǒng)計分析法。c.再測法。注:要避免與表面效度相混淆。表面效度是一個測驗看起來好像是測量所要測的心理特質(zhì)的程度。換句話說,當(dāng)那些未經(jīng)過訓(xùn)練的被試或測驗應(yīng)用者認(rèn)為某測驗是有效的測驗時,該測驗就有表面效度。結(jié)構(gòu)效度:一個測驗實際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度。確定步驟:a.提出理論假設(shè)。b.依據(jù)理論框架,推演出有關(guān)測驗成績的假設(shè)。c.用邏輯和實證的方法驗證假設(shè)。確定方法:a.測驗內(nèi)部(內(nèi)容效度、答題過程、同質(zhì)性信度)。b.測驗之間(相容效度發(fā)、區(qū)分效度法、因素分析法)。c.實證效度。d.多種特質(zhì)-多種方法矩陣法。實證效度:指一個測驗對特定情境中的個體的行為進(jìn)行估計的有效性。即測驗總分與外在標(biāo)準(zhǔn)之間的相關(guān)程度,由于外在標(biāo)準(zhǔn)成為考察測驗有效性的參照標(biāo)準(zhǔn),所以稱為校標(biāo)。校標(biāo):衡量一個測驗是否有效的外在標(biāo)準(zhǔn),它是獨立于測驗并可以從實踐中直接獲得的我們所感興趣的行為。阿斯丁把校標(biāo)分成兩個層次:a.理論描述水平的“觀念校標(biāo)”。b.操作定義水平的“校標(biāo)測量”。為了使校標(biāo)測量能真正反映觀念校標(biāo),要做到:a.避免偏見影響校標(biāo)測量。b.防止校標(biāo)污染,即指個人的校標(biāo)因評定者知道個體的測驗分?jǐn)?shù)(預(yù)測源分?jǐn)?shù))而受到影響。常用的校標(biāo):學(xué)業(yè)成就、等級評定、臨床診斷、專門訓(xùn)練成績、實際工作表現(xiàn)、對團(tuán)體的區(qū)分能力、其他現(xiàn)成的校標(biāo)。分類:同時效度:其校標(biāo)資料是與測驗分?jǐn)?shù)同時搜集的。主要用于診斷現(xiàn)狀,預(yù)測效度:其校標(biāo)資料是在測驗后根據(jù)實際工作成績來確定的。用于預(yù)測。確定步驟:a.明確觀念校標(biāo)。b.確定校標(biāo)測量。c.考察測驗分?jǐn)?shù)與校標(biāo)測量的關(guān)系。確定方法:a.相關(guān)法。b.區(qū)分法。c.命中率。注:總命中率:測驗選出的人當(dāng)中工作合格的人數(shù),以及根據(jù)測驗淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之比。正命中率:測驗選出的人中合格者所占的比例。提高測驗效度的方法影響測驗效度的因素:測驗的構(gòu)成:試題樣本沒有較好地代表欲測內(nèi)容或結(jié)構(gòu)、題目語義不清、指導(dǎo)語不明、題目太難或太易、題目太少或安排不當(dāng)?shù)龋紩档托Ф?。實施過程:如不遵從指導(dǎo)語的要求、或出現(xiàn)意外干擾、或評分記分出現(xiàn)差錯。被試:個體:應(yīng)試動機(jī)、情緒、態(tài)度、身體狀態(tài)等。團(tuán)體:年齡、性別、文化程度與職業(yè)等方面的特征。所選校標(biāo)的性質(zhì)測量的信度提高測量效度的方法:(1)精心編制測驗量表,避免出現(xiàn)較大的系統(tǒng)誤差。妥善組織測驗,控制隨機(jī)誤差。創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個被試都能發(fā)揮正常的水平。選好正確的校標(biāo),定好恰當(dāng)?shù)男?biāo)測量,正確地使用公式。第六章.測驗的項目分析項目分析概述項目分析:一種分析被試對測驗項目的反應(yīng)的統(tǒng)計方法,而廣義的項目分析還包括內(nèi)容效度分析和項目編寫的分析。狹義的指難度和區(qū)分度。難度難度:指測驗的難易程度。計算:(二分法記分)a.通過率:P=R/N。b.極端分組法:P=(Ph+Pl)/2(非二分法記分)P=X/Xmax確定:(1)項目難度為0.5最理想,此時的項目具有最大鑒別能力。在實際操作中,一般只要是項目的平均難度接近0.5,而各個項目難度在0.5±0.2之間。如果用于選拔、錄用人員,將項目難度控制在接近錄取率左右。當(dāng)項目形式是選擇題時,要讓P值大于概率水平,否則項目是無效的。以上難度指標(biāo)屬于順序變量,不具有相等單位,無法指出難度之間差異大小,所以要將其轉(zhuǎn)換為等距量表,即轉(zhuǎn)換成Z分?jǐn)?shù)(方法:將難度作為正態(tài)曲線下的面積)?!?13+4Z(美國教育測驗服務(wù)中心采用的難度指標(biāo))難度對測驗的影響:(1)測驗難度影響測驗分?jǐn)?shù)的分布形態(tài)。(2)測驗難度影響測驗分?jǐn)?shù)的離散程度。猜測校正:難度校正、分人分?jǐn)?shù)校正區(qū)分度區(qū)分度:測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力。-1WDW1鑒別力分析(區(qū)分能力分析)的設(shè)想基礎(chǔ):如果單個項目與測驗測的是同一特質(zhì),那么我們可以預(yù)期在測驗上的高分的人正確回答這一問題的概率大,而在測驗上得低分的人正確回答這一問題的概率小。計算方法:(1)鑒別指數(shù)法:d=Ph-Pl(二分法記分)注:艾伯爾提出鑒別指數(shù)評價題目效能的標(biāo)準(zhǔn):0.19以下差必須修改,0.2到0.29尚可仍需修改,0.3到0.39良好修改會更好,0.4以上很好。(2)相關(guān)法:即以項目分?jǐn)?shù)與校標(biāo)分?jǐn)?shù)或測驗總分的相關(guān)作為項目區(qū)分度指標(biāo)。點二列相關(guān)。b.二列相關(guān)。c.0相關(guān)。d.積差相關(guān)。區(qū)分度和難度的關(guān)系:難度越接近0.5,項目潛在的區(qū)分度越大。實際中,應(yīng)使項目的難度分布廣一點,梯度大一點,使整個測驗的難度分布呈正態(tài)分布,且平均水平在0.5左右。區(qū)分度的相對性:不同的計算方法,所得區(qū)分值不同。樣本容量大小影響相關(guān)法區(qū)分值的大小。分組標(biāo)準(zhǔn)影響鑒別力指數(shù)值。被試樣本的同質(zhì)性程度影響區(qū)分度的大小。第七章.常模編制分?jǐn)?shù)轉(zhuǎn)換原始分?jǐn)?shù):在被試接受測驗后,根據(jù)測驗計分標(biāo)準(zhǔn),對照被試的反應(yīng)所計算出的測驗分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù):在原始分?jǐn)?shù)的轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計處理后獲得的具有一定參照點和單位,且可以相互比較的分?jǐn)?shù)。常見的導(dǎo)出分?jǐn)?shù)有:常模參照分?jǐn)?shù)、內(nèi)容參照分?jǐn)?shù)、結(jié)果參照分?jǐn)?shù)。分?jǐn)?shù)合成分?jǐn)?shù)合成:將幾個分?jǐn)?shù)或幾個預(yù)測源組合起來,以獲得一個合成分?jǐn)?shù)或作總的預(yù)測。類型:(1)由基本測驗項目組合成一個分測驗或一個測驗。(2)由幾個分測驗上的得分組合成合成分?jǐn)?shù)。(3)由幾個測驗的得分組合,獲得合成分?jǐn)?shù)或合成預(yù)測。方法:a.臨床診斷:根據(jù)直覺的經(jīng)驗,主觀地將各種因素加權(quán),而獲得結(jié)論或預(yù)測的方法。優(yōu)點:高度的綜合性、靈活的針對性。缺點:易受決策者的偏見影響,不夠客觀;沒有精確數(shù)量分析。加權(quán)求和:單位加權(quán)(根據(jù)每個變數(shù)與它的標(biāo)準(zhǔn)差成比例的加權(quán))、等量加權(quán)(適合于個測驗對預(yù)測校標(biāo)有同等重要性的場合)、差異加權(quán)(根據(jù)各個變數(shù)與校標(biāo)之間的經(jīng)驗關(guān)系加權(quán))。多重回歸:即利用測驗結(jié)果對預(yù)測校標(biāo)做出估計。條件:線性關(guān)系、同時獲得。多重劃分:在各個特質(zhì)上都確定一個標(biāo)準(zhǔn),從而把成績劃分成合格和不合格兩類,只有每個測驗都合格才算合格。(連續(xù)柵欄)常模參照測驗常模參照測驗:度量與比較個體間的差異,以被試在團(tuán)體中的相對位置來評定和解釋測量結(jié)果。常模參照測驗的導(dǎo)出分?jǐn)?shù)(常模分?jǐn)?shù)):常見的有百分等級、標(biāo)準(zhǔn)分?jǐn)?shù)以及標(biāo)準(zhǔn)分?jǐn)?shù)的各種變式等。(1)百分等級:a.定義:一個分?jǐn)?shù)的百分等級是指在一個群體的測驗分?jǐn)?shù)中,得分低于這個分?jǐn)?shù)的人數(shù)的百分比計算:未分組、分組。優(yōu)點:1.是一種相對位置量數(shù),具有可比性。2.易于計算,解釋方便。3.不受原始分?jǐn)?shù)分布狀態(tài)的影響,即使原始分?jǐn)?shù)分配不是正態(tài)的,也不會改變百分等級常模的解釋力。缺點:1.單位不等,尤其在分配的兩個極端。2.百分等級是順序變量。3.在運用時應(yīng)注意,百分等級是相對于特定的被試團(tuán)體而言的。(2)標(biāo)準(zhǔn)分?jǐn)?shù):a.定義:標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù),又稱Z分?jǐn)?shù)。它是將原始分?jǐn)?shù)與團(tuán)體的平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商數(shù),是以標(biāo)準(zhǔn)差為單位度量原始分?jǐn)?shù)離開其平均數(shù)多少個標(biāo)準(zhǔn)差。計算。性質(zhì):1.Z分?jǐn)?shù)原始分?jǐn)?shù)的分布形態(tài)相同。2.平均數(shù)為0,標(biāo)準(zhǔn)差為1.3.是以一批數(shù)的平均數(shù)為參照點,標(biāo)準(zhǔn)差為單位的等距量表。缺點:1.常出現(xiàn)負(fù)數(shù)和小數(shù)。2.單位過大。c.標(biāo)準(zhǔn)分?jǐn)?shù)的正態(tài)化:為了使來源于不同分布的分?jǐn)?shù)進(jìn)行比較,可使用非線性轉(zhuǎn)換,將非正態(tài)分布的分?jǐn)?shù)強(qiáng)制性地轉(zhuǎn)換成正態(tài)分布。(先求百分等級,再求對應(yīng)Z值)(3)標(biāo)準(zhǔn)分?jǐn)?shù)的變式:將Z分?jǐn)?shù)作線性變換。如T分?jǐn)?shù)、離差智商等。T分?jǐn)?shù):T=10Z+50(麥柯爾)。平均數(shù)為50,標(biāo)準(zhǔn)差為10。離差智商:IQ=15Z+100美國大學(xué)入學(xué)考試委員會使用的:CEEB分?jǐn)?shù)=100Z+500出國人員英語水平考試:EPT分?jǐn)?shù)=20Z+90(4)標(biāo)準(zhǔn)九分?jǐn)?shù):a.定義:也是一種標(biāo)準(zhǔn)分?jǐn)?shù),它將原始分?jǐn)?shù)劃分為九部分,最高是9分,最低是1分,除去1和9的范圍略大以外,其余均是以5為中心向兩邊各包含0.5個標(biāo)準(zhǔn)差的分?jǐn)?shù)段。常模編制(1)常模:根據(jù)標(biāo)準(zhǔn)化樣本的測驗分?jǐn)?shù)經(jīng)過統(tǒng)計處理而建立起來的具有參照點和單位的測驗量表。(2)常模團(tuán)體:a.定義:具有某種共同特征的人所組成的一個群體,或是該群體的一個樣本,大部分測驗不止一個常模團(tuán)體。b.確定常模團(tuán)體注意事項:1.群體構(gòu)成的界限必須明確。2.常模團(tuán)體必須是所測群體的一個代表性樣本。3.取樣的過程必須有明確且詳盡的描述。4.樣本大小要適當(dāng)(一般情況,最小樣本為30~100個;全國性的常模,一般地要求有2000~3000人為宜)。5.常模團(tuán)體必須是近時的。6.注意一般常模和特殊常模的結(jié)合。(3)常模分類:發(fā)展量表:將個人的成績與各種發(fā)展水平的人的平均成績相比較制作出來,明確指出個人按正常途徑發(fā)展的心理特征處于什么樣的發(fā)展水平。年齡常模:△定義:以智力年齡為代表,比內(nèi)西蒙量表中首先使用了智力年齡的概念,即用年齡來表示測驗分?jǐn)?shù)?!鲀?yōu)點:易于理解與解釋,可以與同齡團(tuán)體做直接比較?!魅秉c:智力年齡的單位不是恒定相等的,而且不適用于成人,成人到某個階段后智力發(fā)展相對穩(wěn)定,顯示不出一年與一年之間的差異?!骰疽兀?.一組可區(qū)分不同年齡組的題目。2.一個常模團(tuán)體,該團(tuán)體是由各個年齡的被試所組成的具有代表性的樣本。3.常模表。年級當(dāng)量:△定義:即將被試的測驗成績與某一年級的學(xué)生的平均分?jǐn)?shù)作比較,而說成相當(dāng)于某一年級水平?!魅秉c:1.教育內(nèi)容在各個年級是不同的。2.解釋比較困難。3.誤用為標(biāo)準(zhǔn)。發(fā)展順序量表:是直觀的發(fā)展常模,因為它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常。商數(shù):智商:智力年齡與實際年齡之比。IQ=MA/CAX100教育商數(shù):教育年齡與實際年齡之比。EQ=EA/CAX100成就商數(shù):教育年齡與智力年齡之比。AQ=EA/MAX100=EQ/IQX100百分位常模標(biāo)準(zhǔn)分?jǐn)?shù)常模:補(bǔ)充:△標(biāo)準(zhǔn)九是標(biāo)準(zhǔn)化九分制的簡稱。它是以5為平均數(shù),以2為標(biāo)準(zhǔn)差的一個分?jǐn)?shù)量表,最早時被廣泛應(yīng)用于美國空軍的心理測驗中?!髅Qz分?jǐn)?shù)和z’分?jǐn)?shù)T分?jǐn)?shù)標(biāo)準(zhǔn)九標(biāo)準(zhǔn)十標(biāo)準(zhǔn)二十平均數(shù)0505510標(biāo)準(zhǔn)差11021.53△離差智商及其意義:傳統(tǒng)比率智商的缺點:1.智齡與年齡的發(fā)展并不是呈線性關(guān)系。2.智力增長到何時達(dá)終點仍在爭論。離差智商:通過與同年齡的代表性樣本的平均數(shù)相比較來確定智商的高低。離差智商公式為:IQ=100+15z'。由于離差智商的提出,過去使用比率智商的測驗都改用離差智商,其公式為:IQ=100+16z'。兩者唯一的區(qū)別是標(biāo)準(zhǔn)差:一個是15,一個是16。注:常態(tài)化使得IQ的評定對智力較低者打分偏高,對智力較高者打分又偏低,而對中等智力者打分最準(zhǔn)確。(4)常模編制程序:a.取得常模團(tuán)體。b.獲得常模團(tuán)體的測驗分?jǐn)?shù)。c.確定常模分?jǐn)?shù)類型,制作常模分?jǐn)?shù)轉(zhuǎn)換表,即常模量表,同時給出抽取常模團(tuán)體的書面說明,以及常模分?jǐn)?shù)的解釋指南。(5)常模呈現(xiàn)方法:a.轉(zhuǎn)化表:具備三個要素,即原始分?jǐn)?shù)、導(dǎo)出分?jǐn)?shù)、對常模團(tuán)體的有關(guān)具體描述。b.剖析圖:把一套測驗中幾個分測驗分?jǐn)?shù)用圖表表示出來。從剖析圖上可以很直觀地看出被試在各個分測驗中的表現(xiàn)及其相對應(yīng)的位置。第八章.心理與教育測驗的編制和實施編制心理與教育測驗的基本程序:確定測驗?zāi)康模篴.明確測量對象:明確測量那些個人或團(tuán)體。明確測量目標(biāo):明確測量什么心理功能。目標(biāo)分析依測驗不同可分為工作分析、對特定概念下定義、確定測驗的具體內(nèi)容。明確測驗用途:顯示性測驗(測驗的題目要與測驗的特征相似的測驗)和預(yù)測性測驗(為了預(yù)測一些沒有被測量的行為的測驗)。制定編題計劃:確定測驗內(nèi)容和相對百分比。編輯測驗題目:a.收集測驗資料:資料要豐富性、普遍性、趣味性。測驗題目的來源:已出版的標(biāo)準(zhǔn)測驗、理論和專家的經(jīng)驗、臨床觀察和記錄。選擇項目形式:提供型和選擇型、口頭和操作、團(tuán)體和個人等等。編寫測驗項目預(yù)測與項目分析合成測驗:a.項目的選擇:指標(biāo)有測驗的性質(zhì)、項目的難度、項目的區(qū)分度。b/項目的編排:并列直進(jìn)式和混合螺旋式。編排時的原則:測量同一因素的題目放在一起、同類型的測試題盡可能組合在一起、題目的難度排列宜逐步上升。c.編制復(fù)本測驗標(biāo)準(zhǔn)化:所謂標(biāo)準(zhǔn)化是指測驗的編制、施測、評分以及解釋測驗分?jǐn)?shù)的程序的一致性。鑒定測驗:信度、效度、測驗量表(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 培訓(xùn)班合作協(xié)議書(5篇)
- 廚房的消防應(yīng)急預(yù)案(5篇)
- 網(wǎng)絡(luò)安全應(yīng)急響應(yīng)機(jī)制研究-洞察分析
- 新聞紙強(qiáng)度提升策略-洞察分析
- 元數(shù)據(jù)標(biāo)準(zhǔn)與互操作性-洞察分析
- 疫情后物流新趨勢-洞察分析
- 微生物組與個性化醫(yī)療-洞察分析
- 同慶建筑風(fēng)格的文化內(nèi)涵解讀-洞察分析
- 用戶旅程優(yōu)化路徑-洞察分析
- 向媽媽承認(rèn)錯誤檢討書(15篇)
- 養(yǎng)生餐廳調(diào)查研究報告
- 臨床醫(yī)學(xué)研究進(jìn)展展望新興領(lǐng)域與發(fā)展趨勢培訓(xùn)課件
- 北京市2022-2023學(xué)年三年級上學(xué)期語文期末試卷(含答案)2
- 普外科-臨床重點??平ㄔO(shè)項目自查總結(jié)報告
- 2023-2024年三年級上冊科學(xué)(教科版) 期末模擬試卷(三)(含解析)
- 消防爬梯施工方案
- 關(guān)于工程師思維素養(yǎng)課件
- 昆蟲記32種昆蟲簡介
- 短視頻平臺私域建設(shè)研究報告
- 工業(yè)風(fēng)扇-專業(yè)介紹
- 23秋國家開放大學(xué)《廣告設(shè)計》形考任務(wù)1-4參考答案
評論
0/150
提交評論