第七章教育測驗_第1頁
第七章教育測驗_第2頁
第七章教育測驗_第3頁
第七章教育測驗_第4頁
第七章教育測驗_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第七章教育測驗

教育測驗概述

測驗的信度

測驗效度

測驗的難度和區(qū)分度

第一節(jié)教育測驗概述一、教育測驗分類(一)、按行為目標(biāo)和測驗內(nèi)容分

1、智力測驗智力測驗是用來測人的智力水平高低的。

智力測驗的目的是為了區(qū)別人的智力差異,預(yù)測人的發(fā)展趨勢以便選拔人才,或診斷學(xué)生智力發(fā)展情況,以便因材施教,提高學(xué)習(xí)效果。智力測驗的結(jié)果用智商(IQ)來表示。

IQ=智力年齡/實際年齡×100。

例如5歲兒童智齡為6歲,則其智商IQ=6/5x100=120

著名的智力測驗有比奈——西蒙測驗、韋克斯勒智力測驗、瑞文漸進推理測驗、考夫曼兒童成套評估測驗。(1)、比奈—西蒙智力測驗中國修訂版

此量表是比奈——西蒙智力測驗傳入我國后經(jīng)三次修訂而成的,適用于2—18歲被試。測驗共51個題目,依難度順序排列,每歲三個題目。

操作要點:首先根據(jù)被試的實際年齡從測驗指導(dǎo)書的附表中查到測驗的起點題,然后按指導(dǎo)書的測驗程序和要求進行測驗。每通過一題記一分,連續(xù)五題不通過即停止測驗。最后根據(jù)被試答對題目的分?jǐn)?shù),加上承認(rèn)他能通過的題目的分?jǐn)?shù)(補加分),得到測驗總分,從指導(dǎo)書的智商表中查出該被試者的智商。(2)、韋克斯勒智力量表

韋氏量表分為幼兒、兒童和成人3種,分別適用于4—6.5歲、6—16歲、16—74歲被試。量表包括言語和操作兩部分。實施測驗時言語和操作分測驗交替進行。以韋氏兒童智力量表為例。

言語量表操作量表

①常識(30項)②圖畫補缺(26項)

③類同(17項)④圖片排列(13項)⑤算術(shù)(9項)⑥積木圖案(11項)⑦詞匯(32項)⑧物體拼圖(4項)⑨理解(17項)⑩譯碼A(45項,用于8歲以下)⑾背數(shù)⑿迷津韋克斯勒兒童智力量表1、常識該分測驗共有30道題,包括被試日常生活中常見的內(nèi)容。如:狗有幾條腿?[4條]2、填圖該分測驗有26張圖片,每張圖片上的圖形都缺少了一個主要部分,要求被試說出或指出圖中缺少的這個部分。如:圖形是只狐貍,但缺少耳朵。每張圖觀察時限20秒,測驗主要考察被試的觀察能力。

3、類同該分測驗有17對配對的名詞要求被試概括出二者共同之處,如輪子和球相象的地方在哪里?測驗主要考察被試的抽象概括能力。

4、圖片排列

該分測驗有幾組圖片,每組圖片3—5張不等,均按統(tǒng)一打亂的順序呈現(xiàn)給被試,要求被試在一定的時間內(nèi)對圖片進行正確的排列。如量體重:有3張圖片,打亂順序擺在兒童面前,主試說:“這些圖片是關(guān)于一個人在磅秤上量體重的故事,現(xiàn)在圖片的順序是錯誤的,看看你會不會把它們按正確的順序排好,使它們成為一個有意義的故事。”

5、算術(shù)

該分測驗共有19道算術(shù)題,被試不能用鉛筆和紙演算。如主試說:“如果我把一個蘋果切成兩半,我有幾塊蘋果?”[時限:30秒,答案:2]測驗主要考察被試的推理能力。

6、積木

該分測驗要求被試按給定圖案拼搭11個圖形,有時間限制,完成得快還可以加分。材料為9塊正方形積木,每一塊是兩面紅色,兩面白色,另兩面按對角線分成紅白兩色,另外圖案卡片11張。7、詞匯

該分測驗要求對32個按難易程度排列的詞作出解釋。材料為32張詞匯小卡片,每張上分別寫著一個詞,主試按詞匯的順序?qū)γ總€詞提問,如:“什么是勇敢?”或“勇敢是什么意思?”

8、拼圖

該分測驗材料有4套圖象組合拼版,要求被試將其組合成一物體,如:主試按規(guī)定擺好拼版的部件并呈現(xiàn)給被試,然后說:“這些塊塊可以拼成一匹馬,你盡快地把它們拼在一起”[時限:150秒,速度快可加分。]

9、理解

該分測驗要求被試回答17道有關(guān)社會規(guī)則方面的問題,如“如果你把小朋友的排球丟了,你應(yīng)該怎么辦?”[賠償損失]

10、理解

該分測驗要求被試按圖例的樣子分別給圖形加符號或數(shù)字,材料為測驗紙和紅鉛筆。如主試說:“看這兒,你看到一顆星、一個圓球,一個三角和其他東西。看,星星當(dāng)中有一道從上到下的線;圓球里面有兩道橫線;三角上有一道橫線;十字形當(dāng)中有一個圓;方塊里面有兩條直線。現(xiàn)在在下面,這兒有圓球、星星、方塊和其他東西,摻雜在一起,但它們沒有任何符號。我要你用上面的同樣符號填在這些圖形里?!盵測驗時限:120秒]

11、背數(shù)

為備用測驗,當(dāng)語言測驗失效時使用。分順背和倒背兩部分。12、迷津

為備用測驗。該分測驗共有9個從易到難的迷津。

2、能力傾向測驗。

測被試潛在的某種能力,以了解其發(fā)展的可能性,如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的才能的測驗。3、成就測驗

測被試經(jīng)過某種形式的學(xué)習(xí)后對知識、技能的掌握或熟練程度。依測驗內(nèi)容、編制程序及測驗?zāi)康牡鹊牟煌?,可以分為不同種類。按測量科目的多少不同成套成就測驗單科成就測驗按測驗編制程序不同標(biāo)準(zhǔn)化成就測驗教師自編測驗按測驗?zāi)康牡牟煌A(yù)測性測驗診斷性測驗按解釋時的參照標(biāo)準(zhǔn)不同

常模參照測驗

標(biāo)準(zhǔn)參照測驗(1)、標(biāo)準(zhǔn)化成就測驗至今還沒有一個公認(rèn)的確切定義。一般地說,如果某次考試從確定考試目的和進行考試設(shè)計,到編制試卷、實施考試、閱卷評分和對分?jǐn)?shù)的處理解釋等全過程都嚴(yán)格執(zhí)行統(tǒng)一的標(biāo)準(zhǔn),這樣的考試就可以稱為標(biāo)準(zhǔn)化成就測驗。

①、編制試卷科學(xué)化

②、實施考試統(tǒng)一化

③、閱卷評分公正化④、分?jǐn)?shù)解釋合理化

(2)、教師自編測驗①、制定考試計劃確定考試目的,即為什么要考試。分析考試目標(biāo),即明確考哪些東西。設(shè)計考試藍圖,繪制雙向細(xì)目表。

②、編寫試題選擇試題類型。兩大類型:客觀性試題,主觀性試題。試題編寫。審查試題,編寫試卷。編寫標(biāo)準(zhǔn)答案,決定計分方法。目標(biāo)比例內(nèi)容

識記理解應(yīng)用綜合運用合計第一章7108025第二章3710525第三章711121040第四章320510合計203030201004、個性人格測驗

是用心理測驗方法對人的個性進行的測驗,即測量一個人在一定情境下,經(jīng)常表現(xiàn)出來的典型行為與情感反應(yīng)。較為著名的有明尼蘇達多相個性測驗、卡特爾16項人格因素測驗、羅夏墨跡測驗等。①、明尼蘇達多相個性測驗

這項測驗是由美國明尼蘇達大學(xué)的哈薩維和麥肯利教授編制的,是目前應(yīng)用最廣的人格測驗。適用于16歲以上的成年人,要求被試有小學(xué)以上文化水平。已由中科院心理所宋維真等同志引進修訂。

該量表共有566個題目(有16個為重復(fù)題目,實際上是550題)。題目的內(nèi)容非常廣泛,包括健康狀況,精神狀態(tài),對婚姻、家庭、宗教、社會、政治、法律等問題的態(tài)度。明尼蘇達多相個性測驗包括10個臨床量表和4個效度量表。10個臨床量表分別是:疑病、抑郁、癔病、精神變態(tài)、男子氣——女子氣、妄想狂、精神衰弱、精神分裂、輕躁狂、社會內(nèi)向,這10個量表所得分?jǐn)?shù)代表10種人格特質(zhì)。4個效度量表主要是考察被試在測驗是有無粗心、不明題意、掩飾、反應(yīng)定勢等現(xiàn)象,參加測驗時的態(tài)度如何。這些量表分?jǐn)?shù)出現(xiàn)異常,表示測驗的效度值得懷疑。這4個量表是:疑問量表、說謊量表、詐病量表、校正量表。②、卡特爾16項人格因素測驗

由美國伊利諾州立大學(xué)卡特爾教授編制的,適用于16歲以上的成人。已由臺灣學(xué)者劉永和做了修訂。

該量表現(xiàn)有5個復(fù)本,其中A、B本為全版本,各有187個題目;C、D本為縮減本,各有106個題目;E本適用于文化水平較低的被試,有128個題目??ㄌ貭?6項人格因素測驗的16種人格特質(zhì)分別是:樂群性、聰慧性、穩(wěn)定性、恃強性、興奮性、有恒性、敢為性、敏感性、懷疑性、幻想性、世故性、憂慮性、實驗性、獨立性、自律性、緊張性。③、羅夏墨跡測驗

是由瑞士精神病學(xué)家羅夏首創(chuàng)的。羅夏墨跡測驗由十張墨汁圖構(gòu)成。施測方法分自由聯(lián)想和詢問兩階段。

(二)、按測驗方式分1、個別測驗2、團體測驗(三)、按測驗材料分1、語言、文字測驗2、非語言、文字測驗(操作測驗)(四)、按測驗的參照系分

1、常模參照測驗2、目標(biāo)參照測驗

(五)、按測驗的標(biāo)準(zhǔn)化程度分1、標(biāo)準(zhǔn)化測驗2、非標(biāo)準(zhǔn)化測驗二、教育測驗的要求

1、保證測驗的信度

2、提高測驗的效度

3、把握試題的難度、區(qū)分度

第二節(jié)測驗的信度一、信度的定義

信度指測驗結(jié)果的可靠性和穩(wěn)定性,即同一個測驗對同一組被試先后實施兩次,所得測量的一致性程度。

信度實際上就是對測驗誤差大小的一種描述。一般來說,誤差越小,信度越大;誤差越大,信度越小。X=T+EX表示實測值,T表示真值,E表示誤差。

信度指兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度。

如果對同一對象進行兩次重復(fù)測量或者等值測量后,計算兩次測量的相關(guān)系數(shù),相關(guān)系數(shù)越高,說明測量的信度就越高;反之,就越低。對于信度的這種理解,有利于信度的計算。二、信度的種類

(一)、重測信度

用同一種測驗對同一組被試實施兩次或更多次的測驗,前后兩次或多次測驗分?jǐn)?shù)的相關(guān)系數(shù)即為重測信度。估計重測信度的基本程序是:測驗A1----(適當(dāng)時距)A2。使用重測法要注意幾點:(1)、重測法只適用于速度測驗而不適用于難度測驗;(2)、所測的信度大小,常常受兩次測驗時間間隔長短影響;(3)、第二次測驗沒有吸引力,不易引起學(xué)生的興趣;

(4)、要實施兩次,耗費人力、物力和時間較多。

10名考生兩次測驗的得分情況測驗

考生平均分標(biāo)準(zhǔn)差12345678910X17885636887927573817277.58.54X27279686983907968826175.19.53(二)、復(fù)本信度

當(dāng)同測驗的一種型式不能或不適合實施兩次時,就需要采用該測驗的另一個平行型測驗或者復(fù)本。其基本程序為:測驗A1————(最短時距)測驗B1采用復(fù)本法估計信度系數(shù)要注意:(1)兩次測驗試卷要等值,即在內(nèi)容范圍、題型、題數(shù)、難度、區(qū)分度等方面要基本相同;(2)、兩次測驗要盡可能在較短的時距內(nèi)進行;

(3)、確定兩次測驗是否等值,還要考察兩次測驗結(jié)果的平均數(shù)與標(biāo)準(zhǔn)差。

A、B兩型測驗的得分情況

考生平均分標(biāo)準(zhǔn)差

12345678910

A8879678376989162708777.510.85

B8372768083889071698579.706.90(三)、分半信度

這種方法是將一個測驗中的題目按編號分成兩半,例如一半為奇數(shù)題,另一半為偶數(shù)題,分別計算出每個被試兩部分的得分。然后計算這兩部分的相關(guān)系數(shù)。最后用斯皮爾曼---布郎公式校正,求得整個測驗的信度系數(shù)。rxx=2r/1+2r

10個學(xué)生在奇數(shù)題和偶數(shù)題的得分被試編號01020304050607080910奇數(shù)題得分38373841403638394035偶數(shù)題得分37373639393438393936三、提高信度的方法(一)、信度系數(shù)以多大為宜

對于學(xué)科測驗,信度系數(shù)要求達到0.9以上,智力測驗要求達到0.8以上,品德測驗?zāi)苓_到0.6以上就算不錯了。

(二)、測量誤差的來源

1、測驗本身引起的誤差2、測驗的實施所引起的誤差3、被試所引起的誤差(三)、提高測驗信度的方法1、適當(dāng)增加測驗長度2、測驗的難度要適中

3、測驗的內(nèi)容應(yīng)盡量同質(zhì)

4、測驗的時間要充分

5、測驗的實施和評分方法應(yīng)統(tǒng)一和客觀。

第三節(jié)測驗效度一、效度的概念

1、效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度,即一個測驗?zāi)軌驕y量出其所要測量的東西的程度。2、信度和效度(1)、一個測驗的效度首先取決于測驗的目的和測驗工具的匹配程度。(2)、一個測驗可以有很高的信度,而效度卻很低;但如果信度低,則效度一定低。

二、效度的類型(一)、內(nèi)容效度指測驗題目對所要測的內(nèi)容的覆蓋程度,即測驗題目對有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性和代表性。內(nèi)容效度主要用于成就測驗,內(nèi)容效度的值常由該領(lǐng)域的專家判定。估計內(nèi)容效度的方法:用測驗題目與教材內(nèi)容比較的方法。

需要先制定兩個表。一個是測驗的雙向細(xì)目表,表的頂端橫行列出了應(yīng)測量的教學(xué)目標(biāo)。表的左斷列出了要測量的教學(xué)內(nèi)容。第二個表是測驗試題分類表。

小學(xué)二年級語文綜合水平檢測雙向細(xì)目表(二)、效標(biāo)關(guān)聯(lián)效度是指一個測驗與選定的效標(biāo)的相關(guān)系數(shù)。例如,一個初中畢業(yè)班英語教師出了一份模擬試題進行測驗,對于該測驗,學(xué)生升高中的英語統(tǒng)考成績就可以作為一個效標(biāo)。如果兩者相關(guān)高,則模擬測驗的效度高。三、提高效度的方法1、提高測驗的信度。

2、精心編制測驗3、選擇好的效標(biāo)

第四節(jié)測驗的難度和區(qū)分度一、難度(一)、難度的定義和計算1、難度是指題目的難易程度。2、難度的計算(1)、客觀題的難度計算P=R/NP代表試題難度,R為答對試題的人數(shù),N代表參加測驗的總?cè)藬?shù)。

例如,100人參加測驗,某題有60人答對,則此題的難度為:P=R/N=60/100=0.6。此題通過率60%,難度適中。(2)、主觀題的難度計算

P=X/WP表示試題的難度,X為被試在該題上的平均得分,W為該題的滿分值。

例如,某道論述題滿分為12分,所有考生在這道題上的平均得分為3.6分,則此題的難度為:P=X/W=3.6/12=0.3(此題偏難)。(3)、測驗的平均難度公式計算P=∑WiPi/W其中,W是測驗的滿分值,Wi是各個題目的滿分值,Pi是各個題目的難度。例,一份試題經(jīng)過實測,得到下表的數(shù)據(jù)各題的滿分值和難度題號123456789滿分33420510152515難度0.500.550.300.400.700.600.700.600.60(二)、難度對測驗的影響

1、測驗難度影響測驗分?jǐn)?shù)的分布形態(tài)

2、測驗難度影響測驗分?jǐn)?shù)的離散程度3、測驗難度影響測驗的鑒別能力(三)、測驗的適宜難度難度值P的取值范圍為:0≦P≦1,當(dāng)P=0時,試題的實際困難程度最大(所有考生得0分),當(dāng)P=1時,試題的實際難度最小(所有考生全答對)。

在常模參照性測驗中要求試題難度適中,即大多數(shù)題目的難度在0.3—0.7之間,少數(shù)題目可在這一范圍之兩邊且題數(shù)(或題分)大體相當(dāng),使整個試卷的平均難度為0.5左右(0.45—0.55之間)。只有適中的題目難度,才能使試題產(chǎn)生區(qū)分不同程度考生的最大效果,也才能使考生得分呈正態(tài)分布。

對于其他類型的測驗,目的不同對難度的要求也不同。比如,選拔奧林匹克數(shù)學(xué)競賽的學(xué)生,難度值就得偏小;而選擇補習(xí)功課的學(xué)生,難度值就得偏大。(四)、控制題目難度的基本方法(1)、考查知識點的多少;(2)、考查能力的復(fù)雜程度或?qū)哟胃叩?;?)、考生對題目的熟悉程度(4)、命題的技巧性二、區(qū)分度(一)、區(qū)分度的概念區(qū)分度是指測驗對考生實際水平的區(qū)分程度,用符號D表示。區(qū)分分為正區(qū)分(D>0)、零區(qū)分(D=0)和負(fù)區(qū)分(D<0),正區(qū)分又稱積極區(qū)分,負(fù)區(qū)分又稱消極區(qū)分。

區(qū)分度高的試題,可以準(zhǔn)確地鑒別學(xué)生的實際水平,使不同水平的學(xué)生的考試成績落在不同的分?jǐn)?shù)段上,分成多樣層次,學(xué)習(xí)好的學(xué)生得分高,學(xué)習(xí)差的學(xué)生得分低.

區(qū)分度低的試題,難以鑒別學(xué)生的學(xué)習(xí)水平,往往不同水平的學(xué)生的考試成績落在同一分?jǐn)?shù)段上,顯示不出學(xué)生之間的明顯差異。(二)、區(qū)分度的計算用被試在某個題目上的得分與被試的測驗總分的相關(guān)系數(shù)作為該題目的區(qū)分度。

計算區(qū)分度的方法通常包括求鑒別指數(shù)D和點二列相關(guān)系數(shù)等。D=PH—PLD為該試題的鑒別指數(shù),PH和PL分別為高分組和低分組的通過人數(shù)的比率。

例:某題高分組的通過率為0.73,低分組的通過率為0.25,那么,該題的區(qū)分度為D=0.73-0.25=0.48(三)、提高區(qū)分度的方法

1、使題目的難度適中,使整個考試難度適中區(qū)分度的最大值與難度的關(guān)系難度(P)1.000.900.700.500.300.100.00區(qū)分度的最大值0.000.200.601.000.600.200.002、著重考察復(fù)雜的學(xué)習(xí)結(jié)果(四)、區(qū)分度的評價標(biāo)準(zhǔn)區(qū)分度評價

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論