版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
教育測量學(xué)基礎(chǔ)主講:張建華節(jié)目介紹垂釣之樂微觀世界旅游之樂優(yōu)美舞姿參考資料別忘了做學(xué)問主要教學(xué)內(nèi)容第七章標(biāo)準(zhǔn)化考試第八章常見統(tǒng)計分析軟件第一章緒論第二章考試概論第四章試題的分析與評價第五章考試的分析與評價第三章考試分?jǐn)?shù)的收集、整理和解釋第六章考試結(jié)果的統(tǒng)計檢驗與預(yù)測第一章緒論§1-1教育測量的概念一、引言二、教育測量的概念三、教育測量的要素四、測量單位§1-2教育測量的特點一、教育測量與一般測量的共同點二、教育測量與一般測量的不同點三、教育測量特點小結(jié)四、教育測量的標(biāo)準(zhǔn)物§1-3教育測量的發(fā)展歷史和現(xiàn)狀一、中國悠久的教育測量歷史二、教育測量發(fā)展的三個階段和兩次飛躍三、教育測量的功能、未來發(fā)展展望(略)思考題§1-1教育測量的概念
一、引言
教育是一種以人才培養(yǎng)為目的的社會現(xiàn)象。專門研究教育現(xiàn)象的教育科學(xué),也和其它任何一門科學(xué)一樣,要經(jīng)歷從定性描述到定量分析的發(fā)展過程。要作定量分析就離不開測量(Measurement)。教育測量學(xué)的創(chuàng)始人之一、美國心理學(xué)家桑代克(E.L.Thorndike)指出:“凡是存在的東西都有數(shù)量,凡有數(shù)量的東西都可以測量”。教育作為一種社會現(xiàn)象,也是社會上客觀存在的一種事物,它也是有數(shù)量的,自然也是可以測量的二、教育測量的概念1、什么是教育測量?教育測量是對教育的特征、屬性及其運動、發(fā)展規(guī)律的定量描述,它主要用于對學(xué)生的精神特性進(jìn)行數(shù)量化測定。(評:不妥)2、理解(1)教育測量就是對學(xué)生的學(xué)習(xí)能力、學(xué)業(yè)成績、興趣愛好、思想品德、身體素質(zhì)及教育措施上的許多問題的數(shù)量化測定。(2)教育測量是對教育諸要素(如主體、客體、媒體)進(jìn)行判斷、和評價的過程。(3)教育測量是事實的一種比較活動。三、教育測量的要素1、被測量的事物或?qū)ο?評:應(yīng)包括教育主體、客體、媒體等)。2、測量方法與測量工具如考試、考查、測驗等。3、測量單位四、測量單位通過測量,可實現(xiàn)對被測量事物的數(shù)量化描述,即得到量值。量值出現(xiàn)在一個有參照點和單位的連續(xù)體上,這個連續(xù)體稱為量表,如常見的百分量表和五分量表等。根據(jù)量表的屬性,可分為五大類:1、名義量表,又稱為分類量表即用分類的方法,對被測事物進(jìn)行定性的描述.雖是一種低水平的量表但卻常用,如考試中的選擇題,答案只能按對與錯來分類.當(dāng)然,名義量表也不限于二分變量(即只有兩個參照標(biāo)準(zhǔn)),也可以有多分變量(即有多個參考標(biāo)準(zhǔn)),如高校教師按職稱可分為教授、副教授、講師、助教等。2、位次量表是用反映事物的相對順序關(guān)系的數(shù)值來表示的一種量表,如按學(xué)生的考試成績來確定名次如第一名、第二名、第三名等等,這種量表中的數(shù)值是能進(jìn)行加減運算的,但可以用于作次序的統(tǒng)計3、間距量表以確定的單位間的距離來描述被測量的事物,但變量不具有零點的量表稱為間距量表。用這種量表表示的數(shù)值,可以作相互加減運算,但不能作乘除運算。4、比率量表是具有等距、等質(zhì)性且具有零點的量表,用這種量表表示的數(shù)值,不僅可以作加減運算,還可以作乘除運算。與前三種量表相比,這是一種高水平的量表5、模糊量表用來描述模糊關(guān)系的量表稱為模糊量表。如學(xué)生的思想品德、團(tuán)結(jié)互助精神等具有一定的模糊性,只能用模糊量表來描述。相互關(guān)系雖然上述各量表具有不同的屬性,但這種分類是相對的,它們之間還是有一定的關(guān)系,主要表現(xiàn)在以下兩個方面:(1)各種量表之間以一定的依存性互相聯(lián)系著。如,可以將位次量表轉(zhuǎn)化為很好、好、較好、差、很差等語言描述的模糊量表。(2)隨著人們對于教育活動中各種事物及其屬性的認(rèn)識的深化和教育測量手段的發(fā)展,對同一事物屬性的描述可由只能使用低水平量表發(fā)展到可以使用高水平的量表。如1916年引入智商概念前對兒童智力的測量只能按位次量表進(jìn)行,而引入智商概念后就可以用間距量表對兒童智力進(jìn)行測量了§1-2教育測量的特點一、教育測量與一般測量的共同點1、具有測量客體:教育測量與一般物理量的測量都是對客觀的事物的存在、特征、屬性及運動規(guī)律作定量描述,或說是進(jìn)行數(shù)量化測定的過程。這一測量過程就是對客觀的事物的存在、特征、屬性及運動規(guī)律賦予一定的量值。教育測量是一種事實判斷的過程。2、具有一定的測量方法和測量工具教育測量的工具是考試(Examination)、測驗(Test)、鑒定會等3、測量結(jié)果需要有特定的量表描述4、測量結(jié)果有誤差測量誤差也有系統(tǒng)誤差和隨機(jī)誤差,這種測量誤差影響著測量結(jié)果的有效性和可信程度,應(yīng)設(shè)法減小測量誤差。二、教育測量與一般測量的不同點1、測量對象的特點不同一般測量是對客觀事物的物理特征與屬性進(jìn)行的測量,而教育測量是對學(xué)生的心理特性(精神特性)進(jìn)行的測量(評:原文如此,不妥)??陀^事物的物理特征與屬性具體、穩(wěn)定、易于控制,而心理特性則比較抽象、不穩(wěn)定、不易于控制。2、測量尺度的客觀性不同如不同的主體人對同一文章的看法相去甚遠(yuǎn),一般測量則不然。3、測量結(jié)果的客觀性不同三、教育測量特點小結(jié)1、具有一般測量的共同特征與屬性2、測量對象與測量標(biāo)準(zhǔn)具有社會性3、測量尺度和測量單位具有較大的不確定性和近似性4、測量標(biāo)準(zhǔn)及測量結(jié)果具有主觀性四、教育測量的標(biāo)準(zhǔn)物鑒于教育測量的上述特點,為使測量結(jié)果比較真實地、準(zhǔn)確地、客觀地反映出被測對象的特征與屬性,必須對教育測量的標(biāo)準(zhǔn)物進(jìn)行規(guī)范,或者說教育測量的標(biāo)準(zhǔn)物應(yīng)滿足以下一些基本條件:1、不低于構(gòu)成被測對象穩(wěn)定狀態(tài)的最低限度。如60分及格。2、具有使用意義上的合理性;3、在測量過程中單位的不變性,即在一次測量過程中,不能使用不同的單位。以上1、2兩個條件是容易滿足的。第3個條件在一般物理量的測量中是不難滿足的,但在教育測量中有時卻是不容易滿足的。如,在測量科研成果時,可以用完成鑒定的科研成果的項目數(shù)或發(fā)表的科研論文的篇數(shù)來測量,但這一項成果和那一項成果,雖然都是一項,但它們不可能等值;同樣,這一篇論文和那一篇論文雖然都是一項,但也不等值。因此要找到一種具有不變性的測量單位是非常困難的。只有正確認(rèn)識教育測量的的這些特點,才能正確地掌握教育測量的規(guī)律和技術(shù),正確地進(jìn)行教育測量工作§1-3教育測量的發(fā)展歷史、現(xiàn)狀一、中國悠久的教育測量歷史教育測量起源于中國:伴隨西周初步建立的學(xué)校教育制度就已經(jīng)實行了教育考評;隋末唐初就開始實行科舉考試制度,以試取人;歐美各國在此后一千余年開始采用的以考試來選拔官吏的做法就是從我國學(xué)去的。二、教育測量發(fā)展的三個階段和兩次飛躍1、第一階段:1846年前的主觀經(jīng)驗化開始階段,在這一階段采用的考試方法是傳統(tǒng)的考試方法。其特征是主觀經(jīng)驗化、片面。2、第二階段:1846年到1940年的客觀標(biāo)準(zhǔn)化考試階段,在這個階段,對考試的理論和方法進(jìn)行了積極的、系統(tǒng)的研究,使考試排除了命題、評分和成績分析中的主觀經(jīng)驗性和片面性,逐步形成了客觀標(biāo)準(zhǔn)化考試,即按照一定的目的,根據(jù)客觀標(biāo)準(zhǔn)命題、平分和進(jìn)行成績的分析。3、第三階段:1940后較完善的客觀標(biāo)準(zhǔn)化考試階段。其特點:(1)既重視對學(xué)生知識的測量,也重視對思想品德和智力測量;(2)不僅注意單一答案的求同性思維,而且注意包括有多種答案的求異性思維;(3)不僅對學(xué)生成績進(jìn)行測量,也對教育其它各要素如教育主體、教育手段、教學(xué)措施和教育法規(guī)進(jìn)行測量‘(4)不僅注意測量學(xué)生的成績在群體中的相對位置,也注意測量學(xué)生的成績達(dá)到教育目標(biāo)的情況。兩次飛躍(評:原文如此,不妥,應(yīng)為三次飛躍)1、第一次飛躍:發(fā)生在上世紀(jì)初,它是由于在考試工作中應(yīng)用數(shù)理統(tǒng)計方法引起的。結(jié)果導(dǎo)致了教育科學(xué)的一個分支—教育測量學(xué)的誕生;2、第二次飛躍:發(fā)生在上世紀(jì)40年代末,這次飛躍的動力是計算機(jī)的出現(xiàn),使測量數(shù)據(jù)處理、計算的能力和可靠性大大提高;3、第三次飛躍:發(fā)生在上世紀(jì)80年代后期,飛躍的動力是互連網(wǎng)技術(shù)的應(yīng)用。資源共享、遠(yuǎn)程考試,從而可以瞬間實現(xiàn)全省、全國乃至全球教育測量評估工作。三、教育測量的功能、未來發(fā)展展望(略)思考題
1、P.14No.1~No.62、查尋資料論述互連網(wǎng)技術(shù)在教育測量中的作用和地位謝謝合作第二章考試概述§2-1考試的意義和任務(wù)一、引言二、考試的意義三、考試的功能§2-2考試的分類一、按考試的時間分類二、按考試的目的分類§2-3考試命題的基本原則與步驟一、命題在考試中的地位與作用二、命題的基本原則三、命題的步驟§2-4試題結(jié)構(gòu)、分類與命題方法一、主觀題二、客觀題§2-1考試的意義和任務(wù)一、引言1、什么是考試根據(jù)教育目標(biāo)的要求,由國家及各級教育管理部門或教師按照事先擬定的命題組織的對學(xué)生所進(jìn)行的學(xué)業(yè)成就或?qū)W歷的測試等,稱為考試。2、理解(1)考試是教育主體所引起的教育客體的一種行為過程,包括提出考試目的、確定考試內(nèi)容與范圍、命題、進(jìn)行考試、閱卷、分析與統(tǒng)計等環(huán)節(jié);(2)考試是教育測量的重要手段和工具之一(評:“之一”二字為本人所加)。二、考試的意義1、考試的一般意義考試是教育測量的工具之一,在教育測量中,它所起的作用相當(dāng)于一般物理量測量中的量具和儀器。一般測量的測量結(jié)果用量值表示(包括數(shù)值和測量單位)。教育測量的結(jié)果就是(不妥)考試的成績,它通常用分?jǐn)?shù)來表示。既然考試是教育測量的工具,故考試應(yīng)有以下幾點規(guī)范(1)因為考試的成績就是教育測量的結(jié)果,所以它應(yīng)該是客觀的,不應(yīng)隨測量者及測量條件的改變而改變。(2)作為教育測量的單位,考試分?jǐn)?shù)的最小值即成績的單位---分值應(yīng)具有等值性。等值性有兩重含義,其一,若兩個考生的考試成績分別為80分和40分,則前者學(xué)習(xí)水平(知識量和能力)應(yīng)為后者的兩倍;其二,80分和70分的差異與50分和40分的差異相同。(3)考試作為教育測量的工具有系統(tǒng)誤差和隨機(jī)誤差,因此考試中也需要有用來衡量這兩類測量誤差對教育測量結(jié)果影響的指標(biāo)2、考試的教學(xué)意義從教學(xué)角度,考試建立了教學(xué)系統(tǒng)中的信息反饋渠道。這一點非常重要,所有教學(xué)資源(教學(xué)大綱、教學(xué)改革、教學(xué)主體和客體關(guān)系優(yōu)化等)配置都建立在這個反饋來的信息基礎(chǔ)上的。3、考試的社會意義(1)考試是對教育進(jìn)行評估的重要手段之一。教育評估的內(nèi)容有:教育的社會價值、教育投資效能、教育法規(guī)、教育機(jī)構(gòu)設(shè)置、教育目標(biāo)、教育過程(教育主體構(gòu)成與培養(yǎng)、教學(xué)大綱、教學(xué)計劃、課程設(shè)置、教材、教學(xué)手段、教學(xué)客體規(guī)范)、人才機(jī)制等。(2)考試是開發(fā)智力資源的重要手段之一考試對教育主、客體有督促作用;考試對人才培養(yǎng)目標(biāo)、培養(yǎng)質(zhì)量有規(guī)范作用;考試對人才資格有認(rèn)證作用;考試對人才選拔有甄別作用。(3)考試及考試制度是社會公正的重要標(biāo)志之一(評:教材未提及)三、考試的功能1、評定學(xué)生的學(xué)業(yè)成績,包括確定學(xué)生的學(xué)業(yè)成就在一個群體中所處的相對位置和確定學(xué)生達(dá)到的學(xué)業(yè)水平與教育目標(biāo)所規(guī)定的學(xué)業(yè)標(biāo)準(zhǔn)之間的差距;2、為教學(xué)管理提供信息和依據(jù);3、為改進(jìn)教學(xué)工作提供反饋信息;4、鑒定資格、甄別人才;5、提高過度學(xué)習(xí)程度,增大學(xué)習(xí)保留量;6、為教育科學(xué)研究提供一種有效的手段。§2-2
考試的分類考試一般按目的和時間兩種分類方法:一、按考試的時間分類在教學(xué)過程的不同階段有著不同的特點和要求,因而有不同的考試安置性考試和準(zhǔn)備性考試:安排在教學(xué)的開始階段;形成性考試和診斷性考試:安排在教學(xué)的中期階段;總結(jié)性考試:安排在教學(xué)的結(jié)束階段;1、安置性考試和準(zhǔn)備性考試:(1)安置性考試的目的要求:為了發(fā)現(xiàn)優(yōu)秀學(xué)生,所以命題范圍應(yīng)當(dāng)廣,而且要求有較高的難度和區(qū)分度(第四章介紹);(2)準(zhǔn)備性考試的目的要求:檢查學(xué)生對基礎(chǔ)知識的掌握情況,所以命題范圍比較小、其難度也較低,對區(qū)分度不作要求。2、形成性考試和診斷性考試:(1)形成性考試的目的要求:了解學(xué)生對教學(xué)內(nèi)容的掌握程度,如單元考試、中段考試等;命題要求嚴(yán)格按照教學(xué)大綱,題目應(yīng)按由易到難的順序排列。以便教師對學(xué)生學(xué)習(xí)情況心中有數(shù)。(2)診斷性考試的目的要求:為深入了解學(xué)生的學(xué)習(xí)障礙及產(chǎn)生原因,如課堂小測驗等。命題要求必須在欲檢查的每一個特定的領(lǐng)域或知識點包含有較多的考題,并且要關(guān)注學(xué)生對特殊題目的反映及出現(xiàn)的共同錯誤,以便制定教學(xué)改進(jìn)方案。3、總結(jié)性考試目的和要求:對學(xué)生的學(xué)習(xí)成績作一次全面的檢查,觀察其對全部教學(xué)內(nèi)容的掌握情況,評定成績、排列名次,決定是否重修。如期末考試、結(jié)業(yè)考試等。命題要求范圍較廣,有代表性和綜合性,題目難度和區(qū)分度適中,應(yīng)做到考教分離,且命題主體應(yīng)為教學(xué)機(jī)構(gòu)如教研室、學(xué)科組或教學(xué)小組,有條件的還應(yīng)全市、全省乃至全國范圍的統(tǒng)一命題。二、按考試的目的分類按考試的目的分類有常模參照考試和目標(biāo)參照考試1、常模參照考試什么是常模參照考試?用來測量學(xué)生群體中各個學(xué)生個體的相對水平的考試。所謂常模,是指一個規(guī)定的學(xué)生群體,在這種考試中總的成績或水平,通常用群體的考試成績的統(tǒng)計數(shù)據(jù)來表示。在標(biāo)準(zhǔn)化考試中,則以標(biāo)準(zhǔn)化樣本(用標(biāo)準(zhǔn)化考試的試卷對隨機(jī)抽取的學(xué)生)在測試中的平均成績及標(biāo)準(zhǔn)差(第三章介紹)作為常模。常模參照考試實例:我國英語四級水平考試(CET--Ⅳ)的常模定為平均分72分,標(biāo)準(zhǔn)差12分。美國和加拿大兩國77所醫(yī)學(xué)院的四年級學(xué)生共5877人參加考試,平均分?jǐn)?shù)為500分,那么次考試的常模就是500分。因此,檢查各個學(xué)生與常模的差距,確定其在規(guī)定的學(xué)生群體中的相對地位為目的的考試就是常模參照考試。值得注意的是常模并不是真正的標(biāo)準(zhǔn),只是把它當(dāng)作標(biāo)準(zhǔn)用作比較。常模參照考試的要求:難度要適中,有較高的區(qū)分度,常用于安置性考試和總結(jié)性考試。2、目標(biāo)參照考試什么是目標(biāo)參照考試?測量每個學(xué)生實際(絕對)水平的考試。所謂目標(biāo),指某門課程既定的標(biāo)準(zhǔn),亦即由教學(xué)大綱所規(guī)定的該門課程的教學(xué)目標(biāo)。目標(biāo)參照考試實例:國家教委制訂的工科基礎(chǔ)課程教學(xué)基本要求,就是各類工科基礎(chǔ)課程的教學(xué)目標(biāo)。檢查學(xué)生是否達(dá)到這一目標(biāo)而進(jìn)行的考試就是目標(biāo)參照考試。所關(guān)心的是參加考試的學(xué)生是否達(dá)到了教學(xué)目標(biāo),不關(guān)心其在群體中的相對位置。值得注意的是,目標(biāo)是一個真正的標(biāo)準(zhǔn),而不僅是用作比較的標(biāo)準(zhǔn)。目標(biāo)參照考試的要求:難度由教學(xué)大綱或其它教學(xué)綱領(lǐng)性文件決定,不要求區(qū)分度。常用于準(zhǔn)備性考試、診斷性考試、各類資格考試。3、混合型考試(評:教材無此知識點):實際情況是上述兩類考試是相互滲透的,其作用和解讀由考試組織者根據(jù)實際需要取舍。4、常模參照考試與目標(biāo)參照考試比較兩種考試的差異有:(1)常模參照考試的成績分布范圍應(yīng)該比較寬,具體說難度適中,區(qū)分度高;而目標(biāo)參照考試對成績的分布無要求,不要求區(qū)分度。(2)常模參照考試中,試卷樣本項目多(概念、原理、分析、能力),但每項目中題目不宜多;而目標(biāo)參照考試項目不宜多,但每項目中的題目應(yīng)比較多。(3)常模參照考試多采用選擇題,目標(biāo)參照考試較少采用選擇題。(4)常模參照考試更重視試題區(qū)分學(xué)生學(xué)習(xí)成績高低的功能;而目標(biāo)參照考試重視測試學(xué)生對所學(xué)內(nèi)容的掌握情況。(5)由于常模參照考試的成績分布范圍廣,分?jǐn)?shù)的離散性大,考試的信度(第五章介紹)可以用傳統(tǒng)的統(tǒng)計方法進(jìn)行估計,而目標(biāo)參照考試數(shù)據(jù)離散性小,考試的信度不能用傳統(tǒng)的統(tǒng)計方法進(jìn)行估計。(6)常模參照考試多用于安置性考試和總結(jié)性考試,而目標(biāo)參照考試多用于準(zhǔn)備性考試、形成性考試和診斷性考試。(7)常模參照考試和目標(biāo)參照考試有聯(lián)系,有時同一次考試同時具有這兩種考試的性質(zhì)。所以兩者之間并無明顯的分界線。§2-3考試命題的基本原理與步驟一、命題在考試中的地位與作用1、導(dǎo)向作用考試什么?怎樣考?引導(dǎo)學(xué)生正確地進(jìn)行學(xué)習(xí)。2、命題決定了作為教育測量工具的準(zhǔn)確度。過難、過易、過少、過多會導(dǎo)致測量誤差,影響教學(xué)工作的開展。3、命題是教學(xué)測量正常進(jìn)行的前提,是教學(xué)工作的一部分。二、命題的基本原則考試命題以保證試題質(zhì)量為最基本的原則。所謂保證試題的質(zhì)量,就是要使試題具有合適的難度和較高的區(qū)分度,還要使考試具有較高的效度和信度。為實現(xiàn)這一目標(biāo),命題應(yīng)遵循以下一些原則:1、命題的基本依據(jù)是教學(xué)大綱2、命題覆蓋面應(yīng)包括課程的所有主要內(nèi)容,以保證考試的效度。3、命題要對學(xué)生的學(xué)習(xí)有促進(jìn)作用。4、試題的難度要適當(dāng)。5、試題不宜過大,但數(shù)量要適當(dāng)多一些。6、考試不應(yīng)出偏題、怪題。難題應(yīng)當(dāng)占合適的比例。7、命題的敘述要清楚無誤,不能產(chǎn)生語言歧義。三、命題的步驟1、根據(jù)考試目的,確定考試的類型。根據(jù)考試目的,確定考試是常模參照考試,還是目標(biāo)參照考試等。2、根據(jù)課程的特點、教材的內(nèi)容和考試對象的特點,確定要測量的知識和能力的具體要求。3、選擇題型。4、編制命題計劃表。所謂命題計劃表,是一種列出了教材各部分內(nèi)容、確定各種知識、能力的測量在考試中所占的比例,及所采用的各種題型在數(shù)量上的分配比例的雙向細(xì)目表。編制命題計劃表有兩個目的:(1)保證試題是教材內(nèi)容中有代表性的樣本,并使試題能反映出各部分教學(xué)內(nèi)容的相對重要性,從而保證了試題取樣合理,考試有足夠高的內(nèi)容效度。(2)為各部分試題具有合理的難度和區(qū)分度提供了依據(jù)。因此,若把考試命題比作一項工程,那么,命題計劃表就是該工程的設(shè)計藍(lán)圖,是編制試卷的指南。能編制高質(zhì)量的命題計劃表的命題者就有可能編制出高質(zhì)量試卷??梢?,編制命題計劃表,是考試命題工作中關(guān)鍵的一步,必須認(rèn)真對待、精心編制好。5、根據(jù)命題計劃表編制試題。6、編制參考答案和評分標(biāo)準(zhǔn)。以下是典型的命題計劃表:表2.3.1GRE考試1977—1978年的內(nèi)容分布答卷的時間測驗的項目試題數(shù)量第一組50分鐘語言能力80填空造句類推反義詞閱讀理解(兩大段,三小段)15~2015~2015~2015~20第二組50分鐘定量能力55定量比較數(shù)學(xué)能力3025第三組25分鐘分析能力40分析解釋40第四組25分鐘分析能力30邏輯圖分析推理1515第五組25分鐘定量能力、語言能力、分析能力或試驗項目25共計175分鐘共約230題§2-4試題的結(jié)構(gòu)、分類與命題方法題型種類繁多,可以按課程特點分類,也可以按考試方式(筆試、面試、提問、實驗操作)分類,還可以按答案特征、答題方式分類。一般根據(jù)試題的答案特征、答題方式分為客觀題和主觀題。下面介紹各類試題的測試功能、結(jié)構(gòu)、特點和命題方法(原則):一、主觀題:包括簡答題和論說題1、簡答題(1)結(jié)構(gòu):簡答題由一個直接問句或一個未完成的陳述句構(gòu)成,前者即為問答題,由學(xué)生提供用適當(dāng)?shù)淖衷~、數(shù)字和符號組成的陳述句作為答案;后者為填空題,由學(xué)生提供用適當(dāng)?shù)淖衷~、數(shù)字和符號作為答案,將題目所給的陳述句完成為一個完整的句子。(2)特點:學(xué)生主動提供簡單答案,學(xué)生具有一定的主觀自由度。(3)測試功能:簡答題需要由學(xué)生主動提供簡單答案,它主要用來測試學(xué)生對知識的記憶程度。(4)優(yōu)缺點:命題容易、靠僥幸猜測而能正確做出答案的可能性小;缺點是只宜用來測試簡單內(nèi)容的學(xué)習(xí)結(jié)果,不能用來測試復(fù)雜內(nèi)容的學(xué)習(xí)結(jié)果,而且有相當(dāng)一部分簡答題的評分不夠客觀。(5)其它變形題型:屬于簡答題范疇的具體題型還有:名詞解釋、簡答題、主觀填空題、簡單計算題、簡單證明題、看圖說話題、口算題等。(6)簡答題命題原則(A)試題的答案應(yīng)具有唯一性,且答案應(yīng)盡可能簡短而具體,要防止一個問題可以有多種答案。下面的題例不符合這一原則:例1測量交流電壓的儀表是(B)要盡量結(jié)合具體課程將簡單題編為合適的形式,以使問題明確,并盡量減少猜測答案的可能性。下面的題例不符合本原則:例2“七.七”事變爆發(fā)在(C)要求學(xué)生提供的答案,應(yīng)當(dāng)是重要概念和結(jié)論,不應(yīng)當(dāng)是枝節(jié)次要問題,尤其盡量避免讓學(xué)生提供是、不是、有、沒有等(D)要避免可能出現(xiàn)的暗示,如空格的長度不同。(E)數(shù)字答案應(yīng)對單位和有效數(shù)字有明確要求,以使答案客觀。(F)要盡量避免僅僅靠機(jī)械記憶就可以作出答案的命題。(G)采用填空題時,不宜有太多的空格,以面造成學(xué)生審題故障。以下題例違反了這一原則:木材的防腐技術(shù)2、論說題(1)結(jié)構(gòu):論說題是指由一些問句或陳述句組成、需要由學(xué)生用自己的語言寫成一份較長的答案的試題。(2)特點:學(xué)生在回答問題時,有較大的自由度,可以充分運用所學(xué)的知識,并且可以加上自己獨特的見解。(3)測試功能:用來測試學(xué)生比較復(fù)雜知識的學(xué)習(xí)情況和運用所掌握的知識的能力。(4)優(yōu)點:A)可以用來進(jìn)行高層次學(xué)習(xí)結(jié)果的測量,可以用在各種學(xué)科領(lǐng)域,特別適用于社會、人文學(xué)科,各種變形題型也同樣適用于理、工學(xué)科;B)對學(xué)生學(xué)習(xí)態(tài)度和學(xué)習(xí)方式可以產(chǎn)生積極影響,例如可使學(xué)生比較注重學(xué)科在整體上的內(nèi)在聯(lián)系以及運用知識分析解決問題;C)可以培養(yǎng)學(xué)生的寫作能力;D)試題編制容易。(5)缺點:A)考試效度不高。因為論說題分值高,但測量容量或范圍有限,不能有效代表學(xué)科的全部內(nèi)容(見教材P.37);B)評分的主觀性太強(qiáng),可信度太低。C)不適合初中、小學(xué)基礎(chǔ)教育測量。(6)其它變形題型:屬于論說題范疇的具體題型還有:閱讀理解、作文、綜合計算應(yīng)用題等。(7)論說題編制原則1、論說題應(yīng)該只用于測量較高層次的學(xué)習(xí)結(jié)果。2、由于論說題只用于測量較高層次的學(xué)習(xí)結(jié)果,所以在編制論說題時,應(yīng)使用“為什么”“怎么樣”“評論”“對照”“說明”“分析”“比較”等詞語,而不宜使用“何處”“何時”“何人”“什么”“列舉”等詞語,因為后者一般只適用于測量較低層次的學(xué)習(xí)結(jié)果。3、要避免含糊不清的問句,必要時要對答案的長度等作出明確的要求,并對所預(yù)期的答案內(nèi)容作出說明。以下題例就是不符合本原則的故障試題:例1.試比較氫氣、氧氣和二氧化碳的性質(zhì)。如果改成下面的形式,就是一個比較好的命題。例2.試就密度、顏色、可燃性、助染性、還原性、氧化性、在水中的溶解性、比重等方面的特點,對氫氣、氧氣和二氧化碳?xì)獾男再|(zhì)作比較,字?jǐn)?shù)要求在600字以內(nèi)。4、除了用來測量學(xué)生寫作能力的論說題,一般不允許學(xué)生對試題選擇作答如三選二、二選一等,否則將破壞對學(xué)生作比較性評定的公平性和科學(xué)性。5、編制論說題時,最好能給出回答該題所需要的參考時間,一面學(xué)生在作答論說題時花費過多時間,而影響整個考試。二、客觀題:包括選擇題和配合題1、選擇題:是指由學(xué)生在若干備選答案中選擇正確答案的試題。(1)結(jié)構(gòu):由題干(陳述句、問句,可以是完整的或不完整的)以及多個備選答案兩部分組成。備選答案中有一個或多個正確答案,其余都是錯誤的,稱為偽答案、似真答案、迷惑答案或干擾答案。(2)特點:答案客觀,學(xué)生無自由度。適合各級各類考試,在50年代后興起的標(biāo)準(zhǔn)化考試中廣泛應(yīng)用。(3)測試功能:特別適合測試學(xué)生所學(xué)課程重要知識點、概念、方法、結(jié)論、分析、判斷、應(yīng)用的情況,有較好的區(qū)分度和可信度。(4)優(yōu)點:A)可以用來測量學(xué)生各種不同層次的學(xué)習(xí)結(jié)果,不僅可以測量學(xué)生掌握所學(xué)知識的程度,而且可以測量學(xué)生對所學(xué)知識的理解、分析、判斷、應(yīng)用和綜合能力。在教育測量中應(yīng)用最廣泛;B)容量大,測量面廣,可有效克服傳統(tǒng)考試中簡答題、論說題由于題量小、抽樣面窄而造成的測量效度不高的缺點;C)有利于提高學(xué)生的判斷和推理能力,提高解題的速度和靈活性;D)可避免題意不清的命題故障;E)評分標(biāo)準(zhǔn)統(tǒng)一、客觀,便于計算機(jī)快速閱卷,提高了考試的可信度,進(jìn)而提高了教育測量的效率;F)便于計算機(jī)遠(yuǎn)程考試(此點教材未提及);G)便于發(fā)現(xiàn)、分析、排除學(xué)生的學(xué)習(xí)障礙。(5)選擇題缺點:A)編制選擇題工作量大、難度高,要求命題者有較高的命題技巧;B)由于備選答案數(shù)量有限,故學(xué)生僥幸猜中答案的概率較大,如五個備選答案中有一個正確答案,則猜中答案的概率為20%,因而對考試的信度有一定影響;C)不能測試學(xué)生完整的推理能力、綜合運用知識的能力、嚴(yán)密的表達(dá)能力以及寫作能力。(6)其它變形題型:最佳選擇題、比較選擇題、組合選擇題、多重選擇題、填空選擇題、類推選擇題、因果選擇題、是非選擇題、改錯選擇題、排列選擇題等。(7)選擇題命題原則(A)每題應(yīng)獨立測量一個且僅測量一個重要問題,而不是枝節(jié)問題,且提干提出的問題應(yīng)該是很明確的。(B)任何一題備選答案不能是另一選擇題的提示或前提條件。(C)題干要盡可能簡明扼要,盡量不要使用過于長而復(fù)雜的字詞句,保證考試時學(xué)生在短時間內(nèi)完成答題,美國規(guī)定每個選擇題答題時間不超過45s。(D)備選答案不能有任何暗示。(E)應(yīng)給出必要的說明語,以幫助應(yīng)試者正確理解題意。(F)干擾答案應(yīng)具有很高的似真性,以便提高試題質(zhì)量。2、配合題:配合題是一種改良變形的選擇題(1)結(jié)構(gòu):試題由一組題干和一組與之相配合的備選答案組成:
(題干)(答案)1、南昌起義發(fā)生在()年A1931年2、盧溝橋事變發(fā)生在()年B1840年3、“一二.九”運動發(fā)生在()年C1937年4、第一次鴉片戰(zhàn)爭爆發(fā)在()年D1935年E1927年考試時,要求學(xué)生從選項中為每一個題干選配一個合適的答案。不難看出,配合題與選擇題的差別在于,前者為一組題干共用一組備選答案,后者為每一個題干都有一組備選答案。(2)特點和測試功能:基本同選擇題。(3)優(yōu)缺點:優(yōu)點更加明顯,考試效率更高;缺點也更加突出,僅能測試機(jī)械記憶的知識。(4)命題原則:(A)一道題中,要求各題干(同樣地,也要求各個備選答案)具有相同或相近的性質(zhì),這種同質(zhì)性可以保證所有的備選答案都能成為任何一個題干的似真答案。以保證試題質(zhì)量。(B)應(yīng)要求備選答案數(shù)量大于題干的數(shù)目。(C)有時要給出明確的答題說明,指出每個答案被選擇的次數(shù)。(D)卷面安排要便于理解,便于評分。3、選擇題得分校正:猜測答案引起虛假成績??梢远覒?yīng)該對答錯的題目倒扣一定分?jǐn)?shù)。倒扣多少分,不能由教師主觀隨意確定,而應(yīng)根據(jù)猜測答對的概率來確定??梢宰C明,應(yīng)按下列公式計算選擇題最終考試成績:式中F為最終考試成績,F(xiàn)0為一個題目的滿分?jǐn)?shù),R為答對的題數(shù),W為答錯的題數(shù),n為每個題目的備選答案數(shù)。如某次考試共有40個選擇題,每題滿分位2分,某學(xué)生共答對25題,答錯15題,每題有4個備選答案,則他的最終考試成績?yōu)椋河袝r為了簡便,干脆在試卷上明確規(guī)定對選錯答案的題目倒扣一定的分?jǐn)?shù)。例如,規(guī)定每題答對的3分,不答不得分,答錯倒扣一分。當(dāng)然,規(guī)定的倒扣分?jǐn)?shù)應(yīng)該是根據(jù)科學(xué)方法計算出來的第二章結(jié)束語1、以上主觀和客觀兩大類試題究竟哪一種更有利于對學(xué)生學(xué)習(xí)結(jié)果的測量與評估眾說紛紜、莫衷一是。但可以肯定,無論哪一種試題都不可能全面地測量學(xué)生的學(xué)習(xí)情況??茖W(xué)的態(tài)度是:在教育測量的實踐中,應(yīng)根據(jù)考試的目的、性質(zhì),配合使用才能取得較好的效果。2、研究表明,各類大規(guī)模的考試應(yīng)以客觀題為主、配以適量的主觀題的模式。一般情況下,客觀題占總分的80%,主觀題占20%。3、結(jié)合各學(xué)科具體的特點,以上主觀和客觀兩大類試題有多種變形體不可能一一枚舉。謝謝大家第三章考試分?jǐn)?shù)的收集、整理和解釋§3-1考試分?jǐn)?shù)的收集§3-2考試分?jǐn)?shù)的整理一、頻數(shù)分布表和頻數(shù)直方圖二、考試分?jǐn)?shù)的各種分布圖§3-3特征量數(shù)及其求法一、集中量數(shù)
二、差異量數(shù)三、相關(guān)量數(shù)
四、標(biāo)準(zhǔn)分?jǐn)?shù)§3-4正態(tài)分布的性質(zhì)、計算與應(yīng)用一、正態(tài)分布的性質(zhì)
二、正態(tài)分布的計算三、正態(tài)分布的應(yīng)用§3-5原始考試分?jǐn)?shù)的解釋一、非正態(tài)分布的正態(tài)化二、常模參考分?jǐn)?shù)三、標(biāo)準(zhǔn)參考分?jǐn)?shù)§3-1考試分?jǐn)?shù)的收集考試后,要對考試分?jǐn)?shù)有一個直觀的、整體的了解,需要收集考試分?jǐn)?shù),即將考試分?jǐn)?shù)按照一定格式進(jìn)行登記。常見的登記方法是,按學(xué)生編號或根據(jù)分?jǐn)?shù)高低,由高到低或由低到高排列。為便于對考試分?jǐn)?shù)進(jìn)行整理、分析和解釋,推薦介紹兩種收集方法:1、奇、偶數(shù)試題考分收集表把試卷中的試題按照奇數(shù)題和偶數(shù)題分為兩部分,并求出各部分試題的得分總和,如表3-1所示。然后計算兩部分得分總數(shù)之和及差的相關(guān)系數(shù),最后可由此計算出本次考試的信度(第五章介紹),也就是關(guān)于考試結(jié)果的可靠程度的系數(shù)。這種收集方法,工作量大,要使考試的信度高,要求教師掌握好奇數(shù)題和偶數(shù)題的難易程度,進(jìn)行合理的搭配。2、試題順序考分收集表登記各試題得分及總分?jǐn)?shù),如表3-2。收集分?jǐn)?shù)的目的是對其進(jìn)行科學(xué)的分析、評價,故要求事實求是,考試分?jǐn)?shù)具有較高的準(zhǔn)確性。表3-1奇、偶數(shù)試題考分收集表考試日期年月日系科目班級
序號各奇數(shù)題得分奇數(shù)題得總分?jǐn)?shù)a各偶數(shù)題得分偶數(shù)題得總分?jǐn)?shù)b和分a+b差分a-b1357911246810121234567項目姓名各試題滿分?jǐn)?shù)表3-2試題順序考分收集表考試日期年月日系科目班級
各
試
題
分序
數(shù)
號姓名項目
各試題分?jǐn)?shù)總分備注12345……123456§3-2考試分?jǐn)?shù)的整理整理考試分?jǐn)?shù)的意義考試得到一批卷面原始分?jǐn)?shù),表面看沒有什么規(guī)律,教師無法從中發(fā)現(xiàn)教學(xué)中存在的問題,學(xué)生也無法了解自己的考試分?jǐn)?shù)在考生群體中的相對位置??荚嚪?jǐn)?shù)的整理可得到許多信息,如哪道試題難度大,哪些內(nèi)容學(xué)生尚未完全掌握,考試的可靠性有多高等。這對客觀評價學(xué)生學(xué)習(xí)水平、改進(jìn)教師的教學(xué)工作、改善教學(xué)質(zhì)量是十分必要的、有利的。一、頻數(shù)分布表與頻數(shù)直方圖所謂頻數(shù),是指一段分?jǐn)?shù)中所包含考試分?jǐn)?shù)的個數(shù)。頻數(shù)分布表就是把一批考試分?jǐn)?shù),按照從低分到高分(或從高分到低分)的順序排列后進(jìn)行分組,計算出每一組的頻數(shù),登記在一張表中。其列表步驟如下:1、求全距:全距R就是一批分?jǐn)?shù)中最高分與最低分之差,即
R=最高分?jǐn)?shù)-最低分?jǐn)?shù)(3-1)它反映了全部分?jǐn)?shù)的分布范圍。2、定組數(shù):組數(shù)是根據(jù)全距R和考試分?jǐn)?shù)的個數(shù)n來確定的,R值大,考試分?jǐn)?shù)的個數(shù)n多,相應(yīng)地組數(shù)就分得多。計算方法如下:組數(shù)=
(3-2)式中n為考分的個數(shù)。組數(shù)也可參照表3-3確定。(n實際就是人數(shù))表3-3分組數(shù)參考表3、定組距:全距R與組數(shù)確定之后,組距ZR也就可以確定了,即
ZR=R/組數(shù)(3-3)如果計算出來的組數(shù)及組距有小數(shù)應(yīng)取整。組距可以相等,也可以不相等,即當(dāng)某些組的頻數(shù)特別大時,可以把這些組再分成若干個小組,以減小組距。考分?jǐn)?shù)量(個)分組數(shù)(個)505—101008—1620010—2030012—2450015—304、分組將全部分?jǐn)?shù)根據(jù)分?jǐn)?shù)段進(jìn)行分組,可高分做起,也可從低分做起。在分組時,應(yīng)注意以下兩個問題:(1)統(tǒng)一約定每組只含下限,不含上限,即每組為左閉右開區(qū)間。(2)在實際計算中,每組的分點值要取得比原考試分?jǐn)?shù)多一位有效數(shù)字,如某一組的下、上限原來是[30,35),而取比原來考試分?jǐn)?shù)多一位有效數(shù)字就應(yīng)變?yōu)閇29.5,35.5),29.5分和35.5分就是這一組的實際下、上限。這樣處理可以避免某些考試分?jǐn)?shù)恰好處于分點處,以致無法確定這些分?jǐn)?shù)究竟分在哪一組。5、求組中值:組就是每一點的中點值,其計算公式為:
組中值=組實際下限+0.5ZR(3-4)6、列頻數(shù)分布表:數(shù)出落在每個組的考試分?jǐn)?shù)的個數(shù),這個個數(shù)就是每一組的頻數(shù),將它們填入頻數(shù)分布表中即可。7、計算頻率:每一組的頻數(shù)除以這批考試分?jǐn)?shù)的總個數(shù)n,就是該組的頻率。以下是列頻數(shù)分布表的實例。例3-1某班112名學(xué)生在結(jié)構(gòu)化學(xué)考試分?jǐn)?shù)如下:68707077768685768741857665787665908673669073867062926285767263636176517076789070828066867874637776858384837674757586886892688585829480809175868285857280807565629075656090787686809186657886788572727290787885788688728576827585試作出這批考試分?jǐn)?shù)的頻數(shù)分布表。解:第一步,求全距RR=最高分?jǐn)?shù)–最低分?jǐn)?shù)=94–41=53第二步,定組數(shù)考試分?jǐn)?shù)總共有112個,根據(jù)表3-3,將其分為11組。第三步,求組距ZRZR=R/組數(shù)=53/11≈4.8≈5分第四步,分組根據(jù)全距R=53和組距ZR=5,分組為41—45,46--50,51—55,56—60,61—65,66—70,71—75,76—80,81—85,86—90,91—95,根據(jù)前述約定,實際分組及組限為(40.5,45.5),(45.5,50.5),(50.5,55.5),(55.5,60.5),(60.5,65,5),(65.5,70.5),(70.5,75.5),(75.5,80.5),(80.5,85.5),(85.5,90.5),(90.5,95.5)第五步,求組中值:根據(jù)公式:組中值=組實際下限+0.5ZR第一組,中值為:40.5+5/2=43分;頻數(shù)為:1頻率為0.009第二組,中值為:45.5+5/2=48分;頻數(shù)為:0頻率為0.000第三組,中值為:50.5+5/2=53分;頻數(shù)為:1頻率為0.009第四組,中值為:55.5+5/2=58分;頻數(shù)為:1頻率為0.009第五組,中值為:60.5+5/2=63分;頻數(shù)為:13頻率為0.116第六組,中值為:65.5+5/2=68分;頻數(shù)為:10頻率為0.089第七組,中值為:70.5+5/2=73分;頻數(shù)為:16頻率為0.147第八組,中值為:75.5+5/2=78分;頻數(shù)為:27頻率為0.241第九組,中值為:80.5+5/2=83分;頻數(shù)為:20頻率為0.179第十組,中值為:85.5+5/2=88分;頻數(shù)為:18頻率為0.161第十一組,中值為:90.5+5/2=93分。頻數(shù)為:5頻率為0.045第六步,求每一組的頻數(shù)用唱票的辦法,找出各組頻數(shù)為前述幻燈片或下表3-4。第七步,求每一組的頻率:結(jié)果列在前述幻燈片或下表3-4。第八步,列出頻數(shù)、頻率分布表如下:表3-4頻數(shù)、頻率分布表組別起止點組中值頻數(shù)頻率141—454310.009246—504800.000351—555310.009456—605810.009561—6563130.116666—7068100.089771—7573160.147876—8078270.241981—8583200.1791086—9088180.1611191—959350.045第九步,頻數(shù)直方圖和頻率直方圖圖3-1頻數(shù)直方圖(上)和頻率直方圖(下)第十步,頻數(shù)多邊圖和頻率多邊圖當(dāng)考試分?jǐn)?shù)的數(shù)量增多到一定程度時,上圖的折線圖就會變成一條光滑的曲線。這條光滑的曲線就稱為頻數(shù)分布線或頻率分布線(紅線)。圖3-2頻數(shù)多邊圖(上)和頻率多邊圖(下)二、考試分?jǐn)?shù)的各種分布曲線1、正態(tài)分布曲線圖3-3所示為正態(tài)分布曲線,特點是:(1)曲線位于橫坐標(biāo)軸x的上方,中間高兩邊低,以直線x=平均數(shù)為對稱軸,且無限接近于x軸。(2)考試成績呈正態(tài)分布,能夠比較客觀地反映教學(xué)情況和學(xué)生掌握知識的程度以及智力水平。因為人的智商分布是符合正態(tài)分布的,即IQ特高和特低的人很少,多數(shù)人處于中等水平,學(xué)習(xí)成績也如此。否則就不合理了。2、偏態(tài)分布統(tǒng)計學(xué)將頻數(shù)最大的那個數(shù)值叫作眾數(shù)(對應(yīng)的分布稱為最可幾分布)。正態(tài)分布曲線中平均值等于眾數(shù)。實際教育測量中會遇到平均值不等于眾數(shù)的情況,這種分布稱為偏態(tài)分布曲線。平均數(shù)大于眾數(shù)時的偏態(tài)分布曲線稱為正偏態(tài)曲線,平均數(shù)小于眾數(shù)時的偏態(tài)分布曲線稱為負(fù)偏態(tài)曲線。這兩種偏態(tài)分布曲線如圖3-4。頻數(shù)或頻率圖3-3正態(tài)分布曲線xx幾種偏態(tài)分布圖試題過難試題過易正態(tài)分布,學(xué)生基礎(chǔ)相近或中等難度題目過多理想正態(tài)分布正態(tài)分布,學(xué)生基礎(chǔ)相差較大,難易程度不同的試題的比例接近偏態(tài)分布,難度過大和難度過小的試題偏多,或?qū)W生兩極分化。§3-3特征量數(shù)及其求法從頻數(shù)、頻率分布表,直方圖和分布曲線可大致看到一批考試分?jǐn)?shù)的集中趨勢和變異程度。本節(jié)進(jìn)一步介紹特征統(tǒng)計量數(shù)。一、集中量數(shù):既反映數(shù)據(jù)組的典型情況,也可以用來數(shù)據(jù)組比較1、眾數(shù):頻數(shù)最大的數(shù)據(jù)稱為眾數(shù)。下列數(shù)據(jù)1,5,4,5,6,5,7,8,5,9,6,11,共12個數(shù)據(jù),其中5出現(xiàn)4次,頻數(shù)最大,故為眾數(shù)。2、中位數(shù):一組數(shù)據(jù)從小到大排列,居于中間者為中位數(shù),例如4,5,6,8,9,10,11,11,30,前8個數(shù)據(jù)彼此相差不大,而第九個數(shù)據(jù)30與前8個數(shù)據(jù)相差懸殊,為不使個別相差懸殊的數(shù)據(jù)影響這組數(shù)據(jù)的代表性,常用居于中間的數(shù)據(jù)9作為該組數(shù)據(jù)的集中量數(shù)。如數(shù)據(jù)個數(shù)是偶數(shù),就用居于中間的兩個數(shù)據(jù)的平均數(shù)作為中位數(shù)。3、算術(shù)平均值:是教育統(tǒng)計工作中用的最多的集中量數(shù)。(1)算術(shù)平均值:一批數(shù)據(jù)的總和除以這批數(shù)據(jù)的個數(shù),記為:(3-5)(2)加權(quán)平均值:加權(quán)平均值公式為:(3-6)式中為對應(yīng)于的權(quán)重因子。加權(quán)平均實例某4個班的人數(shù)分別為N1=30人,N2=31人,N3=26人,N4=25人,考試平均成績分別為X1=75,X2=75,X3=80,X4=78,則加權(quán)平均值為:=(75X30+75X31+80X26+78X25)/(30+31+26+25)二、差異量數(shù):描述數(shù)據(jù)之間彼此差異程度的一種統(tǒng)計量數(shù)。僅用集中量數(shù)描述數(shù)據(jù)集中的趨勢是不能全面了解其全部特征的,還要了解差異程度或離散程度,才能了解數(shù)據(jù)的全貌如表3-5表3-5兩個組的考試成績與平均分兩組數(shù)據(jù)平均分相同,但離散程度差異巨大。后者離散程度小可用集中量數(shù)描述,而前者離散程度大,單用集中量數(shù)描述是不全面的常見的差異量數(shù)有以下幾種:1、全距:一批考試分?jǐn)?shù)中最高分與最低分之差(前已述及)
R=最高分–最低分特點:僅能粗略地描述一批分?jǐn)?shù)的離散程度。2、四分差:將一批數(shù)據(jù)按照從小到大順序排列,按數(shù)據(jù)的個數(shù)分為大體相等的四份,產(chǎn)生3個分點Q1、Q2、Q3,則四分差Q為:
Q=(Q1–Q2)/2(3-8)組別考試分?jǐn)?shù)平均分?jǐn)?shù)第一組204072989010070第二組66657370717570四分差計算舉例例如,有一批數(shù)據(jù)30,35,38,40,42,45,49,50,70,89,90共計11個數(shù)據(jù)。將其分為4份,三個分點分別為:Q1=38,Q2=45,Q3=70,則有四分差:Q=(70-38)/2=16四分差Q是與中位數(shù)相對應(yīng)的差異量數(shù),它比全距R描述一批數(shù)據(jù)的離散程度要精細(xì),但仍然只考慮到了幾個點上的數(shù)據(jù),沒有涉及到全部數(shù)據(jù),因此仍然只能作比較粗略的描述3、平均差:平均差A(yù)D是指一批數(shù)據(jù)中每一個數(shù)據(jù)與算術(shù)平均值之差的絕對值的平均值:(3-9)式中,n為數(shù)據(jù)個數(shù),xi為第i個數(shù)據(jù);x為這批數(shù)據(jù)的算術(shù)平均值。平均差A(yù)D能較好地反映一批數(shù)據(jù)的離散程度,但計算AD時要用到絕對值,不方便,因而應(yīng)用受到了限制。4、方差:方差S2是一批數(shù)據(jù)中每一個數(shù)據(jù)與算術(shù)平均值之差的平方和,除以這批數(shù)據(jù)的個數(shù)所得到的商:(3-10)方差特點、標(biāo)準(zhǔn)差方差的單位與原數(shù)據(jù)的單位不同,因此其實際應(yīng)用有一定局限性。5、標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差就是方差的平方根:(3-11)例:求表3-5中兩組數(shù)據(jù)的標(biāo)準(zhǔn)差,根據(jù)式(3-11)得:可以看出,第一組考試分?jǐn)?shù)的標(biāo)準(zhǔn)差S1與第二組的標(biāo)準(zhǔn)差S2相差甚大,表明第一組考試分?jǐn)?shù)的離散程度要比第二組大(平均分相同)。可見標(biāo)準(zhǔn)差能比較精細(xì)地描述一批數(shù)據(jù)的離散程度,且其單位與原數(shù)據(jù)一致,是一種用得比較多的差異量數(shù)。6、相對標(biāo)準(zhǔn)差:定義為:(3-12)為什么要定義相對標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差、方差雖然是反映一批數(shù)據(jù)離散程度最好的統(tǒng)計量數(shù),但并不能直接用來比較兩批數(shù)據(jù)的離散程度,尤其當(dāng)兩批數(shù)據(jù)的單位不同時,更不能用方差或標(biāo)準(zhǔn)差來直接比較;即使測量單位相同,但平均值不同時,仍然不能直接用方差或標(biāo)準(zhǔn)差進(jìn)行比較。只能用相對標(biāo)準(zhǔn)差CV,如:某班物理課程考試x1=70分,S1=7分,數(shù)學(xué)課程考試x2=85分,S2=7.8分,并不能斷定數(shù)學(xué)課程考試成績的離散程度比物理課程大。這種情況下,應(yīng)當(dāng)采用相對標(biāo)準(zhǔn)差來比較:物理課程:CV1=7/70=10%
數(shù)學(xué)課程:CV2=7.8/85=9.18%計算表明:物理課程考試成績的離散程度更大。7、總體標(biāo)準(zhǔn)差:在教育實踐中,大面積統(tǒng)考如高考等,參加考試的人多,若要計算總體標(biāo)準(zhǔn)差,就要收集全部的考試分?jǐn)?shù),還要有儲存量較大的計算機(jī),十分不便。這時可分系統(tǒng)進(jìn)行統(tǒng)計,或者分批統(tǒng)計出每批考試分?jǐn)?shù)的標(biāo)準(zhǔn)差,然后計算總體標(biāo)準(zhǔn)差。公式為:(3-13)總體標(biāo)準(zhǔn)差實例式中
NT—考試總?cè)藬?shù);--總體標(biāo)準(zhǔn)差;k—考試成績的分組數(shù);Ni—第i組的全重因子;Si—第i組標(biāo)準(zhǔn)差;di—第i組的平均值與總體平均值之差。舉例如下:例:化學(xué)系有三個班,在物化考試中,甲班平均分X1=70,標(biāo)準(zhǔn)差S1=11分,人數(shù)N1=31人;乙班平均分X2=75,標(biāo)準(zhǔn)差S2=10分,人數(shù)N2=30人;丙班平均分X3=80,標(biāo)準(zhǔn)差S2=8分,人數(shù)N2=28人;求3個班的總體標(biāo)準(zhǔn)差。解(1)求總體平均分(2)求各班平均分與總體平均分之差d1=70-74.8=-4.8分;d2=75-74.8=0.2分;d3=80-74.8=5.2分(3)求總體標(biāo)準(zhǔn)差三、相關(guān)量數(shù)
集中量數(shù)和差異量數(shù)可用來描述一數(shù)據(jù)的某些特征,但在教育測量中,還需要研究幾種事物之間的關(guān)系,以及關(guān)系的程度如何。如研究身高與體重之間的關(guān)系、學(xué)習(xí)時間與學(xué)習(xí)效果之間的關(guān)系、學(xué)習(xí)質(zhì)量與教師的主導(dǎo)作用之間的關(guān)系等。
當(dāng)一些變量變化時,另一些變量要按照某種趨勢變化。變量之間的這種按照某種趨勢共變的關(guān)系稱為相關(guān)關(guān)系。當(dāng)一個變量增大(或減小)時,另一變量也隨之增大(或減小)時,稱這兩個變量為正相關(guān);反之,當(dāng)一個變量增大(或減小)時,另一變量卻隨之減小(或增大)時,即兩變量變化方向相反,稱這兩個變量為負(fù)相關(guān);如果兩個變量沒有上述的相互影響關(guān)系,則稱這兩個變量不相關(guān)。兩個變量的相關(guān)情況可以用散點圖來形象表示。有三種情況:1、散點分布在一條曲線上,兩個變量之間存在著非常緊密的、確定的、一一對應(yīng)的關(guān)系,這就是函數(shù)關(guān)系。2、散點分布在某一條曲線的附近,或者分布在某條曲線的兩側(cè)。這樣,當(dāng)一個變量的取值確定后,通過這條曲線可求出一個函數(shù)值,而另一個變量的取值就在這個函數(shù)值附近,于是可以利用這條曲線對該變量的取值進(jìn)行預(yù)測。散點的這種分布表明兩個變量之間存在著相關(guān)關(guān)系。根據(jù)這條曲線是否為直線,可以把兩個變量之間的相關(guān)關(guān)系分為線性相關(guān)和非線性相關(guān)兩種情況。3、無相關(guān)關(guān)系散點分布無規(guī)律性,即一個變量對另一個變量沒有任何影響,也即,兩個變量之間不存在相關(guān)關(guān)系。教育測量中,兩個變量相關(guān),多為線性相關(guān),此處僅討論線性相關(guān)線性相關(guān)和相關(guān)系數(shù):相關(guān)系數(shù)是重要的相關(guān)量數(shù)。線性相關(guān)的幾種情況見圖3-4:圖3-7相關(guān)散點圖在兩個變量為線性相關(guān)時,描述兩個變量之間相關(guān)的量就是相關(guān)量數(shù),叫做相關(guān)系數(shù)。相關(guān)系數(shù)可定義為:相關(guān)系數(shù)及標(biāo)準(zhǔn)分?jǐn)?shù)的定義設(shè)X1,X2,X3,...,Xn及Y1,Y2,Y3,...,Yn分別表示兩個變量的實際測量值,則相關(guān)系數(shù)可定義為:(3-14)相關(guān)系數(shù)的計算已經(jīng)計算機(jī)化,很容易求得。四、標(biāo)準(zhǔn)分?jǐn)?shù)在卷面上看到的分?jǐn)?shù)是原始分?jǐn)?shù),它有兩大缺陷:1、原始分的缺陷(1)原始分?jǐn)?shù)沒有絕對的零點。在物理量測量中,零點就是什么都沒有、是空白,稱為絕對零點。而在教育測量中則不然,因為在知識的長軸上,各次考試起點都不同,且每次考試都有一定的偶然性,故一名考生雖在考試中得了零分,但不能說他一點知識都沒有,也許下次考試能得高分呢。又如一名考生無法將他前后兩次的考試分?jǐn)?shù)進(jìn)行比較,即使兩次的分?jǐn)?shù)一樣,也不能說他毫無進(jìn)步。因此零分是相對的,只有結(jié)合試題才有實際意義。(2)原始分每分之間是不等值的。原始分?jǐn)?shù)每分之間不等值,如80分和40分,數(shù)字上,80分是40分的兩倍。但80分所代表的知識量不一定是40分的兩倍,這是因為每個試題的難度不同,考生在每個試題上所花費的心理能量不同,而心理能量也無法測量出準(zhǔn)確的數(shù)值。因此數(shù)學(xué)的80分不等于外語的80分,在學(xué)期末,簡單地按幾門課程考試成績的算術(shù)平均分,將考生的學(xué)習(xí)情況排名次是不完全合理的。采用標(biāo)準(zhǔn)分能克服以上的不足2、標(biāo)準(zhǔn)分定義及各種變形體(1)標(biāo)準(zhǔn)分定義:標(biāo)準(zhǔn)分Z就是原始分?jǐn)?shù)x與平均分x之差除以標(biāo)準(zhǔn)差(3-15)例:某班在考試中平均分x=87.69分,標(biāo)準(zhǔn)差S=7.04分,其中甲生得95分,乙生得88分,丙生得73分,求這些考生考試中的標(biāo)準(zhǔn)分。解:Z甲=(95-87.69)/7.04=1.04分同理:Z乙=0.04分;Z丙=-2.09分標(biāo)準(zhǔn)分是原始分?jǐn)?shù)的導(dǎo)出分?jǐn)?shù),以平均分X為絕對零點,以標(biāo)準(zhǔn)差S為一種等值的單位,每一分之間都是等值的,因此用標(biāo)準(zhǔn)分Z來衡量學(xué)生個體在群體中的相對地位是比較合適的,標(biāo)準(zhǔn)分有以下特點(A)若Z<0,則原始分?jǐn)?shù)小于平均分(B)若Z>0,則原始分?jǐn)?shù)大于平均分(C)若Z=0,則原始分?jǐn)?shù)等于平均分標(biāo)準(zhǔn)分及其應(yīng)用(D)標(biāo)準(zhǔn)分Z每多(或少)1分,則原始分?jǐn)?shù)X就比平均分X高(或少)一個標(biāo)準(zhǔn)差的分?jǐn)?shù)。(2)T分?jǐn)?shù):定義為:T=10Z+50T分?jǐn)?shù)是由標(biāo)準(zhǔn)分直接轉(zhuǎn)換而來的。由于標(biāo)準(zhǔn)分一般在-4到+4之間,T分?jǐn)?shù)就在10—90之間,比較接近百分比制。(3)標(biāo)準(zhǔn)九J(Standardnine):定義為:J=2Z+5類似T分?jǐn)?shù),標(biāo)準(zhǔn)九J在1—9之間。(4)CEEB分?jǐn)?shù):是美國大學(xué)入學(xué)考試委員會(CollegeEntranceExaminationBoard)所采用的一種標(biāo)準(zhǔn)化分?jǐn)?shù),定義為:
CEEB分?jǐn)?shù)=100Z+500CEEB分?jǐn)?shù)的平均數(shù)為500,標(biāo)準(zhǔn)差是100,CEEB的范圍為100—900。目前國內(nèi)標(biāo)準(zhǔn)分采用這一模式,先計算出每科的標(biāo)準(zhǔn)分,再計算出每科的CEEB分?jǐn)?shù),而總分實際上是各科CEEB分?jǐn)?shù)的平均數(shù)。“托?!笨荚嚕彩遣捎眠@一轉(zhuǎn)換模式。3、標(biāo)準(zhǔn)分的用途及優(yōu)點(1)比較不同課程的考試成績。例:某班進(jìn)行數(shù)學(xué)和語文測驗,數(shù)學(xué)平均分為70,標(biāo)準(zhǔn)差為5分;語文平均分為80分,標(biāo)準(zhǔn)差為10分;某生數(shù)學(xué)得了75分,語文得了85分,問甲生哪科成績在班上的位置較高?標(biāo)準(zhǔn)分應(yīng)用實例解:Z數(shù)學(xué)=(75-70)/5=1;Z語文=(85-80)/10=0.5可見,表面上語文分高,但實際上數(shù)學(xué)成績在班上的位置較高。(2)比較不同學(xué)生幾門課程考試的總成績的高低。(3)確定學(xué)生個體的考試成績在群體中的相對位置。§3-4正態(tài)分布的性質(zhì)、計算與應(yīng)用一、正態(tài)分布的性質(zhì)在教學(xué)工作中,出現(xiàn)于許多現(xiàn)象中的隨機(jī)變量的取值常常會出現(xiàn)“兩頭小、中間大”的概率分布。比較典型的是大規(guī)模考試成績的分布,往往是分布在平均分X附近的人數(shù)最多,成績較好與成績較差的人數(shù)較少,且離平均分越遠(yuǎn),分布的人數(shù)就越少,成績很好和成績很差的人數(shù)則極少。這種概率分布就是正態(tài)分布。在數(shù)理統(tǒng)計中,正態(tài)分布的方程是:(3-16)式中:(x)—概率密度,--為總體標(biāo)準(zhǔn)差;--總體平均值正態(tài)分布又稱為常態(tài)分布,在數(shù)學(xué)上又稱為高斯分布。性質(zhì)如下:正態(tài)分布曲線的性質(zhì)1、曲線位于x軸的上方,即(x)0,且曲線以直線x=為軸對稱,即曲線是左右對稱的,在對稱軸左右兩側(cè),隨著x的增大與減小,曲線無限趨于x軸。2、當(dāng)x取值為平均值μ時,(x)位于曲線的單峰的最高點,即此時(x)的值最大,這表明在x=μ附近的概率密度最大;當(dāng)x的取值離開平均值μ時,曲線的高度降低,即概率密度(x)減小,x距μ越遠(yuǎn),概率密度(x)越?。?、標(biāo)準(zhǔn)差σ越小,曲線越“高瘦”,表明原始數(shù)據(jù)的差異程度越??;σ越大,曲線越“矮胖”,表明原始數(shù)據(jù)的差異程度越大。4、當(dāng)標(biāo)準(zhǔn)差σ相同而平均值μ不同時,曲線的形狀不變,只是隨平均值μ增大(或減小)而向右(或向左平移)。5、正態(tài)分布是一種連續(xù)型的隨機(jī)變量的分布函數(shù),隨機(jī)變量分布在某區(qū)間[a,b]上的概率,就是這個區(qū)間上曲線下方的面積。隨機(jī)變量分布在(-∞,+∞)上的概率應(yīng)為1。二、正態(tài)分布的計算在數(shù)理統(tǒng)計中,經(jīng)常把研究對象的全體叫做總體,總體中的每一個成員叫做個體,總體中的一部分叫做樣本。數(shù)理統(tǒng)計的中心問題是根據(jù)樣本的特征來探求總體的各種統(tǒng)計特性,以樣本的特征量數(shù)來估計總體的特征量數(shù)。正態(tài)分布曲線,就是由總體平均值μ及總體標(biāo)準(zhǔn)差σ來決定的。正態(tài)分布曲線的數(shù)學(xué)表達(dá)式為:為計算方便,教育統(tǒng)計中把平均數(shù)μ=0、標(biāo)準(zhǔn)差σ=1的正態(tài)分布曲線稱為標(biāo)準(zhǔn)正態(tài)分布,其公式為:(3-17)標(biāo)準(zhǔn)正態(tài)分布曲線如圖3-8所示。下面以樣本平均值代替總體平均值,以樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差來進(jìn)行研究。頻數(shù)或頻率圖3-8正態(tài)分布曲線0x正態(tài)分布的計算對曲線下的面積即隨機(jī)變量分布在某一區(qū)域的概率可用積分方法求得,對區(qū)間(-,x),曲線下的面積為:(3-18)對區(qū)間(X–σ,X+σ),曲線下方的面積為:(3-19)應(yīng)用拉普拉斯函數(shù),既得:(2-20)隨機(jī)變量分布在某區(qū)間[a,b]的概率,就是該區(qū)間內(nèi)曲線下方曲邊梯形的面積。如果事先把平均數(shù)μ=0、標(biāo)準(zhǔn)差σ=1的標(biāo)準(zhǔn)正態(tài)分布曲線下相應(yīng)的曲邊梯形面積制成表格,那么,只要應(yīng)用這張表格,就可以計算隨機(jī)變量分布在不同區(qū)間的概率了。在教育測量中,常用到考試分?jǐn)?shù),前已述及的標(biāo)準(zhǔn)分Z的概念:Z=(X–X)/σ。它恰好具有μ=0、σ=1的特點,因此在查正態(tài)分布表時,一律使用標(biāo)準(zhǔn)分Z。例:設(shè)有一批考試分?jǐn)?shù)服從正態(tài)分布,平均分為X,標(biāo)準(zhǔn)差為σ,求考試分?jǐn)?shù)落在區(qū)間(X–kσ,X+kσ)的概率(k為1,2,3).正態(tài)分布計算實例解:利用(3-19)式和正態(tài)分布表,考試分?jǐn)?shù)落在不同區(qū)間內(nèi)的概率:同理:以上計算結(jié)果可圖示如下:圖3-11考試分?jǐn)?shù)在不同區(qū)間的概率分布以上積分如用計算機(jī)計算就更加方便了。正態(tài)分布的應(yīng)用三、正態(tài)分布的應(yīng)用例:某大學(xué)一年級有987人參加高等數(shù)學(xué)統(tǒng)考,已知這次統(tǒng)考成績符合正態(tài)分布,其平均分X=65,標(biāo)準(zhǔn)差σ=15分,試求不及格率和90分以上的人數(shù)。解:首先求不及格率,即考試分?jǐn)?shù)為59分及以下的概率:
Z59=(59-65)/15=-0.4分查正態(tài)分布表,有:P(-0.4)=0.3446=34.46%為不及格率再求分?jǐn)?shù)為90分及以上的百分比:
Z90=(90-65)/15=1.67分查正態(tài)分布表,有:P(1.67)=0.95254=95.254%90及90分以上的百分比為:1-P(1.67)=4.75%90及90分以上人數(shù)為:987X4.75%=46.8人,約為47人。SOMUCHTODAY,THANKS§3.5原始分?jǐn)?shù)的解釋原始分整理前雜亂無章,考生、教師無法看出自己教與學(xué)的真實情況。如88年高考,由于數(shù)學(xué)考試分?jǐn)?shù)沒有能拉開檔次,在北京有三分之二考生在90分以上,而同年化學(xué)題目較難,能及格的就是優(yōu)秀學(xué)生了。某考生數(shù)學(xué)得89分,化學(xué)得61分,表面看數(shù)學(xué)考得不錯,化學(xué)考得差。實際情況正相反。所以原始分很難對學(xué)生成績作出客觀的評價。因此必須對原始分?jǐn)?shù)進(jìn)行分析,給予正確的解釋。一、多個參照點:非正態(tài)分布正態(tài)化處理
以上討論了考試成績服從正態(tài)分布的情況。若考試成績不服從正態(tài)分布,此時最好采用頻數(shù)分布表、直方圖、平均分、最高分、最低分來解釋。但有時為了進(jìn)行比較,常把非正態(tài)分布正態(tài)化,然后按照正態(tài)分布來處理,以便確定一個等值的單位。處理步驟為:1、編制原始分?jǐn)?shù)的頻數(shù)分布表;2、計算每一組的頻數(shù)f
;3、計算每一組上限的累計頻數(shù)Cf
;4、計算至每一組中點值的累計頻數(shù)Cf中點;5、將Cf
中點欄內(nèi)的各數(shù)據(jù)除以考生總數(shù)N,得出C
u
m中點欄內(nèi)的各數(shù)據(jù);6、將C
u
m中點欄內(nèi)的各數(shù)據(jù)看成是正態(tài)分布時的概率,反查正態(tài)分布表,由各概率求出相應(yīng)的標(biāo)準(zhǔn)分Z’值,Z’值即為正態(tài)化后的標(biāo)準(zhǔn)分。將表3-4中的考試分?jǐn)?shù)正態(tài)化后得表3-6表3-6非正態(tài)化轉(zhuǎn)換為正態(tài)化表原始分組距組中點X’標(biāo)準(zhǔn)分Z頻數(shù)f上限累計頻數(shù)CfCf中點Cum中點正態(tài)化后標(biāo)準(zhǔn)分Z‘41—4543-2.41110.50.004-3.3546—5048-2.060110.009-2.3751—5553-1.7121.50.013-2.2356—6058-1.34132.50.022-2.0161—6563-0.9913169.50.085-1.3766—7068-0.631026210.188-0.8971—7573-0.271642340.304-0.5176—80780.09276955.50.496-0.0181—85830.442089790.7050.5486—90880.818107980.8751.1591—95931.165112109.50.9782.0非正態(tài)化轉(zhuǎn)換為正態(tài)化圖表分別用頻數(shù)f對非正態(tài)標(biāo)準(zhǔn)分Z、正態(tài)化標(biāo)準(zhǔn)分Z’作直方圖3-12圖3-12非正態(tài)分布轉(zhuǎn)換為正態(tài)分布圖二、常模參考分?jǐn)?shù)
常模參考分?jǐn)?shù)是以常模為標(biāo)準(zhǔn)的導(dǎo)出分?jǐn)?shù),由原始分轉(zhuǎn)換而來。常見的有標(biāo)準(zhǔn)分Z、百分等級分T等。它的主要功能是確定和比較考生個體在群體中的相對位置。常模是考生群體在考試中的總的水平,如平均分和標(biāo)準(zhǔn)差。常模參考分就是以常模作為標(biāo)準(zhǔn)參照點,在個體或部分之間進(jìn)行比較的指標(biāo)。如全國英語四級統(tǒng)考,以平均通過率作為常模來比較各高校英語的教學(xué)水平。應(yīng)當(dāng)注意的是:當(dāng)各科考試成績合成為總分時,一般需要加權(quán),但僅對原始分?jǐn)?shù)加權(quán)有時起不到應(yīng)有的作用。比如,數(shù)學(xué)是一門重要的基礎(chǔ)學(xué)科,在高考中應(yīng)有比較大的權(quán)重。但是,1984年高考數(shù)學(xué)試題過于靈活,結(jié)果分?jǐn)?shù)普遍比較低,大部分考生的數(shù)學(xué)成績在總成績中只占很小的比例,這就失去了加權(quán)的意義。
如果將原始分?jǐn)?shù)轉(zhuǎn)化為標(biāo)準(zhǔn)分,再進(jìn)行加權(quán)合成就合理了。具體的步驟是:1、計算出各門課程的標(biāo)準(zhǔn)分;2、確定各門課程的權(quán)重系數(shù);3、將各門課程標(biāo)準(zhǔn)分乘以相應(yīng)權(quán)重系數(shù)后再相加,得標(biāo)準(zhǔn)總分。標(biāo)準(zhǔn)分是最常用的一種常模參考分?jǐn)?shù)。三、標(biāo)準(zhǔn)參考分?jǐn)?shù)標(biāo)準(zhǔn)參考分?jǐn)?shù)是將個體的分?jǐn)?shù)與某一特定的標(biāo)準(zhǔn)相比較而得到的一個指標(biāo),它表示個人能做什么,達(dá)到什么水準(zhǔn)。當(dāng)用某一范圍內(nèi)的技能掌握程度作為標(biāo)準(zhǔn)時,個人分?jǐn)?shù)轉(zhuǎn)換后叫做內(nèi)容參考分?jǐn)?shù),如單元測驗、期終考試,其目的不在于比較學(xué)生個體在群體中的相對位置,而是檢查學(xué)生對本單元、本課程的教學(xué)內(nèi)容掌握得如何。常用正確百分率來衡量:正確百分率=答對題目數(shù)/題目總數(shù)內(nèi)容參考分?jǐn)?shù)與常模參考分?jǐn)?shù)是不同的,前者描述了一個人掌握了什么,而后者則表示了一個人在群體中的相對位置。注意:兩者并不排斥。內(nèi)容參考分?jǐn)?shù)既描述了一個人掌握了什么,也可以描述相對位置;常模參考分?jǐn)?shù)有時也能描述一個人掌握了什么。SOMUCHTODAY,THANKS第四章試題的分析與評價§4-1對試題進(jìn)行分析與評價的必要性§4-2試題的難度一、平均得分率
二、難度系數(shù)三、極端平均得分率及極端難度系數(shù)四、難度指數(shù)
五、對試題難度的要求§4-3試題的區(qū)分度一、試題區(qū)分度的概念
二、項目效度分析三、內(nèi)部一致性分析
四、對區(qū)分度偏低試題的分析與處理§4-4目標(biāo)參照考試的試題分析一、教學(xué)敏感系數(shù)S
二、識別度B§4-1對試題進(jìn)行分析與評價的必要性
首先,試題是組織試卷的基本單元,只有試題的質(zhì)量高,才可能有高質(zhì)量的試卷,考試的質(zhì)量才有可能高,也就是說,高質(zhì)量的試題是產(chǎn)生高質(zhì)量的試卷和實現(xiàn)高質(zhì)量考試的前提;其次,整體優(yōu)化也是高質(zhì)量試卷的一個必要條件。第二章已述及,一份高質(zhì)量的試題,應(yīng)當(dāng)符合命題的基本要求及各種類型試題的具體要求、符合教學(xué)大綱的要求。除此而外,還應(yīng)滿足下面兩項要求:1、難度:應(yīng)當(dāng)有一定難度,以便測量出學(xué)生實現(xiàn)教學(xué)目標(biāo)、掌握所學(xué)知識和能力的程度與水平。2、區(qū)分度:應(yīng)能區(qū)別出學(xué)習(xí)情況不同的學(xué)生,亦即能測量出每個學(xué)生個體學(xué)習(xí)情況的差異。就是說,一份好的試題,應(yīng)具有兩個共同的特性,就是具有合適的難度和較高的區(qū)分度。分析和評價試題的難度和區(qū)分度是本章的主要內(nèi)容§4-2試題的難度
試題的難度(Difficut)是指試題的難易程度。試題的難度可以用平均得分率(或通過率)、難度系數(shù)、極端平均得分率、難度指數(shù)等技術(shù)指標(biāo)來衡量。一、平均得分率(通過率)P
平均得分率可定義為:P=R/N(4-1)
或P=n/n0(4-2)式中,N為學(xué)生總數(shù);R答對該試題的學(xué)生數(shù);n0為該試題的滿分;n為該群體所有學(xué)生在該試題所得到的平均分?jǐn)?shù)??陀^題宜用(4-1)式;主觀題宜用(4-2)。事實上,式(4-2)具有更普遍的意義,應(yīng)用兩式計算的結(jié)果相同。二、難度系數(shù)q
平均得分率(或通過率)p可以衡量試題的難度。但是,不難看出,p與試題難度之間具有反變的關(guān)系,p值越小,試題難度越大,反之亦然。因此認(rèn)為,p值表示難度不夠直觀。難度系數(shù)q為一個試題可能達(dá)到的最大平均得分率(或通過率)pm與實際平均得分率(或通過率)p之差:
q=pm–p(4-3)顯然,此時pm=1,因此q=1-p(4-4)三、極端平均得分率(通過率)P及極端難度系數(shù)Q
平均得分率(通過率)P與難度系數(shù)都是對學(xué)生群體總體為對象
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年新版中國沖擊夯項目可行性研究報告
- 2024-2030年塑料清潔袋公司技術(shù)改造及擴(kuò)產(chǎn)項目可行性研究報告
- 2024-2030年北京古玩行業(yè)競爭格局及投資經(jīng)營狀況分析報告
- 2024-2030年全球口罩行業(yè)需求前景及未來發(fā)展規(guī)模預(yù)測報告
- 2024年房屋買賣合同法律效力
- 2024-2030年全球及中國老花眼處方鏡片行業(yè)現(xiàn)狀動態(tài)及投資效益預(yù)測報告
- 2024-2030年全球及中國消防靴行業(yè)銷售動態(tài)及盈利前景預(yù)測報告
- 2024年房地產(chǎn)開發(fā)商貸款協(xié)議
- 2024-2030年全球及中國太陽能紙行業(yè)發(fā)展前景及投資趨勢預(yù)測報告
- 2024年建筑工程項目施工安全協(xié)議書范本
- 《全國技工院校專業(yè)目錄(2022年修訂)》專業(yè)主要信息
- EM277的DP通訊使用詳解
- 醫(yī)學(xué)考博閱讀強(qiáng)化3附答案
- 耐壓絕緣測試報告
- 野獸派 beast 花店 調(diào)研 設(shè)計-文檔資料
- 水泵房每日巡視檢查表
- 杭州市區(qū)汽車客運站臨時加班管理規(guī)定
- 墊片沖壓模具設(shè)計畢業(yè)設(shè)計論文
- 冷庫工程特點施工難點分析及對策
- Python-Django開發(fā)實戰(zhàn)
- 小學(xué)道法小學(xué)道法1我們的好朋友--第一課時ppt課件
評論
0/150
提交評論