版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第十一章教育測量法第十一章教育測量法1優(yōu)選第十一章教育測量法優(yōu)選第十一章教育測量法2一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程,以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予3教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象,根據(jù)一定法則進行考核,并將考核結(jié)果用數(shù)量描述。包括對學(xué)生德、智、體各方面的測量(狹義),也包括對教師的教育教學(xué)效果、學(xué)校辦學(xué)水平、學(xué)校辦學(xué)效益等方面的測量。教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象,根據(jù)一定法則進行考4
通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。1、2、3、4、5這些數(shù)字本身是沒有數(shù)量或質(zhì)量意義的,只是個符號。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;2代表“及格”;3代表“中等”;4代表“良好”;5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。1、2、5測量的要素(1)測量客體。指測量的對象。測量的客體可以是人,也可以是教育研究中的事物或現(xiàn)象。(2)測量內(nèi)容。指測量客體的屬性和特征。測量內(nèi)容可以是外顯的,如學(xué)生的性別、年齡、身高、體重等,也可以是內(nèi)隱的,如學(xué)習(xí)興趣、動機、態(tài)度、價值觀等。(3)測量規(guī)則。指測量的法則或方法。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。(4)測量工具。指測量的指標(biāo)體系。沒有工具,測量難以進行。測量的要素6二、教育測量法的特點(一)教育測量一般是間接測量測量心理屬性,需要具體行為操作指標(biāo);(二)教育測量的結(jié)果是相對的學(xué)生不斷成長變化;測量對象不同、測量工具不同,無法比(三)教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)二、教育測量法的特點(一)教育測量一般是間接測量7數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。難度是指測驗項目的難易程度,試題的難度可以用試題的通過率來表示。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;有順序的測量,在量表中表現(xiàn)為數(shù)量上的等距變化系統(tǒng)誤差由于某種因素的影響,使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。常模有地區(qū)性常模和全國性常模,地區(qū)性常模只適用于特定的區(qū)域,如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū),而全國性常模適用于全國所有的同類個體。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。(二)順序量表(等級量表)如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。(一)編制試題的一般原則信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。正確回答的人數(shù)在全體受測者中所占的比例。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。三、教育測量的要求(一)數(shù)量化把事物或人的屬性加以數(shù)量化,用可以比較的數(shù)值計量學(xué)習(xí)的成果。學(xué)生成績?yōu)?分,不代表其沒有能力,因而要結(jié)合質(zhì)與量。(二)合理處理數(shù)據(jù)在運用測量數(shù)據(jù)時,最基本的要求是單位一致,這樣才能排列順序或等級,進行比較,也便于分析數(shù)據(jù)間的差異。(三)注意誤差的影響隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;系統(tǒng)誤差由于某種因素的影響,使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。三、教育測量的要求(一)數(shù)量化8系統(tǒng)誤差由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。例如,各種刻度尺的熱脹冷縮,溫度計、表盤的刻度不準(zhǔn)確等都會造成誤差。由于實驗本身所依據(jù)的理論、公式的近似性,或者對實驗條件、測量方法的考慮不周也會造成誤差。例如,熱學(xué)實驗中常常沒有考慮散熱的影響,用伏安法測電阻時沒有考慮電表內(nèi)阻的影響等。由于測量者的生理特點,例如反應(yīng)速度,分辨能力,甚至固有習(xí)慣等也會在測量中造成誤差。以上都是造成系統(tǒng)誤差的原因。系統(tǒng)誤差的特點是測量結(jié)果向一個方向偏離,其數(shù)值按一定規(guī)律變化。我們應(yīng)根據(jù)具體的實驗條件,系統(tǒng)誤差的特點,找出產(chǎn)生系統(tǒng)誤差的主要原因,采取適當(dāng)措施降低它的影響。系統(tǒng)誤差9隨機誤差在相同條件下,對同一物理量進行多次測量,由于各種偶然因素,會出現(xiàn)測量值時而偏大,時而偏小的誤差現(xiàn)象,這種類型的誤差叫做偶然誤差。產(chǎn)生偶然誤差的原因很多,例如讀數(shù)時,視線的位置不正確,測量點的位置不準(zhǔn)確,實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化,等等,這些因素的影響一般是微小的,而且難以確定某個因素產(chǎn)生的具體影響的大小,因此偶然誤差難以找出原因加以排除。實驗結(jié)果還表明,在確定的測量條件下,對同一物理量進行多次測量,并且用它的算術(shù)平均值作為該物理量的測量結(jié)果,能夠比較好地減少偶然誤差。隨機誤差在相同條件下,對同一物理量進行多次測量,由于各種偶然10測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較多,其中比較著名的有斯坦?!燃{智力測驗、韋克斯勒兒童智力測驗量表(WISCCR)、瑞文推理測驗等。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。據(jù)此,度量乙的信度要比度量甲的信度高。問渠那得清如許,_____。(二)檢驗教育或教學(xué)目標(biāo)貫徹的情況規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測;把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得由于測題記分的方法不同,所以難度的估計方法也不同。另一種是相對參照點,即以人為確定的零點為測量的起點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;零點是指測量的起點或參照點。相對誤差(乙)=1/185×100%=0.四、教育測量的作用(一)考試和選拔學(xué)生(二)檢驗教育或教學(xué)目標(biāo)貫徹的情況(三)診斷學(xué)習(xí)困難,解釋成績不良的原因(四)激勵動機的作用(五)升級、編班與分組(六)改進課程內(nèi)容與教學(xué)方法(七)提供咨詢與個別指導(dǎo)測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較11第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具,測量的工具應(yīng)具有單位和參照點,并且有表示量數(shù)的方法,我們把這種工具稱之為量表。如,尺是度量長度的量表,血壓計是測量血壓高低的量表,智力測驗是測量智商高低的量表。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具,測量的工具12參照點指的是在測量工作中必須具有一個量的起點,這個起點就叫作測量的參照點。這是任何測量都必須具備的兩個要素之一,測量所必須具備的要素包括參照點和單位。參照點有兩種一種是絕對參照點,即以絕對的零點作為測量的起點。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。另一種是相對參照點,即以人為確定的零點為測量的起點。如地勢高度的測量,就是以海平面為測量的起點。最理想的參照點是絕對參照點。參照點指的是在測量工作中必須具有一個量的起點,這個起點就叫作13測量的單位不同測量的單位是不同的。理想的測量單位應(yīng)當(dāng)具備兩個條件一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;二是要有相等的價值,即單位與單位之間的距離是相等的。但是教育與心理測量中的單位往往很難達到這個要求,它遠不如其他測量中使用的單位成熟和完善。測量的單位14量表的數(shù)據(jù)類型稱名數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)點記數(shù)據(jù)度量數(shù)據(jù)量表的數(shù)據(jù)類型點記數(shù)據(jù)度量數(shù)據(jù)15建立常模、確定指導(dǎo)語、時限和施測條件;是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實際測量出其所要測量特性的程度。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;改進方法提高出題質(zhì)量,對錯答題目扣分。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。在使用相關(guān)系數(shù)表示信度的高低時,相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。(二)教育測量的結(jié)果是相對的個別測量的可靠性比較高,主試能有效地觀察控制被試的行為反應(yīng),但個別測量費時費力,短時間內(nèi)難以獲得大量的資料,并且對主試的要求較高。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;產(chǎn)生偶然誤差的原因很多,例如讀數(shù)時,視線的位置不正確,測量點的位置不準(zhǔn)確,實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化,等等,這些因素的影響一般是微小的,而且難以確定某個因素產(chǎn)生的具體影響的大小,因此偶然誤差難以找出原因加以排除。竹外桃花三兩枝,_____。(三)教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量,通常由教師或研究人員自編的、為臨時測量所用的簡單測量。(一)編制試題的一般原則一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;(一)稱名量表(類別量表)是根據(jù)事物的某一特點,對事物屬性進行分類,用名稱或數(shù)字來代表事物或性質(zhì),是給事物進行簡單歸類的一種量表形式。如男生為1,女生為2喜歡語文的學(xué)生為1,喜歡數(shù)學(xué)的學(xué)生為2稱名量表測量的結(jié)果不能運算,但可以做統(tǒng)計分析(如計算百分比、列聯(lián)相關(guān)、卡方檢驗)建立常模、確定指導(dǎo)語、時限和施測條件;(一)稱名量表(類別量16指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一個被試)。試題難度要有一定的分布范圍是具有相等的單位,但沒有絕對零點的量表。測量對象不同、測量工具不同,無法比英語的臥房是"Sleeproom"常模參照測驗要有常模對照表。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。是具有相等的單位,但沒有絕對零點的量表。標(biāo)準(zhǔn)客觀測驗的各種試題形式由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。指的是在測量工作中必須具有一個量的起點,這個起點就叫作測量的參照點。在計算客觀題的難度時,它就是受測者在回答該題目時含有絕對或真正的零點和統(tǒng)一的單位。有些零點具有實際意義,稱絕對零點。有些零點是人定的,稱相對零點,如攝氏零度,這里零度并不意味著沒有一點溫度,而是以人定的冰點為參照標(biāo)準(zhǔn)。一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。(二)順序量表(等級量表)只有等級順序而無等距的單位和絕對零點,只是按研究對象的某一種屬性的順序排列出等第次序。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。又如,對于生活水平,我們可以給出四個等級貧困、溫飽、小康、富裕。指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一17(三)等距量表(間距量表)是具有相等的單位,但沒有絕對零點的量表。等距量表的數(shù)量單位之間的間距是相等的,可以相加減。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。三個兒童在智商測驗中分別得分105、110、115,在智商測驗分?jǐn)?shù)體系中,分?jǐn)?shù)差距是相等的。等距量表在學(xué)校教育系統(tǒng)運用廣泛,一般將百分制評分看作等距量表。(三)等距量表(間距量表)18(四)比率量表(等比量表)除了具有類別、順序、等距量表的特征外,還有一個具有實際意義的絕對零點。可以加減乘除。零點是指測量的起點或參照點。有些零點是人定的,稱相對零點,如攝氏零度,這里零度并不意味著沒有一點溫度,而是以人定的冰點為參照標(biāo)準(zhǔn)。像學(xué)生的考試成績、智商的0分都是相對零點。有些零點具有實際意義,稱絕對零點。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。(四)比率量表(等比量表)19量表條件例子稱名量表無順序的測量,只是指出有兩個或多個范疇。中學(xué)的類型:公立、私立、職業(yè)、普通等。順序量表是有順序有測量,在于指出所測量的范疇的不同并能夠按一定的順序排列。字母的排列系統(tǒng)、學(xué)習(xí)態(tài)度。等距量表有順序的測量,在量表中表現(xiàn)為數(shù)量上的等距變化數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。比率量表含有絕對或真正的零點和統(tǒng)一的單位。高度、體重上述四種量表的比較:量表條件例子稱名量表無順序的測量,只是指出有兩個或多個范疇。20衡量教育測量的質(zhì)量,可采用四個指標(biāo)信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度二、測量的條件衡量教育測量的質(zhì)量,可采用四個指標(biāo)二、測量的條件21一、信度信度(reliability)指的是測量結(jié)果的穩(wěn)定性和可靠的程度,亦即測量的結(jié)果是否真實、客觀地反映了受測者的實際水平。具體而言,可以從以下三方面來理解測量的信度1.信度指實測值和真值相差的程度2.信度指統(tǒng)計量與參數(shù)之間的接近程度3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度一、信度信度(reliability)指的是測量結(jié)果的穩(wěn)定性221.信度指實測值和真值相差的程度x=T+E(公式11)x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。E=xT(公式12)1.信度指實測值和真值相差的程度x=T+E(公式11)23試比較以下兩次測量結(jié)果(只進行一次)的信度用尺子量100cm高的一個兒童,得到1cm的絕對誤差;量185cm高的一位運動員,也得得到1cm的絕對誤差。要比較兩種測量結(jié)果的信度,一定要看誤差分?jǐn)?shù)(E)對于真分?jǐn)?shù)(T)所占的百分?jǐn)?shù)是多少。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)(x)的相對誤差。其計算式如下相對誤差=E/T×100%公式(13)把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得相對誤差(甲)=1/100×100%=1%相對誤差(乙)=1/185×100%=0.54%據(jù)此,度量乙的信度要比度量甲的信度高。試比較以下兩次測量結(jié)果(只進行一次)的信度24(三)等距量表(間距量表)信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。溫度、各種能力分?jǐn)?shù)、智商;常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。試題內(nèi)容廣泛,評分客觀,提供選擇的答案多,可以減少猜中題目的機會。常模參照測驗要有常模對照表。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。在計算客觀題的難度時,它就是受測者在回答該題目時測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征,較為著名的有明尼蘇達多相個性測驗(MMPI)、艾森克人格問卷(EPQR)、卡特爾16項人格因素測驗(16PF)等。據(jù)此,度量乙的信度要比度量甲的信度高。區(qū)分度是指一個題目區(qū)分所有受試者的能力。正確回答的人數(shù)在全體受測者中所占的比例。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一個被試)。把事物或人的屬性加以數(shù)量化,用可以比較的數(shù)值計量學(xué)習(xí)的成果。(四)比率量表(等比量表)團體測量節(jié)省人力與時間,在短時間內(nèi)能收集到大量的資料,效率較高,但被試的反應(yīng)不容易控制,并且測量效果不及個別測量可靠。統(tǒng)計量是指樣本上的各種數(shù)字特征。(如樣本平均數(shù)、標(biāo)準(zhǔn)差等);參數(shù)是總體上的各種數(shù)字特征(如總體平均數(shù)、標(biāo)準(zhǔn)差等)。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。而要知道統(tǒng)計量與參數(shù)的接近程度,可以對參數(shù)進行區(qū)間估計。2.信度指統(tǒng)計量與參數(shù)之間的接近程度(三)等距量表(間距量表)統(tǒng)計量是指樣本上的各種數(shù)字特征。(253.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計事物或現(xiàn)象間數(shù)量變動的一致性,主要采用相關(guān)分析的方法,即計算出兩種變量的相關(guān)系數(shù)(rxy)。在使用相關(guān)系數(shù)表示信度的高低時,相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計26提高測量信度的方法1.測題要有一定數(shù)量
延長測驗的長度,既可排除試題抽樣的偶然性因素,也有可能擴大得分的范圍,因而使信度系數(shù)增大,測驗信度提高。2.測題難度適中3.測題內(nèi)容要有同質(zhì)性,不要包含過多性質(zhì)不同的內(nèi)容4.測驗時間要充分5.評分要客觀提高測量信度的方法1.測題要有一定數(shù)量27是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實際測量出其所要測量特性的程度。
含義二、效度是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實28提高效度的注意事項(1)要控制系數(shù)誤差,即控制測驗過程的誤差;(2)精心編制測題,分析教學(xué)目標(biāo),編制雙向細目表,測題表述簡明易懂,測量有必要的覆蓋面。(3)妥善組織測驗。提高效度的注意事項(1)要控制系數(shù)誤差,即控制測驗過程的誤差29
難度是指題目的難易程度。表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。
試題卷面的難度值范圍是0.4~0.7由于測題記分的方法不同,所以難度的估計方法也不同。三、難度
難度是指題目的難易程度。表示題目難易程度的數(shù)量,稱為題301.在計算客觀題的難度時,它就是受測者在回答該題目時正確回答的人數(shù)在全體受測者中所占的比例。2.當(dāng)題目的分?jǐn)?shù)為多值時(包括主觀題或一些分步解答的題目),難度就是全體平均分與題目滿分的比例。難度是指測驗項目的難易程度,試題的難度可以用試題的通過率來表示。1.在計算客觀題的難度時,它就是受測者在回答該題目時難度是31第十一章教育測量法培訓(xùn)課件32第十一章教育測量法培訓(xùn)課件33區(qū)分度是指一個題目區(qū)分所有受試者的能力。(題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。它反映了一個題目的鑒別能力。因此區(qū)分度又稱題目的鑒別度。)四、區(qū)分度
區(qū)分度是指一個題目區(qū)分所有受試者的能力。(題目的區(qū)分度是衡量34D越高則質(zhì)量越好。0.2以下應(yīng)淘汰第十一章教育測量法培訓(xùn)課件35練習(xí)A.稱名數(shù)據(jù)B.順序數(shù)據(jù)C.等距數(shù)據(jù)D.等比數(shù)據(jù)性別、顏色分類、人口數(shù)、學(xué)校數(shù);身高、體重;溫度、各種能力分?jǐn)?shù)、智商;學(xué)生等級評定、喜愛程度、品質(zhì)等級、能力等級、興趣等。練習(xí)36第十一章教育測量法培訓(xùn)課件37第三節(jié)教育測量的類型與方法(一)根據(jù)測量的標(biāo)準(zhǔn)化程度分類標(biāo)準(zhǔn)化測量、非標(biāo)準(zhǔn)化測量1.標(biāo)準(zhǔn)化測量由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。編制和施測有一套標(biāo)準(zhǔn)程序。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測;根據(jù)數(shù)量化指標(biāo)篩選測驗題目;鑒定整個測驗的信度和效度;建立常模、確定指導(dǎo)語、時限和施測條件;規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。第三節(jié)教育測量的類型與方法(一)根據(jù)測量的標(biāo)準(zhǔn)化程度分類382.非標(biāo)準(zhǔn)化測量(教師自編測量)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量,通常由教師或研究人員自編的、為臨時測量所用的簡單測量。如課堂測驗、考試、等級評定量表等。這些測量是教師根據(jù)教學(xué)目標(biāo)和自己的教學(xué)經(jīng)驗編制而成,它通常與日常教學(xué)工作緊密聯(lián)系;測驗內(nèi)容與教材內(nèi)容、教學(xué)進度一致;難易程度由教師把握;針對性較強。編制省時、省力、靈活、方便。不足之處在于測驗的客觀性和標(biāo)準(zhǔn)化程度不如標(biāo)準(zhǔn)化測驗,測驗的實施和記分也不甚嚴(yán)格。2.非標(biāo)準(zhǔn)化測量(教師自編測量)39(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。1.學(xué)業(yè)成就測驗測被試經(jīng)某種形式的學(xué)習(xí)或訓(xùn)練后對知識、技能的掌握程度或熟練水平。如識字量、閱讀、算術(shù)測驗等,成就測驗可以是學(xué)科成就測驗或綜合成就測驗。2.智力測驗測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較多,其中比較著名的有斯坦福——比納智力測驗、韋克斯勒兒童智力測驗量表(WISCCR)、瑞文推理測驗等。(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗403.能力傾向測驗測被試潛在的某種能力,以了解其發(fā)展的可能性,預(yù)測個人能力發(fā)展傾向。如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。4.人格測驗測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征,較為著名的有明尼蘇達多相個性測驗(MMPI)、艾森克人格問卷(EPQR)、卡特爾16項人格因素測驗(16PF)等。3.能力傾向測驗41(三)根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。1.常模參照測驗常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。常模參照測驗要有常模對照表。常模有地區(qū)性常模和全國性常模,地區(qū)性常模只適用于特定的區(qū)域,如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū),而全國性常模適用于全國所有的同類個體。如,兒童的身高、體重就有全國性常模,中國兒童發(fā)展量表(36歲)就有全國性常模。只要我們將個體實際測量的數(shù)據(jù)與常模一對照,就可以知道個體所處的地位。(三)根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。42(一)編制試題的一般原則是有順序有測量,在于指出所測量的范疇的不同并能夠按一定的順序排列。測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程,以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。零點是指測量的起點或參照點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)(x)的相對誤差。由于測題記分的方法不同,所以難度的估計方法也不同。優(yōu)選第十一章教育測量法性別、顏色分類、人口數(shù)、學(xué)校數(shù);它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。(二)教育測量的結(jié)果是相對的5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。指一個主試能同時對許多被試進行的測量。如,尺是度量長度的量表,血壓計是測量血壓高低的量表,智力測驗是測量智商高低的量表。如,兒童的身高、體重就有全國性常模,中國兒童發(fā)展量表(36歲)就有全國性常模。在計算客觀題的難度時,它就是受測者在回答該題目時問渠那得清如許,_____。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。題目容易編寫,容易計分。學(xué)生成績?yōu)?分,不代表其沒有能力,因而要結(jié)合質(zhì)與量。問渠那得清如許,_____。(二)順序量表(等級量表)如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。如地勢高度的測量,就是以海平面為測量的起點。但是教育與心理測量中的單位往往很難達到這個要求,它遠不如其他測量中使用的單位成熟和完善。測量需要有測量的工具,測量的工具應(yīng)具有單位和參照點,并且有表示量數(shù)的方法,我們把這種工具稱之為量表。信度指統(tǒng)計量與參數(shù)之間的接近程度(三)診斷學(xué)習(xí)困難,解釋成績不良的原因通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。量185cm高的一位運動員,也得得到1cm的絕對誤差。主要對整個測量而言。(一)編制試題的一般原則指一個主試能同時對許多被試進行的測量432.目標(biāo)參照測驗又稱標(biāo)準(zhǔn)參照測驗,是衡量被試實際水平的測驗,將被試在測驗上的分?jǐn)?shù)與事先制定好的某種標(biāo)準(zhǔn)進行比較,看被試是否達到了目標(biāo)規(guī)定的要求。目標(biāo)參照測驗的特點是依據(jù)標(biāo)準(zhǔn),判斷被試的達標(biāo)程度,而不是將被試的成績與他人成績做比較。如,英語水平測試、畢業(yè)考試、動作技能測試、體育達標(biāo)測試等。2.目標(biāo)參照測驗44常模參照測驗要有常模對照表。通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。另一種是相對參照點,即以人為確定的零點為測量的起點。缺點容易造成死記硬背的現(xiàn)象,學(xué)習(xí)內(nèi)容容易混淆。常模有地區(qū)性常模和全國性常模,地區(qū)性常模只適用于特定的區(qū)域,如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū),而全國性常模適用于全國所有的同類個體。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。沒有工具,測量難以進行。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。學(xué)生成績?yōu)?分,不代表其沒有能力,因而要結(jié)合質(zhì)與量。系統(tǒng)誤差由于某種因素的影響,使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。正確回答的人數(shù)在全體受測者中所占的比例。區(qū)分度是指一個題目區(qū)分所有受試者的能力。測題內(nèi)容要有同質(zhì)性,不要包含過多性質(zhì)不同的內(nèi)容通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。問渠那得清如許,_____。理想的測量單位應(yīng)當(dāng)具備兩個條件測被試潛在的某種能力,以了解其發(fā)展的可能性,預(yù)測個人能力發(fā)展傾向。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。是根據(jù)事物的某一特點,對事物屬性進行分類,用名稱或數(shù)字來代表事物或性質(zhì),是給事物進行簡單歸類的一種量表形式。(四)根據(jù)同時受測的人數(shù)分類個別測量、團體測量1.個別測量指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一個被試)。個別測量的可靠性比較高,主試能有效地觀察控制被試的行為反應(yīng),但個別測量費時費力,短時間內(nèi)難以獲得大量的資料,并且對主試的要求較高。2.團體測量指一個主試能同時對許多被試進行的測量。團體測量節(jié)省人力與時間,在短時間內(nèi)能收集到大量的資料,效率較高,但被試的反應(yīng)不容易控制,并且測量效果不及個別測量可靠。常模參照測驗要有常模對照表。(四)根據(jù)同時受測的人數(shù)分類個別45二、教育測量的方法(一)編制試題的一般原則1.要有明確的測驗?zāi)康?.能反映學(xué)科的重點內(nèi)容3.試題取樣要有代表性4.試題難度要有一定的分布范圍5.試題的文字要適合學(xué)生閱讀能力,力求淺顯易懂二、教育測量的方法(一)編制試題的一般原則46(二)測量的編制方法1.標(biāo)準(zhǔn)客觀測驗的各種試題形式(1)填空題(2)是非題(3)選擇題(4)匹配題(5)簡答題(6)論述題(二)測量的編制方法1.標(biāo)準(zhǔn)客觀測驗的各種試題形式47(1)填空題問渠那得清如許,_____。竹外桃花三兩枝,_____。測驗學(xué)生完成句子的能力優(yōu)點試題容易編寫,避免亂猜;缺點容易造成死記硬背的現(xiàn)象,學(xué)習(xí)內(nèi)容容易混淆。(1)填空題問渠那得清如許,_____。48(2)是非題1.《背影》的作者是朱自清嗎?2.企鵝是在北極嗎?3.剛吃完飯能馬上運動嗎?4.口腔有消化作用嗎?5.英語的臥房是"Sleeproom"測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能力。題目容易編寫,容易計分。缺點容易猜題改進方法提高出題質(zhì)量,對錯答題目扣分。(2)是非題1.《背影》的作者是朱自清嗎?2.企鵝是49(3)選擇題測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能力。試題內(nèi)容廣泛,評分客觀,提供選擇的答案多,可以減少猜中題目的機會。缺點編寫試題時費時較多。(3)選擇題測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能50常模參照測驗要有常模對照表。測題內(nèi)容要有同質(zhì)性,不要包含過多性質(zhì)不同的內(nèi)容測量心理屬性,需要具體行為操作指標(biāo);二是要有相等的價值,即單位與單位之間的距離是相等的。信度指統(tǒng)計量與參數(shù)之間的接近程度通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。難度就是全體平均分與題目滿分的比例。英語的臥房是"Sleeproom"信度指統(tǒng)計量與參數(shù)之間的接近程度問渠那得清如許,_____。含有絕對或真正的零點和統(tǒng)一的單位。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。它反映了一個題目的鑒別能力。另一種是相對參照點,即以人為確定的零點為測量的起點。產(chǎn)生偶然誤差的原因很多,例如讀數(shù)時,視線的位置不正確,測量點的位置不準(zhǔn)確,實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化,等等,這些因素的影響一般是微小的,而且難以確定某個因素產(chǎn)生的具體影響的大小,因此偶然誤差難以找出原因加以排除。指一個主試能同時對許多被試進行的測量。溫度、各種能力分?jǐn)?shù)、智商;5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。如地勢高度的測量,就是以海平面為測量的起點。是有順序有測量,在于指出所測量的范疇的不同并能夠按一定的順序排列。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件(題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。編制和施測有一套標(biāo)準(zhǔn)程序。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;理想的測量單位應(yīng)當(dāng)具備兩個條件正確回答的人數(shù)在全體受測者中所占的比例。常模參照測驗要有常模對照表。測題內(nèi)容要有同質(zhì)性,不要包含過多性質(zhì)不同的內(nèi)容信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如地勢高度的測量,就是以海平面為測量的起點。(四)根據(jù)同時受測的人數(shù)分類個別測量、團體測量5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得據(jù)此,度量乙的信度要比度量甲的信度高。指測量客體的屬性和特征。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。
(4)匹配題測查學(xué)生對字詞、文法、日期、事件、地點、人物、公式、原則等關(guān)系的了解與聯(lián)結(jié)的能力。優(yōu)點測量學(xué)生簡易的聯(lián)結(jié)能力;缺點使用過多容易鼓勵學(xué)生死記硬背的材料,學(xué)生往往為了使材料相互匹配而重復(fù)閱讀,消耗時間精力。常模參照測驗要有常模對照表。如溫度攝氏30度至32度與攝氏151第十一章教育測量法第十一章教育測量法52優(yōu)選第十一章教育測量法優(yōu)選第十一章教育測量法53一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程,以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予54教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象,根據(jù)一定法則進行考核,并將考核結(jié)果用數(shù)量描述。包括對學(xué)生德、智、體各方面的測量(狹義),也包括對教師的教育教學(xué)效果、學(xué)校辦學(xué)水平、學(xué)校辦學(xué)效益等方面的測量。教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象,根據(jù)一定法則進行考55
通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。1、2、3、4、5這些數(shù)字本身是沒有數(shù)量或質(zhì)量意義的,只是個符號。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;2代表“及格”;3代表“中等”;4代表“良好”;5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。1、2、56測量的要素(1)測量客體。指測量的對象。測量的客體可以是人,也可以是教育研究中的事物或現(xiàn)象。(2)測量內(nèi)容。指測量客體的屬性和特征。測量內(nèi)容可以是外顯的,如學(xué)生的性別、年齡、身高、體重等,也可以是內(nèi)隱的,如學(xué)習(xí)興趣、動機、態(tài)度、價值觀等。(3)測量規(guī)則。指測量的法則或方法。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。(4)測量工具。指測量的指標(biāo)體系。沒有工具,測量難以進行。測量的要素57二、教育測量法的特點(一)教育測量一般是間接測量測量心理屬性,需要具體行為操作指標(biāo);(二)教育測量的結(jié)果是相對的學(xué)生不斷成長變化;測量對象不同、測量工具不同,無法比(三)教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)二、教育測量法的特點(一)教育測量一般是間接測量58數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。難度是指測驗項目的難易程度,試題的難度可以用試題的通過率來表示。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;有順序的測量,在量表中表現(xiàn)為數(shù)量上的等距變化系統(tǒng)誤差由于某種因素的影響,使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。常模有地區(qū)性常模和全國性常模,地區(qū)性常模只適用于特定的區(qū)域,如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū),而全國性常模適用于全國所有的同類個體。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。(二)順序量表(等級量表)如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。(一)編制試題的一般原則信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。正確回答的人數(shù)在全體受測者中所占的比例。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。三、教育測量的要求(一)數(shù)量化把事物或人的屬性加以數(shù)量化,用可以比較的數(shù)值計量學(xué)習(xí)的成果。學(xué)生成績?yōu)?分,不代表其沒有能力,因而要結(jié)合質(zhì)與量。(二)合理處理數(shù)據(jù)在運用測量數(shù)據(jù)時,最基本的要求是單位一致,這樣才能排列順序或等級,進行比較,也便于分析數(shù)據(jù)間的差異。(三)注意誤差的影響隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;系統(tǒng)誤差由于某種因素的影響,使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。三、教育測量的要求(一)數(shù)量化59系統(tǒng)誤差由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。例如,各種刻度尺的熱脹冷縮,溫度計、表盤的刻度不準(zhǔn)確等都會造成誤差。由于實驗本身所依據(jù)的理論、公式的近似性,或者對實驗條件、測量方法的考慮不周也會造成誤差。例如,熱學(xué)實驗中常常沒有考慮散熱的影響,用伏安法測電阻時沒有考慮電表內(nèi)阻的影響等。由于測量者的生理特點,例如反應(yīng)速度,分辨能力,甚至固有習(xí)慣等也會在測量中造成誤差。以上都是造成系統(tǒng)誤差的原因。系統(tǒng)誤差的特點是測量結(jié)果向一個方向偏離,其數(shù)值按一定規(guī)律變化。我們應(yīng)根據(jù)具體的實驗條件,系統(tǒng)誤差的特點,找出產(chǎn)生系統(tǒng)誤差的主要原因,采取適當(dāng)措施降低它的影響。系統(tǒng)誤差60隨機誤差在相同條件下,對同一物理量進行多次測量,由于各種偶然因素,會出現(xiàn)測量值時而偏大,時而偏小的誤差現(xiàn)象,這種類型的誤差叫做偶然誤差。產(chǎn)生偶然誤差的原因很多,例如讀數(shù)時,視線的位置不正確,測量點的位置不準(zhǔn)確,實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化,等等,這些因素的影響一般是微小的,而且難以確定某個因素產(chǎn)生的具體影響的大小,因此偶然誤差難以找出原因加以排除。實驗結(jié)果還表明,在確定的測量條件下,對同一物理量進行多次測量,并且用它的算術(shù)平均值作為該物理量的測量結(jié)果,能夠比較好地減少偶然誤差。隨機誤差在相同條件下,對同一物理量進行多次測量,由于各種偶然61測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較多,其中比較著名的有斯坦?!燃{智力測驗、韋克斯勒兒童智力測驗量表(WISCCR)、瑞文推理測驗等。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。據(jù)此,度量乙的信度要比度量甲的信度高。問渠那得清如許,_____。(二)檢驗教育或教學(xué)目標(biāo)貫徹的情況規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測;把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得由于測題記分的方法不同,所以難度的估計方法也不同。另一種是相對參照點,即以人為確定的零點為測量的起點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;零點是指測量的起點或參照點。相對誤差(乙)=1/185×100%=0.四、教育測量的作用(一)考試和選拔學(xué)生(二)檢驗教育或教學(xué)目標(biāo)貫徹的情況(三)診斷學(xué)習(xí)困難,解釋成績不良的原因(四)激勵動機的作用(五)升級、編班與分組(六)改進課程內(nèi)容與教學(xué)方法(七)提供咨詢與個別指導(dǎo)測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較62第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具,測量的工具應(yīng)具有單位和參照點,并且有表示量數(shù)的方法,我們把這種工具稱之為量表。如,尺是度量長度的量表,血壓計是測量血壓高低的量表,智力測驗是測量智商高低的量表。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具,測量的工具63參照點指的是在測量工作中必須具有一個量的起點,這個起點就叫作測量的參照點。這是任何測量都必須具備的兩個要素之一,測量所必須具備的要素包括參照點和單位。參照點有兩種一種是絕對參照點,即以絕對的零點作為測量的起點。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。另一種是相對參照點,即以人為確定的零點為測量的起點。如地勢高度的測量,就是以海平面為測量的起點。最理想的參照點是絕對參照點。參照點指的是在測量工作中必須具有一個量的起點,這個起點就叫作64測量的單位不同測量的單位是不同的。理想的測量單位應(yīng)當(dāng)具備兩個條件一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;二是要有相等的價值,即單位與單位之間的距離是相等的。但是教育與心理測量中的單位往往很難達到這個要求,它遠不如其他測量中使用的單位成熟和完善。測量的單位65量表的數(shù)據(jù)類型稱名數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)點記數(shù)據(jù)度量數(shù)據(jù)量表的數(shù)據(jù)類型點記數(shù)據(jù)度量數(shù)據(jù)66建立常模、確定指導(dǎo)語、時限和施測條件;是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實際測量出其所要測量特性的程度。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;改進方法提高出題質(zhì)量,對錯答題目扣分。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。在使用相關(guān)系數(shù)表示信度的高低時,相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。(二)教育測量的結(jié)果是相對的個別測量的可靠性比較高,主試能有效地觀察控制被試的行為反應(yīng),但個別測量費時費力,短時間內(nèi)難以獲得大量的資料,并且對主試的要求較高。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。隨機誤差由于難于控制的偶然因素,使測量結(jié)果不準(zhǔn)確;產(chǎn)生偶然誤差的原因很多,例如讀數(shù)時,視線的位置不正確,測量點的位置不準(zhǔn)確,實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化,等等,這些因素的影響一般是微小的,而且難以確定某個因素產(chǎn)生的具體影響的大小,因此偶然誤差難以找出原因加以排除。竹外桃花三兩枝,_____。(三)教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量,通常由教師或研究人員自編的、為臨時測量所用的簡單測量。(一)編制試題的一般原則一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;(一)稱名量表(類別量表)是根據(jù)事物的某一特點,對事物屬性進行分類,用名稱或數(shù)字來代表事物或性質(zhì),是給事物進行簡單歸類的一種量表形式。如男生為1,女生為2喜歡語文的學(xué)生為1,喜歡數(shù)學(xué)的學(xué)生為2稱名量表測量的結(jié)果不能運算,但可以做統(tǒng)計分析(如計算百分比、列聯(lián)相關(guān)、卡方檢驗)建立常模、確定指導(dǎo)語、時限和施測條件;(一)稱名量表(類別量67指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一個被試)。試題難度要有一定的分布范圍是具有相等的單位,但沒有絕對零點的量表。測量對象不同、測量工具不同,無法比英語的臥房是"Sleeproom"常模參照測驗要有常模對照表。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。是具有相等的單位,但沒有絕對零點的量表。標(biāo)準(zhǔn)客觀測驗的各種試題形式由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。指的是在測量工作中必須具有一個量的起點,這個起點就叫作測量的參照點。在計算客觀題的難度時,它就是受測者在回答該題目時含有絕對或真正的零點和統(tǒng)一的單位。有些零點具有實際意義,稱絕對零點。有些零點是人定的,稱相對零點,如攝氏零度,這里零度并不意味著沒有一點溫度,而是以人定的冰點為參照標(biāo)準(zhǔn)。一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。(二)順序量表(等級量表)只有等級順序而無等距的單位和絕對零點,只是按研究對象的某一種屬性的順序排列出等第次序。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。又如,對于生活水平,我們可以給出四個等級貧困、溫飽、小康、富裕。指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一68(三)等距量表(間距量表)是具有相等的單位,但沒有絕對零點的量表。等距量表的數(shù)量單位之間的間距是相等的,可以相加減。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。三個兒童在智商測驗中分別得分105、110、115,在智商測驗分?jǐn)?shù)體系中,分?jǐn)?shù)差距是相等的。等距量表在學(xué)校教育系統(tǒng)運用廣泛,一般將百分制評分看作等距量表。(三)等距量表(間距量表)69(四)比率量表(等比量表)除了具有類別、順序、等距量表的特征外,還有一個具有實際意義的絕對零點??梢约訙p乘除。零點是指測量的起點或參照點。有些零點是人定的,稱相對零點,如攝氏零度,這里零度并不意味著沒有一點溫度,而是以人定的冰點為參照標(biāo)準(zhǔn)。像學(xué)生的考試成績、智商的0分都是相對零點。有些零點具有實際意義,稱絕對零點。如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。(四)比率量表(等比量表)70量表條件例子稱名量表無順序的測量,只是指出有兩個或多個范疇。中學(xué)的類型:公立、私立、職業(yè)、普通等。順序量表是有順序有測量,在于指出所測量的范疇的不同并能夠按一定的順序排列。字母的排列系統(tǒng)、學(xué)習(xí)態(tài)度。等距量表有順序的測量,在量表中表現(xiàn)為數(shù)量上的等距變化數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。比率量表含有絕對或真正的零點和統(tǒng)一的單位。高度、體重上述四種量表的比較:量表條件例子稱名量表無順序的測量,只是指出有兩個或多個范疇。71衡量教育測量的質(zhì)量,可采用四個指標(biāo)信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度二、測量的條件衡量教育測量的質(zhì)量,可采用四個指標(biāo)二、測量的條件72一、信度信度(reliability)指的是測量結(jié)果的穩(wěn)定性和可靠的程度,亦即測量的結(jié)果是否真實、客觀地反映了受測者的實際水平。具體而言,可以從以下三方面來理解測量的信度1.信度指實測值和真值相差的程度2.信度指統(tǒng)計量與參數(shù)之間的接近程度3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度一、信度信度(reliability)指的是測量結(jié)果的穩(wěn)定性731.信度指實測值和真值相差的程度x=T+E(公式11)x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。E=xT(公式12)1.信度指實測值和真值相差的程度x=T+E(公式11)74試比較以下兩次測量結(jié)果(只進行一次)的信度用尺子量100cm高的一個兒童,得到1cm的絕對誤差;量185cm高的一位運動員,也得得到1cm的絕對誤差。要比較兩種測量結(jié)果的信度,一定要看誤差分?jǐn)?shù)(E)對于真分?jǐn)?shù)(T)所占的百分?jǐn)?shù)是多少。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)(x)的相對誤差。其計算式如下相對誤差=E/T×100%公式(13)把上述兩次測量(設(shè)為甲和乙)和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式,得相對誤差(甲)=1/100×100%=1%相對誤差(乙)=1/185×100%=0.54%據(jù)此,度量乙的信度要比度量甲的信度高。試比較以下兩次測量結(jié)果(只進行一次)的信度75(三)等距量表(間距量表)信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”;如年齡、身高、經(jīng)費開支等都有絕對零點,0歲、0米、0元中的“零”都表示真實的“無”,表示一點都沒有。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。溫度、各種能力分?jǐn)?shù)、智商;常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。試題內(nèi)容廣泛,評分客觀,提供選擇的答案多,可以減少猜中題目的機會。常模參照測驗要有常模對照表。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。在計算客觀題的難度時,它就是受測者在回答該題目時測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征,較為著名的有明尼蘇達多相個性測驗(MMPI)、艾森克人格問卷(EPQR)、卡特爾16項人格因素測驗(16PF)等。據(jù)此,度量乙的信度要比度量甲的信度高。區(qū)分度是指一個題目區(qū)分所有受試者的能力。正確回答的人數(shù)在全體受測者中所占的比例。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。指主試與被試一對一進行的測量(一個主試在同一時間內(nèi),只測驗一個被試)。把事物或人的屬性加以數(shù)量化,用可以比較的數(shù)值計量學(xué)習(xí)的成果。(四)比率量表(等比量表)團體測量節(jié)省人力與時間,在短時間內(nèi)能收集到大量的資料,效率較高,但被試的反應(yīng)不容易控制,并且測量效果不及個別測量可靠。統(tǒng)計量是指樣本上的各種數(shù)字特征。(如樣本平均數(shù)、標(biāo)準(zhǔn)差等);參數(shù)是總體上的各種數(shù)字特征(如總體平均數(shù)、標(biāo)準(zhǔn)差等)。在統(tǒng)計學(xué)中,統(tǒng)計量越接近參數(shù),這個統(tǒng)計量的可靠性越高。而要知道統(tǒng)計量與參數(shù)的接近程度,可以對參數(shù)進行區(qū)間估計。2.信度指統(tǒng)計量與參數(shù)之間的接近程度(三)等距量表(間距量表)統(tǒng)計量是指樣本上的各種數(shù)字特征。(763.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計事物或現(xiàn)象間數(shù)量變動的一致性,主要采用相關(guān)分析的方法,即計算出兩種變量的相關(guān)系數(shù)(rxy)。在使用相關(guān)系數(shù)表示信度的高低時,相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計77提高測量信度的方法1.測題要有一定數(shù)量
延長測驗的長度,既可排除試題抽樣的偶然性因素,也有可能擴大得分的范圍,因而使信度系數(shù)增大,測驗信度提高。2.測題難度適中3.測題內(nèi)容要有同質(zhì)性,不要包含過多性質(zhì)不同的內(nèi)容4.測驗時間要充分5.評分要客觀提高測量信度的方法1.測題要有一定數(shù)量78是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實際測量出其所要測量特性的程度。
含義二、效度是測驗的準(zhǔn)確性,是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度,即測驗實79提高效度的注意事項(1)要控制系數(shù)誤差,即控制測驗過程的誤差;(2)精心編制測題,分析教學(xué)目標(biāo),編制雙向細目表,測題表述簡明易懂,測量有必要的覆蓋面。(3)妥善組織測驗。提高效度的注意事項(1)要控制系數(shù)誤差,即控制測驗過程的誤差80
難度是指題目的難易程度。表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。
試題卷面的難度值范圍是0.4~0.7由于測題記分的方法不同,所以難度的估計方法也不同。三、難度
難度是指題目的難易程度。表示題目難易程度的數(shù)量,稱為題811.在計算客觀題的難度時,它就是受測者在回答該題目時正確回答的人數(shù)在全體受測者中所占的比例。2.當(dāng)題目的分?jǐn)?shù)為多值時(包括主觀題或一些分步解答的題目),難度就是全體平均分與題目滿分的比例。難度是指測驗項目的難易程度,試題的難度可以用試題的通過率來表示。1.在計算客觀題的難度時,它就是受測者在回答該題目時難度是82第十一章教育測量法培訓(xùn)課件83第十一章教育測量法培訓(xùn)課件84區(qū)分度是指一個題目區(qū)分所有受試者的能力。(題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。它反映了一個題目的鑒別能力。因此區(qū)分度又稱題目的鑒別度。)四、區(qū)分度
區(qū)分度是指一個題目區(qū)分所有受試者的能力。(題目的區(qū)分度是衡量85D越高則質(zhì)量越好。0.2以下應(yīng)淘汰第十一章教育測量法培訓(xùn)課件86練習(xí)A.稱名數(shù)據(jù)B.順序數(shù)據(jù)C.等距數(shù)據(jù)D.等比數(shù)據(jù)性別、顏色分類、人口數(shù)、學(xué)校數(shù);身高、體重;溫度、各種能力分?jǐn)?shù)、智商;學(xué)生等級評定、喜愛程度、品質(zhì)等級、能力等級、興趣等。練習(xí)87第十一章教育測量法培訓(xùn)課件88第三節(jié)教育測量的類型與方法(一)根據(jù)測量的標(biāo)準(zhǔn)化程度分類標(biāo)準(zhǔn)化測量、非標(biāo)準(zhǔn)化測量1.標(biāo)準(zhǔn)化測量由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。編制和施測有一套標(biāo)準(zhǔn)程序。測驗編制包括確定測驗?zāi)康摹⒖茖W(xué)命題、選取有代表性的樣本進行試測;根據(jù)數(shù)量化指標(biāo)篩選測驗題目;鑒定整個測驗的信度和效度;建立常模、確定指導(dǎo)語、時限和施測條件;規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣,一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。第三節(jié)教育測量的類型與方法(一)根據(jù)測量的標(biāo)準(zhǔn)化程度分類892.非標(biāo)準(zhǔn)化測量(教師自編測量)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量,通常由教師或研究人員自編的、為臨時測量所用的簡單測量。如課堂測驗、考試、等級評定量表等。這些測量是教師根據(jù)教學(xué)目標(biāo)和自己的教學(xué)經(jīng)驗編制而成,它通常與日常教學(xué)工作緊密聯(lián)系;測驗內(nèi)容與教材內(nèi)容、教學(xué)進度一致;難易程度由教師把握;針對性較強。編制省時、省力、靈活、方便。不足之處在于測驗的客觀性和標(biāo)準(zhǔn)化程度不如標(biāo)準(zhǔn)化測驗,測驗的實施和記分也不甚嚴(yán)格。2.非標(biāo)準(zhǔn)化測量(教師自編測量)90(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。1.學(xué)業(yè)成就測驗測被試經(jīng)某種形式的學(xué)習(xí)或訓(xùn)練后對知識、技能的掌握程度或熟練水平。如識字量、閱讀、算術(shù)測驗等,成就測驗可以是學(xué)科成就測驗或綜合成就測驗。2.智力測驗測被試的智力高低,其結(jié)果常以智商(IQ)來表示,此類測驗比較多,其中比較著名的有斯坦?!燃{智力測驗、韋克斯勒兒童智力測驗量表(WISCCR)、瑞文推理測驗等。(二)根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗913.能力傾向測驗測被試潛在的某種能力,以了解其發(fā)展的可能性,預(yù)測個人能力發(fā)展傾向。如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。4.人格測驗測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征,較為著名的有明尼蘇達多相個性測驗(MMPI)、艾森克人格問卷(EPQR)、卡特爾16項人格因素測驗(16PF)等。3.能力傾向測驗92(三)根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。1.常模參照測驗常模參照測驗是一種衡量被試相對水平的測驗,是將被試的測驗成績與同類對象在同一測驗上的平均分(常模)相比較,從而解釋分?jǐn)?shù),確定被試在總體中的相對位置的測驗方法。常模參照測驗要有常模對照表。常模有地區(qū)性常模和全國性常模,地區(qū)性常模只適用于特定的區(qū)域,如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū),而全國性常模適用于全國所有的同類個體。如,兒童的身高、體重就有全國性常模,中國兒童發(fā)展量表(36歲)就有全國性常模。只要我們將個體實際測量的數(shù)據(jù)與常模一對照,就可以知道個體所處的地位。(三)根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。93(一)編制試題的一般原則是有順序有測量,在于指出所測量的范疇的不同并能夠按一定的順序排列。測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程,以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。零點是指測量的起點或參照點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)(x)的相對誤差。由于測題記分的方法不同,所以難度的估計方法也不同。優(yōu)選第十一章教育測量法性別、顏色分類、人口數(shù)、學(xué)校數(shù);它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù),是測量結(jié)果的一致性的指標(biāo)。表示題目難易程度的數(shù)量,稱為題目的難度指數(shù),一般用P來表示。一個是要有確定的意義,即對同一單位來說所有人的理解是相同的;規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。x表示實測值,T表示真值(是未知的,可以把多次測量的實測值的平均值作為真值的近似值),E表示誤差。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的,都是相差2度。(二)教育測量的結(jié)果是相對的5代表“優(yōu)秀”,這時1、2、3、4、5才具有實際意義,數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。指一個主試能同時對許多被試進行的測量。如,尺是度量長度的量表,血壓計是測量血壓高低的量表,智力測驗是測量智商高低的量表。如,兒童的身高、體重就有全國性常模,中國兒童發(fā)展量表(36歲)就有全國性常模。在計算客觀題的難度時,它就是受測者在回答該題目時問渠那得清如許,_____。由專家學(xué)者或?qū)iT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的,并對測驗誤差做了嚴(yán)格控制。題目容易編寫,容易計分。學(xué)生成績?yōu)?分,不代表其沒有能力,因而要結(jié)合質(zhì)與量。問渠那得清如許,_____。(二)順序量表(等級量表)如根據(jù)學(xué)生的測驗成績排出名次,成績最好的為1,成績次之為2,再次之為3,依次類推。也就是說,要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則,按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。如地勢高度的測量,就是以海平面為測量的起點。但是教育與心理測量中的單位往往很難達到這個要求,它遠不如其他測量中使用的單位成熟和完善。測量需要有測量的工具,測量的工具應(yīng)具有單位和參照點,并且有表示量數(shù)的方法,我們把這種工具稱之為量表。信度指統(tǒng)計量與參數(shù)之間的接近程度(三)診斷學(xué)習(xí)困難,解釋成績不良的原因通俗地說,就是根據(jù)一定的規(guī)則,給事物分派數(shù)字。量185cm高的一位運動員,也得得到1cm的絕對誤差。主要對整個測量而言。(一)編制試題的一般原則指一個主試能同時對許多被試進行的測量942.目標(biāo)參照測驗又稱標(biāo)準(zhǔn)參照測驗,是衡量被試實際水平的測驗,將被試在測驗上的分?jǐn)?shù)與事先制定好的某種標(biāo)準(zhǔn)進行比較,看
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版食品包裝模具設(shè)計與制造服務(wù)合同4篇
- 2025年高溫殺菌機項目可行性研究報告
- 2025年度綠色節(jié)能車棚工程承包施工協(xié)議范本合同4篇
- 2025年中國支線航空行業(yè)發(fā)展運行現(xiàn)狀及投資潛力預(yù)測報告
- 桶裝水供應(yīng)與購買的2025年度合同4篇
- 2025年中國靜電吸盤行業(yè)發(fā)展前景預(yù)測及投資戰(zhàn)略咨詢報告
- 2025年招貼海報項目投資可行性研究分析報告
- 2025版人防宣傳教育活動承包合同范本2篇
- 2025年度外墻保溫工程安全教育培訓(xùn)與考核合同
- 2025年針織混紡紗項目可行性研究報告
- 道路瀝青工程施工方案
- 《田口方法的導(dǎo)入》課件
- 內(nèi)陸?zhàn)B殖與水產(chǎn)品市場營銷策略考核試卷
- 票據(jù)業(yè)務(wù)居間合同模板
- 承包鋼板水泥庫合同范本(2篇)
- DLT 572-2021 電力變壓器運行規(guī)程
- 公司沒繳社保勞動仲裁申請書
- 損傷力學(xué)與斷裂分析
- 2024年縣鄉(xiāng)教師選調(diào)進城考試《教育學(xué)》題庫及完整答案(考點梳理)
- 車借給別人免責(zé)協(xié)議書
- 應(yīng)急預(yù)案評分標(biāo)準(zhǔn)表
評論
0/150
提交評論