教育測量法培訓(xùn)課件

上傳人：z*** IP屬地：貴州上傳時間：2022-10-31 格式：PPT 頁數(shù)：102 大?。?.26MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩97頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第十一章教育測量法第十一章教育測量法1優(yōu)選第十一章教育測量法優(yōu)選第十一章教育測量法2一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程，以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予3教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象，根據(jù)一定法則進行考核，并將考核結(jié)果用數(shù)量描述。包括對學(xué)生德、智、體各方面的測量（狹義），也包括對教師的教育教學(xué)效果、學(xué)校辦學(xué)水平、學(xué)校辦學(xué)效益等方面的測量。教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象，根據(jù)一定法則進行考4

通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。1、2、3、4、5這些數(shù)字本身是沒有數(shù)量或質(zhì)量意義的，只是個符號。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；2代表“及格”；3代表“中等”；4代表“良好”；5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。1、2、5測量的要素（1）測量客體。指測量的對象。測量的客體可以是人，也可以是教育研究中的事物或現(xiàn)象。（2）測量內(nèi)容。指測量客體的屬性和特征。測量內(nèi)容可以是外顯的，如學(xué)生的性別、年齡、身高、體重等，也可以是內(nèi)隱的，如學(xué)習(xí)興趣、動機、態(tài)度、價值觀等。（3）測量規(guī)則。指測量的法則或方法。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。（4）測量工具。指測量的指標(biāo)體系。沒有工具，測量難以進行。測量的要素6二、教育測量法的特點（一）教育測量一般是間接測量測量心理屬性，需要具體行為操作指標(biāo)；（二）教育測量的結(jié)果是相對的學(xué)生不斷成長變化；測量對象不同、測量工具不同，無法比（三）教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)二、教育測量法的特點（一）教育測量一般是間接測量7數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。難度是指測驗項目的難易程度，試題的難度可以用試題的通過率來表示。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；有順序的測量，在量表中表現(xiàn)為數(shù)量上的等距變化系統(tǒng)誤差由于某種因素的影響，使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。常模有地區(qū)性常模和全國性常模，地區(qū)性常模只適用于特定的區(qū)域，如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū)，而全國性常模適用于全國所有的同類個體。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。（二）順序量表（等級量表）如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。（一）編制試題的一般原則信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。正確回答的人數(shù)在全體受測者中所占的比例。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。三、教育測量的要求（一）數(shù)量化把事物或人的屬性加以數(shù)量化，用可以比較的數(shù)值計量學(xué)習(xí)的成果。學(xué)生成績?yōu)?分，不代表其沒有能力，因而要結(jié)合質(zhì)與量。（二）合理處理數(shù)據(jù)在運用測量數(shù)據(jù)時，最基本的要求是單位一致，這樣才能排列順序或等級，進行比較，也便于分析數(shù)據(jù)間的差異。（三）注意誤差的影響隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；系統(tǒng)誤差由于某種因素的影響，使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。三、教育測量的要求（一）數(shù)量化8系統(tǒng)誤差由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。例如，各種刻度尺的熱脹冷縮，溫度計、表盤的刻度不準(zhǔn)確等都會造成誤差。由于實驗本身所依據(jù)的理論、公式的近似性，或者對實驗條件、測量方法的考慮不周也會造成誤差。例如，熱學(xué)實驗中常常沒有考慮散熱的影響，用伏安法測電阻時沒有考慮電表內(nèi)阻的影響等。由于測量者的生理特點，例如反應(yīng)速度，分辨能力，甚至固有習(xí)慣等也會在測量中造成誤差。以上都是造成系統(tǒng)誤差的原因。系統(tǒng)誤差的特點是測量結(jié)果向一個方向偏離，其數(shù)值按一定規(guī)律變化。我們應(yīng)根據(jù)具體的實驗條件，系統(tǒng)誤差的特點，找出產(chǎn)生系統(tǒng)誤差的主要原因，采取適當(dāng)措施降低它的影響。系統(tǒng)誤差9隨機誤差在相同條件下，對同一物理量進行多次測量，由于各種偶然因素，會出現(xiàn)測量值時而偏大，時而偏小的誤差現(xiàn)象，這種類型的誤差叫做偶然誤差。產(chǎn)生偶然誤差的原因很多，例如讀數(shù)時，視線的位置不正確，測量點的位置不準(zhǔn)確，實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化，等等，這些因素的影響一般是微小的，而且難以確定某個因素產(chǎn)生的具體影響的大小，因此偶然誤差難以找出原因加以排除。實驗結(jié)果還表明，在確定的測量條件下，對同一物理量進行多次測量，并且用它的算術(shù)平均值作為該物理量的測量結(jié)果，能夠比較好地減少偶然誤差。隨機誤差在相同條件下，對同一物理量進行多次測量，由于各種偶然10測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較多，其中比較著名的有斯坦?！燃{智力測驗、韋克斯勒兒童智力測驗量表（WISCCR）、瑞文推理測驗等。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。據(jù)此，度量乙的信度要比度量甲的信度高。問渠那得清如許，_____。（二）檢驗教育或教學(xué)目標(biāo)貫徹的情況規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測；把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得由于測題記分的方法不同，所以難度的估計方法也不同。另一種是相對參照點，即以人為確定的零點為測量的起點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；零點是指測量的起點或參照點。相對誤差（乙）＝1/185×100%＝0.四、教育測量的作用（一）考試和選拔學(xué)生（二）檢驗教育或教學(xué)目標(biāo)貫徹的情況（三）診斷學(xué)習(xí)困難，解釋成績不良的原因（四）激勵動機的作用（五）升級、編班與分組（六）改進課程內(nèi)容與教學(xué)方法（七）提供咨詢與個別指導(dǎo)測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較11第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具，測量的工具應(yīng)具有單位和參照點，并且有表示量數(shù)的方法，我們把這種工具稱之為量表。如，尺是度量長度的量表，血壓計是測量血壓高低的量表，智力測驗是測量智商高低的量表。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具，測量的工具12參照點指的是在測量工作中必須具有一個量的起點，這個起點就叫作測量的參照點。這是任何測量都必須具備的兩個要素之一，測量所必須具備的要素包括參照點和單位。參照點有兩種一種是絕對參照點，即以絕對的零點作為測量的起點。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。另一種是相對參照點，即以人為確定的零點為測量的起點。如地勢高度的測量，就是以海平面為測量的起點。最理想的參照點是絕對參照點。參照點指的是在測量工作中必須具有一個量的起點，這個起點就叫作13測量的單位不同測量的單位是不同的。理想的測量單位應(yīng)當(dāng)具備兩個條件一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；二是要有相等的價值，即單位與單位之間的距離是相等的。但是教育與心理測量中的單位往往很難達到這個要求，它遠不如其他測量中使用的單位成熟和完善。測量的單位14量表的數(shù)據(jù)類型稱名數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)點記數(shù)據(jù)度量數(shù)據(jù)量表的數(shù)據(jù)類型點記數(shù)據(jù)度量數(shù)據(jù)15建立常模、確定指導(dǎo)語、時限和施測條件；是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實際測量出其所要測量特性的程度。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；改進方法提高出題質(zhì)量，對錯答題目扣分。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。在使用相關(guān)系數(shù)表示信度的高低時，相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。（二）教育測量的結(jié)果是相對的個別測量的可靠性比較高，主試能有效地觀察控制被試的行為反應(yīng)，但個別測量費時費力，短時間內(nèi)難以獲得大量的資料，并且對主試的要求較高。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；產(chǎn)生偶然誤差的原因很多，例如讀數(shù)時，視線的位置不正確，測量點的位置不準(zhǔn)確，實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化，等等，這些因素的影響一般是微小的，而且難以確定某個因素產(chǎn)生的具體影響的大小，因此偶然誤差難以找出原因加以排除。竹外桃花三兩枝，_____。（三）教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量，通常由教師或研究人員自編的、為臨時測量所用的簡單測量。（一）編制試題的一般原則一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；（一）稱名量表（類別量表）是根據(jù)事物的某一特點，對事物屬性進行分類，用名稱或數(shù)字來代表事物或性質(zhì)，是給事物進行簡單歸類的一種量表形式。如男生為1，女生為2喜歡語文的學(xué)生為1，喜歡數(shù)學(xué)的學(xué)生為2稱名量表測量的結(jié)果不能運算，但可以做統(tǒng)計分析（如計算百分比、列聯(lián)相關(guān)、卡方檢驗）建立常模、確定指導(dǎo)語、時限和施測條件；（一）稱名量表（類別量16指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一個被試）。試題難度要有一定的分布范圍是具有相等的單位，但沒有絕對零點的量表。測量對象不同、測量工具不同，無法比英語的臥房是"Sleeproom"常模參照測驗要有常模對照表。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。是具有相等的單位，但沒有絕對零點的量表。標(biāo)準(zhǔn)客觀測驗的各種試題形式由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。指的是在測量工作中必須具有一個量的起點，這個起點就叫作測量的參照點。在計算客觀題的難度時，它就是受測者在回答該題目時含有絕對或真正的零點和統(tǒng)一的單位。有些零點具有實際意義，稱絕對零點。有些零點是人定的，稱相對零點，如攝氏零度，這里零度并不意味著沒有一點溫度，而是以人定的冰點為參照標(biāo)準(zhǔn)。一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。（二）順序量表（等級量表）只有等級順序而無等距的單位和絕對零點，只是按研究對象的某一種屬性的順序排列出等第次序。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。又如，對于生活水平，我們可以給出四個等級貧困、溫飽、小康、富裕。指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一17（三）等距量表（間距量表）是具有相等的單位，但沒有絕對零點的量表。等距量表的數(shù)量單位之間的間距是相等的，可以相加減。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。三個兒童在智商測驗中分別得分105、110、115，在智商測驗分?jǐn)?shù)體系中，分?jǐn)?shù)差距是相等的。等距量表在學(xué)校教育系統(tǒng)運用廣泛，一般將百分制評分看作等距量表。（三）等距量表（間距量表）18（四）比率量表（等比量表）除了具有類別、順序、等距量表的特征外，還有一個具有實際意義的絕對零點。可以加減乘除。零點是指測量的起點或參照點。有些零點是人定的，稱相對零點，如攝氏零度，這里零度并不意味著沒有一點溫度，而是以人定的冰點為參照標(biāo)準(zhǔn)。像學(xué)生的考試成績、智商的0分都是相對零點。有些零點具有實際意義，稱絕對零點。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。（四）比率量表（等比量表）19量表條件例子稱名量表無順序的測量，只是指出有兩個或多個范疇。中學(xué)的類型：公立、私立、職業(yè)、普通等。順序量表是有順序有測量，在于指出所測量的范疇的不同并能夠按一定的順序排列。字母的排列系統(tǒng)、學(xué)習(xí)態(tài)度。等距量表有順序的測量，在量表中表現(xiàn)為數(shù)量上的等距變化數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。比率量表含有絕對或真正的零點和統(tǒng)一的單位。高度、體重上述四種量表的比較：量表條件例子稱名量表無順序的測量，只是指出有兩個或多個范疇。20衡量教育測量的質(zhì)量，可采用四個指標(biāo)信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度二、測量的條件衡量教育測量的質(zhì)量，可采用四個指標(biāo)二、測量的條件21一、信度信度（reliability）指的是測量結(jié)果的穩(wěn)定性和可靠的程度，亦即測量的結(jié)果是否真實、客觀地反映了受測者的實際水平。具體而言，可以從以下三方面來理解測量的信度1.信度指實測值和真值相差的程度2.信度指統(tǒng)計量與參數(shù)之間的接近程度3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度一、信度信度（reliability）指的是測量結(jié)果的穩(wěn)定性221.信度指實測值和真值相差的程度x＝T＋E（公式11）x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。E＝xT（公式12）1.信度指實測值和真值相差的程度x＝T＋E（公式11）23試比較以下兩次測量結(jié)果（只進行一次）的信度用尺子量100cm高的一個兒童，得到1cm的絕對誤差；量185cm高的一位運動員，也得得到1cm的絕對誤差。要比較兩種測量結(jié)果的信度，一定要看誤差分?jǐn)?shù)（E）對于真分?jǐn)?shù)（T）所占的百分?jǐn)?shù)是多少。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)（x）的相對誤差。其計算式如下相對誤差＝E/T×100%公式（13）把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得相對誤差（甲）＝1/100×100%＝1%相對誤差（乙）＝1/185×100%＝0.54%據(jù)此，度量乙的信度要比度量甲的信度高。試比較以下兩次測量結(jié)果（只進行一次）的信度24（三）等距量表（間距量表）信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。溫度、各種能力分?jǐn)?shù)、智商；常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。試題內(nèi)容廣泛，評分客觀，提供選擇的答案多，可以減少猜中題目的機會。常模參照測驗要有常模對照表。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。在計算客觀題的難度時，它就是受測者在回答該題目時測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征，較為著名的有明尼蘇達多相個性測驗（MMPI）、艾森克人格問卷（EPQR）、卡特爾16項人格因素測驗（16PF）等。據(jù)此，度量乙的信度要比度量甲的信度高。區(qū)分度是指一個題目區(qū)分所有受試者的能力。正確回答的人數(shù)在全體受測者中所占的比例。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一個被試）。把事物或人的屬性加以數(shù)量化，用可以比較的數(shù)值計量學(xué)習(xí)的成果。（四）比率量表（等比量表）團體測量節(jié)省人力與時間，在短時間內(nèi)能收集到大量的資料，效率較高，但被試的反應(yīng)不容易控制，并且測量效果不及個別測量可靠。統(tǒng)計量是指樣本上的各種數(shù)字特征。（如樣本平均數(shù)、標(biāo)準(zhǔn)差等）；參數(shù)是總體上的各種數(shù)字特征（如總體平均數(shù)、標(biāo)準(zhǔn)差等）。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。而要知道統(tǒng)計量與參數(shù)的接近程度，可以對參數(shù)進行區(qū)間估計。2.信度指統(tǒng)計量與參數(shù)之間的接近程度（三）等距量表（間距量表）統(tǒng)計量是指樣本上的各種數(shù)字特征。（253.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計事物或現(xiàn)象間數(shù)量變動的一致性，主要采用相關(guān)分析的方法，即計算出兩種變量的相關(guān)系數(shù)（rxy）。在使用相關(guān)系數(shù)表示信度的高低時，相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計26提高測量信度的方法1.測題要有一定數(shù)量

延長測驗的長度，既可排除試題抽樣的偶然性因素，也有可能擴大得分的范圍，因而使信度系數(shù)增大，測驗信度提高。2.測題難度適中3.測題內(nèi)容要有同質(zhì)性，不要包含過多性質(zhì)不同的內(nèi)容4.測驗時間要充分5.評分要客觀提高測量信度的方法1.測題要有一定數(shù)量27是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實際測量出其所要測量特性的程度。

含義二、效度是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實28提高效度的注意事項（1）要控制系數(shù)誤差，即控制測驗過程的誤差；（2）精心編制測題，分析教學(xué)目標(biāo)，編制雙向細目表，測題表述簡明易懂，測量有必要的覆蓋面。（3）妥善組織測驗。提高效度的注意事項（1）要控制系數(shù)誤差，即控制測驗過程的誤差29

難度是指題目的難易程度。表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。

試題卷面的難度值范圍是0.4~0.7由于測題記分的方法不同，所以難度的估計方法也不同。三、難度

難度是指題目的難易程度。表示題目難易程度的數(shù)量，稱為題301.在計算客觀題的難度時，它就是受測者在回答該題目時正確回答的人數(shù)在全體受測者中所占的比例。2.當(dāng)題目的分?jǐn)?shù)為多值時（包括主觀題或一些分步解答的題目），難度就是全體平均分與題目滿分的比例。難度是指測驗項目的難易程度，試題的難度可以用試題的通過率來表示。1.在計算客觀題的難度時，它就是受測者在回答該題目時難度是31第十一章教育測量法培訓(xùn)課件32第十一章教育測量法培訓(xùn)課件33區(qū)分度是指一個題目區(qū)分所有受試者的能力。（題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。它反映了一個題目的鑒別能力。因此區(qū)分度又稱題目的鑒別度。）四、區(qū)分度

區(qū)分度是指一個題目區(qū)分所有受試者的能力。（題目的區(qū)分度是衡量34D越高則質(zhì)量越好。0.2以下應(yīng)淘汰第十一章教育測量法培訓(xùn)課件35練習(xí)A.稱名數(shù)據(jù)B.順序數(shù)據(jù)C.等距數(shù)據(jù)D.等比數(shù)據(jù)性別、顏色分類、人口數(shù)、學(xué)校數(shù)；身高、體重；溫度、各種能力分?jǐn)?shù)、智商；學(xué)生等級評定、喜愛程度、品質(zhì)等級、能力等級、興趣等。練習(xí)36第十一章教育測量法培訓(xùn)課件37第三節(jié)教育測量的類型與方法（一）根據(jù)測量的標(biāo)準(zhǔn)化程度分類標(biāo)準(zhǔn)化測量、非標(biāo)準(zhǔn)化測量1.標(biāo)準(zhǔn)化測量由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。編制和施測有一套標(biāo)準(zhǔn)程序。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測；根據(jù)數(shù)量化指標(biāo)篩選測驗題目；鑒定整個測驗的信度和效度；建立常模、確定指導(dǎo)語、時限和施測條件；規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。第三節(jié)教育測量的類型與方法（一）根據(jù)測量的標(biāo)準(zhǔn)化程度分類382.非標(biāo)準(zhǔn)化測量（教師自編測量）指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量，通常由教師或研究人員自編的、為臨時測量所用的簡單測量。如課堂測驗、考試、等級評定量表等。這些測量是教師根據(jù)教學(xué)目標(biāo)和自己的教學(xué)經(jīng)驗編制而成，它通常與日常教學(xué)工作緊密聯(lián)系；測驗內(nèi)容與教材內(nèi)容、教學(xué)進度一致；難易程度由教師把握；針對性較強。編制省時、省力、靈活、方便。不足之處在于測驗的客觀性和標(biāo)準(zhǔn)化程度不如標(biāo)準(zhǔn)化測驗，測驗的實施和記分也不甚嚴(yán)格。2.非標(biāo)準(zhǔn)化測量（教師自編測量）39（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。1.學(xué)業(yè)成就測驗測被試經(jīng)某種形式的學(xué)習(xí)或訓(xùn)練后對知識、技能的掌握程度或熟練水平。如識字量、閱讀、算術(shù)測驗等，成就測驗可以是學(xué)科成就測驗或綜合成就測驗。2.智力測驗測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較多，其中比較著名的有斯坦福——比納智力測驗、韋克斯勒兒童智力測驗量表（WISCCR）、瑞文推理測驗等。（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗403.能力傾向測驗測被試潛在的某種能力，以了解其發(fā)展的可能性，預(yù)測個人能力發(fā)展傾向。如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。4.人格測驗測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征，較為著名的有明尼蘇達多相個性測驗（MMPI）、艾森克人格問卷（EPQR）、卡特爾16項人格因素測驗（16PF）等。3.能力傾向測驗41（三）根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。1.常模參照測驗常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。常模參照測驗要有常模對照表。常模有地區(qū)性常模和全國性常模，地區(qū)性常模只適用于特定的區(qū)域，如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū)，而全國性常模適用于全國所有的同類個體。如，兒童的身高、體重就有全國性常模，中國兒童發(fā)展量表（36歲）就有全國性常模。只要我們將個體實際測量的數(shù)據(jù)與常模一對照，就可以知道個體所處的地位。（三）根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。42（一）編制試題的一般原則是有順序有測量，在于指出所測量的范疇的不同并能夠按一定的順序排列。測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程，以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。零點是指測量的起點或參照點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)（x）的相對誤差。由于測題記分的方法不同，所以難度的估計方法也不同。優(yōu)選第十一章教育測量法性別、顏色分類、人口數(shù)、學(xué)校數(shù)；它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。（二）教育測量的結(jié)果是相對的5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。指一個主試能同時對許多被試進行的測量。如，尺是度量長度的量表，血壓計是測量血壓高低的量表，智力測驗是測量智商高低的量表。如，兒童的身高、體重就有全國性常模，中國兒童發(fā)展量表（36歲）就有全國性常模。在計算客觀題的難度時，它就是受測者在回答該題目時問渠那得清如許，_____。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。題目容易編寫，容易計分。學(xué)生成績?yōu)?分，不代表其沒有能力，因而要結(jié)合質(zhì)與量。問渠那得清如許，_____。（二）順序量表（等級量表）如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。如地勢高度的測量，就是以海平面為測量的起點。但是教育與心理測量中的單位往往很難達到這個要求，它遠不如其他測量中使用的單位成熟和完善。測量需要有測量的工具，測量的工具應(yīng)具有單位和參照點，并且有表示量數(shù)的方法，我們把這種工具稱之為量表。信度指統(tǒng)計量與參數(shù)之間的接近程度（三）診斷學(xué)習(xí)困難，解釋成績不良的原因通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。量185cm高的一位運動員，也得得到1cm的絕對誤差。主要對整個測量而言。（一）編制試題的一般原則指一個主試能同時對許多被試進行的測量432.目標(biāo)參照測驗又稱標(biāo)準(zhǔn)參照測驗，是衡量被試實際水平的測驗，將被試在測驗上的分?jǐn)?shù)與事先制定好的某種標(biāo)準(zhǔn)進行比較，看被試是否達到了目標(biāo)規(guī)定的要求。目標(biāo)參照測驗的特點是依據(jù)標(biāo)準(zhǔn)，判斷被試的達標(biāo)程度，而不是將被試的成績與他人成績做比較。如，英語水平測試、畢業(yè)考試、動作技能測試、體育達標(biāo)測試等。2.目標(biāo)參照測驗44常模參照測驗要有常模對照表。通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。另一種是相對參照點，即以人為確定的零點為測量的起點。缺點容易造成死記硬背的現(xiàn)象，學(xué)習(xí)內(nèi)容容易混淆。常模有地區(qū)性常模和全國性常模，地區(qū)性常模只適用于特定的區(qū)域，如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū)，而全國性常模適用于全國所有的同類個體。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。沒有工具，測量難以進行。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。學(xué)生成績?yōu)?分，不代表其沒有能力，因而要結(jié)合質(zhì)與量。系統(tǒng)誤差由于某種因素的影響，使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。正確回答的人數(shù)在全體受測者中所占的比例。區(qū)分度是指一個題目區(qū)分所有受試者的能力。測題內(nèi)容要有同質(zhì)性，不要包含過多性質(zhì)不同的內(nèi)容通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。問渠那得清如許，_____。理想的測量單位應(yīng)當(dāng)具備兩個條件測被試潛在的某種能力，以了解其發(fā)展的可能性，預(yù)測個人能力發(fā)展傾向。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。是根據(jù)事物的某一特點，對事物屬性進行分類，用名稱或數(shù)字來代表事物或性質(zhì)，是給事物進行簡單歸類的一種量表形式。（四）根據(jù)同時受測的人數(shù)分類個別測量、團體測量1.個別測量指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一個被試）。個別測量的可靠性比較高，主試能有效地觀察控制被試的行為反應(yīng)，但個別測量費時費力，短時間內(nèi)難以獲得大量的資料，并且對主試的要求較高。2.團體測量指一個主試能同時對許多被試進行的測量。團體測量節(jié)省人力與時間，在短時間內(nèi)能收集到大量的資料，效率較高，但被試的反應(yīng)不容易控制，并且測量效果不及個別測量可靠。常模參照測驗要有常模對照表。（四）根據(jù)同時受測的人數(shù)分類個別45二、教育測量的方法（一）編制試題的一般原則1.要有明確的測驗?zāi)康?.能反映學(xué)科的重點內(nèi)容3.試題取樣要有代表性4.試題難度要有一定的分布范圍5.試題的文字要適合學(xué)生閱讀能力，力求淺顯易懂二、教育測量的方法（一）編制試題的一般原則46（二）測量的編制方法1.標(biāo)準(zhǔn)客觀測驗的各種試題形式（1）填空題（2）是非題（3）選擇題（4）匹配題（5）簡答題（6）論述題（二）測量的編制方法1.標(biāo)準(zhǔn)客觀測驗的各種試題形式47（1）填空題問渠那得清如許，_____。竹外桃花三兩枝，_____。測驗學(xué)生完成句子的能力優(yōu)點試題容易編寫，避免亂猜；缺點容易造成死記硬背的現(xiàn)象，學(xué)習(xí)內(nèi)容容易混淆。（1）填空題問渠那得清如許，_____。48（2）是非題1.《背影》的作者是朱自清嗎？2.企鵝是在北極嗎？3.剛吃完飯能馬上運動嗎？4.口腔有消化作用嗎？5.英語的臥房是"Sleeproom"測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能力。題目容易編寫，容易計分。缺點容易猜題改進方法提高出題質(zhì)量，對錯答題目扣分。（2）是非題1.《背影》的作者是朱自清嗎？2.企鵝是49（3）選擇題測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能力。試題內(nèi)容廣泛，評分客觀，提供選擇的答案多，可以減少猜中題目的機會。缺點編寫試題時費時較多。（3）選擇題測量學(xué)生對問題的理解、解釋、再認(rèn)、比較與辨認(rèn)的能50常模參照測驗要有常模對照表。測題內(nèi)容要有同質(zhì)性，不要包含過多性質(zhì)不同的內(nèi)容測量心理屬性，需要具體行為操作指標(biāo)；二是要有相等的價值，即單位與單位之間的距離是相等的。信度指統(tǒng)計量與參數(shù)之間的接近程度通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。難度就是全體平均分與題目滿分的比例。英語的臥房是"Sleeproom"信度指統(tǒng)計量與參數(shù)之間的接近程度問渠那得清如許，_____。含有絕對或真正的零點和統(tǒng)一的單位。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。它反映了一個題目的鑒別能力。另一種是相對參照點，即以人為確定的零點為測量的起點。產(chǎn)生偶然誤差的原因很多，例如讀數(shù)時，視線的位置不正確，測量點的位置不準(zhǔn)確，實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化，等等，這些因素的影響一般是微小的，而且難以確定某個因素產(chǎn)生的具體影響的大小，因此偶然誤差難以找出原因加以排除。指一個主試能同時對許多被試進行的測量。溫度、各種能力分?jǐn)?shù)、智商；5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。如地勢高度的測量，就是以海平面為測量的起點。是有順序有測量，在于指出所測量的范疇的不同并能夠按一定的順序排列。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件（題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。編制和施測有一套標(biāo)準(zhǔn)程序。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；理想的測量單位應(yīng)當(dāng)具備兩個條件正確回答的人數(shù)在全體受測者中所占的比例。常模參照測驗要有常模對照表。測題內(nèi)容要有同質(zhì)性，不要包含過多性質(zhì)不同的內(nèi)容信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如地勢高度的測量，就是以海平面為測量的起點。（四）根據(jù)同時受測的人數(shù)分類個別測量、團體測量5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得據(jù)此，度量乙的信度要比度量甲的信度高。指測量客體的屬性和特征。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。

（4）匹配題測查學(xué)生對字詞、文法、日期、事件、地點、人物、公式、原則等關(guān)系的了解與聯(lián)結(jié)的能力。優(yōu)點測量學(xué)生簡易的聯(lián)結(jié)能力；缺點使用過多容易鼓勵學(xué)生死記硬背的材料，學(xué)生往往為了使材料相互匹配而重復(fù)閱讀，消耗時間精力。常模參照測驗要有常模對照表。如溫度攝氏30度至32度與攝氏151第十一章教育測量法第十一章教育測量法52優(yōu)選第十一章教育測量法優(yōu)選第十一章教育測量法53一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程，以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。一、教育測量的涵義測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予54教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象，根據(jù)一定法則進行考核，并將考核結(jié)果用數(shù)量描述。包括對學(xué)生德、智、體各方面的測量（狹義），也包括對教師的教育教學(xué)效果、學(xué)校辦學(xué)水平、學(xué)校辦學(xué)效益等方面的測量。教育測量是指對教育領(lǐng)域內(nèi)的各種事物或現(xiàn)象，根據(jù)一定法則進行考55

通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。1、2、3、4、5這些數(shù)字本身是沒有數(shù)量或質(zhì)量意義的，只是個符號。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；2代表“及格”；3代表“中等”；4代表“良好”；5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。1、2、56測量的要素（1）測量客體。指測量的對象。測量的客體可以是人，也可以是教育研究中的事物或現(xiàn)象。（2）測量內(nèi)容。指測量客體的屬性和特征。測量內(nèi)容可以是外顯的，如學(xué)生的性別、年齡、身高、體重等，也可以是內(nèi)隱的，如學(xué)習(xí)興趣、動機、態(tài)度、價值觀等。（3）測量規(guī)則。指測量的法則或方法。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。（4）測量工具。指測量的指標(biāo)體系。沒有工具，測量難以進行。測量的要素57二、教育測量法的特點（一）教育測量一般是間接測量測量心理屬性，需要具體行為操作指標(biāo)；（二）教育測量的結(jié)果是相對的學(xué)生不斷成長變化；測量對象不同、測量工具不同，無法比（三）教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)二、教育測量法的特點（一）教育測量一般是間接測量58數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。難度是指測驗項目的難易程度，試題的難度可以用試題的通過率來表示。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；有順序的測量，在量表中表現(xiàn)為數(shù)量上的等距變化系統(tǒng)誤差由于某種因素的影響，使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。常模有地區(qū)性常模和全國性常模，地區(qū)性常模只適用于特定的區(qū)域，如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū)，而全國性常模適用于全國所有的同類個體。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。（二）順序量表（等級量表）如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。（一）編制試題的一般原則信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。正確回答的人數(shù)在全體受測者中所占的比例。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。三、教育測量的要求（一）數(shù)量化把事物或人的屬性加以數(shù)量化，用可以比較的數(shù)值計量學(xué)習(xí)的成果。學(xué)生成績?yōu)?分，不代表其沒有能力，因而要結(jié)合質(zhì)與量。（二）合理處理數(shù)據(jù)在運用測量數(shù)據(jù)時，最基本的要求是單位一致，這樣才能排列順序或等級，進行比較，也便于分析數(shù)據(jù)間的差異。（三）注意誤差的影響隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；系統(tǒng)誤差由于某種因素的影響，使測量變量有系統(tǒng)地發(fā)生變化而產(chǎn)生的誤差。數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。三、教育測量的要求（一）數(shù)量化59系統(tǒng)誤差由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。例如，各種刻度尺的熱脹冷縮，溫度計、表盤的刻度不準(zhǔn)確等都會造成誤差。由于實驗本身所依據(jù)的理論、公式的近似性，或者對實驗條件、測量方法的考慮不周也會造成誤差。例如，熱學(xué)實驗中常常沒有考慮散熱的影響，用伏安法測電阻時沒有考慮電表內(nèi)阻的影響等。由于測量者的生理特點，例如反應(yīng)速度，分辨能力，甚至固有習(xí)慣等也會在測量中造成誤差。以上都是造成系統(tǒng)誤差的原因。系統(tǒng)誤差的特點是測量結(jié)果向一個方向偏離，其數(shù)值按一定規(guī)律變化。我們應(yīng)根據(jù)具體的實驗條件，系統(tǒng)誤差的特點，找出產(chǎn)生系統(tǒng)誤差的主要原因，采取適當(dāng)措施降低它的影響。系統(tǒng)誤差60隨機誤差在相同條件下，對同一物理量進行多次測量，由于各種偶然因素，會出現(xiàn)測量值時而偏大，時而偏小的誤差現(xiàn)象，這種類型的誤差叫做偶然誤差。產(chǎn)生偶然誤差的原因很多，例如讀數(shù)時，視線的位置不正確，測量點的位置不準(zhǔn)確，實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化，等等，這些因素的影響一般是微小的，而且難以確定某個因素產(chǎn)生的具體影響的大小，因此偶然誤差難以找出原因加以排除。實驗結(jié)果還表明，在確定的測量條件下，對同一物理量進行多次測量，并且用它的算術(shù)平均值作為該物理量的測量結(jié)果，能夠比較好地減少偶然誤差。隨機誤差在相同條件下，對同一物理量進行多次測量，由于各種偶然61測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較多，其中比較著名的有斯坦?！燃{智力測驗、韋克斯勒兒童智力測驗量表（WISCCR）、瑞文推理測驗等。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。據(jù)此，度量乙的信度要比度量甲的信度高。問渠那得清如許，_____。（二）檢驗教育或教學(xué)目標(biāo)貫徹的情況規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。測驗編制包括確定測驗?zāi)康?、科學(xué)命題、選取有代表性的樣本進行試測；把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得由于測題記分的方法不同，所以難度的估計方法也不同。另一種是相對參照點，即以人為確定的零點為測量的起點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；零點是指測量的起點或參照點。相對誤差（乙）＝1/185×100%＝0.四、教育測量的作用（一）考試和選拔學(xué)生（二）檢驗教育或教學(xué)目標(biāo)貫徹的情況（三）診斷學(xué)習(xí)困難，解釋成績不良的原因（四）激勵動機的作用（五）升級、編班與分組（六）改進課程內(nèi)容與教學(xué)方法（七）提供咨詢與個別指導(dǎo)測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較62第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具，測量的工具應(yīng)具有單位和參照點，并且有表示量數(shù)的方法，我們把這種工具稱之為量表。如，尺是度量長度的量表，血壓計是測量血壓高低的量表，智力測驗是測量智商高低的量表。第二節(jié)教育測量的標(biāo)準(zhǔn)與條件測量需要有測量的工具，測量的工具63參照點指的是在測量工作中必須具有一個量的起點，這個起點就叫作測量的參照點。這是任何測量都必須具備的兩個要素之一，測量所必須具備的要素包括參照點和單位。參照點有兩種一種是絕對參照點，即以絕對的零點作為測量的起點。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。另一種是相對參照點，即以人為確定的零點為測量的起點。如地勢高度的測量，就是以海平面為測量的起點。最理想的參照點是絕對參照點。參照點指的是在測量工作中必須具有一個量的起點，這個起點就叫作64測量的單位不同測量的單位是不同的。理想的測量單位應(yīng)當(dāng)具備兩個條件一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；二是要有相等的價值，即單位與單位之間的距離是相等的。但是教育與心理測量中的單位往往很難達到這個要求，它遠不如其他測量中使用的單位成熟和完善。測量的單位65量表的數(shù)據(jù)類型稱名數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)點記數(shù)據(jù)度量數(shù)據(jù)量表的數(shù)據(jù)類型點記數(shù)據(jù)度量數(shù)據(jù)66建立常模、確定指導(dǎo)語、時限和施測條件；是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實際測量出其所要測量特性的程度。當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；改進方法提高出題質(zhì)量，對錯答題目扣分。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。在使用相關(guān)系數(shù)表示信度的高低時，相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。（二）教育測量的結(jié)果是相對的個別測量的可靠性比較高，主試能有效地觀察控制被試的行為反應(yīng)，但個別測量費時費力，短時間內(nèi)難以獲得大量的資料，并且對主試的要求較高。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。隨機誤差由于難于控制的偶然因素，使測量結(jié)果不準(zhǔn)確；產(chǎn)生偶然誤差的原因很多，例如讀數(shù)時，視線的位置不正確，測量點的位置不準(zhǔn)確，實驗儀器由于環(huán)境溫度、濕度、電源電壓不穩(wěn)定、振動等因素的影響而產(chǎn)生微小變化，等等，這些因素的影響一般是微小的，而且難以確定某個因素產(chǎn)生的具體影響的大小，因此偶然誤差難以找出原因加以排除。竹外桃花三兩枝，_____。（三）教育測量更強調(diào)直接為實現(xiàn)教育目的服務(wù)指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量，通常由教師或研究人員自編的、為臨時測量所用的簡單測量。（一）編制試題的一般原則一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；（一）稱名量表（類別量表）是根據(jù)事物的某一特點，對事物屬性進行分類，用名稱或數(shù)字來代表事物或性質(zhì)，是給事物進行簡單歸類的一種量表形式。如男生為1，女生為2喜歡語文的學(xué)生為1，喜歡數(shù)學(xué)的學(xué)生為2稱名量表測量的結(jié)果不能運算，但可以做統(tǒng)計分析（如計算百分比、列聯(lián)相關(guān)、卡方檢驗）建立常模、確定指導(dǎo)語、時限和施測條件；（一）稱名量表（類別量67指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一個被試）。試題難度要有一定的分布范圍是具有相等的單位，但沒有絕對零點的量表。測量對象不同、測量工具不同，無法比英語的臥房是"Sleeproom"常模參照測驗要有常模對照表。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。是具有相等的單位，但沒有絕對零點的量表。標(biāo)準(zhǔn)客觀測驗的各種試題形式由于儀器結(jié)構(gòu)上不夠完善或儀器未經(jīng)很好校準(zhǔn)等原因會產(chǎn)生誤差。指的是在測量工作中必須具有一個量的起點，這個起點就叫作測量的參照點。在計算客觀題的難度時，它就是受測者在回答該題目時含有絕對或真正的零點和統(tǒng)一的單位。有些零點具有實際意義，稱絕對零點。有些零點是人定的，稱相對零點，如攝氏零度，這里零度并不意味著沒有一點溫度，而是以人定的冰點為參照標(biāo)準(zhǔn)。一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。（二）順序量表（等級量表）只有等級順序而無等距的單位和絕對零點，只是按研究對象的某一種屬性的順序排列出等第次序。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。又如，對于生活水平，我們可以給出四個等級貧困、溫飽、小康、富裕。指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一68（三）等距量表（間距量表）是具有相等的單位，但沒有絕對零點的量表。等距量表的數(shù)量單位之間的間距是相等的，可以相加減。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。三個兒童在智商測驗中分別得分105、110、115，在智商測驗分?jǐn)?shù)體系中，分?jǐn)?shù)差距是相等的。等距量表在學(xué)校教育系統(tǒng)運用廣泛，一般將百分制評分看作等距量表。（三）等距量表（間距量表）69（四）比率量表（等比量表）除了具有類別、順序、等距量表的特征外，還有一個具有實際意義的絕對零點?？梢约訙p乘除。零點是指測量的起點或參照點。有些零點是人定的，稱相對零點，如攝氏零度，這里零度并不意味著沒有一點溫度，而是以人定的冰點為參照標(biāo)準(zhǔn)。像學(xué)生的考試成績、智商的0分都是相對零點。有些零點具有實際意義，稱絕對零點。如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。（四）比率量表（等比量表）70量表條件例子稱名量表無順序的測量，只是指出有兩個或多個范疇。中學(xué)的類型：公立、私立、職業(yè)、普通等。順序量表是有順序有測量，在于指出所測量的范疇的不同并能夠按一定的順序排列。字母的排列系統(tǒng)、學(xué)習(xí)態(tài)度。等距量表有順序的測量，在量表中表現(xiàn)為數(shù)量上的等距變化數(shù)學(xué)成績測量的標(biāo)準(zhǔn)分?jǐn)?shù)。比率量表含有絕對或真正的零點和統(tǒng)一的單位。高度、體重上述四種量表的比較：量表條件例子稱名量表無順序的測量，只是指出有兩個或多個范疇。71衡量教育測量的質(zhì)量，可采用四個指標(biāo)信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度二、測量的條件衡量教育測量的質(zhì)量，可采用四個指標(biāo)二、測量的條件72一、信度信度（reliability）指的是測量結(jié)果的穩(wěn)定性和可靠的程度，亦即測量的結(jié)果是否真實、客觀地反映了受測者的實際水平。具體而言，可以從以下三方面來理解測量的信度1.信度指實測值和真值相差的程度2.信度指統(tǒng)計量與參數(shù)之間的接近程度3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度一、信度信度（reliability）指的是測量結(jié)果的穩(wěn)定性731.信度指實測值和真值相差的程度x＝T＋E（公式11）x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。E＝xT（公式12）1.信度指實測值和真值相差的程度x＝T＋E（公式11）74試比較以下兩次測量結(jié)果（只進行一次）的信度用尺子量100cm高的一個兒童，得到1cm的絕對誤差；量185cm高的一位運動員，也得得到1cm的絕對誤差。要比較兩種測量結(jié)果的信度，一定要看誤差分?jǐn)?shù)（E）對于真分?jǐn)?shù)（T）所占的百分?jǐn)?shù)是多少。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)（x）的相對誤差。其計算式如下相對誤差＝E/T×100%公式（13）把上述兩次測量（設(shè)為甲和乙）和絕對誤差分?jǐn)?shù)和真分?jǐn)?shù)代入上式，得相對誤差（甲）＝1/100×100%＝1%相對誤差（乙）＝1/185×100%＝0.54%據(jù)此，度量乙的信度要比度量甲的信度高。試比較以下兩次測量結(jié)果（只進行一次）的信度75（三）等距量表（間距量表）信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度當(dāng)我們規(guī)定1代表學(xué)業(yè)成績的最低等級“不及格”；如年齡、身高、經(jīng)費開支等都有絕對零點，0歲、0米、0元中的“零”都表示真實的“無”，表示一點都沒有。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。溫度、各種能力分?jǐn)?shù)、智商；常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。試題內(nèi)容廣泛，評分客觀，提供選擇的答案多，可以減少猜中題目的機會。常模參照測驗要有常模對照表。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。在計算客觀題的難度時，它就是受測者在回答該題目時測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征，較為著名的有明尼蘇達多相個性測驗（MMPI）、艾森克人格問卷（EPQR）、卡特爾16項人格因素測驗（16PF）等。據(jù)此，度量乙的信度要比度量甲的信度高。區(qū)分度是指一個題目區(qū)分所有受試者的能力。正確回答的人數(shù)在全體受測者中所占的比例。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。指主試與被試一對一進行的測量（一個主試在同一時間內(nèi)，只測驗一個被試）。把事物或人的屬性加以數(shù)量化，用可以比較的數(shù)值計量學(xué)習(xí)的成果。（四）比率量表（等比量表）團體測量節(jié)省人力與時間，在短時間內(nèi)能收集到大量的資料，效率較高，但被試的反應(yīng)不容易控制，并且測量效果不及個別測量可靠。統(tǒng)計量是指樣本上的各種數(shù)字特征。（如樣本平均數(shù)、標(biāo)準(zhǔn)差等）；參數(shù)是總體上的各種數(shù)字特征（如總體平均數(shù)、標(biāo)準(zhǔn)差等）。在統(tǒng)計學(xué)中，統(tǒng)計量越接近參數(shù)，這個統(tǒng)計量的可靠性越高。而要知道統(tǒng)計量與參數(shù)的接近程度，可以對參數(shù)進行區(qū)間估計。2.信度指統(tǒng)計量與參數(shù)之間的接近程度（三）等距量表（間距量表）統(tǒng)計量是指樣本上的各種數(shù)字特征。（763.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計事物或現(xiàn)象間數(shù)量變動的一致性，主要采用相關(guān)分析的方法，即計算出兩種變量的相關(guān)系數(shù)（rxy）。在使用相關(guān)系數(shù)表示信度的高低時，相關(guān)系數(shù)可稱為信度系數(shù)(coefficientofreliability)。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。3.信度指兩次重復(fù)測驗或等值測驗之間的關(guān)聯(lián)程度統(tǒng)計學(xué)中估計77提高測量信度的方法1.測題要有一定數(shù)量

延長測驗的長度，既可排除試題抽樣的偶然性因素，也有可能擴大得分的范圍，因而使信度系數(shù)增大，測驗信度提高。2.測題難度適中3.測題內(nèi)容要有同質(zhì)性，不要包含過多性質(zhì)不同的內(nèi)容4.測驗時間要充分5.評分要客觀提高測量信度的方法1.測題要有一定數(shù)量78是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實際測量出其所要測量特性的程度。

含義二、效度是測驗的準(zhǔn)確性，是測驗?zāi)軌驕y出它所欲測的特質(zhì)的程度，即測驗實79提高效度的注意事項（1）要控制系數(shù)誤差，即控制測驗過程的誤差；（2）精心編制測題，分析教學(xué)目標(biāo)，編制雙向細目表，測題表述簡明易懂，測量有必要的覆蓋面。（3）妥善組織測驗。提高效度的注意事項（1）要控制系數(shù)誤差，即控制測驗過程的誤差80

難度是指題目的難易程度。表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。

試題卷面的難度值范圍是0.4~0.7由于測題記分的方法不同，所以難度的估計方法也不同。三、難度

難度是指題目的難易程度。表示題目難易程度的數(shù)量，稱為題811.在計算客觀題的難度時，它就是受測者在回答該題目時正確回答的人數(shù)在全體受測者中所占的比例。2.當(dāng)題目的分?jǐn)?shù)為多值時（包括主觀題或一些分步解答的題目），難度就是全體平均分與題目滿分的比例。難度是指測驗項目的難易程度，試題的難度可以用試題的通過率來表示。1.在計算客觀題的難度時，它就是受測者在回答該題目時難度是82第十一章教育測量法培訓(xùn)課件83第十一章教育測量法培訓(xùn)課件84區(qū)分度是指一個題目區(qū)分所有受試者的能力。（題目的區(qū)分度是衡量題目對測量目的所做的貢獻大小程度的指標(biāo)。它反映了一個題目的鑒別能力。因此區(qū)分度又稱題目的鑒別度。）四、區(qū)分度

區(qū)分度是指一個題目區(qū)分所有受試者的能力。（題目的區(qū)分度是衡量85D越高則質(zhì)量越好。0.2以下應(yīng)淘汰第十一章教育測量法培訓(xùn)課件86練習(xí)A.稱名數(shù)據(jù)B.順序數(shù)據(jù)C.等距數(shù)據(jù)D.等比數(shù)據(jù)性別、顏色分類、人口數(shù)、學(xué)校數(shù)；身高、體重；溫度、各種能力分?jǐn)?shù)、智商；學(xué)生等級評定、喜愛程度、品質(zhì)等級、能力等級、興趣等。練習(xí)87第十一章教育測量法培訓(xùn)課件88第三節(jié)教育測量的類型與方法（一）根據(jù)測量的標(biāo)準(zhǔn)化程度分類標(biāo)準(zhǔn)化測量、非標(biāo)準(zhǔn)化測量1.標(biāo)準(zhǔn)化測量由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。編制和施測有一套標(biāo)準(zhǔn)程序。測驗編制包括確定測驗?zāi)康摹⒖茖W(xué)命題、選取有代表性的樣本進行試測；根據(jù)數(shù)量化指標(biāo)篩選測驗題目；鑒定整個測驗的信度和效度；建立常模、確定指導(dǎo)語、時限和施測條件；規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。標(biāo)準(zhǔn)化測驗所獲得的測量結(jié)果比較客觀、可靠、應(yīng)用范圍較廣，一般測量調(diào)查應(yīng)盡可能選用標(biāo)準(zhǔn)化的測驗工具。第三節(jié)教育測量的類型與方法（一）根據(jù)測量的標(biāo)準(zhǔn)化程度分類892.非標(biāo)準(zhǔn)化測量（教師自編測量）指測量的編制和實施不按標(biāo)準(zhǔn)程序進行的測量，通常由教師或研究人員自編的、為臨時測量所用的簡單測量。如課堂測驗、考試、等級評定量表等。這些測量是教師根據(jù)教學(xué)目標(biāo)和自己的教學(xué)經(jīng)驗編制而成，它通常與日常教學(xué)工作緊密聯(lián)系；測驗內(nèi)容與教材內(nèi)容、教學(xué)進度一致；難易程度由教師把握；針對性較強。編制省時、省力、靈活、方便。不足之處在于測驗的客觀性和標(biāo)準(zhǔn)化程度不如標(biāo)準(zhǔn)化測驗，測驗的實施和記分也不甚嚴(yán)格。2.非標(biāo)準(zhǔn)化測量（教師自編測量）90（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗、人格測驗等。1.學(xué)業(yè)成就測驗測被試經(jīng)某種形式的學(xué)習(xí)或訓(xùn)練后對知識、技能的掌握程度或熟練水平。如識字量、閱讀、算術(shù)測驗等，成就測驗可以是學(xué)科成就測驗或綜合成就測驗。2.智力測驗測被試的智力高低，其結(jié)果常以智商（IQ）來表示，此類測驗比較多，其中比較著名的有斯坦?！燃{智力測驗、韋克斯勒兒童智力測驗量表（WISCCR）、瑞文推理測驗等。（二）根據(jù)測量的內(nèi)容分類學(xué)業(yè)成就測驗、智力測驗、能力傾向測驗913.能力傾向測驗測被試潛在的某種能力，以了解其發(fā)展的可能性，預(yù)測個人能力發(fā)展傾向。如音樂、美術(shù)、體育、創(chuàng)造力、想象力、記憶力等方面的能力傾向測驗。4.人格測驗測被試的需要、動機、興趣、態(tài)度、氣質(zhì)、性格、人際關(guān)系等人格心理特征，較為著名的有明尼蘇達多相個性測驗（MMPI）、艾森克人格問卷（EPQR）、卡特爾16項人格因素測驗（16PF）等。3.能力傾向測驗92（三）根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。1.常模參照測驗常模參照測驗是一種衡量被試相對水平的測驗，是將被試的測驗成績與同類對象在同一測驗上的平均分（常模）相比較，從而解釋分?jǐn)?shù)，確定被試在總體中的相對位置的測驗方法。常模參照測驗要有常模對照表。常模有地區(qū)性常模和全國性常模，地區(qū)性常模只適用于特定的區(qū)域，如在城市獲得的常模就不一定適用于農(nóng)村或邊遠地區(qū)，而全國性常模適用于全國所有的同類個體。如，兒童的身高、體重就有全國性常模，中國兒童發(fā)展量表（36歲）就有全國性常模。只要我們將個體實際測量的數(shù)據(jù)與常模一對照，就可以知道個體所處的地位。（三）根據(jù)測量結(jié)果的評價標(biāo)準(zhǔn)分為常模參照測驗、目標(biāo)參照測驗。93（一）編制試題的一般原則是有順序有測量，在于指出所測量的范疇的不同并能夠按一定的順序排列。測量就是根據(jù)某種規(guī)則把所觀察的對象的屬性予以數(shù)值化的過程，以表明被測對象通過作業(yè)和活動所達到的程度或量的多少。零點是指測量的起點或參照點。它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。這個百分?jǐn)?shù)表示該實得分?jǐn)?shù)（x）的相對誤差。由于測題記分的方法不同，所以難度的估計方法也不同。優(yōu)選第十一章教育測量法性別、顏色分類、人口數(shù)、學(xué)校數(shù)；它是對相同應(yīng)試者的同一特性的兩次測量分?jǐn)?shù)的相關(guān)系數(shù)，是測量結(jié)果的一致性的指標(biāo)。表示題目難易程度的數(shù)量，稱為題目的難度指數(shù)，一般用P來表示。一個是要有確定的意義，即對同一單位來說所有人的理解是相同的；規(guī)定評分標(biāo)準(zhǔn)、分?jǐn)?shù)轉(zhuǎn)換和解釋方法等。比如長度和重量測量就是建立在以絕對的零點為參照點的基礎(chǔ)上的測量。x表示實測值，T表示真值(是未知的，可以把多次測量的實測值的平均值作為真值的近似值)，E表示誤差。如溫度攝氏30度至32度與攝氏18度至20度的溫差是相等的，都是相差2度。（二）教育測量的結(jié)果是相對的5代表“優(yōu)秀”，這時1、2、3、4、5才具有實際意義，數(shù)字按規(guī)則被賦予了意義。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。指一個主試能同時對許多被試進行的測量。如，尺是度量長度的量表，血壓計是測量血壓高低的量表，智力測驗是測量智商高低的量表。如，兒童的身高、體重就有全國性常模，中國兒童發(fā)展量表（36歲）就有全國性常模。在計算客觀題的難度時，它就是受測者在回答該題目時問渠那得清如許，_____。由專家學(xué)者或?qū)ｉT機構(gòu)采用系統(tǒng)的科學(xué)程序編制的、在測驗實施過程、評分手續(xù)、分?jǐn)?shù)的解釋上具有統(tǒng)一標(biāo)準(zhǔn)的，并對測驗誤差做了嚴(yán)格控制。題目容易編寫，容易計分。學(xué)生成績?yōu)?分，不代表其沒有能力，因而要結(jié)合質(zhì)與量。問渠那得清如許，_____。（二）順序量表（等級量表）如根據(jù)學(xué)生的測驗成績排出名次，成績最好的為1，成績次之為2，再次之為3，依次類推。也就是說，要構(gòu)建一套如何分派數(shù)字或符號的準(zhǔn)則，按準(zhǔn)則對測量內(nèi)容進行規(guī)范化、標(biāo)準(zhǔn)化的操作。如地勢高度的測量，就是以海平面為測量的起點。但是教育與心理測量中的單位往往很難達到這個要求，它遠不如其他測量中使用的單位成熟和完善。測量需要有測量的工具，測量的工具應(yīng)具有單位和參照點，并且有表示量數(shù)的方法，我們把這種工具稱之為量表。信度指統(tǒng)計量與參數(shù)之間的接近程度（三）診斷學(xué)習(xí)困難，解釋成績不良的原因通俗地說，就是根據(jù)一定的規(guī)則，給事物分派數(shù)字。量185cm高的一位運動員，也得得到1cm的絕對誤差。主要對整個測量而言。（一）編制試題的一般原則指一個主試能同時對許多被試進行的測量942.目標(biāo)參照測驗又稱標(biāo)準(zhǔn)參照測驗，是衡量被試實際水平的測驗，將被試在測驗上的分?jǐn)?shù)與事先制定好的某種標(biāo)準(zhǔn)進行比較，看

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

教育測量法培訓(xùn)課件

文檔簡介

溫馨提示

最新文檔

評論

教育測量法培訓(xùn)課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔