




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
0144《教育測量與評價》2020年6-7月期末考試指導(dǎo)一、考試說明(一)考試說明滿分為100分,考試時間為90分鐘,考試形式為閉卷。(二)包含的題型及各題型相應(yīng)的答題技巧單選題答題技巧:選擇你認(rèn)為正確的一個選項到括號里,答案與講義與課件中的知識點一致。簡答題答題技巧:答出講義與課件中的重要知識點要點即可。論述題答題技巧:答題時注意結(jié)合相關(guān)的知識點,首先找到題目對應(yīng)的知識點,再闡述自己的認(rèn)識,然后圍繞此觀點從幾方面展開論述,闡述對某一問題的認(rèn)識和看法,需要比較詳細(xì)的展開論述。二、復(fù)習(xí)重點內(nèi)容第一章教育測量與評價的學(xué)科發(fā)展1.測量的含義所謂測量,就是根據(jù)某些法則與程序,用數(shù)字對事物在量上的規(guī)定性予以確定和描述的過程測量的要素測量的量具、測量的單位和測量的參照點,是測量的三個基本要素或三個基本條件。用數(shù)字對事物在量上的規(guī)定性予以確定,就需要有一個測量或計算的起點,這個起點叫參照點。教育測量的特點(1)測量結(jié)果的間接性(2)度量單位的相對性(3)測量對象的復(fù)雜性(4)測量目的的針對性教育測量和教育評價(1)教育測量:就是針對學(xué)校教育影響下學(xué)生各方面的發(fā)展,側(cè)重從量的規(guī)定性上予以確定和描述的過程。(2)教育評價:按照一定的價值標(biāo)準(zhǔn)和教育目標(biāo),利用測量和非測量的種種方法系統(tǒng)收集資料信息,對學(xué)生的發(fā)展變化及其影響學(xué)生發(fā)展變化的各種要素進(jìn)行價值分析和價值判斷,并為教育決策提供依據(jù)的過程。(3)“評價”概念的重點在于以教育目標(biāo)為標(biāo)準(zhǔn)的價值判斷。(4)教育評價的特點包含如下幾個共同的要點:第一,強調(diào)以教育目標(biāo)為標(biāo)準(zhǔn)的價值判斷過程。第二,強調(diào)用多種方法(測量和非測量)系統(tǒng)收集資料與信息。第三,教育評價的內(nèi)容既可以是教育計劃,也可以是課程;既可以是學(xué)生的學(xué)習(xí)結(jié)果,也可以是某種教育現(xiàn)象、教學(xué)活動、教育目的或教育程序。第四,強調(diào)為學(xué)生發(fā)展和教育決策服務(wù)。“行為目標(biāo)評價模式”和“當(dāng)代教育評價之父”美國心理學(xué)家桑代克的論著《精神與社會測量導(dǎo)論》一書,首次較系統(tǒng)地介紹了教育統(tǒng)計方法及編制測驗的基本原理,標(biāo)志著教育測量理論的誕生。泰勒在1940年的“八年研究”報告書中,首次提出“教育評價”的概念,被稱為“當(dāng)代教育評價之父”。第二章教育測量與評價的類型和功能教育測量與評價的類型(1)按測評在教學(xué)中運用的時機分類:形成性測量與評價、診斷性測量與評價、終結(jié)性測量與評價。診斷性測量與評價是對經(jīng)常表現(xiàn)出學(xué)習(xí)困難的學(xué)生所做的測量與評價,它的目的是對個人的問題行為及其原因進(jìn)行診斷。(2)按解釋測評結(jié)果時的參照點分類:常模參照測量與評價、標(biāo)準(zhǔn)參照測量與評價、潛力參照測量與評價。常模參照測量與評價是將被試水平與測驗常模相比較,以評價被試在團體中的相對地位的一種測量與評價類型。潛力參照測量與評價,是將被試實際水平與其自身潛在水平(潛力)相比較,以評價被試有無充分發(fā)揮自身潛力為目的。(3)按測量與評價的內(nèi)容分類:智力測量與評價、能力傾向測量與評價、成就測量與評價、人格測量與評價。成就測量與評價常見的有兩種類型:一是學(xué)科成就測驗,旨在測量與評價被試在某一科目上的學(xué)習(xí)成就;二是綜合成就測驗,旨在測量與評價被試在多個學(xué)科或綜合學(xué)科上的學(xué)習(xí)成就。人格測量與評價也稱為個性測量與評價,其目的在于測量與評價被試的人格心理特征,諸如氣質(zhì)、性格、興趣、態(tài)度、動機、適應(yīng)性等方面的心理特征。(4)按照測量與評價被試行為表現(xiàn)的性質(zhì)分類:最佳行為測量與評價、典型行為測量與評價。(5)其它分類:按測量對象可分為個別測量與評價和團體測量與評價;按測驗材料可分為文字測驗和非文字測驗;按量具的標(biāo)準(zhǔn)化程度可分為標(biāo)準(zhǔn)化測驗和非標(biāo)準(zhǔn)化測驗。非文字測驗的內(nèi)容是通過圖形、儀器、工具、實物、模型等形式表現(xiàn)的,被試通過指認(rèn)、手工操作向主試提供答案,所以也稱為操作測驗。標(biāo)準(zhǔn)化測驗是指由測量專家嚴(yán)格按照測驗編制程序而編成的一種測驗。教育測量與評價的主要功能(1)實現(xiàn)教育判斷的功能教育測量與評價的最基本、最原始、最現(xiàn)實、最普遍的功能,就是實現(xiàn)教育判斷。教育測量與評價具有測量評定的功能,是因為這種判斷過程不是主觀隨意的。問題判斷的功能,如對學(xué)生學(xué)習(xí)困難的診斷;對學(xué)生心理問題的診斷;對兒童智力發(fā)展的診斷;對教師教學(xué)問題的診斷;對課程設(shè)置、課程計劃、課程實施的診斷;對教育管理機制的診斷;對辦學(xué)問題的診斷等。由于教育測量與評價具有問題診斷的功能。(2)改進(jìn)教師教學(xué)的功能(3)促進(jìn)學(xué)生學(xué)習(xí)的功能主要體現(xiàn)在如下幾個方面:①激勵學(xué)生的學(xué)習(xí)動機②幫助學(xué)生的記憶和促進(jìn)遷移③促進(jìn)學(xué)生自我評價。(4)行使教育管理的功能教育測量與教育評價概念辨析教育評價最根本的特征是做出價值判斷。而教育測量過程的完結(jié),在給出數(shù)量事實的描述與判斷之后,不一定都要做出價值判斷。教育測量是教育評價的基礎(chǔ);而教育評價往往是教育測量過程的延續(xù),是對測量結(jié)果的解釋與應(yīng)用。第三章教育測量與評價的質(zhì)量特性衡量測驗質(zhì)量的四個指標(biāo)從教育測量的理論上來講,一個良好的測驗應(yīng)該具備恰當(dāng)?shù)碾y度和區(qū)分度,具備較高的信度和效度,也就是說,測驗的信度、效度、難度和區(qū)分度是衡量測驗質(zhì)量的基本指標(biāo)。其中,前兩個指標(biāo)主要是對整個測驗而言,后來兩個指標(biāo)主要是對測量的項目而言。?信度(reliability)簡單地說就是測量結(jié)果的可信程度,指的是測量結(jié)果的穩(wěn)定性程度,記為rxx。具體地說,測驗的信度是指同一組學(xué)生用同一測驗實施兩次后所得分?jǐn)?shù)的一致性,或者同一組學(xué)生經(jīng)過一次測驗后,用另一個同質(zhì)的測驗再測一次,這兩次測驗所得分?jǐn)?shù)的一致性。估算測驗的信度有三種方法:重測信度、復(fù)本信度、同質(zhì)性信度。?效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度,亦即測量是否達(dá)到了預(yù)期的目的,理解為測量的結(jié)果正確反映所欲測量的特性或功能的程度。效度分為三大類:內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和結(jié)構(gòu)效度。內(nèi)容效度是指測驗?zāi)康拇硭麥y量的內(nèi)容和引起預(yù)期反應(yīng)所達(dá)到的程度。預(yù)測效度是指測驗與將來的效標(biāo)之間的關(guān)聯(lián)程度。所謂結(jié)構(gòu)效度,是指一個測量能實際測量出理論上的構(gòu)念或心理特性的程度。不同的測驗對效度系數(shù)有不同的要求。例如,智力測驗分?jǐn)?shù)與教師對學(xué)生的等級評定之間的效度系數(shù)一般在0.30?0.50的范圍內(nèi);兩種不同的智力測驗或標(biāo)準(zhǔn)測驗之間的相關(guān)系數(shù)應(yīng)達(dá)到0.60—0.80,才能符合要求。?難度是指測驗的難易程度,是試題對學(xué)生知識和能力水平的適合程度的指標(biāo)。在教育測量中,某測驗的難度一般是用正確解答該測驗題的人數(shù)與參與測驗的學(xué)生數(shù)的比值來刻畫的。用公式表示即:P=R/N,其中,P表示某測驗題的難度,R表示答案對該測驗題的人數(shù),N表示參加測驗的人數(shù)。測驗題目的難度必須根據(jù)測驗的目的確定和評價。難度是試題對學(xué)生知識和能力水平的適合程度的指標(biāo),是由參與測量的被試群體的整體水平?jīng)Q定的。?區(qū)分度,又叫鑒別力,是指測驗對考生實際水平的區(qū)分程度,用符號D表示。區(qū)分又分為正區(qū)分(D〉0)、零區(qū)分(D=0)和負(fù)區(qū)分(D〈0),正區(qū)分又稱積極區(qū)分,負(fù)區(qū)分又稱消極區(qū)分。所謂正區(qū)分是指實際水平高的考生得了高分,實際水平低的考生得了低分;信度的估算方法根據(jù)統(tǒng)計學(xué)的基本原理,估算測驗的信度有三種方法:重測信度、復(fù)本信度和同質(zhì)性信度。重測信度也叫穩(wěn)定性系數(shù),它指的就是用同一量表(測驗或評價表)對同一組被試施測兩次所得結(jié)果的一致程度,其大小等于同一組被試在兩次測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。一般而言,時間間隔越長,可能由于被試的身心成長發(fā)展、遺忘、施測情境改變等因素,而容易使信度降低。重測信度適用于速度測驗而不適用于難度測驗。所謂異質(zhì)性測驗就是說一個測驗包括幾個不同的部分,這幾個部分分別測量幾個不同的心理特質(zhì),它們之間可能并不存在相關(guān)或相關(guān)較低。所謂復(fù)本測驗是指在試題格式、題數(shù)、難度、指導(dǎo)語說明、施測要求等方面都相當(dāng),并且都用來測量相同潛在特質(zhì)或?qū)傩?,但試題又是不相同的測驗。復(fù)本測驗也稱作平行測驗。復(fù)本信度指的是兩個平行測驗測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的相關(guān)系數(shù)。同質(zhì)性信度也叫內(nèi)部一致性信度,它是指測驗內(nèi)部所有題目間的一致性程度。分半信度的計算方法和等值復(fù)本信度的方法類似,必須用斯皮爾曼一布朗公式加以校正:rxx=2rhh/(l+rhh)式中,rxx為整個測驗的信度系數(shù);rhh為兩個“半測驗”上得分的相關(guān)系數(shù)。注意:由于對實施指導(dǎo)語的錯誤理解,對答案紙的錯劃,時間記錄的錯誤以及一些不能預(yù)見的干擾等,都會產(chǎn)生誤差。對一組被試實施測驗不是同一個主試,而是由很多的主試實施,以及主試本身在安排測驗上有較多的余地,這些也會引起誤差。此外,記分也會產(chǎn)生誤差,如論文式的測驗和其他自由反應(yīng)的測題格式,記分就很難做到完全客觀,從而產(chǎn)生誤差。提高測驗信度的方法(l)適當(dāng)增加測驗題目的數(shù)量;(2)測驗的難度要適中(測驗的難度適中,能使測驗的信度達(dá)到最大,也能使測驗的區(qū)分度達(dá)到最大,所以,必須使測驗的難度適中);(3)測驗的內(nèi)容應(yīng)盡量同質(zhì);(4)測驗的程序應(yīng)統(tǒng)一;(5)測驗的時間要充分;(6)評分要盡量做到客觀化、減少評分誤差;(7)應(yīng)試者參加測驗的動機水平、積極性、疲勞程度也會影響測驗分?jǐn)?shù),從而影響信度。引起應(yīng)試者參加測驗的強烈動機,提高其積極性,使其保持旺盛的精力,都對提高測驗信度有一定作用。信度和效度的關(guān)系在效度和信度之間,首先要重點保證是高效度,因為,高效度必然高信度;反之,則不然。特別是對于教育測量而言,效度問題顯得更為重要。在處理信度與效度的關(guān)系問題上,首先要保證高的效度。因為,高效度必然高信度;反之,則不然。信度是效度的必要條件。雖然信度高的測驗效度不一定高,但效度高的測驗,信度卻一定比較高。效度和信度的關(guān)系是:效度的最大值等于信度的平方根。難度(1)難度對測驗的影響:影響測驗分?jǐn)?shù)的分布狀態(tài)、影響測驗分?jǐn)?shù)的離散程度、影響測驗的鑒別能力。難度值過大或過小,都會造成測驗分?jǐn)?shù)的偏態(tài)分布。難度值越接近0,測驗的難度就越大,正確回答試題的人數(shù)就越少,測驗分?jǐn)?shù)就越是集中在低分段,其分?jǐn)?shù)分布呈正偏態(tài)。測驗難度直接影響測驗分?jǐn)?shù)的離散程度,因為難度過大或過小,測驗分?jǐn)?shù)的分布都呈偏態(tài)分布,亦即測驗分?jǐn)?shù)都分布在高分段或低分段,這樣,測驗分?jǐn)?shù)的離散程度就變小了。適中的難度可使試題的區(qū)分度達(dá)到最大。(2)影響題目難度的因素:考查知識點的多少、考查能力的復(fù)雜程度或?qū)哟蔚母叩汀⒖忌鷮︻}目的熟悉程度、命題的技巧、利用經(jīng)驗判斷或者通過預(yù)測調(diào)整難度。對于其他類型的測驗,目的不同對難度的要求也不同。區(qū)分度與測驗信度、難度的關(guān)系(1)區(qū)分度與信度的關(guān)系:提高區(qū)分度可以達(dá)到理想的測驗信度。(2)區(qū)分度與難度的關(guān)系:難度適中,可使區(qū)分度達(dá)到最大值。難度為1時,區(qū)分度為0。第四章編制教育測驗的一般原理與方法1.測驗題目基本上分為兩大類:選擇型和供答型。前者一般要求被試在幾個選項中選擇正確的答案,如是非題、匹配題、選擇題等,后者要求被試自己提供答案,如論文題、簡答題、填空題等。根據(jù)被試作答的范圍和評分方法不同,測驗題目又可分為主觀性試題和客觀性試題。在編制配合題時,相對于選項而言,題干的詞語應(yīng)較長些。并且每一試題的配對數(shù)目不能超過10個,通常以4到7個配對數(shù)目最為合適。填空題可用來考查被試對知識的記憶和理解能力,在診斷性測驗中特別適用。布盧姆的教育目標(biāo)分類布盧姆等人首先把教育目標(biāo)分為認(rèn)知、情感和動作技能三個領(lǐng)域。認(rèn)知領(lǐng)域的目標(biāo)分類布盧姆將認(rèn)知領(lǐng)域的目標(biāo)分為六個類別,按照由低級到高級的難易程度形成一種遞進(jìn)的等級關(guān)系,前一類別是后一類別的基礎(chǔ),后一類別又涵蓋了前面的類別。(1)知識/知道。這是最低等級的認(rèn)知目標(biāo)。此處的知識是指對具體事物和普遍原理的回憶,對方法和過程的回憶,或者對一種模式、結(jié)構(gòu)或框架的回憶。(2)領(lǐng)會。這是最低層次的理解,指個人把某種材料與其他材料聯(lián)系起來,也不必弄清它的最充分的含義,便知道正在交流什么,并能夠運用正在交流的這種材料和觀點。(3)運用。運用是指將抽象概念用于特定、具體的情境。這些抽象的概念,可能是以一般的觀念、程序的規(guī)則或概括化的方法等形式表現(xiàn)出來的,也可能是那些必須記住、能夠?qū)iT運用的原理、觀念和理論。(4)分析。分析是指把材料分解成各個組成部分,弄清各部分之間的相互關(guān)系及其構(gòu)成的方式,以指出那些用來傳遞意義或確定交流結(jié)果的技術(shù)和手段。(5)綜合。綜合是指將各種要素和組成部分組合起來,以形成一個整體。它是對各種要素和組成部分等進(jìn)行加工的過程,是一個用這種方式將它們組合起來,以構(gòu)成一種原先不那么清楚的模式或結(jié)構(gòu)的過程。(6)評價。評價是指為了某種目的,對觀念、作品、答案、方法和資料的價值及符合準(zhǔn)則的程度作定量和定性的判斷。情感領(lǐng)域的目標(biāo)分類(1)接受(2)反應(yīng)(3)價值評價(4)組織(5)由價值或價值復(fù)合體形成的性格化,是情感領(lǐng)域教育目標(biāo)的最高境界。表述得當(dāng)?shù)慕逃繕?biāo)必須符合下列要求:(1)以學(xué)生為行為主體。如“培養(yǎng)學(xué)生的能力”、“促進(jìn)學(xué)生技能的提高”這樣的目標(biāo)表述是不恰當(dāng)?shù)模?)表述明確、具體(3)反映學(xué)習(xí)結(jié)果的層次性(4)表達(dá)教育工作者的意圖確立教育目標(biāo)的原則(1)服務(wù)性原則(2)適應(yīng)性原則(3)層次性原則(4)階段性原則(5)可測性原則對于標(biāo)準(zhǔn)化測驗而言,編制測驗的最后一步,就是編寫測驗說明書,也稱作測驗手冊。第五章教育測驗的常模及其建立方法數(shù)據(jù)的種類(1)按照數(shù)據(jù)的來源分,可將數(shù)據(jù)分為點計數(shù)據(jù)和度量數(shù)據(jù)度量數(shù)據(jù)是指用一定的工具或一定的標(biāo)準(zhǔn)測量所獲得的數(shù)據(jù)。例如,用某種智力測驗測得學(xué)生智商的數(shù)據(jù),用某學(xué)科測驗獲得學(xué)生該科知識、能力情況的數(shù)據(jù),用米尺測得學(xué)生身高的數(shù)據(jù)。(2)按照數(shù)據(jù)的連續(xù)與否,可將數(shù)據(jù)分為間斷性數(shù)據(jù)和連續(xù)性數(shù)據(jù)取值個數(shù)無限的(不可數(shù)的)數(shù)據(jù),稱為連續(xù)型隨機變量的數(shù)據(jù)。學(xué)生的身高、體重、智商、用百分制分?jǐn)?shù)表示的學(xué)科成績等,都屬于連續(xù)型隨機變量的數(shù)據(jù)。(3)按照數(shù)據(jù)的精確性程度,可將數(shù)據(jù)分為類別數(shù)據(jù)、等級數(shù)據(jù)、等距數(shù)據(jù)和比率數(shù)據(jù)。等距變量具有等級變量的特征,還要求連續(xù)數(shù)量之間的差距相等,亦即具有相等的單位。因此,等距變量可以作加減運算,不能作乘除運算(因為等距變量并沒有絕對零點)。教育測量數(shù)據(jù)的特點(1)教育科學(xué)研究中絕大部分?jǐn)?shù)據(jù)屬于等級變量,可以比較大小,不能加減更不能乘除。(2)教育測量的多數(shù)數(shù)據(jù)從本質(zhì)上說是主觀的。(3)教育測量的數(shù)據(jù)還具有隨機性。(4)教育測量的數(shù)據(jù)也具有模糊性。加權(quán)求和權(quán)重是指各分變量在總變量中所占的比例或比重的大小。加權(quán)求和是將各次測量的結(jié)果按照一定的權(quán)重相加,采用所得結(jié)果作出判斷。根據(jù)權(quán)重的不同可分為下列幾種情況。(1)等權(quán)相加等權(quán)求和是加權(quán)求和的一種特殊情況,它是將各變量(題目、分測驗或測驗)的得分直接相加而獲得一個合成分?jǐn)?shù)。(2)加權(quán)求和(3)多科測驗分?jǐn)?shù)加權(quán)平均的標(biāo)準(zhǔn)化一個與被試同類的團體在相同測驗上得分的分布狀況與結(jié)構(gòu)模式,成為常模。測驗的常模可分成兩類,一是發(fā)展常模,二是組內(nèi)常模。發(fā)展常模有年級常模和年齡常模之別。所謂年級常模,就是不同年級學(xué)生在某種測驗上的正常的一般的表現(xiàn)水平。常模參照測驗與標(biāo)準(zhǔn)參照測驗在教育與心理測驗中,可依據(jù)解釋測驗分?jǐn)?shù)的參照點不同,把測驗分成常模參照測驗和標(biāo)準(zhǔn)參照測驗。即參照測驗的常模,對測驗的分?jǐn)?shù)進(jìn)行解釋與評價的測驗,稱為常模參照測驗;參照測驗的“標(biāo)準(zhǔn)”,對測驗的分?jǐn)?shù)進(jìn)行解釋與評價的測驗,稱為標(biāo)準(zhǔn)參照測驗。百分等級常模百分等級是一個地位量數(shù),能夠反映某個測驗分?jǐn)?shù)在一個次數(shù)據(jù)中的相對地位。它是把學(xué)生的原始分?jǐn)?shù)放在該學(xué)生所在群體的成績中進(jìn)行比較,以確定該學(xué)生在群體中的相對地位之高低。百分等級常模就是基于某個常模團體,為某種測驗的原始分?jǐn)?shù)與百分等級之間建立起對應(yīng)關(guān)系的組內(nèi)常模類型。標(biāo)準(zhǔn)分?jǐn)?shù)常模標(biāo)準(zhǔn)分?jǐn)?shù)是以標(biāo)準(zhǔn)差為單位表示測驗成績與平均分?jǐn)?shù)之間的距離標(biāo)準(zhǔn)分?jǐn)?shù)的使用是基于常模數(shù)據(jù)服從正態(tài)分布的假設(shè)。標(biāo)準(zhǔn)分?jǐn)?shù)本身是關(guān)于原始分?jǐn)?shù)的一種線性變換,因此,標(biāo)準(zhǔn)分?jǐn)?shù)Z分?jǐn)?shù)不改變原始分?jǐn)?shù)的分布形態(tài)。標(biāo)準(zhǔn)分?jǐn)?shù)Z分?jǐn)?shù)具有較好的可比性和可加性。在現(xiàn)行試點使用的高考標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換方案中,一律采用正態(tài)化轉(zhuǎn)換方案。教育測量量表分類按照測量的精確程度,將測量量表從低到高分為稱名量表、順序量表、區(qū)間量表/等距量表和比率量表。等距變量等距變量具有等級變量的特征,還要求連續(xù)數(shù)量之間的差距相等,亦即具有相等的單位。因此,等距變量可以作加減運算,不能作乘除運算(因為等距變量并沒有絕對零點)。測驗藍(lán)圖的設(shè)計一般采取的步驟測驗的藍(lán)圖一般用反映測驗內(nèi)容和學(xué)習(xí)水平的命題雙向細(xì)目表表示。設(shè)計測驗藍(lán)圖主要采用以下步驟:(1)確定測驗內(nèi)容要目。如何確定測驗內(nèi)容要目,必須依據(jù)課程標(biāo)準(zhǔn)或教學(xué)大綱、教學(xué)目標(biāo)和學(xué)生的實際而定。(2)確定該科目應(yīng)考查的目標(biāo)層次。把這些目標(biāo)層次從低級到高級依次安排在表中頂端第一行的有關(guān)格上。(3)確定各項測驗內(nèi)容要目下的權(quán)重。根據(jù)課程標(biāo)準(zhǔn)或教學(xué)大綱所規(guī)定的教學(xué)時間和分配比例,以及測驗性質(zhì)和其他因素,對列入測驗范圍的內(nèi)容要目或內(nèi)容點,賦以合適的相對比重即權(quán)重。該比重是測驗試題數(shù)量、測驗時間、分?jǐn)?shù)分配的依據(jù)。(4)形成命題雙向細(xì)目表。把每一項考試內(nèi)容的分?jǐn)?shù)比重逐一分配到若干必要的測驗?zāi)繕?biāo)層次上去,形成網(wǎng)格狀的分?jǐn)?shù)分配方案,即命題雙向細(xì)目表。第六章教育測驗的標(biāo)準(zhǔn)及其建立方法教育測驗標(biāo)準(zhǔn)的含義教育測驗的“標(biāo)準(zhǔn)”指的是教育測驗的成就標(biāo)準(zhǔn),它對于編制標(biāo)準(zhǔn)參照測驗以及解釋標(biāo)準(zhǔn)參照測驗的分?jǐn)?shù)具有重要的意義。領(lǐng)域參照測驗是建立在一套完善的題目匯編或內(nèi)容領(lǐng)域規(guī)范匯編基礎(chǔ)上用以檢查被試的素質(zhì)及發(fā)展水平的測驗。正確百分?jǐn)?shù)正確百分?jǐn)?shù)是以學(xué)生在標(biāo)準(zhǔn)參照測驗中答對題目的比例來解釋測驗分?jǐn)?shù)或描述學(xué)生取得成就的方法。計算公式為:正確百分?jǐn)?shù)=答對題目數(shù)/總題目數(shù)X100第七章制定教育評價表的一般方法和步驟教育評價表教育評價表是根據(jù)教育教學(xué)的特性編制而成的,它由評價指標(biāo)、評價項目(條目)、評價標(biāo)準(zhǔn)、評定等級、指標(biāo)權(quán)重等構(gòu)成。它是進(jìn)行教育測量與評價的工具,為了使評價的結(jié)果更為可靠,需要對教育評價表進(jìn)行更深入的研究。制定教育評價標(biāo)的原則(1)科學(xué)性與導(dǎo)向性原則所謂科學(xué)性和導(dǎo)向性原則是指所建立的指標(biāo)和標(biāo)準(zhǔn)必須能反映教育的發(fā)展目標(biāo)和教學(xué)的客觀規(guī)律,找出影響和制約教育教學(xué)的關(guān)鍵性因素。(2)完備性與獨立性原則(3)發(fā)展性與整體性原則(4)操作性與可測性原則(5)可行性與可比性原則(6)超前性與持續(xù)性原則教育評價表的構(gòu)成要素(1)評價指標(biāo):就是根據(jù)評價的目標(biāo),由評價指標(biāo)的設(shè)計者分解出來的,能夠反映評價對象某方面本質(zhì)特征的具體化、行為化的主要因素,是對評價對象進(jìn)行價值判斷的依據(jù)。(2)指標(biāo)權(quán)重:就是表示每項評價指標(biāo)在指標(biāo)體系中所占的重要性程度,并賦予相應(yīng)的值,這個數(shù)值就叫做對應(yīng)指標(biāo)的權(quán)數(shù),或叫做權(quán)重。(3)評價標(biāo)準(zhǔn):衡量評價對象達(dá)到評價指標(biāo)要求的尺度,是由強度和頻率、標(biāo)號、標(biāo)度三個要素構(gòu)成。強度是指指標(biāo)達(dá)到項目要求的程度或各種規(guī)范行為的優(yōu)劣程度,又稱定性標(biāo)準(zhǔn)。例如,在等級評定中,達(dá)到什么要求評為好、較好、一般或差,都要有一定的規(guī)定。評價標(biāo)準(zhǔn)一般確定3—5個等級為宜。提出初擬評價指標(biāo)的方法主要有以下幾種:(1)頭腦風(fēng)暴法(2)因素分解法。因素分解法是一種將評價指標(biāo)按照評價對象本身的邏輯結(jié)構(gòu)逐級進(jìn)行分解,把分解出來的主要因素作為評價指標(biāo)的方法。(3)理論推演法(4)典型研究法期望評語式編寫法這種編寫方法是指根據(jù)理想的要求,將評價指標(biāo)體系的末級指標(biāo)分為若干因素,又將每一個因素分為若干個等級,每個等級編制相應(yīng)的期望評語。6.在評價中,根據(jù)所獲信息的性質(zhì)來分,調(diào)查又可分為:證實性調(diào)查、疑問性調(diào)查、評估性調(diào)查與經(jīng)驗性調(diào)查四種類型。評估性調(diào)查則要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷。第八章學(xué)生評價學(xué)生評價概述學(xué)生評價的類型按照在課堂教學(xué)活動中的作用,學(xué)生評價又有:定位性評價、形成性評價、診斷性評價與總結(jié)性評價等多種類型。(1)定位性評價:又稱安置性評價、預(yù)備性評價,主要是在特定的教學(xué)活動之前,判斷學(xué)生的前期準(zhǔn)備。在這種評價里面要解決的問題是學(xué)生是否已經(jīng)掌握了參加預(yù)定活動所需要的知識和技能,在多大程度上已經(jīng)達(dá)到教學(xué)目標(biāo),學(xué)生的興趣等基本情況等等。(2)形成性評價:主要是指不斷地反映學(xué)生學(xué)習(xí)成功或者是失敗的信息,特別注重強化學(xué)生學(xué)習(xí)的成功之處,顯示學(xué)生學(xué)習(xí)過程中需要改進(jìn)的具體的錯誤。(3)診斷性評價:診斷性評價對學(xué)生的學(xué)習(xí)進(jìn)行進(jìn)一步的評價,對于學(xué)習(xí)中錯誤的深層診斷。(4)總結(jié)性評價:在某個期末教師對學(xué)生的測驗和評價。對教學(xué)目標(biāo)達(dá)到程度的判斷,同時也提供教學(xué)目標(biāo)適當(dāng)性和教學(xué)策略有效性的信息。現(xiàn)代學(xué)生評價的特點(1)強調(diào)了評價功能的形成性現(xiàn)代教育評價的目的中強調(diào)參與和推動教育的發(fā)展?,F(xiàn)代的學(xué)生評價,主要是用來診斷問題,改進(jìn)教育,其目的則是創(chuàng)造適合兒童的教育。對評價形成性功能的重視又反過來是現(xiàn)代教育評價發(fā)展的一個重要動因。(2)重視評價內(nèi)容的全面性教育工作者要求評價須全面地反映教育目標(biāo),對學(xué)生認(rèn)知、情感以及動作技能的發(fā)展做出全面的評價,以促進(jìn)學(xué)生的全面發(fā)展。因而,評價活動對教育活動能提供更大的幫助。(3)重視評價類型的多樣性根據(jù)現(xiàn)代教育的需要,現(xiàn)代教育評價注意為教育提供全方位的服務(wù),逐步地發(fā)展了包括定位性評價、形成性評價、診斷性評價在內(nèi)的多種評價。這種多樣性的評價,在學(xué)校教育的不同階段提供不同的評價服務(wù),使得評價在推動教育的發(fā)展中能起到越來越大的作用。學(xué)生評價的原則現(xiàn)代學(xué)生評價的原則,是在現(xiàn)代教育評價觀指導(dǎo)下對評價工作者的要求;評價的基本步驟則是根據(jù)這一評價觀提出的操作程序。掌握現(xiàn)代教育評價的原則與步驟,對正確地開展評價具有重要意義。學(xué)生評價的基本原則:(1)發(fā)展性原則。學(xué)生評價要圍繞學(xué)生的發(fā)展,為學(xué)生的發(fā)展服務(wù),這是發(fā)展性原則的核心思想。(2)全面性原則。學(xué)生評價要緊扣教育目標(biāo),全面地反映教育目標(biāo)。學(xué)生評價不全面,必然會把學(xué)校教育引向片面。(3)明確性原則。評價的目的要明確,評價的要求也要明確,這是明確性原則的基本涵義。(4)過程性原則。學(xué)生評價作為促進(jìn)學(xué)生發(fā)展的工具,要貫穿學(xué)生學(xué)習(xí)活動的全過程。要充分利用定位性評價、形成性評價、診斷性評價與總結(jié)性評價的不同功能,在學(xué)生學(xué)習(xí)的各個過程提供各種不同類型的評價服務(wù)。課業(yè)考評所謂課業(yè)考評,是指對學(xué)生的課程學(xué)業(yè)所取得的發(fā)展進(jìn)步進(jìn)行考核評價。在課業(yè)考評過程中,考試是最基本也是最常用的一種測量與評價手段。課業(yè)考評對學(xué)生發(fā)展起的作用:課業(yè)考評對促進(jìn)學(xué)生發(fā)展起著重要的作用,尤其是以現(xiàn)代教育理念和教育評價理論為指導(dǎo)而建立起來的課業(yè)考評制度與方法。首先,合理的課業(yè)考評制度為學(xué)生發(fā)展提供較明確的目標(biāo)和努力的方向。確立教育目標(biāo),這不僅是現(xiàn)代教育評價活動的起點,而且是現(xiàn)代課程教學(xué)活動的重要特點,它在教學(xué)過程中起著重要作用。其次,合理的課業(yè)考評制度將有助于評價學(xué)生的發(fā)展進(jìn)步,從而對教與學(xué)雙方活動起著重要的控制、調(diào)節(jié)和促進(jìn)等作用。再次,課業(yè)考評為學(xué)生心理發(fā)展和學(xué)習(xí)進(jìn)步創(chuàng)造必要的背景和空間,誘發(fā)學(xué)生的學(xué)習(xí)動機和自主發(fā)展的動力。最后,課業(yè)考評在中小學(xué)生個體社會化進(jìn)程中起著控制、調(diào)節(jié)、促進(jìn)和加速的作用。檔案袋評價法檔案袋評價是“教師依據(jù)教學(xué)目標(biāo)與計劃,請學(xué)生持續(xù)一段時間主動收集、組織與省思學(xué)習(xí)成果的檔案,以評定其努力、進(jìn)步、成長情形”的一種評價方法。目前正在進(jìn)行的課程改革對教育評價的要求是“建立促進(jìn)學(xué)生全面發(fā)展的評價體系。對學(xué)生的評價不僅要關(guān)注學(xué)生的學(xué)業(yè)成績,而且要注重發(fā)現(xiàn)和發(fā)展學(xué)生多方面的潛能,了解學(xué)生發(fā)展中的需求,幫助學(xué)生認(rèn)識自我,建立自信。”學(xué)生認(rèn)知過程基本能力發(fā)展的測量與評價認(rèn)知過程涉及心理過程的全部范圍,但觀察能力、記憶能力、思維能力和想象能力是其中的四種基本能力。?觀察是一種有目的、有計劃、持久的知覺活動,是知覺的高級形態(tài)。?想象是在原有的感性材料基礎(chǔ)上,經(jīng)過重組聯(lián)合等加工改造而創(chuàng)造出新形象的活動。想象按其目的性、意識性的程度,可以分為無意想象和有意想象兩種。想象過程,按照創(chuàng)造性的程度不同,可分為再造想象和創(chuàng)造想象。想象能力的測量與評價方法測量與評價學(xué)生的想象能力,大致有兩類常用的方法:一是作品分析評價法;二是心理測驗評價法。作品分析評價法:常見的有作圖法、完成法、課堂作業(yè)觀察評估法人格人格即指人與社會性聯(lián)系最為密切的心理特質(zhì)的總和。人格特征可以是外在的,也可以是隱藏在內(nèi)部的。人格的形成是由先天的遺傳因素和后天的環(huán)境和教育因素相互作用的結(jié)果。人格是在先天遺傳因素的自然基礎(chǔ)上形成和發(fā)展的,又主要由個體的生活史所決定,它受社會歷史條件的影響。人格有其不同的側(cè)面,通常包括:氣質(zhì)、性格、適應(yīng)性、興趣、態(tài)度等,所以說人格很重要的方面是自我與現(xiàn)實之間的和諧,以及自我和理想的自我之間的和諧。(1)氣質(zhì)。氣質(zhì)是每個人獨特的行為心理特征,它決定于人的高級神經(jīng)活動,是人格形成的心理基礎(chǔ)。人們常常把氣質(zhì)分為四種典型的氣質(zhì),即:膽汁質(zhì)、多血質(zhì)、粘液質(zhì)、抑郁質(zhì)。膽汁質(zhì)的人的特點:興奮和抑制反差大,是不均衡型。多血質(zhì)的人的特點:興奮和抑制是平衡型。屬于多血質(zhì)的人反應(yīng)迅速,有靈活性,性情活潑,較善于交際,語言流利,易適應(yīng)環(huán)境,情緒不穩(wěn)定,注意力易轉(zhuǎn)移,較粗枝大葉。自陳量表法,也稱問卷測驗法,多是以被試提供關(guān)于自己人格特征的自我報告的形式出現(xiàn),所以稱為自陳量表,是人格測驗最常用的方式。人格測驗的種類繁多,不同類型的測驗有不同的測驗?zāi)康?,適應(yīng)不同的年齡范圍,各自描述不同方面的人格功能,也各有利弊。在現(xiàn)代社會中,具有健康人格的學(xué)生具有的特征:在現(xiàn)代社會中,青少年學(xué)生所具有的健康人格應(yīng)是:能客觀地認(rèn)識自我和外部世界;情感和態(tài)度上是開放的;對所承擔(dān)的學(xué)習(xí)和其他活動有勝任感;充分發(fā)揮自己潛能;對父母、朋友有顯示愛的能力;有安全感;喜歡創(chuàng)造;有能力管理自己的生活;有責(zé)任感等。課業(yè)考評存在的問題近幾年來,校內(nèi)考試制度與方法有許多重要的改進(jìn),但就學(xué)校教育整體來看,課業(yè)考評仍存在一些較嚴(yán)重的問題,主要表現(xiàn)在如下幾個方面:首先,課業(yè)考評指導(dǎo)思想與學(xué)校教育理念、目標(biāo)不相適應(yīng),在考試設(shè)計及考試結(jié)果的使用過程中過分強調(diào)區(qū)分和選拔功能。許多學(xué)校的教育人員還常常利用考分去夸大學(xué)生之間的差異和許多低考分學(xué)生的弱點,并把低考分的學(xué)生列為差生或落后生,使其蒙受許多羞辱。在這樣一種以考試為導(dǎo)向的教學(xué)及其評價模式中,學(xué)生從小學(xué)開始便經(jīng)常接受考試的磨練,自覺不自覺地把學(xué)習(xí)的注意點和動機幾乎全押在考試之上。可以想到,在學(xué)生成長過程中,一旦有些個體在考試歷程中屢遭挫折和失敗,這意味著激烈競爭的現(xiàn)實在學(xué)校中是以考試作為唯一標(biāo)準(zhǔn)對他們進(jìn)行淘汰,也意味著現(xiàn)實教育價值觀體系及學(xué)校教育實踐對他們的否定,更意味著教育追求和教育模式在這些學(xué)生個體身上的失效。更令人痛心與不安的是,考試失敗給這些學(xué)生帶來“少年新煩惱”及意志消沉,而且他們還常因影響所在學(xué)校的升學(xué)率而遭一些人的嫌棄。所有這些極端的現(xiàn)象,與學(xué)校教育的理念、目標(biāo)尤其是與基礎(chǔ)教育的性質(zhì)及要求是格格不入的。其次,課業(yè)考評方法單一,把考試的教育功能簡單化,考試的評定功能絕對化。長期以來,許多學(xué)校把書面考試作為學(xué)生課業(yè)和心智發(fā)展的唯一測評手段,而且考試設(shè)計和考試方法多局限于那些能夠用紙筆材料加以測評的知識技能,對于那些沒被測到的或者難以用紙筆測到高級心智技能,則在日常教學(xué)中不夠重視。這無形中強化了“分?jǐn)?shù)至上”的人才評價觀,使教師、學(xué)生乃至家長都在為高分而努力;使學(xué)校的課程內(nèi)容變得更加狹窄,考試和教學(xué)關(guān)系異化;考試其他種種積極的教育功能受到弱化,背離了基礎(chǔ)教育所應(yīng)秉持的教育理念。再次,課業(yè)考評抽象化和表征化。長期以來,學(xué)校課業(yè)考評只重視考試結(jié)果量化的分?jǐn)?shù)表達(dá),不重視分析研究每個學(xué)生的試卷,不重視學(xué)習(xí)過程和發(fā)展進(jìn)步在質(zhì)性方面的描述評價;只重視對認(rèn)知領(lǐng)域可測性內(nèi)容的考試測量,忽視了學(xué)校教育目標(biāo)的廣泛性和學(xué)習(xí)內(nèi)容的豐富;只重視用抽象概括化的考分來評價學(xué)生的學(xué)習(xí)結(jié)果,不重視采用多種方法對學(xué)生發(fā)展進(jìn)步作實質(zhì)性的描述評價;只注意學(xué)習(xí)的共性目標(biāo),不重視對學(xué)生學(xué)習(xí)特點、發(fā)展進(jìn)步以及潛能結(jié)構(gòu)作個別化的評價。在這種單調(diào)和抽象的課業(yè)考評方法下,必然丟失學(xué)習(xí)過程及考試過程業(yè)已顯示出來的大量有用信息,并且把相同考分的學(xué)生看成相同的發(fā)展,忽視了學(xué)生心理發(fā)展和智能結(jié)構(gòu)差異的多面性和客觀性。第九章教師評價教師評價的種類成果評價、教學(xué)行為評價、素質(zhì)評價教師認(rèn)知發(fā)展評價模式:由加利福尼亞州立大學(xué)科斯塔等人開發(fā)的評價方法,以不可觀察的教學(xué)技能作為被評因素。教師評價的方法研究結(jié)果表明,有多種途徑可用于教師評價:自我評價、家長評價、學(xué)生評教、同行評議、書面材料的收集與觀察以及教學(xué)成果等等。目前常用的教師評價方法主要有教師自評、學(xué)生評教、同行評議以及觀察與會談等。教師自評是教師評價中一個重要的方面,這不僅因為它是收集必要的信息的一個途徑,而且因為它也是教師自我診斷的一個重要方面。在一定意義上,甚至可以說,教師自我評價的過程就是教師自我激勵與自我提高的過程。在這多種資料的收集途徑中,學(xué)生對課堂教學(xué)的評價也是最有力的材料。同行評議不僅在形成性評價中有很大的潛在價值,而且對在教師中創(chuàng)造一種專業(yè)發(fā)展的氣氛也有重要意義。使用同行評議這一方法的基本觀點,是在評價教師能力方面同行具有較大的發(fā)言權(quán)?,F(xiàn)場觀察在教師評價中一直占有重要的位置,因為它具有相當(dāng)?shù)目煽啃?。但研究表明,課堂觀察的可靠性與有用性,直接地依賴于觀察者在觀察之前所掌握的信息量與信息的類型。在實踐中還沒有任何一種方法,已被證明對總結(jié)性的判斷來說,已達(dá)到必要的信度的要求。然而,多渠道地收集信息,有助于提高評價的信度。投射效應(yīng):人們有一種傾向,往往假設(shè)他人與自己是相同的,特別在他人某方面的特點與自己相似時,這種傾向就更加強烈。心理學(xué)上把這種將自己的特性歸屬到他人身上的現(xiàn)象稱為投射效應(yīng)。首因效應(yīng):這種最先獲得的信息對認(rèn)識的影響,在心理學(xué)上稱為“首因效應(yīng)”。近因效應(yīng):最后留下的信息常常給人以強烈的印象,并在相當(dāng)程度上決定著人們的認(rèn)識。首因效應(yīng)與近因效應(yīng)在認(rèn)識中起作用,都有條件制約。在認(rèn)識中,當(dāng)信息資料較少時,首因效應(yīng)起主要作用;如果信息資料較多的話,則近因效應(yīng)起主要作用。第十章課程方案評價課程方案評價的內(nèi)容(1)課程計劃的評價;(2)學(xué)科教學(xué)大綱的評價;(3)教材的評價教材是教學(xué)大綱的具體化,因此,對教材的評價核心是教材與教學(xué)大綱的一致性、科學(xué)性與可讀性。課程方案評價的基本模式(1)梅特費賽爾模式梅特費賽爾模式是由美國學(xué)者在60年代后期提出的一種模式。這一模式在泰勒模式基礎(chǔ)上加以補充與完善,本質(zhì)上仍然是一種目標(biāo)評價的模式,然而,它更強調(diào)了課程評價的持續(xù)性與課程的全面整體效果。這一模式是以目標(biāo)為中心的,但是它強調(diào)了全體成員的參與、目標(biāo)的寬泛性與對課程效果的持續(xù)觀察,這就使它在泰勒模式的基礎(chǔ)上有了進(jìn)步。(2)CSE評價模式CSE評價模式是一種與CIPP最為接近的評價模式。包括四個步驟:需要評定、方案計劃、形成性評價、總結(jié)性評價。(3)反對者模式反對者模式是一種為了揭示方案正、反兩方面長短得失,而采取準(zhǔn)法律過程評委會審議形式的評價模式。反對者模式十分重視聽取關(guān)于教育方案和教育活動的爭議意見,尤其是反對者的意見,這對各方面的情況能得到充分的反映提供保證。一般地說,這一評價的基本特點是它充分反映了各類人員“多元的”價值認(rèn)識,是依靠人們直覺與經(jīng)驗的評價。(4)應(yīng)答模式應(yīng)答評價是通過評價者與同教育活動有關(guān)的各種人員接觸,了解他們的愿望,然后把它同實際活動進(jìn)行比較,對教育決策或立案做出修改,對大多數(shù)人的愿望做出應(yīng)答,以使教育能滿足各種人的需要。與泰勒模式相比,應(yīng)答模式強調(diào)了“多元現(xiàn)實性”和價值觀念的發(fā)散性。在方法上,它注重與科學(xué)主義相對的自然主義方法,強調(diào)了非正式的觀察、交往、描述性的定性分析方法。(5)消費者導(dǎo)向模式消費者導(dǎo)向模式(consumer-orientedevaluation)是由斯克里文提出的。這里的“消費者”可以是教育活動的參與者或受教育者。根據(jù)斯克里文的觀點,評價是對事物的價值和優(yōu)缺點所作的系統(tǒng)判斷,而非只測量事物或決定目標(biāo)是否達(dá)成。依照斯克里文的觀點,評價者不應(yīng)接受制訂者提供的目標(biāo),而是要判斷所達(dá)成的目標(biāo)是否對消費者的利益有貢獻(xiàn)。評價者須從消費者的觀點來確認(rèn)真正的成果,以及這一成果的價值。這一評價模式與泰勒模式、CIPP模式的最大區(qū)別就在于:它做出評價結(jié)論的依據(jù)不是方案制訂者的目標(biāo),而是活動參與者的意圖。西方的評論家認(rèn)為,這是一種較為民主的評價模式。教材評價的原則教材評價的原則有科學(xué)性原則、教育性原則、思想性原則、學(xué)科先進(jìn)性和藝術(shù)性原則、技術(shù)性原則等。第十一章教學(xué)工作評價教學(xué)工作評價的功能教學(xué)工作評價的功能可以從不同角度去考察,主要有以下幾個方面:(1)檢查:教學(xué)工作評價是檢查教學(xué)工作的重要手段。(2)反饋:教學(xué)工作評價可以給教學(xué)工作提供科學(xué)的反饋信息,從而有利于教學(xué)工作的改進(jìn)。(3)激勵:加強教學(xué)工作評價,也有利于激發(fā)教師的活動動機。(4)研究:教學(xué)工作評價有利于開展教育研究活動。(5)定向:教學(xué)工作評價的指標(biāo)對教學(xué)工作具有指揮定向作用。(6)管理:教學(xué)工作評價中對教師的教學(xué)工作給予鑒定或評分,使教學(xué)管理部門更好地了解教師的教學(xué)質(zhì)量和水平,可作為教師晉升、評優(yōu)及使用的重要依據(jù)。教學(xué)工作評價應(yīng)注意的問題(1)關(guān)于教學(xué)工作量與質(zhì)的關(guān)系問題在教學(xué)工作評價中,首先涉及的當(dāng)是教學(xué)工作量與教學(xué)工作質(zhì)的關(guān)系問題,如何合理地將兩者綜合評價,難度相當(dāng)大。所謂教學(xué)工作量,是指教學(xué)工作中所付出的勞動量,它大多表現(xiàn)在工作過程中,如教師出勤率,備課所付出的時間,教學(xué)時數(shù),評改作業(yè)和課外輔導(dǎo)學(xué)生人次數(shù)和時間,學(xué)科實踐活動人次數(shù)和付出的時間,命題考試評卷所付出的時間,以及完成其他教學(xué)任務(wù)所付出的勞動時間。所謂教學(xué)工作質(zhì),是指教師完成教學(xué)工作的好壞或優(yōu)劣程度,它既反映在教學(xué)工作過程中,也反映在教學(xué)工作的結(jié)果上,即反映在工作質(zhì)量與工作效果上。由于教學(xué)工作量和工作質(zhì)難以精確評價,一般只作大體估計和模糊描述。在教學(xué)工作評價中,注重教學(xué)工作量和工作質(zhì)的分析評價的同時,還要考察教師工作的態(tài)度、自覺性、積極性等評價的隱性內(nèi)容(這些內(nèi)容也是影響教師工作過程和效果的中介變量),綜合分析與教學(xué)工作量和工作質(zhì)密切相關(guān)的各種因素,令教學(xué)評價逐步邁向科學(xué)化。(2)關(guān)于他評價和自評價的關(guān)系問題他評價是一種外部的顯性的評價,它通過外人對教師教學(xué)工作進(jìn)行明顯的(或看得見的眾所周知的)統(tǒng)計分析或文字描述,可給教師教學(xué)工作進(jìn)行“寫真”。自我評價的過程有時是內(nèi)隱性的,它通過思想內(nèi)部的“反省”、“自查”、“檢討”、“總結(jié)”、“自判”等方式來進(jìn)行;但有時也具有外顯性,如給自己的教學(xué)工作評分,或?qū)懗鲎栽u報告,給自己的思想品德寫出自我鑒定,等等。由于評價結(jié)果與被評者的榮譽或利益息息相關(guān),加上許多人都有其不誠實的思想因素,因而自評往往不如他評結(jié)果可靠??傊?,他評價與自評價各自有其獨特的功能。它們的局限性可以互補。開展教學(xué)工作評價應(yīng)將他評價與自評價有機地結(jié)合起來。發(fā)展性教學(xué)評價的基本認(rèn)識(1)教師唱主角的課不是好課(2)面面俱到的課不是好課(3)沒有教師教學(xué)機智的課不是好課(4)只是“教教材”,沒“用教材教”的課不是好課(5)中評不中用的課不是好課網(wǎng)絡(luò)教學(xué)評價具有傳統(tǒng)教學(xué)評價的所有因素,而且還包括特有的對學(xué)習(xí)支持與服務(wù)系統(tǒng)的評價,具有評價及時、評價對象廣泛、針對性強等特點。第十二章學(xué)校辦學(xué)評價學(xué)校教育質(zhì)量評價最重要的是辦學(xué)水平評價。學(xué)校辦學(xué)評價的特點有:(1)地區(qū)性、(2)綜合性、(3)復(fù)雜性。辦學(xué)評價與學(xué)生思想品德評價和教學(xué)工作評價相比,它具有地區(qū)性、綜合性和復(fù)雜性等特點。學(xué)校辦學(xué)水平的評價學(xué)校辦學(xué)水平的評價包括辦學(xué)條件、辦學(xué)水平、社會評價和獲獎情況等四方面的評價。它基本上涵蓋了教育質(zhì)量評價的主要指標(biāo)。第十三章現(xiàn)代教育測量與評價的發(fā)展趨勢經(jīng)典測驗理論(簡稱CTT)是最早的測驗理論,也是最實用的測驗理論。題目反應(yīng)理論現(xiàn)代測驗理論有許多模式,其中題目反應(yīng)理論最具優(yōu)越性。題目反應(yīng)理論認(rèn)為:一個人的行為舉止就好像處于自身某些心理品質(zhì)的定量控制之中,要定量地估計個體在每一種特質(zhì)上的位置是心理測量的任務(wù)。反之,也可用所估計到的特質(zhì)的量去預(yù)測和解釋個體在相應(yīng)情境中將會產(chǎn)生的行為反應(yīng)。題目反應(yīng)理論是建立在如下的假設(shè)中的:假設(shè)1:一維性(即考生的某一測驗結(jié)果只取決于一種潛在特質(zhì)或稱能力,其他能力的影響均可忽略);假設(shè)2:局部獨立(即考生答題時不受其他試題影響);假設(shè)3:適合的數(shù)學(xué)模型(須經(jīng)擬合度檢驗)。經(jīng)典測驗理論與現(xiàn)代測驗理論的比較(1)參數(shù)穩(wěn)定性經(jīng)典測驗理論使用的題目分析法所得的題目統(tǒng)計量數(shù)受樣本的抽樣影響較大?,F(xiàn)代測驗理論IRT的方法具有局部獨立和參數(shù)獨立等特點。題目參數(shù)估計是獨立于被試樣本和題目樣本。(2)能力的比較經(jīng)典測驗理論對被試能力間的比較只能在相同的測驗或平行復(fù)本的情況下進(jìn)行。而現(xiàn)代測驗IRT是自適性測驗或電腦自適應(yīng)測驗,它的處理較方便且靈活。(3)平行復(fù)本難實現(xiàn)經(jīng)典測驗理論最基本的概念是測驗的信度。而信度的設(shè)定來自平行復(fù)本的假設(shè)。但事實上平行測驗是很難達(dá)到的,被試不可能在兩次測驗中得到完全相同的結(jié)果。影響測驗結(jié)果的因素很多,如遺忘、學(xué)習(xí)新知識技能、動機及焦慮程度等。經(jīng)典測驗理論常依賴平行復(fù)本的假設(shè),所以研究者在現(xiàn)實實施中只能接受下限的信度估計或具偏差的信度估計。(4)缺乏預(yù)測力經(jīng)典測驗理論無法預(yù)測被試在一個新的測驗中可能的表現(xiàn)?,F(xiàn)代測驗IRT就是使用概率的觀念來表示被試能力與項目的關(guān)系表示具有某種能力的被試答對某題的概率P。(5)測量標(biāo)準(zhǔn)誤經(jīng)典測驗理論是假定所有被試的測量標(biāo)準(zhǔn)誤都是相等的。事實上,不難發(fā)現(xiàn),不同能力組表現(xiàn)在測驗上的穩(wěn)定性是不同的。如施測幾個復(fù)本,可能高能力組比中能力組穩(wěn)定性高。良好的測驗?zāi)J綉?yīng)能針對某一測驗得分或被試能力進(jìn)行精確的估計,不同的得分或能力有其不同的概率誤差,而非統(tǒng)一的測量標(biāo)準(zhǔn)誤。除此之外,經(jīng)典測驗理論在測驗的設(shè)計、偏誤題的認(rèn)定、測驗的等值問題上還沒有得到滿意的解決。三、重點習(xí)題(一)單選題測量的要素包括量具、()和參照點。測量單位B.測量環(huán)境C.測量程序D.測量時間與物理測量不同,教育測量數(shù)據(jù)大多數(shù)屬于等級變量,是主觀的,具有隨機性和()。A.確定性B.重復(fù)性C.模糊性D.多樣性網(wǎng)絡(luò)教學(xué)評價具有傳統(tǒng)教學(xué)評價的所有因素,而且還包括特有的(),具有評價及時、評價對象廣泛、針對性強等特點。學(xué)習(xí)資料評價B.對學(xué)習(xí)支持與服務(wù)系統(tǒng)的評價C.學(xué)習(xí)方式評價D.學(xué)習(xí)平臺評價
4?由加利福尼亞州立大學(xué)科斯塔(Costa,A.L.)等人開發(fā)的,以不可觀察的教學(xué)技能作為被評因素的教師評價的模式是()。教師職責(zé)評價模式B.教師活動評價模式C.教師教學(xué)評價模式D.教師認(rèn)知發(fā)展評價模式教育評價表在結(jié)構(gòu)上由評價指標(biāo)、()和評價標(biāo)準(zhǔn)三部分構(gòu)成,其中構(gòu)建評價指標(biāo)是比較關(guān)鍵的內(nèi)容。評價方式B.評價維度C.指標(biāo)權(quán)重D.評價目標(biāo)課程方案評價主要包括課程計劃的評價、學(xué)科教學(xué)大綱的評價和()。A.課程結(jié)果評價B.教材的評價C.教學(xué)設(shè)計評價D.教學(xué)評價()是對經(jīng)常表現(xiàn)出學(xué)習(xí)困難的學(xué)生所做的測量與評價,它的目的是對個人的問題行為及其原因進(jìn)行診斷。A.形成性測量與評價B.診斷性測量與評價C.典型行為測量與評價D.終結(jié)性測量與評價同一組學(xué)生用同一測驗實施兩次后所得分?jǐn)?shù)的一致性,或者同一組學(xué)生經(jīng)過一次測驗后,用另一個同質(zhì)的測驗再測一次,這兩次測驗所得分?jǐn)?shù)的一致性,這是測驗的()。A.內(nèi)容效度B.難度C.信度D.區(qū)分度()是指在試題格式、題數(shù)、難度、指導(dǎo)語說明、施測要求等方面都相當(dāng),并且都用來測量相同潛在特質(zhì)或?qū)傩?,但試題又是不相同的測驗。復(fù)本測驗也稱作平行測驗。A.同質(zhì)性測驗B.異質(zhì)性測驗C.重復(fù)測驗D.復(fù)本測驗一個測量能實際測量出理論上的構(gòu)念或心理特性的程度,稱為()。A.結(jié)構(gòu)效度B.效標(biāo)關(guān)聯(lián)效度C.同時效度D.內(nèi)容效度以下哪一項不是人格評價的內(nèi)容()。A.氣質(zhì)B.性格C.適應(yīng)性D.交際人們有一種傾向,往往假設(shè)他人與自己是相同的,特別在他人某方面的特點與自己相似時,這種傾向就更加強烈。心理學(xué)上把這種將自己的特性歸屬到他人身上的現(xiàn)象稱為()。A.投射效應(yīng)B.首因效應(yīng)C.近因效應(yīng)D.參照效應(yīng)已知測驗的分半信度為0.6,原測驗的信度為()。A.0.85B.0.80C.0.75D.0.70將被試實際水平與其自身潛在水平(潛力)相比較,以評價被試有無充分發(fā)揮自身潛力為目的測量與評價稱為()。A.形成性測量與評價B.潛力參照測量與評價C.診斷性測量與評價D.終結(jié)性測量與評價兩種不同的智力測驗或標(biāo)準(zhǔn)測驗之間的相關(guān)系數(shù)應(yīng)達(dá)到()。A.0.60—0.80B.0.30—0.5016.A.0.60—0.80B.0.30—0.5016.年齡常模是屬于()。A.發(fā)展常模B.組內(nèi)常模C.0.60—0.70C.百分等級常模D.0.50-0.70D.標(biāo)準(zhǔn)分?jǐn)?shù)常模將評價指標(biāo)按照評價對象本身的邏輯結(jié)構(gòu)逐級進(jìn)行分解,把分解出來的主要因素作為評價指標(biāo)的方法,稱為()。A.頭腦風(fēng)暴法理論推演法因素分解法A.頭腦風(fēng)暴法理論推演法因素分解法典型研究法要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷的調(diào)查方式是()。A.評估性調(diào)查B.證實性調(diào)查要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷的調(diào)查方式是()。A.評估性調(diào)查B.證實性調(diào)查以下哪一項不屬于作品分析評價法()A.拼圖法B.作圖法C.疑問性調(diào)查C.完成法在現(xiàn)行使用的高考標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換方案中,采用的是()。A.對比參照方案B.百分等級方案C.常模參照方案D.經(jīng)驗性調(diào)查D.課堂作業(yè)觀察評估法D.正態(tài)化轉(zhuǎn)換方案教育測驗可以按照分?jǐn)?shù)解釋的參照體系不同,分成常模參照測驗與()兩大類。A.標(biāo)準(zhǔn)參照測驗B.A.標(biāo)準(zhǔn)參照測驗B.認(rèn)知測驗C.診斷性測驗D.實驗參照測驗37.37.在布魯姆的教育目標(biāo)分類中,最低級的認(rèn)知目標(biāo)是()。()是試題對學(xué)生知識和能力水平的適合程度的指標(biāo)。A.信度B.效度C.難度D.區(qū)分度與物理測量相比,以下屬于教育測量特點的是()。A.它一般是間接測量B.它的度量單位是絕對的C.它的目的是特為測量服務(wù)的D.它的作用是單一的用同一個量表(測驗或評價表)對同一組被試測兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測驗上所得分?jǐn)?shù)的相關(guān)系數(shù),這一概念是()。A.復(fù)本信度B.重測信度A.復(fù)本信度B.重測信度25.衡量測量題目質(zhì)量的兩個重要指標(biāo)是(A.信度與區(qū)分度B.效度與信度C.同質(zhì)性信度)。C.難度與效度D.分半信度D.難度與區(qū)分度對于平均數(shù)來講,下列哪句表述是正確的?()A.平均數(shù)易受極端數(shù)值的影響B(tài).平均數(shù)計算不準(zhǔn)確A.平均數(shù)易受極端數(shù)值的影響B(tài).平均數(shù)計算不準(zhǔn)確C.平均數(shù)位于數(shù)據(jù)的正中間D.平均數(shù)本身沒有意義TOC\o"1-5"\h\z根據(jù)題目答案的范圍和評分誤差的大小,可把測驗題目分成()。A.選擇題和填空題B.選擇題和簡答題C.論文題和操作題D.客觀題和主觀題下列哪一項不屬于連續(xù)型隨機變量的數(shù)據(jù)?()A身高體重C.用百分制分?jǐn)?shù)表示的學(xué)科成績D.A身高()是將各變量(題目.分測驗或測驗)的得分直接相加而獲得一個合成分?jǐn)?shù)。A.等權(quán)相加B.加權(quán)求和C.加權(quán)平均D.直接加權(quán)在現(xiàn)代測驗理論的諸多模式中,最具有優(yōu)越性的是()。A.經(jīng)典測驗理論B.題目反應(yīng)理論C.心理測驗理論D.智力測驗理論()是將被試水平與測驗常模相比較,以評價被試在團體中的相對地位的一種測量與評價類型。A.常模參照測量與評價A.常模參照測量與評價潛力參照測量與評價標(biāo)準(zhǔn)參照測量與評價診斷性測量與評價[答案]:A內(nèi)容是通過圖形、儀器、工具、實物、模型等形式表現(xiàn)的,被試通過指認(rèn)、手工操作向主試提供答案,這種測驗是()。A.文字測驗A.文字測驗B.非文字測驗[答案]:B教育測量與評價具有促進(jìn)學(xué)生學(xué)習(xí)的功能A.激勵學(xué)生的學(xué)習(xí)動機促進(jìn)學(xué)生自我評價[答案]:D兩個平行測驗測量同一批被試所得結(jié)果的得分?jǐn)?shù)的相關(guān)系數(shù),這種信度成為()。A.重測信度B.同質(zhì)性信度[答案]:C測量的實施所引起的誤差不包括()。A.測驗題目的格式C.對答案紙的錯劃標(biāo)準(zhǔn)化測驗D.計算機測驗以下幾種體現(xiàn)中不準(zhǔn)確的是()。幫助學(xué)生的記憶和促進(jìn)遷移促進(jìn)學(xué)生的班級管理致性程度,其大小等于同一批被試在兩個復(fù)本測驗上所復(fù)本信度D.—致性信度B.對實施指導(dǎo)語的錯誤理解論文式測驗的記分[答案]:A()是指測驗?zāi)康拇硭麥y量的內(nèi)容和引起預(yù)期反應(yīng)所達(dá)到的程度。A.效標(biāo)關(guān)聯(lián)效度B.結(jié)構(gòu)效度C.內(nèi)容效度D.測量效度[答案]:CA.知識B.領(lǐng)會C.運用D.分析[答案]:A38.用米尺測得學(xué)生身高的數(shù)據(jù),屬于()。A.點計數(shù)據(jù)B.度量數(shù)據(jù)C.類別數(shù)據(jù)D.間斷性數(shù)據(jù)[答案]:B39.()是將各次測量的結(jié)果按照一定的權(quán)重相加,采用所得結(jié)果作出判斷。A.加權(quán)求和B.等權(quán)相加C.多重回歸D.加權(quán)平均的標(biāo)準(zhǔn)化[答案]:A40.()是以學(xué)生在標(biāo)準(zhǔn)參照測驗中答對題目的比例來解釋測驗分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)生反饋機制與調(diào)整計劃
- 提升個人職業(yè)技能的計劃
- 超聲科在診斷中的精確應(yīng)用
- 金融安全教育學(xué)生網(wǎng)貸詐騙預(yù)防課程
- 實現(xiàn)班級文化傳承的途徑計劃
- 開發(fā)職業(yè)技能的長期計劃
- 超市貨架布局與消費者行為研究
- 跨文化背景下的營銷活動策劃
- 項目管理中的財務(wù)控制二十法
- 財務(wù)透明度提升審計流程的重要性
- 《計算機網(wǎng)絡(luò)技術(shù)》課程教案(完整版)
- 追覓在線測評題
- 調(diào)崗未到崗解除勞動合同通知書
- 產(chǎn)品標(biāo)準(zhǔn)化大綱
- 西師版小學(xué)數(shù)學(xué)四年級下冊教案
- 國有企業(yè)“三定”工作方案-國有企業(yè)三定方案
- 清華大學(xué)2024年強基計劃數(shù)學(xué)試題(解析)
- 大學(xué)生新時代勞動教育教程全套教學(xué)課件
- 高一英語必修一試卷(含答案)(適合測試)
- 中國非遺文化儺戲詳細(xì)介紹課件
- 語文八年級下冊課后習(xí)題解析
評論
0/150
提交評論