教學測量與評價_第1頁
教學測量與評價_第2頁
教學測量與評價_第3頁
教學測量與評價_第4頁
教學測量與評價_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

教學測量與評價第一講教學測量與評價的含義與作用一、什么是教學測量二、什么是教學評價三、教學測量與評價與關系四、教學測量與評價的作用一、教學測量1.含義教學測量(instructionalmeasurement)是考核教學成效的一種方法。這是借助于一定的手段與方式,對學生的學習成績(簡稱學績)進行探察,并以一定的數(shù)量來表示的考核辦法。2.在教學測量中應注意什么(1)教學測量的目的在于考核教學成效,也就是考察教學目標的完成情況。因此,教學測量的目標應以教學目標為依據(jù),測量目標應與教學目標一致,而不能偏離教學目標。教學目標的例子:掌握水勢概念、根系吸水的動力和葉片散失水分的原理;了解水分在生命活動中的作用(植物生理學,水分生理)。本章要求學生掌握食用菌菌絲體和子實體的形態(tài)結(jié)構;掌握食用菌的生活史(食用菌栽培,食用菌的形態(tài)與生活史)。三維目標1.知識與技能:即每門學科的基本知識和基本技能。

2.過程與方法:即讓學生了解學科知識形成的過程、“親歷”探究知識的過程;學會發(fā)現(xiàn)問題、思考問題、解決問題的方法,學會學習,形成創(chuàng)新精神和實踐能力等。

3.情感、態(tài)度和價值觀:即讓學生形成積極的學習態(tài)度、健康向上的人生態(tài)度,具有科學精神和正確的世界觀、人生觀、價值觀,成為有社會責任感和使命感的社會公民等。(人體生命活動的調(diào)節(jié),第四節(jié)激素調(diào)節(jié)

)1.識記:這是最低等級的認知目標,它指對具體事物和普遍原理的回憶,對方法和過程的回憶,或者對一種模式、結(jié)構或框架的回憶。比如對專業(yè)術語,對日期、事件、人物、地點,對處理具體事物的方式方法,對各種理論等等的記憶。

2.理解:這是低層次的理解,以一種語言或一種交流形式被譯述或轉(zhuǎn)化成另一種語言或另一種交流形式時的嚴謹性和準確性為依據(jù),對材料進行初步的重新整理與排列,指出材料包含的意義和趨勢。因此理解包括三個心理過程:轉(zhuǎn)譯、解釋和推斷。

3.運用:指在某些特定的和具體的情景里使用抽象概念——只是對所學知識的初步運用,而非綜合的、創(chuàng)造性的運用。這些抽象概念可能是以一般的觀念、程序的規(guī)則或概括化的方法等形式表現(xiàn)出來的,也可能是那些必須記住的和能夠運用的專門性的原理、觀念和理論。

4.分析:指將材料分解成各種組成要素或組成成分,弄清各種觀念的有關層次,或者明確所表達的各種觀念之間的關系,闡明材料各要素的組織原理——即對材料內(nèi)容組合起來的組織、系統(tǒng)和結(jié)構的分析。

5.綜合:指對各種要素或組成成分加工,形成新的結(jié)構整體或新的模式;制定出合理的工作計劃或操作步驟;確定一套抽象關系,用以對特定的資料或現(xiàn)象進行分類或解釋;或者從一套基本命題或符號表達式中演繹出各種命題關系。

6.評價:這是認知領域教育目標的最高層次,是指為了特定目的對材料和方法的價值及符合準則的程度作出定量的和定性的判斷。準則既可以是內(nèi)在證據(jù),如邏輯上準確性、一致性等,也可以是外部準則,如相應領域的最高標準等。評價是認知能力的最高水平,是認知行為和情感行為的主要結(jié)合點和過渡橋梁。

識記理解運用分析綜合評價二、教學評價1.含義教學評價(instructionalevaluation)就是依據(jù)教學目標,對學績測驗所得測量結(jié)果進行分析及解釋。它主要包含以下兩個方面的工作。(1)教學評價必須對學績測驗數(shù)據(jù)所表明的教學成效作出確切的診斷。(2)教學評價必須對教學的成敗原因進行分析,并對今后教學工作的改進方面作出明確的規(guī)定。評價(估)的功能為家長提供信息為選拔提供信息為學生提供信息為教師提供信息為學校(間)提供信息評價必須要注意的:公平,公正,標準一致,標準清晰如何評價(估)形成性評估和終極性評估常模參照評估與標準參照評估三、教學測量與評價的關系區(qū)別:教學測量是對學績測驗所得結(jié)果的客觀描述(將結(jié)果予以數(shù)量化),并不考慮結(jié)果的實際意義,而教學評價則是對學績測驗所得結(jié)果的主觀判斷(對結(jié)果進行分析解釋),以了解結(jié)果的實際意義。聯(lián)系:(1)教學評價是一種主觀判斷,但是這種主觀判斷必須以教學測量所得的客觀描述為依據(jù)(2)教學測量也不能脫離教學評價。教學測量只是對學績測驗結(jié)果的客觀描述,只有通過教學評價,才能判斷這種客觀描述的實際意義四、教學測量與評價的功能1.反饋—調(diào)節(jié)功能對教師對學生2.激勵—動機功能對學生對教師第二節(jié)中學生物學測量的命題一、設計雙向細目表

教師可以根據(jù)測驗目的及教學目標的需求,以教學目標為橫軸,而以教材內(nèi)容為縱軸,畫出一個二維度的分類表,且平均分配好試題比重或題數(shù)于表中的每個細目里,并盡量使試題的取材能夠充分涵蓋所要評價的教學目標和教材內(nèi)容的范圍,以作為編擬成就測驗試題的設計藍圖,這樣的一個二維度分類表便叫做雙向細目表(two-wayspecificationtable)。典型的雙向細目表,如所示。

高中生物上學期成就測驗的雙向細目表

教學目標教材內(nèi)容識記理解應用分析綜合評價總計百分比細胞選擇842626%簡答42422新陳代謝選擇482424%簡答4233生殖發(fā)育選擇24332828%簡答4453生命活動調(diào)節(jié)選擇24642222%簡答33總計16311916108100100%百分比16%31%19%16%10%8%

教師在設計雙向細目表時必須注意:第一,命題的范圍在教學過的教材內(nèi)容范圍之內(nèi)第二,雙向細目表邊緣小格中的數(shù)字,不可以為零,也就是說,雙向細目表中列出的教材內(nèi)容或教學目標不能沒有適當?shù)脑囶}。第三,教師可以針對自己的命題及評分的習慣,選定雙向細目表中所陳述的測驗題型,變化或增減所預擬的試題題數(shù)或分值。二、選定測驗的題型

試題的類型可以分成兩大類:

選擇型試題(客觀題)可分為:①選擇題;②是非題;③配合題;④填空題;⑤解釋性習題等。

填充型試題(主觀題)可分為:①簡答題;②限制反應題;③論述題等。1.在下列情況下,以使用主觀型試題來評價為宜

(1)擬評價學生的創(chuàng)意、組織和綜合科學知識或語文表達等比較復雜的成就;(2)擬評測學生對某些科學知識的意見或態(tài)度;(3)擬評測學生分析、應用或評價整體科學概念的能力;(4)受試人數(shù)不多而且試題擬只使用一次或有充足時間閱卷而無足夠時間命題:(5)教師個人在評閱答案時,能明確制訂統(tǒng)一的評分標準。2.在下列情況下,以使用客觀型試題來評價為宜

(1)試題擬重復使用而且受試者人數(shù)眾多;(2)要求測驗結(jié)果具有較高信度;(3)評價結(jié)果必須盡可能公平、公正;(4)有充足時間命題,而缺乏足夠時間閱卷;(5)教師個人在評閱答案時,無法把握明確而統(tǒng)一的標準。3.下列情況則兩類試題均可達到預期目標

(1)評價學生的各方面學習成就;(2)考驗學生是否了解并能運用科學原理、學說、定律;(3)考驗學生應用科學知識以解決問題的能力;(4)考驗學生的批判性思維能力:(5)考驗學生記憶和運用科學知識的能力;(6)考驗學生分析和綜合科學知識的能力。二、編擬測驗試題

(一)編擬試題的一般原則

1.試題取材均勻,并具有教材內(nèi)容的代表性。

2.試題的敘述應力求簡明扼要,題意明確。

3.各個試題宜彼此獨立,互不牽涉,并避免含有暗示答案的線索。

4.試題宜有公認的正確答案或相對較佳的答案。

5.試題中某些錯誤,雖不影響答案的選擇,也應當避免。

6.凡具有爭議性的試題,應該注明命題參考資料的來源。7.若要測量學生的高層次認知能力,則試題不一定要有固定答案。

8.試題的敘述應重新組織,避免直接抄課文或原來教材。

9.試題應重視重要概念或原理原則的了解與應用,要避免偏難瑣碎及零碎知識的記憶。

10.避免使用與測驗無關的敘述,增加作答困難。

11.命題不要超過單元教學的評價目標。

12.提早命題,以預留時間進行試題審查或修正。

13.命題數(shù)量盡量多一些,作為備用試題。第三節(jié)

試卷分析指標及其解讀一、考試與試卷分析二、試卷分析方法三、定量分析的主要指標四、定量分析結(jié)果的解讀五、綜合分析規(guī)范一考試與試卷分析

(1)常模參照性考試:考試的目的主要是在于考查被試者的個體差異,一般用于衡量被試者的相對水平。只有將被試者的得分放到考試所在的團體中,從而直接或間接地以被試者在該團體中的相對等級或相對位置來評估被試者的能力水平。

1.1考試的分類

(2)目標參照性考試:也叫標準參照考試,強調(diào)的是被試者對考試目標和內(nèi)容的掌握程度。因而能反映出被試者的絕對水平及在知識掌握上的強點和弱點,并能對被試者在參照標準上的表現(xiàn)做出解釋。1.2課程考試課程考試是評估學生學習成績,檢驗教師教學和學生學習效果的主要形式,是教學過程中不可或缺的環(huán)節(jié)。課程考試目的:對學生學習狀況和相關知識掌握程度,教師教學計劃的完成程度及效果進行檢查

;對學生的學業(yè)水平、能力做出判斷、區(qū)分和解釋。1.3試卷分析試卷分析:是指對學生考試成績、試卷信度、效度,試題的難度、區(qū)分度,考試命題、試卷編制、閱卷評分等內(nèi)容進行定量和定性分析,以評價考試質(zhì)量、反思教與學效果的活動。試卷分析是教師教學活動的重要環(huán)節(jié),也是教研室的基本工作之一。1.4試卷分析的目的評價考試質(zhì)量,檢驗考試的可靠性、有效性。通過對考試的信度、效度、試題的難度、區(qū)分度等方面作分析,可以判斷此次考試的質(zhì)量。只有有效的、可靠的考試,才能作為評價教學質(zhì)量或衡量學生學習情況的依據(jù)。改進考試工作,提高試題和試卷編制質(zhì)量。通過對試卷一系列指數(shù)的分析,能為我們進一步修改試題、編制試卷提供依據(jù),提高編制試卷的技能、技巧,使測驗更趨科學;

獲取教與學效果的反饋信息。對試卷的深入分析,能反饋大量的信息,及時發(fā)現(xiàn)教與學中存在的問題,便于采取有針對性的措施或建議,改進教學。二試卷分析方法2.1定量分析方法是指通過對試卷和考試成績的數(shù)理統(tǒng)計分析,得出有關試卷的成績分布、平均分、標準差、試題難度、試題區(qū)分度、考試信度、考試效度等數(shù)據(jù)特征,用以說明試卷命題質(zhì)量、教師教學和學生學習效果的分析方法。綜合分析是指在定量分析數(shù)據(jù)結(jié)果的基礎上,結(jié)合考試的具體情況,進行歸納、分析、綜合、概括,從而得出具有普遍意義的結(jié)論的分析方法。如結(jié)合定量分析數(shù)據(jù)結(jié)果對不同專業(yè)考生具體差異,考生在學習中普遍存在的問題,教學中的薄弱環(huán)節(jié)等進行分析。另外,對試卷命題質(zhì)量中比如題目表述是否科學、文字表述是否正確以及閱卷情況等直接進行定性分析。2.2定性分析(綜合分析)

2.3完整的試卷分析應是定量分析和綜合分析相結(jié)合從教育測量學理論角度看,定量分析的數(shù)據(jù)是不完全客觀的數(shù)據(jù),由此產(chǎn)生的定量分析的結(jié)果需要通過綜合分析來加以判斷和解釋。綜合分析是試卷分析的主體,定量分析只能為綜合分析提供輔助的參考依據(jù)。脫離定量分析過程的綜合分析是片面的,沒有綜合分析的定量分析是教條的。

三定量分析的主要指標(1)成績頻數(shù)分布統(tǒng)計表:以5或10分為一個分數(shù)段,統(tǒng)計每個分數(shù)段包含的學生數(shù),組成成績的頻數(shù)分布統(tǒng)計表。3.1成績分布統(tǒng)計(2)成績頻數(shù)分布圖:將該統(tǒng)計表各分數(shù)段的中值和該組學生數(shù)對應點依次制成條形圖,形成中間高兩邊低的成績頻數(shù)分布圖。(3)成績分布曲線圖:

(1)正態(tài)分布:以平均值為中心,左右兩側(cè)頻數(shù)分布基本對稱,靠近均數(shù)兩側(cè)的頻數(shù)較多,而距均數(shù)兩側(cè)較遠時,頻數(shù)逐漸減少。3.2成績分布曲線圖分類

高分或低分考生數(shù)量較少,中間部分數(shù)量較多,且其分檔情況在成績解釋上比較合理。說明測試結(jié)果與學生的實際情況一致,各種難度的題目比例合理。

(2)正偏態(tài)分布

說明試題難度偏高,難度較大的題目比例偏大,或是教與學效果較差。呈這種分布的試題有利于將成績優(yōu)秀的學生和中等程度的學生區(qū)別開,但不利于將中等程度的學生和成績較差的學生區(qū)別開。(3)負偏態(tài)分布:

說明試題難度偏低,難度較低的題目比例偏大,或者教與學的效果較好。呈這種分布的試題有利于將成績較差的學生和中等程度的學生區(qū)別開,但不利于將中等程度的學生和成績優(yōu)秀的學生區(qū)別開。一套質(zhì)量較高的試題,理想的考試成績分布曲線圖應該是呈正態(tài)分布。課程考試作為一種目標參照性考試,學生成績呈正態(tài)或近似正態(tài)分布,都是正常、合理的。

3.3標準差和極值標準差:描述一組分數(shù)離散情況的最常用、最可靠的統(tǒng)計量。考試成績的標準差用來判斷考試分數(shù)的集中程度。標準差理想控制范圍在7-10;極值:指考試出現(xiàn)的最高分數(shù)和最低分數(shù),極值既是數(shù)據(jù)完整性的體現(xiàn),又是數(shù)據(jù)的關鍵觀察點;課程考試不應出現(xiàn)0或滿分的成績,0分屬于異常數(shù)據(jù),出現(xiàn)多個滿分則提示較難考題數(shù)量嚴重不足。3.4試題難度(P)

試題難度(P)是指能夠正確回答試題的人數(shù)和參加考試的總?cè)藬?shù)之比,即指某題的通過率和正答率。試題難度系數(shù)與試題實際難易程度正好相反。

計算公式:P=平均分÷滿分值

一般認為,難度指數(shù)P在0.3~0.7之間為合適,低于0.3太難,高于0.7太易,0.5左右最好。關于難度的幾個問題:難度水平的確定是為了篩選題目。平時測驗難度要利于學生的學習,但一定的難度能增加區(qū)分度,這對全面了解、掌握學生學習情況有十分重要的作用。難度水平的確定要考慮及格率,防止損傷學困生的自尊心。難度水平的確定要考慮對分數(shù)分布的影響,一般以偏正態(tài)分布為前提,有時偏正態(tài)分布更能激發(fā)學生的學習積極性。

3.5試題區(qū)分度(D)區(qū)分度(D)是指試題區(qū)分考生能力的程度,它基于一個假設:即高能考生比低能考生更有可能正確回答試題。區(qū)分度的取值在-1.0~1.0之間,D值越大,試題的區(qū)分能力越強。

D>0時,為積極區(qū)分;

D<0時,為消極區(qū)分;

D=0時,無區(qū)分能力。先將分數(shù)排序,P1=27%高分組的難度,P2=27%低分組的難度,區(qū)分度D=(27%高分組的平均分-27%低分組的平均分)÷滿分值。效度是指試卷的有效性和準確性程度,它反映的是考試測量到的與所要測量的二者之間的符合程度。課程考試主要考慮內(nèi)容效度。即指選取的具有代表性的樣本組成的考試內(nèi)容是否能夠恰當?shù)卮斫虒W內(nèi)容(教學目標)總體。3.6試卷的效度對課程考試而言,試卷效度是決定考試質(zhì)量的重要因素。但目前還沒有一種切實可行的統(tǒng)計方法可以用來合理地計算試題取樣的恰當程度。目前對效度的評價,大多是由專家或經(jīng)驗豐富的教師依據(jù)考試大綱與考試命題的雙向細目表對每道試題進行比較分析來作出估計。3.7試卷的信度信度是指試卷的穩(wěn)定性和可靠性程度。將同一份試卷,對同一組參加考試者進行反復測驗,所得結(jié)果一致,那么這份試卷就具有很高的信度。信度系數(shù)的計算方法有多種,如穩(wěn)定性信度系數(shù)、等值性信度系數(shù)、內(nèi)部一致性信度系數(shù)。學校試卷分析軟件采用的是克倫巴赫(Cronbach)α系數(shù)法。教育測量學理論認為,對于測驗專業(yè)理論與能力的試卷,其信度應在0.90以上,信度在0.70以下的試卷不宜采用。四定量分析結(jié)果的解讀4.1成績分布偏離正態(tài)分布有兩種情況,一是試題難度普遍較大,考生得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài)分布;二是試題難度普遍較小,考生得分普遍較高,使高分端出現(xiàn)高峰,呈負偏態(tài)分布。當考試分數(shù)分布呈明顯偏態(tài)時,可通過改變試題難度的比例加以調(diào)整,使之大體上呈正態(tài)分布。4.2試題難度非正常影響因素試題質(zhì)量:超綱,偏題,怪題,有錯誤,選項迷惑性太差或太強;教學有遺漏,或者對重點強調(diào)不夠;學生不努力,或者對知識點掌握不夠;學生作弊4.3試題區(qū)分度研究證明,難度系數(shù)P越接近0.5,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論