中學教育心理學考點命題教學測量與評價的方法和技術(shù)_第1頁
中學教育心理學考點命題教學測量與評價的方法和技術(shù)_第2頁
中學教育心理學考點命題教學測量與評價的方法和技術(shù)_第3頁
中學教育心理學考點命題教學測量與評價的方法和技術(shù)_第4頁
中學教育心理學考點命題教學測量與評價的方法和技術(shù)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二節(jié)教學測量與評價的方法和技術(shù)與教學目標相一致,教學評價也應(yīng)包括認知、情感和技能三個方 面。對于認知和技能領(lǐng)域的學業(yè)成就, 最常用的教學評價手段是標準化 成就測驗和教師自編測驗。而對于情感以及道德行為表現(xiàn)則常常采用非 測驗性的評價手段,如案卷分析、觀察、問卷量表以及談話等。當然, 這些非測驗性的評價手段也可作為學業(yè)成就評價的補充.一、標準化成就測驗(一)標準化成就測驗的含義及特點標準化成就測驗是指由專家或?qū)W者們所編制的適用于大規(guī)模范圍 內(nèi)評定個體學業(yè)成就水平的測驗。 這種測驗的命題、施測、評分和解釋, 都有一定的標準或規(guī)定。由于測驗條件的標準化,測驗的結(jié)果比較客觀一致,適用的范圍和時限也較寬

2、廣。其特點大致為:測驗是由專門機構(gòu) 或?qū)<覍W者按一定測驗理論和技術(shù),根據(jù)全國或某一地區(qū)所有學校的共 同教育目標來編制的。所有受試人所做的試題、時限等施測條件相同, 計分手段和分數(shù)的解釋也完全相同。(二)標準化成就測驗的優(yōu)越性第一,客觀性。在大多數(shù)情境下,標準化測驗是一種比教師發(fā)展出 的測驗更加客觀的測量工具。 第二,計劃性.專家在編制標準化測驗時, 已經(jīng)考慮到所需的時間和經(jīng)費,因此標準化測驗比大部分的課堂測驗更 有計劃性。第三,可比性。標準化測驗由于具有統(tǒng)一的參照標準,使得 不同考試者的分數(shù)具有可比性。(三)標準化測驗的局限性第一,與學校課程之間的關(guān)系很不協(xié)調(diào).在我國,每個地區(qū)的教學 狀況還存

3、在著一定的差距,一個年級或地區(qū)的教學內(nèi)容可能不同于另一 個地區(qū)。因此,可能不少地區(qū)學生所學到的內(nèi)容與標準化樣本所學的東 西有差異。這就要求教師在選用標準化測驗前,仔細查閱內(nèi)容效度,使得 測驗的目標與評價的目的相匹配。第二,測驗結(jié)果的不當使用,我們通 常利用標準化成就和能力測驗對學生分類和貼標簽 ,對個體造成了不良 影響。它們的使用對得低分的學生傷害尤大 .二、教師自編測驗(一)自編測驗的含義與特點教師自編測驗是由教師根據(jù)具體的教學目標、教材內(nèi)容和測驗?zāi)康模约壕幹频臏y驗,是為特定的教學服務(wù)的。教師自編測驗通常用于 測量學生的學習狀況,而標準化成就測驗則用來判斷學生與常模相比時 所處的水平.(二

4、)測驗前的計劃第一,確定測驗的目的。第二,確定測驗要考查的學習結(jié)果。第三,列出測驗要包括的課程內(nèi)容。第四,寫下考試計劃或細目表。細目表是將考試具體化的最重要的 工具,使得測驗?zāi)軌蚺c教學的目標和內(nèi)容保持一致。細目表的形式是兩 維表,一般縱欄表示學習結(jié)果,橫欄表示課程的內(nèi)容或范圍。中間的欄 目,就是教師根據(jù)自己的情況填上在測驗中計劃測量多大比例的學習結(jié) 果和課程內(nèi)容。第五,針對計劃測量的學習結(jié)果,選擇適合的題型.自編測驗包括客 觀題和主觀題兩種類型.教師使用哪一種類型的題目是由測驗的目的、 內(nèi)容和時間決定的.一般來說,由于這兩種題型各有優(yōu)點和不足,最好 加以綜合使用。(三)自編測驗的類型1.客觀題

5、客觀題具有良好的結(jié)構(gòu),對學生的反應(yīng)限制較多。學生的回答只有 對、錯之分,因此教師評分也就只可能是得分或失分。這類題目包括選 擇題、是非題、匹配題和填空題等。(1)選擇題.選擇題是由題干和兩個或更多的選項組成的。題干可 以是直接提問或者以不完整的名字形式出現(xiàn),目的是為了設(shè)置問題情 境。而選項則提供可供選擇的答案,包括一個正確答案和若干具有干擾 性的錯誤項或迷惑項。學生的任務(wù)就是閱讀題目,再從一系列選項中挑選出正確的項目.教師在出題時,要綜合考慮題干和選項,使整個題目清楚明了。選 項的數(shù)量一般沒有統(tǒng)一的規(guī)定,教師可以隨意確定選項的個數(shù),大多是 45個,這樣可避免學生猜測答案。所有的題目也可以安排各

6、自不同數(shù) 量的選項。良好的選擇題,題干應(yīng)該明確簡單,而選項又深具迷惑性。經(jīng)過精心設(shè)計的題干和選項,可以測查目標系列中的高于知識水平 的任何等級.此外,選擇題還有一種常用變式,選項中有一至多個正確答 案,即通常被稱為多選題.這種題型的難度大大高于常規(guī)的選擇題(單選 題),可以有效地檢查高一級的學習成果,在測驗中使用較廣.(2 )是非題.是非題與選擇題有一點相似之處,就是學生需要識別、 選擇出正確答案。常用的形式是,陳述一句話要求學生判斷對錯或是非。 是非題可用于測量不同水平的教學目標.是非題形式簡單,能夠在一份試卷內(nèi)覆蓋大量的內(nèi)容。教師在評判時也較客觀,計分簡便省時。但是,一個重要的問題是:學生

7、只有兩種 選擇一對或錯,所以即使在完全猜測的情況下,他們也有50%勺機會選擇 到正確答案。一種可行的辦法是,增加題目的數(shù)量。由于題量大,對題目 總體的取樣較全面,學生很難只憑猜測獲得高分。(3)匹配題.匹配題是另一種可提供多種選擇的考試形式。通常, 題目包括兩列詞句,一列是問題選項,一列是反應(yīng)選項.學生根據(jù)題意按照某種關(guān)系將左右的項目連接起來。 匹配題形式簡單,能夠有效地測 量學生對知識聯(lián)系的掌握情況,且易于計分。但是,它只能用于測查彼 此存在著簡單關(guān)系的知識。(4)填空題。填空題是呈現(xiàn)給學生一句或一段不完整的話或者直接 提問,要求學生簡要做答。當教師的目的是考查學生對知識的回憶時,填空題十分

8、有用,它可將學生猜測的可能性降到最小.如果經(jīng)過精心設(shè) 計,也可以通過填空題來考查學生對知識的記憶和理解,以及推理和判 斷能力.填空題的問題在于,學生的答案各不相同甚至還會出現(xiàn)出人意 料的答案,學生的答案還會受筆跡、用詞等無關(guān)因素的影響.2.主觀題主觀題則要求學生自己組織材料,并采用合適的方式表達陳述出 來。這類題型包括論文題及問題解決題。教師在評分時 ,對學生的回答 需要給出不同量的分值,而不僅僅是滿分或零分(1)論文題。論文題是指要求學生用文字論述方式闡述相關(guān)觀點的 題目,回答字數(shù)可以從幾段到幾大頁不等.一般較常使用的有兩種類型, 有限制的問答題和開放式論文。有限制的問答題,是指教師對回答的

9、內(nèi)容和長度都有規(guī)定,如平時測驗中的簡答題等.例如,說明戊戌政變中的 重要人物、事情經(jīng)過以及結(jié)果。開放式論文,則允許學生在內(nèi)容上可以 自由選材、自由發(fā)揮,而且篇幅較長.論文題可以測驗知識、理解或運 用水平,也可考查學生的分析、綜合、類比和評估知識的能力,還可考 查學生組織信息或表達陳述某項意見的能力。使用論文題也有不妥之處.首先,學生回答論文題需要花費很多時 間。因此,在一份試卷里只能出現(xiàn)少量的題目,對課程內(nèi)容的取樣也就非 常有限。通過增加小的論文題(即簡答題或問答題),可以避免這個問 題.其次,對于熟悉自己學生的教師,在判卷時很難做到客觀,導(dǎo)致信度較低。在評分時,經(jīng)常出現(xiàn)一種現(xiàn)象一一暈輪效應(yīng),

10、即教師對學生的總 體印象影響到對論文題目的評價.因為平時的接觸或者前面幾道題解答 的情況,使得教師對學生形成了某種印象,從而影響到對之后題目的評 判。(2)問題解決題.問題解決題是向?qū)W生提供一定的問題情境和目標 情境,要求學生通過對知識進行組織、選擇和運用等復(fù)雜的程序來解決 問題。通常有兩種形式,一種是間接測驗,與前面提到的幾種測驗形式 一樣,是采用紙筆測驗來評價學生的學業(yè)成就或能力。學生在完成時, 通常必須寫出若干步驟或過程,以展現(xiàn)他的思路。評分時,按照步驟計分,如果缺少某些步驟就不能得分。平時的理科考試多出這種類型的問 題解決題.問題解決題的另一種方式則是直接測驗.例如,為了考查學生學習

11、本節(jié)內(nèi)容的情況,讓學生編制一份測驗小學兩步應(yīng)用題的測題。由于它 考查了學生處理實際問題的能力, 所以有時我們又把這種形式叫做操作 評價。教師可以要求學生設(shè)想一個可以解決學校垃圾處理問題的方案 (要求只寫可行性措施,不超過500字),或者要求學生測量學校操場的 面積。操作評價對于考查高級思維技能十分有效,但是往往費時費錢, 而且主觀性較大,并且效度也經(jīng)常受到質(zhì)疑。(四)有效自編測驗的特征1 .信度信度是指測驗的可靠性,即多次測驗分數(shù)的穩(wěn)定、一致的程度。它 既包括在時間上的一致性,也包括內(nèi)容和不同評分者之間的一致性。例 如,采用性格量表測量學生,他們在這一個月的結(jié)果,如果大致等于六 個月前和三個月

12、前的得分,那么我們就認為測驗的信度較高。2 .效度效度是指測量的準確性,即一個測驗?zāi)軌驕y量出其所要測量的東西 的程度。效度是一個相對概念,任何一種測量工具只是對一定的目的來 說才是有效的.效度考慮的問題是:測驗測量什么?測驗對測量目標的測 量精確性和真實性有多大?效度的重要性大于信度,因為一個低效度的測驗,即使具有很好的信度,也不能獲得有用的資料。例如,用磅秤稱量體重,連續(xù)多次都會得到相同的值,而且準確地反映了個體的重量,那 么信度和效度都很高;但是如果使用它來測量身高,雖然測量值之問總 是保持一致的,即信度很好,但是并沒有說明個體的高度,因而不是適 宜的測量身高的工具。3 .區(qū)分度區(qū)分度是指

13、測驗項目對所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學生對測驗項目的反應(yīng)與某種參照標準之間的關(guān)系來估計的。例如,可用年級或教師評定的等級作標準,看測驗的項目能否把不同年級或不同水平的學生區(qū)分開來.(五)自編測驗的常見錯誤第一,教師過于相信自己的主觀判斷而忽視測驗的信度和效度指標。第二,許多教師對測驗準備的重要性缺乏足夠的認識,對測驗準備不夠充分,甚至沒有準備.第三,許多教師編制的測驗太簡單,題量太小??傊?,測驗準備不充分、題量小、相信主觀判斷 ,都會導(dǎo)致過分強 調(diào)無關(guān)細節(jié),從而忽略本章提到的那些重要的原則或注意事項。三、非測驗的評價技術(shù)在實際教育中,前述紙筆測驗并不是收集資料的唯一途徑.教

14、師還使用了許多非測驗的評價技術(shù),尤其是情感領(lǐng)域的教學評價更需要采用 非紙筆測驗。情感教學不屬于任何一個學科,其效果可能產(chǎn)生在任何一 種認知學科的教學過程中(一)案卷分析案卷分析是一種常用的評價策略, 其內(nèi)容主要是按照一定標準收集 起來的學生認知活動的成果.例如,學生的家庭作業(yè)或課堂練習、論文、 日記、手工制作的模型、繪畫等各種作品。對學生的作品進行考察分析, 并形成某種判斷和決策的過程就是案卷分析。(二)觀察通過教學過程中的非正式觀察, 教師也能夠搜集到大量的關(guān)于學生 學業(yè)成就的信息.這種觀察不只限于智能的發(fā)展,還包括學生生理、社 會和情緒的發(fā)展。為了確保觀察的有效性,教師應(yīng)注意自然地對學生進

15、 行全面系統(tǒng)的觀察,然后客觀、詳細地記錄下觀察信息。1 .行為檢查單教師可以使用檢查單來記錄其在教學中的觀察結(jié)果。檢查單一般包括一系列教師認為重要的目標行為,通常采用有/無的方式記錄,但有 時也記錄下次數(shù)。行為檢查單使用簡便易行,對于教師非常有用。尤其 在課堂上,教師可以利用檢查單及時記下所觀察到的行為,便于指導(dǎo)和幫助學生。如果行為是屬于某一個好一壞連續(xù)體上的某一點,那么更適宜的方式是等級評價量表。當觀察目標是具體、特定的經(jīng)過了明確界定 的行為時,檢查單非常有效。2 .軼事記錄軼事記錄是描述所觀察的事件。與檢查單相比,軼事記錄可提供比 較詳細的信息,這些記錄一般是按照發(fā)生時間排列的。教師可以在

16、事先 有明確的觀察目標,就某一方面的行為進行記錄;也可以沒有明確目的, 事后再專門分析或考查某一件事, 這時教師就需要記下很多資料, 甚至 包括一些無關(guān)信息。軼事記錄要求教師純粹記載下所觀察到的內(nèi)容,而 不要摻雜進個人的意見或觀點。許多教師在他們的教案或工作日記上, 都有軼事記錄。但是,軼事記錄比較費時,而且也很難排除主觀偏見。3 .等級評價量表等級評價量表對于連續(xù)性的行為,可能更為有效。它可用于判斷某 種行為的發(fā)生頻率,以及某種操作或活動的質(zhì)量,使得觀察信息被量化. 評價量表是一種間接的觀察技術(shù), 通過量化所觀察的信息,可以迅速簡 便地獲得概括化的信息。評價量表和行為檢查單有一定關(guān)系。 二者

17、都要 求教師對學生的行為進行判斷,可以在觀察過程中或結(jié)束后使用。但是 它們的評價標準不同,檢查單只需要做定性的判斷,而等級評價量表是 做定量的判斷.(三)情感評價許多時候,教師有必要針對學生的情緒、學習動機、個人觀點等進 行評價。固然,我們可以借助已有的量表,但是學校也鼓勵教師自己編 制評價量表。為了獲得這類信息,教師可以自行編寫開放式問題、問卷 等.而在對結(jié)果的評價時,教師也需要寫一份詳細的報告,形式類似于上 文的觀察報告。四、教學評價結(jié)果的處理與報告(一)評分評分時必須以一定的比較標準為依據(jù),評分的標準可分為絕對標準和相對標準兩種。絕對標準是以學生所學的課程內(nèi)容為依據(jù),學生的分數(shù)和其他同學

18、的回答情況沒有關(guān)系.而且絕對標準強調(diào),由于不同學生 的學習起點和背景情況的差異,所以他們的學習結(jié)果也是不可比較的。 它對應(yīng)的評價方式,是標準參照評價.相對標準是以其他學生的成績?yōu)?依據(jù),對應(yīng)于常模參照評價.相對標準的評價不僅與學生自己的成績有 關(guān),還與其他同學的成績有關(guān)。在評分過程中,常常存在計分主觀性問題,教師往往會受一些無關(guān) 因素的影響,使得評分的信度較低.因此,評分標準一定要與測驗的編 制計劃和實際的編制工作保持連續(xù)性,確保整個評價活動是根據(jù)統(tǒng)一的 標準進行的。這樣,評價結(jié)果才可能是教師所預(yù)期的信息,具有較高的 信度,能夠?qū)虒W活動發(fā)揮積極作用。合理的評分過程應(yīng)包括如下步驟:第一,搜集有關(guān)學生的信息,信 息可以來源于不同類型、性質(zhì)的測驗,甚至觀察的評價方式。例如,教 師對學生期末學習成績的評價, 通常是期末考試成績占70%,平時作業(yè) 和考試成績占20%,課堂表現(xiàn)占10%。第二,系統(tǒng)地記錄下評價的結(jié) 果,并隨時保持最新的結(jié)果.第三,盡量將搜集的資料量化,用數(shù)據(jù)來 表示學生的學習情

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論