教育測量與評價(期末復習重點)_第1頁
教育測量與評價(期末復習重點)_第2頁
教育測量與評價(期末復習重點)_第3頁
教育測量與評價(期末復習重點)_第4頁
教育測量與評價(期末復習重點)_第5頁
已閱讀5頁,還剩147頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章教育測量的質(zhì)量指標衡量教育測量的質(zhì)量,可采用四個指標:信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度第一節(jié)信度一、信度概念信度是指測量結(jié)果的穩(wěn)定性或可靠性程度。用同一種工具反復測同一種特質(zhì)對象,結(jié)果的一致性程度就叫信度一般地說,一個好的測量必須具有較高的信度,也就是說,一個好的測量工具,只要遵守操作規(guī)則,其結(jié)果就不應隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化?;蛘哒f,測驗的抗干擾能力強,誤差因素控制得好,測值的一致性高,就叫信度高,人們感覺可靠。可以從以下三個方面去理解測量的信度P29:信度指實測值(X)和真值(T)相差的程度信度是指統(tǒng)計量與參數(shù)之間的接近程度信度指兩次重復測量或等值測量之間的關(guān)聯(lián)程度。三、信度的估計方法(信度類型)1、重復信度(再測信度)指的是同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測驗上所得分數(shù)的相關(guān)系數(shù),一般采用積差相關(guān)的公式來計算。(板書、推導該公式)積差相關(guān)的使用條件:兩個變量的總體都呈正態(tài)分布,至少是單峰對稱的分布。作此判斷需要總體分布的卡方檢驗。必須是成對數(shù)據(jù),每對數(shù)據(jù)之間相互獨立兩個變量之間呈線性關(guān)系,可由散布圖的形狀來決定。例一用一個算術(shù)四則的速度測驗12個小學生,得分記為X,為了考察測量結(jié)果的可靠性,于3個月后再測一次,得分記為Y,問測驗結(jié)果是否可靠?學生序號123456789101112X202021222323232425262627Y202121202323252526262729在使用重測法計算穩(wěn)定性系數(shù)時,應注意以下問題:1、信度的取值范圍為[0,1],當信度值較大時,說明前后兩次測量結(jié)果比較一致;2、兩次測驗之間的時間間隔要適宜。太長,身心發(fā)展、遺忘、環(huán)境改變等使信度降低;太短,練習與記憶等提高了成績,信度降低。3、重測法適用于速度測驗而不適用于難度測驗;因被試很難記憶第一次,而難度測驗相反。還適用于運動技能的測驗。4、適用于異質(zhì)測驗,即一個測驗包含幾個不同的部分,分別測量不同的心理特質(zhì)。因為這種測試不適于計算內(nèi)部一致性信度。4、應注意提高被試者的積極性。2、復本信度指的是兩個平等的測驗測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關(guān)系數(shù)。所謂復本測驗是指在格式、內(nèi)容、題型、題數(shù)、難度、指導語說明、施測要求等方面都一致(或相等)的兩份或多份測驗。例二以A、B兩型英語復本測驗對初中三年級10個學生施測,為避免由測驗施測順序所造成的誤差,其中5個學生先做A型測驗,休息15分鐘后,再做B型測驗;而另5個學生先做B型測驗,休息15分鐘后,再做A型測驗。10個學生A型測驗結(jié)果記為X,B型測驗結(jié)果記為Y,其測驗的復本信度如何?學生序號12345678910X19191817161515141312Y20171818171513151212復本信度的優(yōu)缺點表現(xiàn):優(yōu)點:1、兩個復本在同時使用時,可以避免再測信息的一些缺點如首測對再測在記憶、練習、效果的影響,間隔期間獲得新知識的影響,兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應付測驗所作訓練的影響等。反映究竟是不是真正的平行測驗;換言之,反映了測驗內(nèi)容造成的誤差。2、測驗的兩個復本,如果在不同的時間使用,其信度既可以反映被試在不同時間的穩(wěn)定性,又可以反映測驗內(nèi)容的一致性。換言之,既反映了時間影響,又反映了測驗內(nèi)容的抽樣誤差。這種同時兼顧試題抽樣與時間影響的信度,稱為等值穩(wěn)定性系數(shù),與其他信度系數(shù)相比,該系數(shù)最小,也就是說,此種復本信度是對信度最嚴格的檢驗。3、在追蹤研究或探討某些影響測驗成績的因素時,大多使用復本測驗,分析復本信度。缺點:1、編制兩個完全相等的測驗是很困難的,如果兩個復本過份相似,則變成再測形式,而過分不相似,又使等值的條件不存在;2、兩個復本測驗有可能在某種程度上測量了不同的性質(zhì),這就會低估測驗的信度;(因內(nèi)容造成的誤差)。3、被試同時接受性質(zhì)相似的兩個測驗,可能減少完成測驗的積極性;4、雖然兩個復本測驗的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去復本的意義。3.1、同質(zhì)信度之分半信度就是將測驗分半,被試在每一半測驗上所得分數(shù)的相關(guān)系數(shù)。反映了2半題目間的一致性。

分半的方法很多,如,按題號奇偶,按難度、按題目內(nèi)容。無論如何分半,都要在分開后做微調(diào),最終目的是分成對等的兩半。如果做不到對等,就不適合求分半信度。在實際運用中,由于題目一般是按難度大小排列,采用奇偶分半可以使兩半測驗的題目在難度上基本相等,因此常被采納。

分半后,計算每個被試在兩個分半測驗分數(shù)的積差相關(guān)系數(shù),由于只是半個測驗之間的信度,故,再用斯皮爾曼—布朗公式加以校正。3.2同質(zhì)信度之庫德爾-理查森信度適合于全部二分計分題測驗的內(nèi)部一致性信度分析。常用的兩個公式有:(板書,P33)例三對初中一年級學生進行地理成績測驗,每答對1題得1分,答錯1題得0分,其測驗結(jié)果如下表,試估計該測驗的庫德-理查森信度?學生序號題序

123456總分110000012100100230000112411100035010011361110003711110048111100491101115101111116pqpq請比較兩個公式所算出來的值當測驗中所有的試題難度都一樣,或平均難度接近0.50時,兩個公式所估計出來的信度值將相等。但是,當測驗中所有試題難度值極不相同時,差距將較大。一般KR21比KR20信度值小。4、論文式測驗信度論文沒有嚴格評分標準,同樣題目,不同應試者回答與得分不一樣,可用克龍巴赫阿爾法系數(shù)公式。P34該公式適用于:測驗題型多并非都是2分計分題時。板書公式請閱讀,并解釋公式含義。

例4用一個包含6個論文式試題的測驗,測5個被試,結(jié)果如下,試求該測驗的信度?題序?qū)W生序號

12345某題得分方差136165243323334121425212514454646532總分1728161917四、提高信度的方法(一)信度系數(shù)多大為宜?學科測驗0.9以上;智力測驗0.8以上;品德測驗,達到0.6就不錯了。作業(yè)1、用某量表測驗10名學生,得分記為X,為了考察結(jié)果的可靠性,于15天后用原量表對這10個學生重測一次,得分記為Y,問測驗結(jié)果是否可靠?學生序號12345678910X810961075794Y91010610848942、對10名應試者先進行某種測驗X,隔適當時間后(半年),再進行內(nèi)容、范圍、難度類似的第二次測驗Y,試求測驗的復本信度?應試者12345678910X9101061084894Y49794353243、有一個由100題構(gòu)成的量表施行于10個高三學生(分數(shù)見下表)。測驗一次后,學生即畢業(yè)離校,現(xiàn)怎樣評價測驗結(jié)果的信度?學生序號12345678910奇X38373841403638394035偶Y37373639393438393936四、提高信度的方法1、影響測量信度的主要因素自行閱讀P34-35,請同學們討論、解釋。(1)測量工具方面(對照教材重點解釋)(2)主試、施測情境方面(對照教材舉例)(3)被試方面(同上)(4)兩次施測的間隔時間方面2、提高測量信度的常用方法閱讀p36-37,請學生解釋:(1)適當增加測驗的長度(2)測驗的難度要適中(3)測驗的內(nèi)容應盡量同質(zhì)(不同質(zhì)是如何影響信度的?)(4)測驗的程序應統(tǒng)一(5)測驗的時間要充分(6)測驗的評分要盡量做到客觀化,減少評分誤差第二節(jié)效度一、什么是效度效度是指測量結(jié)果的準確性和有效性的程度。也可以說是測量是否達到了預期的目的。1、效度是一個相對的概念。

測量的效度是相對一定的測量目的而言的2、一種測量的效度只是高或低的問題測量結(jié)果總是有一定效度的,只是效度高低不同罷了。3、教育領(lǐng)域的效度問題比其他領(lǐng)域的測量更重要。二、效度的理論公式板書P39及參考書P58重申變量和的方差運算公式目標真分數(shù)、非目標真分數(shù)根據(jù)理論公式,怎樣才算測量效度高?請同學們回答。

三、效度的估計效度估計就是多方尋找證據(jù)來證明一個測驗的有效性程度的過程。(一)內(nèi)容效度就是指測驗題目樣本對于應測內(nèi)容與行為領(lǐng)域的代表性程度。也就是說,測驗的內(nèi)容范圍、材料與所要測量的內(nèi)容范圍、教育目標是否相符合;測驗中測題所引起的行為是否是所要測量的屬性的明確反應。為了使測驗的內(nèi)容具有有效性,成為所欲測量內(nèi)容的一個具有代表性的行為樣本,在編制測驗時,就要考慮建立內(nèi)容效度的問題。2、內(nèi)容效度的估計邏輯分析法其工作思路是請有關(guān)專家對測驗題目與應測內(nèi)容范圍的吻合程度作出判斷。把所有題目按考試內(nèi)容和考查目標分布進行雙向分類,形成實際的“題目雙向分類表”。與事先預定的“命題雙向分類表”作比較,看是否偏離了原命題計劃。內(nèi)容效度主要應用于成就測驗、學科測驗。內(nèi)容效度不適合用于能力傾向和人格測驗。(二)結(jié)構(gòu)效度結(jié)構(gòu):心理學或社會學上的一種理論構(gòu)想或特質(zhì)。本身觀察不到,也無法直接測量,但學術(shù)理論假設(shè)它是存在的。舉例:結(jié)構(gòu)效度:測量能測出這種結(jié)構(gòu)的程度(1)結(jié)構(gòu)效度的特點結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對同一種心理特質(zhì)有著不同的定義或假設(shè),則會使得關(guān)于特質(zhì)測驗的結(jié)構(gòu)效度的研究結(jié)果無法比較。比如智力(2)建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu),導出各項關(guān)于心理功能或行為的基本假設(shè)。擬定測題,編制測驗;C、以測驗結(jié)果為根據(jù)來驗證假設(shè)結(jié)構(gòu)中的各種因素是否成立。例如智力P42測量甲與其他理論上認為應該與之有關(guān)的其他測量有顯著相關(guān)。與其他理論上認為不應該與之有關(guān)的其他測量沒有顯著相關(guān)。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測驗、人格測驗等一些心理測驗方面。(三)效標關(guān)聯(lián)效度是以測驗分數(shù)和效標之間的相關(guān)系數(shù)來表示測驗效度高低的方法。什么是效標?例如:某年全國高考物理學科的測驗效度,可用大學一年級物理學科的測驗分數(shù)為效標,然后求同一組學生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測驗的效標關(guān)聯(lián)效度系數(shù)。效標不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是一個好的成功的效標,將來就不一定是。所以,為某個測驗選擇一個最有效的效標,這是最重要的事情。教育測驗的效標,可采用各學科成績和教師評定的結(jié)果;智力測驗的效標,可采用學科成績、教師評判的結(jié)果、學生總成績、受教育年限、年齡以及其他事物;能力傾向測驗的效標,可采用特殊課程或特殊訓練的成績;職業(yè)興趣測驗的效標,可采用從業(yè)人員實際服務成績或記錄;人格測驗的效標,可采用被試以后行為或臨床資料。效標關(guān)聯(lián)效度的種類

同時效度預測效度效標關(guān)聯(lián)的計算方法:計算相關(guān)系數(shù)(多采用積差相關(guān)法,略)P41,其他方法參閱教育統(tǒng)計學教材2、提高測量效度的方法P44對效度系數(shù)的要求:P42,閱讀1分鐘控制系統(tǒng)誤差精心編制測驗量表擴充樣本的容量(增加樣本對總體的代表性)合理處理效度和信度的關(guān)系(信度是效度的前提,效度不大于信度的平方根)妥善組織測驗適當增加測驗長度三、難度難度是指試題的難易程度。一道試題,如果大部分被試都能答對,則該題的難度就??;如果大部分被試都不能答對,則該題的難度就大。難度由被試群體整體水平所確定。是相對概念。難度的計算(一)基本公式1、客觀題難度的計算P=R/NR為答對該試題人數(shù),N為參加測驗總?cè)藬?shù)例1:在100個學生中,答對第一題的30人,答對第二題的60人,求第一、二道題的難度?比較這兩道題誰比誰難?2、主觀題難度的計算例2:某道論述題滿分12分,所有考生在這道題上的平均得分為3.6分,求該題的難度?例3:語文測驗第五題最高得分為12分,這道題考生的平均得分是8.5分,求該題難度?例4:60人參加考試,某題滿分為12分,正確得分累積是480分,求該題難度?(2)極端分組法客觀題步驟:將測驗總分進行高低排序(由高到低)進行高低分組(各取27%),并計算某題的得分率求兩組的平均值公式:P=(PH+PL)/2PH為高分組答對該題的百分比;PL為低分組答對該題的百分比。例5某區(qū)域1000人參加考試,試卷第一題高分組180人答對,低分組60人答對,求該題難度?如果該題滿分為10分,高分組得分總數(shù)為2100分,低分組得分總數(shù)為830分,求該題難度?論文題的步驟:將測驗總分進行高低排序(由高到低)進行高低分組(各取25%)分別為高分組、低分組編制每道試題的分析表按下列公式計算難度:P=板書P48

例某道論文題,高分組得分總和40分,低分組得分總和15分,40人參加考試,此題最高得分為5分,最低得分為2分,則此題的難度為P48:2、難度的分析與控制(1)難度分析進行難度分析的主要目的是為了篩選題目。A、測驗題目難度水平的確定測驗題目難度水平的適當與否,取決于測驗的目的、性質(zhì)和題目的形成。當P值接近于0或接近于1時,即被試在該題上全部答對或全部答錯,則該題無法提供個體的信息。而只當P值接近于0.50時,題目才能把被試作最大的程度的區(qū)分。(離散程度最大)對于常模參照性測驗,大多數(shù)難度在0.3-0.7之間,平均0.5。但對于奧林匹克競賽或補習功課的學生,例外。B、測驗難度對分數(shù)分布的影響測驗的難度直接依賴于組成測驗的題目的難度,通過考察測驗分數(shù)的分布,可以對測驗的難度做出直觀檢查。由于人的心理特性值多數(shù)呈正態(tài)分布,因此當測驗目的在于測量個體差異時,若被試樣本具有代表性,則其結(jié)果應呈正態(tài)分布。測驗分數(shù)背離正態(tài)分布有兩種情況:其一是題目難度普遍較大,被試得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài);其二是題目難度普遍較小,被試的得分普遍較高,使得高分端出現(xiàn)高峰,呈負偏態(tài)。(2)難度的控制一般說來,影響題目難度的主要因素有:考察知識點的多少;考察能力的復雜程度或?qū)哟蔚母叩?;考生對題目的熟悉態(tài)度;命題的技巧。難度控制:正確估計考生水平與否;弄清弄懂各知識點與否;掌握命題技巧與否。四、區(qū)分度(一)區(qū)分度的含義指測驗題目對考生實際水平的區(qū)分程度或鑒別能力。如一道題,學業(yè)水平、實際能力都較高的考生都答對了;而學業(yè)水平、實際能力都較低的考生都答錯了,則可認為該題目有好的區(qū)分度。區(qū)分度分析主要以效能為依據(jù),考察考生在每個題目上反應與其在效標上的表現(xiàn)之間的相關(guān)程度。區(qū)分度(D)的取值范圍介于-1.00—+1.00之間,值越大,區(qū)分度的效果越佳。區(qū)分度D>0為正區(qū)分,D<0為負區(qū)分,D=0為零區(qū)分區(qū)分度與測驗信度、難度的關(guān)系,請自行閱讀P51。(二)區(qū)分度的計算1、極端分組法(1)客觀性試題D=PH-PL例6:有道試題,高分組有70%學生通過,低分組有30%的學生通過;而另一道題,高分組有40%學生通過,低分組有70%學生通過,求兩題的各自區(qū)分度?P51(2)主觀題D=(XH-XL)/N(H-L)XH為高分組得分總數(shù)XL為低分組得分總數(shù)H為該道題的最高分L為該道題的最低分N為應試總?cè)藬?shù)的25%。例7

高分組低分組得分X人次f得分X人次f545043413231212310110004此題最高得分5分,最低得分0分2、相關(guān)法點二列相關(guān)法例8:15個學生在數(shù)學測驗中得分記錄如下,計算數(shù)學測驗中第一題的區(qū)分度?學生123456789101112131415測驗657031498050351081697855779042第一題010110100110110二列相關(guān)例9:已知一測驗中某選擇題的通過率為0.5,答對者的測驗總分平均為76分,答錯者的測驗總分平均為63分,全體被試20人總分的標準差為16,求該題的區(qū)分度?(三)提高區(qū)分度的方法1、使題目的難度適中,使整個考試難度適中題目的難度適中可使區(qū)分度達到最大值,因此,使難度適中是提高區(qū)分度的重要方法。2、著重考察復雜的學習結(jié)果使高能學生得高分或低能學生得低分,使分數(shù)盡量分布在整個分數(shù)量尺上。3、掌握區(qū)分度的評價標準。P53,評價標準表第三章測驗目標定義1、深入分析課程教學目標;閱讀5分鐘后,請合上課本描繪教育目的、教學目標、課程目標、單元教學目標、課時教學目標、知識點教學目標、行為目標、學習目標及程序教學諸概念之間的關(guān)系。雙向細目表的概念內(nèi)容類的概念P76,認真閱讀3分鐘。目標層次的概念

第四章教育評價方案的編制與實施第二節(jié)教育評價方案的制定一、教育評價指標體系的的構(gòu)建(一)教育評價指標體系的結(jié)構(gòu)1、框架指標體系的構(gòu)成:指標集、評價標準、量化符號。板書解釋“評價對象”與“指標”的相對性

2、模型一般模型:評價普遍現(xiàn)象分類模型:評價特殊現(xiàn)象舉例:“一間中學,教師的教學工作”一般模型與分類模型的相對性,例如:“一間中學,教師的教學工作”“一間中學,中學的全面工作”指標體系由指標、評價標準和量化符號組成3、指標(與“評價對象”相對)必達指標與期望指標對教師學歷、設(shè)備等設(shè)置;違紀犯罪率最低限度;表彰、獎項穩(wěn)定性指標與變動性指標“教學方法”/“德育”,“計算機輔助教學”軟指標與硬指標設(shè)備、場地/辦學特色,決策水平初擬評價指標頭腦風暴/因素分解/理論推演/篩選評價指標(1)經(jīng)驗法:理由充分否?/主次/指標關(guān)系(近似、交叉、因果、矛盾等)/去難存易,刪繁就簡(2)統(tǒng)計調(diào)查:按5檔給專家問卷,統(tǒng)計“很重要”“重要”人數(shù)比例,按人數(shù)比例高低排列,刪除三分之二或四分之三。4、標準概念:達標程度/末級指標必須明確規(guī)定評價標準從內(nèi)容上分:效能標準:效果標準和效率標準職責標準素質(zhì)標準從參照點分:社會標準;規(guī)范性法則,參照點在外部科學標準:社會學或自然法則,參照點在內(nèi)部5、量化符號權(quán)數(shù):一般把同一級指標群集視為整體,權(quán)值1分數(shù):指標賦分;等級賦分標度:達到標準的程度,說明什么樣的程度屬于什么等級。表示方法有:描述性語言,如,好、中、差;量化形式,如,用分數(shù)閾劃分,100-90屬于優(yōu)秀,

89-75屬于良好。(二)教育評價指標體系的建造1、信度和效度信度:a、同一評價者用同一指標體系去重復評價某一對象,所得結(jié)果的一致程度;(再測信度)b、不同評價者用同一指標體系在相隔較短的時間去評價同一對象,看一致性程度。(評分者信度)c、同一評價者、使用多種指標體系,幾乎同時評價同一對象,考察結(jié)果的真實程度(一致程度)(復份信度)一般來說,指標內(nèi)涵客觀;指標與指標之間相互獨立;硬指標比例大;評價標準的規(guī)定明確,等級間的界限分明,信度就高。如果軟指標多;指標、等級間界限模糊,評價者較難區(qū)分指標之間的差異,難以掌握評判準則,則會降低信度。效度:考察的是,我們所要評的,與指標體系能評的之間的關(guān)系。越接近,說明指標體系各要素(指標、標準、量化符號)的設(shè)置越準確,越有代表性。哪些做法影響效度?P1022、方法前人的啟示:量表與問卷/泰勒的“教育目標”以及目標達到的評價模式/“行為目標”的研究/教育目標分類學及教育評價的研究成果/我國的有關(guān)探索等。P103(1)掌握構(gòu)建教育評價指標體系的依據(jù):理念問題/實證問題。P103

(2)掌握評價對象逐級分解的方法。對內(nèi)涵的理解正確、深刻。如“師德”指標。/理解、分解的多路向性/抓大放小原則/實施評價指標的可行性/(3)掌握評價等級和標準確定的方法。

等級數(shù)應根據(jù)指標的類型和性質(zhì)來確定。/四級分等,兩級定標的簡便方法。標準:根據(jù)不同類型指標的不同特點,綜合運用,如“教改實驗”、“教師隊伍結(jié)構(gòu)”/各等級規(guī)定的評價標準,界限要清楚。(4)掌握指標與等級數(shù)值分配的方法。集體討論、咨詢、同行專家意見、調(diào)查研究,注重程序。參與人員必須:a、知識經(jīng)驗、判斷鑒別力;b、明確賦值依據(jù)和原則;c、認真嚴謹二、教育評價方案的編制以評價指標體系的撰寫為核心1、期望評語式編寫法2、積分評語式編寫法(1)等分積分評語式(2)累計積分評語式復習:設(shè)計教育評價指標體系實操(一)確立目標與指標1、目標目標即目的,泛指人們從事活動所達到的目的。2、指標簡單地說,指標是用來反映、測量和說明上一級項目的下一級項目。是目標一個方面的規(guī)定,它是具體的、可測量的、行為化和操作化的目標。(二)選擇指標體系的結(jié)構(gòu)1、直線式結(jié)構(gòu)二級指標11一級指標1

二級指標12

二級指標21一級指標2

二級指標22

二級指標31一級指標3

二級指標32例1:小學生最優(yōu)發(fā)展的整體評價指標體系

思想品德思想素質(zhì)科學素質(zhì)性格情趣愛好小審美素質(zhì)美的感受和鑒賞學美的表達和創(chuàng)造生學業(yè)成績最知識素質(zhì)知識結(jié)構(gòu)優(yōu)百科知識面發(fā)自學能力展能力素質(zhì)自理生活能力人際交往和組織能力體態(tài)和機能身體素質(zhì)運動能力衛(wèi)生保健2、樹狀式結(jié)構(gòu)一級指標一級指標一級指標總目標二級指標例2:學生主體性的基本結(jié)構(gòu)主體性自主性主動性創(chuàng)造性自尊自信自我調(diào)控獨立判斷決斷自覺自理成就動機競爭意識興趣和求知欲主動參與社會適應性創(chuàng)新意識創(chuàng)造性思維能力動手實踐能力(三)教育評價指標體系建立的步驟和方法1、步驟:(1)分解目標,提出初擬指標(2)歸類合并,進行篩選(3)專家評判(4)預試修訂(1)分解目標,提出初擬指標一般較為注意指標的科學性、完備性,唯恐掛一漏了或包羅不盡。這些指標不僅是較為粗疏的,數(shù)量也可能是比較多的。方法(1)頭腦風暴法是利用頭腦積極思維,進行智力碰撞,激發(fā)智慧的靈感,從而提出評價指標的一種常用方法。(2)因素分解法是一種將評價指標按照評價對象本身的邏輯結(jié)構(gòu)逐級進行分解,把分解出來的主要因素作為評價指標的方法。應當注意:分解出來的因素,從高到低逐層縮小內(nèi)涵,越往下層次指標越明確、越具體、范圍越小,越可以觀測。(3)理論推演法是根據(jù)有關(guān)學科的理論推演出評價指標的方法。(4)典型研究法是通過少數(shù)典型事例進行研究而設(shè)計評價指標的方法。(2)歸類合并,進行篩選在初擬指標中,有的能反映評價對象的本質(zhì),有的則未必;有的算得上主要因素,有的可能只是次要因素。各因素之間出現(xiàn)交叉、重復、包含、矛盾、因果等關(guān)系,也難以避免,必須對初擬指標進行歸類合并和篩選,以達到“少而精”的要求。篩選指標的方法(1)經(jīng)驗法一般遵循以下幾個要點:A、理由是否充分或必要判斷每項指標是否是必要的,缺了它有什么不好,保留它有什么理由,被保留的要有充分的依據(jù),在指標體系中,屬于非要不可的因素。B、取主舍次區(qū)分每項指標反映評價對象本質(zhì)的程度,保留能反映本質(zhì)的主要因素,舍棄不能充分反映本質(zhì)的次要因素。C、從各指標之間的關(guān)系上進行比較內(nèi)涵相同或近似的合并,內(nèi)涵交叉的保留其一;有因果關(guān)系的,保留“因”而去掉“果”;相互矛盾的保留既符合方針、政策規(guī)定又切合當?shù)貙嶋H的指標。D、去難存易,刪繁就簡確實難測的指標可以舍棄;指標內(nèi)涵復雜的,盡量求其單一。(3)專家評判這是指標設(shè)計從設(shè)計者手中走向管理實踐的重要步驟。專家通常包括評價理論研究者、上級領(lǐng)導、富有經(jīng)驗的教育行政干部、教師等。專家評判可采用個別訪問、座談、問卷征詢、現(xiàn)場調(diào)查等方式,應根據(jù)不同情況選擇。調(diào)查統(tǒng)計法是在調(diào)查獲取資料的基礎(chǔ)上進行統(tǒng)計的方法。其具體的做法是:把初擬指標制成問卷,發(fā)給有關(guān)專家和有經(jīng)驗的教育工作者,請他們對初擬指標每一項作出判斷。一般分為五檔,即很重要、重要、一般、可要可不要、不要。答卷者在每項指標后記上自己判斷該項指標相比之下的重要程度(只能定一個檔次),然后,收回問卷,統(tǒng)計“很重要”、“重要”兩檔的人數(shù)比例,按評為“很重要”、“重要”人數(shù)比例由高到低順序排列,把低于某數(shù)值(一般低于三分之二或四分之三處作為劃界)的指標刪除,就得到篩選的指標。(4)預試修訂指標體系經(jīng)過篩選、修訂,初步確定以后,可以同評定標準相匹配,選點在小范圍試驗,看是否可行,試驗后對指標體系再作修改,然后投入使用。例3:學校領(lǐng)導班子評價指標體系的建立1、首先分4個層次提出了16項指標(1)政治素質(zhì)(政治理論和政策水平、思想品德修養(yǎng)、事業(yè)心和責任感)(2)業(yè)務素質(zhì)(文化專業(yè)達標、教育理論修養(yǎng)、管理實踐經(jīng)驗)(3)工作效能(職務與能力相稱、分工明確和各盡其責、團結(jié)協(xié)作、指揮靈便、工作效率高)(4)工作作風(深入實際、發(fā)揚民主、決策果斷、以身作則、開拓精神)2、把以上16項指標,分為五檔(很重要、重要、一般、可要可不要、不要),分別征詢意見,獲得以下結(jié)果:政治素質(zhì)(事業(yè)心和責任感1、政治理論和政策水平3、思想品德修養(yǎng)11)業(yè)務素質(zhì)(教育理論修養(yǎng)2、管理實踐經(jīng)驗10)工作效能(團結(jié)協(xié)作5、分工明確和各盡其責8、工作效率高9)工作作風(決策果斷4、以身作則6、開拓精神7、發(fā)揚民主12)第五章教育評價的方法第一節(jié)教育評價方法概觀絕對評價法相對評價法個體內(nèi)差異評價法定性分析評價法定性綜合判斷法行為目標評價法臨床督導評價法指標評分法確定評價指標權(quán)重的方法(1)關(guān)鍵特征調(diào)查法(2)兩兩比較法(3)專家評判平均法(4)倍數(shù)比較法等級換分法把具體項目的等級評定換算成分數(shù),然后將各項分數(shù)相加,滿分100.具體做法:1、大項目,分數(shù)和(X+Y+Z):100;2、某個大項目(X)再細分若干具體項目(x1,x2,x3),

為x1,x2,x3分配分數(shù);3、將x1(或x2、x3)分等級(評語論域v),每一等級需確定具體的評價標準:合格/不合格;優(yōu)/中/劣;...4、將各等地折算成分數(shù)。如x1滿分11分,則可將優(yōu)算成11分,良-9分,中-7分,差-5分。5、將各項目得分相加。加權(quán)平均法權(quán)重分配方法已經(jīng)介紹;自行閱讀3分鐘即可。模糊綜合評判法P137再介紹集體綜合評價法主要用于思想品德評價1、確定德育評價的具體項目(X+Y+Z)2、對每一個具體如X項目評分(100分):自評、他評。3、板書公式S=(r1+r2+r3+......rn)/Nr為每一德育項目自評分數(shù),N為項目數(shù)Fi=(∑Li-Si)/(R-1)Fi表示對思想品德的集體綜合評價,Li表示集體中每個成員對評價對象作出的評價(各個項目得分的平均數(shù));Si表示自我總評價分,R表示被試人數(shù)。

案例:先打分,再計算同學甲分數(shù)同學乙分數(shù)......尊敬師長學習態(tài)度遵紀守法團結(jié)互助集體觀念社會活動勞動態(tài)度平均分

第三節(jié)處理教育評價信息的方法一、定性分析描述法(一)等級評定法:制定評分等級及評定標準。應用到如操行、能力、職稱、學校等級等方面。(二)評語鑒定法:單方面、多方面評語法/簡易、結(jié)論明晰,能對一些模糊現(xiàn)象進行描述鑒定,解決了一些定量研究不能解決的問題,但難以客觀,信度和效度較低。(三)寫實分析法:集事實資料/整理、描述資料,一般先概括描述一般情況,再描述典型事例/分析評價:簡要、中肯、抓住本質(zhì)。寫實法的優(yōu)點是有依據(jù),新都高。缺點是全面地收集資料很難,耗時多。二、定量分析評判法(一)統(tǒng)計分析評判法自行閱讀P135-137的平均數(shù)、加權(quán)平均數(shù)、標準差、標準分數(shù)、T分數(shù)內(nèi)容,8分鐘。(二)模糊綜合評判簡介補充概念:隸屬度若對論域(研究的范圍)U中的任一元素x,都有一個數(shù)A(x)∈[0,1]與之對應,則稱A為U上的模糊集,A(x)稱為x對A的隸屬度。當x在U中變動時,A(x)就是一個函數(shù),稱為A的隸屬函數(shù)。隸屬度A(x)越接近于1,表示x屬于A的程度越高,A(x)越接近于0表示x屬于A的程度越低。用取值于區(qū)間[0,1]的隸屬函數(shù)A(x)表征x屬于A的程度高低,這樣描述模糊性問題比起經(jīng)典集合論更為合理。舉例例如,對于模糊集A={高個子},如果論域是“成年男性”,則可構(gòu)造隸屬函數(shù)如圖所示:板書確定因素論域X={x1,x2,…,xn}(如全班學生)和評語論域Y={y1(如侏儒),y2(矮子),…,ym(巨人)},其中xi表示問題中所考慮的因素(i=1,2,…,n),yj表示要判斷的等級(j=1,2,…,m)。則稱X與Y之間的模糊關(guān)系矩陣為單因素評判(單單只是一個個因素,未涉及“綜合”之意,即,只有各行向量有意義,整個矩陣沒意義),其中行向量(ri1,ri2,…,rim)是考慮單因素xi在Y上的評判,rij稱為因素xi對評價等級yi的隸屬度,R為Y上模糊子集。設(shè)X上的模糊子集A表示因素xi在本問題的加權(quán)數(shù)(也稱權(quán)重),則合成稱為對各因素的綜合評判,且

bj=板書(四種之一)(j=1,2,...m)其中算符“∨”為取大,“∧”為取小,稱為扎德算子。與矩陣乘法運算順序相同。舉例P57及A為1行m列矩陣的例子,請同學來算。當b1=b2=…=bm時,稱綜合評判全同失效;當b1,b2,…bm中至少有兩個相等的最大分量時,稱綜合評判義性失效。書上例題講解,P139例:根據(jù)某生測評表用1、4模型進行模糊綜合評判 優(yōu)秀良好 一般 較差 差道德觀念 0.25 0.54 0.18 0.03 0尊敬師長 0.39 0.50 0.08 0.030學習態(tài)度 0.64 0.25 0.08 0.03 0尊紀守法 0.58 0.39 0.03 0 0團結(jié)互助 0.08 0.50 0.31 0.08 0.03集體觀念 0.10 0.64 0.18 0.05 0.03社會活動 0.20 0.52 0.23 0.05 0勞動態(tài)度 0.41 0.37 0.14 0.08 0權(quán)重分配:A=(0.18,0.14,0.14,0.13,0.09,0.12,0.12,0.08)教育評價結(jié)果的合成方法(1)單純普通數(shù)據(jù)的合成加權(quán)平均,逐級向上,直到在一級指標上歸并為一個合成的分值。舉例(2)單純模糊數(shù)據(jù)的合成方法A、多級模糊綜合評判法1、對末級(二級)指標進行第一次綜合評判:W、R合成。如上例“某課堂教學質(zhì)量”2、將二級指標對一級指標所形成的若干綜合評判結(jié)果(即第一次綜合評判結(jié)果)組成一個新的模糊矩陣。如“某課堂教學質(zhì)量”再加上...3、將新矩陣與一級指標權(quán)重向量合成計算綜合評判結(jié)果。B、二維加權(quán)綜合合成法P143縱向加權(quán)/橫向加權(quán)板書畫圖:(3)混合數(shù)據(jù)的合成方法1、普通數(shù)據(jù)轉(zhuǎn)模糊數(shù)據(jù)2、模糊數(shù)據(jù)轉(zhuǎn)換成普通數(shù)據(jù)第六章教育測量結(jié)果的整理、轉(zhuǎn)換與組合第一節(jié)教育測量數(shù)據(jù)的特點與種類數(shù)據(jù)的特點:波動性、規(guī)律性數(shù)據(jù)種類:點計數(shù)據(jù)、度量數(shù)據(jù)//間斷性數(shù)據(jù)、連續(xù)型數(shù)據(jù)//類別變量、等級變量、等距變量、比率變量教育測量數(shù)據(jù)的特點:1、多屬等級變量;2、多屬主觀的;3、多屬隨機的(概率為1則為確定性);4、模糊性第二節(jié)教育測量分數(shù)的初步整理一、統(tǒng)計表的結(jié)構(gòu)(自學2分鐘)二、頻數(shù)分布表的編制由同學自習5分鐘后,上臺講解書本例題。第三節(jié)教育測量分數(shù)的轉(zhuǎn)換原始分(卷面分)的缺點:意義模糊,不能直接比較導出分數(shù):由原始

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論