教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第1頁(yè)
教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第2頁(yè)
教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第3頁(yè)
教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第4頁(yè)
教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制 一、教育測(cè)量的質(zhì)量指標(biāo) (一) 信度信度的概念信度指的是測(cè)量結(jié)果的穩(wěn)定性或可靠的程度,亦即測(cè)量的結(jié)果是否真實(shí)、客觀地反映了考生的實(shí)際水平。信度是任何一個(gè)測(cè)量的必要條件,對(duì)于教育測(cè)量來(lái)說(shuō),它具有更為重要的意義。只有高信度的測(cè)量才能成為教育工作有用的工具。否則,測(cè)量的結(jié)果是無(wú)意義的、無(wú)效的。(1)信度指實(shí)測(cè)量值和真值的相差程度。由于種種原因,實(shí)測(cè)值一般不會(huì)完全等于真值,兩者之差稱為測(cè)量誤差,測(cè)量的誤差越小,測(cè)量的信度就越高。用一個(gè)等式表示如下:X=T+E式中,X為實(shí)測(cè)值,T為真值,E為誤差。由于測(cè)量的真值是未知的,誤差也就無(wú)法求出,所以,這種理解無(wú)法求出信度。(2)

2、信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度。統(tǒng)計(jì)量和參數(shù)是統(tǒng)計(jì)學(xué)中的兩個(gè)基本概念。統(tǒng)計(jì)量是指樣本上的各種數(shù)字特征(如樣本的平均數(shù)、標(biāo)準(zhǔn)差等);參數(shù)是指總體上的各種數(shù)字特征(如總體的平均數(shù)、標(biāo)準(zhǔn)差等)。統(tǒng)計(jì)量越接近參數(shù),其可靠性越高,信度就越高。但這種理解也無(wú)法求出信度。(3)信度指兩次重復(fù)測(cè)量或等值測(cè)量之間關(guān)聯(lián)程度。如果對(duì)同一對(duì)象進(jìn)行兩次重復(fù)測(cè)量或等值測(cè)量后,計(jì)算兩次測(cè)量的相關(guān)系數(shù),相關(guān)系數(shù)越高,說(shuō)明測(cè)量的信度越高;相關(guān)系數(shù)越低,說(shuō)明測(cè)量的信度越低。對(duì)于信度的這種理解,有利于信度的計(jì)算。但重復(fù)測(cè)量會(huì)受被測(cè)對(duì)象經(jīng)驗(yàn)、知識(shí)增長(zhǎng)等因素的影響,等值測(cè)量又較難編制,因此用這種方法計(jì)算信度也是有誤差的。信度的理論公

3、式 根據(jù)實(shí)得分?jǐn)?shù)的分解,可將實(shí)得分?jǐn)?shù)的方差分解為真分?jǐn)?shù)的方差與隨機(jī)誤差的方差之和,信度等于真分?jǐn)?shù)的方差與實(shí)得分?jǐn)?shù)的方差之比或減去隨機(jī)誤差的方差與實(shí)得分?jǐn)?shù)的方差之比。所以,隨機(jī)誤差的方差越小,測(cè)量的信度越高。信度的取值范圍為01。信度的類型 (1)穩(wěn)定性系數(shù)。穩(wěn)定性系數(shù)又稱重測(cè)信度。它是指用同一測(cè)驗(yàn)試卷,在先后兩個(gè)不同時(shí)間內(nèi)對(duì)同一組被試進(jìn)行測(cè)驗(yàn),兩次測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)。(2)等值性系數(shù)。等值系數(shù)又稱復(fù)本信度。其方法是,先實(shí)施第一次測(cè)驗(yàn),然后在最短的時(shí)間內(nèi)實(shí)施第二份等值測(cè)驗(yàn),再求它們得分的相關(guān)系數(shù)。這個(gè)相關(guān)系數(shù)即為信度的等值性系數(shù)。(3)內(nèi)部一致性系數(shù)。內(nèi)部一致性系數(shù)是用一次測(cè)驗(yàn)來(lái)計(jì)算測(cè)驗(yàn)的信

4、度。按照分成兩個(gè)部分的不同,計(jì)算內(nèi)部一致性系數(shù)有兩種方法。一是分半信度:這種方法是將一次測(cè)驗(yàn)分成假定相等而獨(dú)立的兩部分來(lái)記分,通常是以題目的奇數(shù)為一組,偶數(shù)為一組,計(jì)算兩組的相關(guān)系數(shù),最后用斯皮爾曼布朗公式校正,求得整個(gè)測(cè)驗(yàn)的信度系數(shù)。二是庫(kù)德?tīng)柪聿樯椒ǎ哼@種方法只要測(cè)驗(yàn)一次,然后以各個(gè)問(wèn)題的正確反應(yīng)數(shù)為基礎(chǔ)(此可視為各題難度的信息),或根據(jù)各個(gè)總分的平均數(shù)和標(biāo)準(zhǔn)差,計(jì)算信度系數(shù)。(4)論文式測(cè)驗(yàn)的信度系數(shù)。論文式測(cè)驗(yàn)的評(píng)分沒(méi)有嚴(yán)格的評(píng)分標(biāo)準(zhǔn),以致同樣一個(gè)題目,不同應(yīng)試者的回答和得分都不一樣,所以無(wú)法用前面的公式,而要用克龍巴赫所創(chuàng)的系數(shù)公式。(5)評(píng)分者的信度系數(shù)。一般論文式測(cè)驗(yàn),只能提

5、供參考答案而無(wú)標(biāo)準(zhǔn)答案,因而不同的評(píng)分者對(duì)同一份試卷往往給分不同,甚至差別很大。評(píng)分者間的評(píng)分不一致,說(shuō)明評(píng)分信度不高,評(píng)分者所評(píng)的分?jǐn)?shù)越一致,評(píng)分信度越高。要計(jì)算評(píng)分者的一致性系數(shù),需區(qū)分評(píng)分者的人次數(shù)。若為2人評(píng)N份試卷,可用斯皮爾曼等級(jí)相關(guān)的公式計(jì)算;若三個(gè)以上的評(píng)分者評(píng)N份試卷時(shí),則需計(jì)算肯德?tīng)柡椭C系數(shù)(參見(jiàn)有關(guān)教育統(tǒng)計(jì)學(xué)的教材)。4提高信度系數(shù)的方法(1)信度系數(shù)以多大為宜。信度系數(shù)究竟以多大為好,沒(méi)有明確的標(biāo)準(zhǔn),要看測(cè)驗(yàn)的目的和類型。對(duì)于學(xué)科測(cè)驗(yàn),信度系數(shù)要求達(dá)到0.9以上。(2)誤差的來(lái)源。誤差的來(lái)源基本可以分為三類:一是測(cè)驗(yàn)本身所引起的誤差,如:測(cè)驗(yàn)的題型、題數(shù)、難度、時(shí)間、題

6、目一致性等。二是測(cè)驗(yàn)的實(shí)施所引起的誤差,如:環(huán)境、程序、主考、主考、評(píng)卷等。三是被試所引起的誤差,如動(dòng)機(jī)、心理、生理、經(jīng)驗(yàn)、身體等。(3)提高測(cè)驗(yàn)信度的方法。根據(jù)上述影響測(cè)量誤差的因素,我們可以采用如下方法提高信度:適當(dāng)增加測(cè)驗(yàn)題目的數(shù)量;盡量使測(cè)驗(yàn)的難度適中;測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì);測(cè)驗(yàn)的程序應(yīng)統(tǒng)一;測(cè)驗(yàn)的時(shí)間要充分;評(píng)分要做到客觀化,養(yǎng)少評(píng)分誤差。(二)效度1 效度的概念效度是指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度,對(duì)所要評(píng)價(jià)的事物實(shí)際上評(píng)價(jià)到的程度,也就是測(cè)量是否達(dá)到了預(yù)期的目的。我們可以從以下幾個(gè)方面來(lái)理解效度:首先, 測(cè)量的效度始終是對(duì)一定的測(cè)量目的而言;其次, 測(cè)量的效度也是對(duì)測(cè)量的結(jié)果而

7、言;第三,測(cè)量的效度只是高或低的的問(wèn)題;第四,在教育測(cè)量中,效度問(wèn)題比在其他領(lǐng)域的測(cè)量更為重要。2 效度的理論公式 實(shí)得分?jǐn)?shù)的方差可以進(jìn)一步分解為潛在真分?jǐn)?shù)的方差、系統(tǒng)誤差的方差和隨機(jī)誤差的方差之和,效度等于潛在真分?jǐn)?shù)的方差與實(shí)得分?jǐn)?shù)的方差之比。由效度的計(jì)算公式可以看出,如果隨機(jī)誤差的方差和系統(tǒng)誤差的方差之和越小,則效度越高。由以上實(shí)得分?jǐn)?shù)方差的分解,可以看出信度和效度之間有三種關(guān)系:第一種是高效度、高信度;第二種是高信度、低效度;第三種是低信度、低效度。因此,在效度與信度之間,首先要重點(diǎn)保證是高效度,因?yàn)?,高效度必然高信度;反之,則不然。特別是對(duì)于教育測(cè)量而言,效度問(wèn)題尤為重要。效度的估計(jì)效

8、度有內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和結(jié)構(gòu)效度三種,在學(xué)科測(cè)驗(yàn)中一般采用內(nèi)容效度。內(nèi)容效度是指測(cè)驗(yàn)?zāi)康拇硭霚y(cè)量的內(nèi)容和引起預(yù)期反應(yīng)所達(dá)到的程度,也就是測(cè)量?jī)?nèi)容的代表性程度,或者說(shuō)實(shí)際評(píng)價(jià)的內(nèi)容、范圍與所要評(píng)價(jià)的內(nèi)容、范圍相符合的程度。在編制測(cè)驗(yàn)時(shí),內(nèi)容效度是一個(gè)相當(dāng)復(fù)雜和不易解決的問(wèn)題。估計(jì)內(nèi)容效度的方法有兩個(gè): (1)邏輯分析的方法。就是根據(jù)教育學(xué)和心理學(xué)理論,以及教學(xué)大綱的要求,勾畫(huà)出學(xué)生應(yīng)掌握知識(shí)內(nèi)容的范圍和深度,提出應(yīng)形成的技能名稱等,然后以邏輯分析的方法估計(jì)測(cè)驗(yàn)在多大程度上代表了這些內(nèi)容,在多大程度上能夠測(cè)量出所要測(cè)量的特性和功能。(2)用測(cè)驗(yàn)題目與教材內(nèi)容比較的方法。這需要先制定兩個(gè)雙向

9、細(xì)目表:一個(gè)是測(cè)驗(yàn)的雙向細(xì)目表,要分別列出各單元教材內(nèi)容在測(cè)驗(yàn)中所占的百分比和所要求的各種行為反應(yīng)在全部反應(yīng)中的百分比;另一個(gè)是測(cè)驗(yàn)試題分類雙向細(xì)目表,要根據(jù)各單元教材內(nèi)容列出試題,并注明各題所要求的行為反應(yīng)及所占的百分比。然后對(duì)照雙向細(xì)目表,根據(jù)各部分的復(fù)合程度,判斷內(nèi)容效度的高低。提高效度的方法(1)各種效度系數(shù)的要求。不同的測(cè)驗(yàn)對(duì)效度系數(shù)有不同的要求。對(duì)效度系數(shù)大小的要求,也受原測(cè)驗(yàn)與獲得效標(biāo)的測(cè)驗(yàn)之間相似性的制約。若兩者不相似,則效度系數(shù)偏低;若相似,則效度系數(shù)會(huì)高些。所以,有的測(cè)驗(yàn)效度系數(shù)達(dá)到0.35即已符合要求,有的測(cè)驗(yàn)卻要達(dá)到0.65 0.77才能被認(rèn)為是有效的。(2)影響效度的

10、因素。 效度的高低受到很多因素的影響:測(cè)驗(yàn)的組成方面:如測(cè)驗(yàn)的取材、長(zhǎng)度,試題的難度、區(qū)分度及編排方式等;測(cè)驗(yàn)的實(shí)施方面:如考場(chǎng)的布置、材料的準(zhǔn)備、答題的說(shuō)明和時(shí)間的限制等;考生主觀狀態(tài)方面:如考生的興趣、動(dòng)機(jī)、情緒、態(tài)度和健康狀況等;估計(jì)效度所依循的效標(biāo):如選擇效標(biāo)不當(dāng)?shù)?;樣本方面:如樣本的大小及代表性等??傊?,為了增進(jìn)測(cè)驗(yàn)的效度,必須要求測(cè)驗(yàn)編制和實(shí)施程序的標(biāo)準(zhǔn)化,注意考生在測(cè)驗(yàn)情境中的行為反應(yīng),并顧及適當(dāng)樣本和效標(biāo)的選擇,以建立符合測(cè)驗(yàn)?zāi)康暮凸δ艿男Ф?。?)提高效度的方法。 控制系統(tǒng)誤差:如儀器沒(méi)有校準(zhǔn)、題目和指導(dǎo)語(yǔ)有暗示性、答案有明顯組形等;精心編制試題:如測(cè)驗(yàn)內(nèi)容要能反映測(cè)驗(yàn)?zāi)康模?/p>

11、題目表述要清晰、簡(jiǎn)明,所用字、詞、句能為考生理解,排列應(yīng)該由易到難,題目難度要合適,并有足夠的區(qū)分度,試卷印刷要清晰無(wú)誤等;妥善組織測(cè)驗(yàn):如嚴(yán)格按照考試手冊(cè)進(jìn)行,不作超出規(guī)定的解釋,掌握好考試時(shí)間,遵照評(píng)分標(biāo)準(zhǔn)評(píng)分,認(rèn)真仔細(xì)登分等;擴(kuò)充樣本的容量和代表性:加大樣本的容量,可增加樣本對(duì)總體的代表性,減小隨機(jī)誤差,使測(cè)驗(yàn)更加可靠;合理處理效度和信度的關(guān)系:因?yàn)樾哦雀咝Ф炔灰欢ǜ撸Ф雀咝哦纫欢ǜ?,所以在處理效度和信度的關(guān)系上,首先要保證效度;適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度:增加測(cè)驗(yàn)的長(zhǎng)度可以提高信度,而效度的最大值與信度有關(guān),所以也可以提高效度。(三)難度1 難度的概念難度是指測(cè)驗(yàn)試題的難易程度。難度是試題

12、對(duì)學(xué)生知識(shí)和能力水平適合程度的指標(biāo)。試題的難度不僅對(duì)題目的區(qū)分度有很大的影響,而且對(duì)試卷的信度和效度也有較大的影響。難度是一個(gè)相對(duì)的概念,難度的高低與考生的水平直接相關(guān)。也就是說(shuō),難度是由參與測(cè)驗(yàn)的考生群體的整體水平?jīng)Q定的。難度的計(jì)算客觀試題的難度為答對(duì)該題的人數(shù)與總?cè)藬?shù)之比,即試題的通過(guò)率。難度系數(shù)越大題目越容易;主觀試題的難度為所有考生對(duì)該題的平均分與該題的滿分之比。同樣,難度系數(shù)越大題目越容易。難度對(duì)測(cè)驗(yàn)的影響(1)測(cè)驗(yàn)難度影響測(cè)驗(yàn)分?jǐn)?shù)的分布形態(tài)。難度系數(shù)過(guò)大或過(guò)小,都會(huì)造成測(cè)驗(yàn)分?jǐn)?shù)的偏態(tài)分布。難度系數(shù)越接近0,測(cè)驗(yàn)的難度越大,答對(duì)題的人數(shù)越少,測(cè)驗(yàn)分?jǐn)?shù)就越集中在低分段,其分?jǐn)?shù)呈正偏態(tài)分

13、布。相反,難度系數(shù)越接近1,測(cè)驗(yàn)的難度越小,答對(duì)題的人數(shù)越多,測(cè)驗(yàn)分?jǐn)?shù)就越集中在高分段,其分?jǐn)?shù)呈負(fù)偏態(tài)分布。(2)測(cè)驗(yàn)難度影響測(cè)驗(yàn)分?jǐn)?shù)的離散程度。因?yàn)殡y度系數(shù)過(guò)大或過(guò)小,測(cè)驗(yàn)分?jǐn)?shù)都呈偏態(tài)分布,從而縮小了考生的差距,所以難度系數(shù)直接影響測(cè)驗(yàn)分?jǐn)?shù)的離散程度。(3)測(cè)驗(yàn)難度影響測(cè)驗(yàn)的鑒別能力。難度系數(shù)過(guò)大或過(guò)小,會(huì)使考生都得高分或低分,從而不能區(qū)分考生的實(shí)際水平,影響測(cè)驗(yàn)的鑒別能力。測(cè)驗(yàn)的適宜難度 從難度的計(jì)算公式,我們可以得出難度的取值范圍為:0P1,當(dāng)P=0時(shí),試題的實(shí)際困難程度最大(所有的考生都得0分);當(dāng)P=1時(shí),試題的實(shí)際難度最?。ㄋ锌忌既珜?duì))。在常模參照性測(cè)驗(yàn)中要求試題難度適中,即題

14、目的難度在0.30.7之間,少數(shù)題目可以在這一范圍之兩邊且題數(shù)(或題分)大體相當(dāng),使整個(gè)試卷的平均難度為0.5左右(0.45 0.55之間)。對(duì)于其他類型的測(cè)驗(yàn),目的不同對(duì)難度的要求也不同??刂祁}目難度的基本方法 一般說(shuō)來(lái)影響題目難度的主要因素有:()考查知識(shí)點(diǎn)的多少;()考查能力的復(fù)雜程度或?qū)哟蔚母叩?;()考生?duì)題目的熟悉程度(如本來(lái)較易的題目會(huì)因考生均未注意而造成很難,或本來(lái)較難的題目會(huì)因?yàn)榭忌毡榫毩?xí)而變得較容易);()命題的技巧性(如對(duì)同一個(gè)問(wèn)題,可以命得容易,也可以命得較難)。除了上述因素,還可以通過(guò)其他方法來(lái)控制。如預(yù)測(cè)或教師在比較了解情況時(shí)的主觀經(jīng)驗(yàn)等。(四)區(qū)分度1. 區(qū)分度的

15、概念區(qū)分度是指測(cè)驗(yàn)對(duì)考生實(shí)際水平的區(qū)分程度,用符號(hào)D表示。具有良好區(qū)分度的測(cè)驗(yàn),實(shí)際水平高的學(xué)生應(yīng)該得高分,實(shí)際水平低的學(xué)生應(yīng)該得低分。所以區(qū)分度又稱為鑒別力。它是評(píng)價(jià)試題質(zhì)量,篩選試題的主要指標(biāo)和依據(jù)。區(qū)分又分為正區(qū)分(D),零區(qū)分()和負(fù)區(qū)分(),正區(qū)分又稱為積極區(qū)分,負(fù)區(qū)分又稱為消極區(qū)分。2 區(qū)分度與測(cè)驗(yàn)信度、難度的關(guān)系(1)區(qū)分度與信度的關(guān)系。區(qū)分度越高,測(cè)驗(yàn)的信度越高。當(dāng)區(qū)分度為0.1225時(shí), 信度系數(shù)為0, 當(dāng)區(qū)分度為0.5時(shí), 信度系數(shù)為0.949。(2)區(qū)分度與難度的關(guān)系。題目的難度系數(shù)過(guò)大或過(guò)小,都會(huì)降低區(qū)分度,只有難度系數(shù)適中的題目,才會(huì)有較高的區(qū)分度。當(dāng)難度系數(shù)為0或1

16、時(shí), 區(qū)分度的值為0,當(dāng)難度系數(shù)為0.5時(shí), 區(qū)分度的值會(huì)達(dá)到1。(3)區(qū)分度的計(jì)算。一是用極端分組法計(jì)算;二是用內(nèi)部一致性系數(shù)計(jì)算。在標(biāo)準(zhǔn)化或大規(guī)模測(cè)驗(yàn)中,一般采用相關(guān)分析法分析試題的區(qū)分度。計(jì)算時(shí)可以采用點(diǎn)二列相關(guān)、兩列相關(guān)、相關(guān)系數(shù)等方法。點(diǎn)二列相關(guān)系數(shù)適用于計(jì)算客觀題的區(qū)分度;二列相關(guān)系數(shù)適用于計(jì)算多重選擇題的區(qū)分度;相關(guān)系數(shù)系數(shù)適用于計(jì)算二個(gè)變量都是二分名義變量的區(qū)分度。3 提高區(qū)分度的方法(1)使題目的難度和整個(gè)測(cè)驗(yàn)的難度適中。使難度適中是提高區(qū)分度的重要方法。(2)著重考察復(fù)雜的學(xué)習(xí)結(jié)果。著重考察復(fù)雜的學(xué)習(xí)結(jié)果,使實(shí)際水平高的學(xué)生得高分或最高分,實(shí)際水平低的學(xué)生得低分甚至最低分,

17、使分?jǐn)?shù)盡量分布在整個(gè)分?jǐn)?shù)量尺上。這樣,可以提高區(qū)分度。4 區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn) 區(qū)分度當(dāng)然是越高越好,但做到這一點(diǎn)較難。對(duì)于有些要求不高的測(cè)驗(yàn),有些試題的區(qū)分度低一些也是允許的。二、測(cè)驗(yàn)的編制(一)測(cè)驗(yàn)?zāi)繕?biāo)的確定1教育目標(biāo)的分類美國(guó)的布盧姆把教育目標(biāo)分為認(rèn)知領(lǐng)域、動(dòng)作技能領(lǐng)域和情感領(lǐng)域;又把認(rèn)知領(lǐng)域分為知識(shí)、理解、應(yīng)用、分析、綜合、評(píng)價(jià)五個(gè)類目,把動(dòng)作技能領(lǐng)域分為觀察、模仿、練習(xí)、適應(yīng)四個(gè)類目,把情感領(lǐng)域分為接受、反應(yīng)、形成價(jià)值觀念、組織價(jià)值體系、形成價(jià)值情結(jié)五個(gè)類目。我國(guó)把認(rèn)知領(lǐng)域的教育目標(biāo)分為知識(shí)、理解、應(yīng)用、分析與綜合、創(chuàng)造五個(gè)類目,或分為知識(shí)、理解、簡(jiǎn)單應(yīng)用、綜合應(yīng)用、創(chuàng)造五個(gè)類目,還有的

18、分為知識(shí)、理解、簡(jiǎn)單應(yīng)用、綜合應(yīng)用四個(gè)類目。2 確定測(cè)驗(yàn)?zāi)繕?biāo)應(yīng)注意的問(wèn)題。(1)深入分析課程教學(xué)目標(biāo)。確定測(cè)驗(yàn)?zāi)繕?biāo)時(shí),應(yīng)在深入研究并弄清課程教學(xué)目標(biāo)的基本上進(jìn)行,做到測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)或?qū)W習(xí)目標(biāo)相一致。教學(xué)目標(biāo)是指教學(xué)活動(dòng)所預(yù)期達(dá)到的標(biāo)準(zhǔn),它是進(jìn)一步具體化的教育目標(biāo)。行為目標(biāo)是教學(xué)設(shè)計(jì)中一種更具體的、可觀察的教學(xué)目標(biāo),又稱為學(xué)習(xí)目標(biāo),是對(duì)學(xué)生通過(guò)教學(xué)以后能做什么的一種明確的、具體的表述。行為目標(biāo)是目標(biāo)教學(xué)系統(tǒng)的一個(gè)有機(jī)組成部分,不能脫離目標(biāo)教學(xué)系統(tǒng)的整體,孤立地編寫(xiě)行為目標(biāo)。行為目標(biāo)的陳述應(yīng)十分具體明確,具有可觀察、可測(cè)量的性質(zhì)。它包括:行為、條件、標(biāo)準(zhǔn)三要素。(2)選擇目標(biāo)領(lǐng)域及其類目。這個(gè)

19、問(wèn)題實(shí)質(zhì)上是對(duì)不同的學(xué)科應(yīng)確立什么樣的測(cè)驗(yàn)?zāi)繕?biāo)的問(wèn)題。是否所有學(xué)科的測(cè)驗(yàn)?zāi)繕?biāo)都包括認(rèn)知、技能、態(tài)度三個(gè)目標(biāo)領(lǐng)域和相同的目標(biāo)類目?應(yīng)根據(jù)社會(huì)要求和學(xué)科課程的性質(zhì)去確定,學(xué)科性質(zhì)不同,著眼點(diǎn)也不同。類目數(shù)的確定,常與最高測(cè)驗(yàn)?zāi)繕?biāo)的確定以及目標(biāo)分類的粗細(xì)有關(guān)。由此可見(jiàn),根據(jù)教學(xué)大綱中的教學(xué)目標(biāo)去選擇測(cè)驗(yàn)領(lǐng)域和設(shè)計(jì)類目層次,關(guān)鍵在于測(cè)驗(yàn)編制者對(duì)教學(xué)目標(biāo)內(nèi)涵理解的準(zhǔn)確程度和透徹程度。理解越準(zhǔn)確、越透徹,測(cè)驗(yàn)?zāi)繕?biāo)的確定就越有效。(3)正確理解各類目標(biāo)之間的關(guān)系。當(dāng)我們?cè)谀骋荒繕?biāo)領(lǐng)域進(jìn)行分類時(shí),要充分考慮各類目標(biāo)之間的疊層性或序?qū)有?。在各類目?biāo)中,起基礎(chǔ)作用的因素,由單一到多元,重疊遞進(jìn),形成一定類別層次,

20、這就是目標(biāo)類目的疊層性。所謂序?qū)有裕侵父黝惸繕?biāo)按一定的邏輯順序排列,形成一定的類別層次。序?qū)有耘c疊層性共同之處是:前一類目標(biāo)是后一類目標(biāo)的基礎(chǔ),而后一類目標(biāo)是前一類目標(biāo)的必然發(fā)展和高層;前一類目標(biāo)較容易達(dá)到,而后一類目標(biāo)則較難達(dá)到。區(qū)別是:序?qū)有詮?qiáng)調(diào)的是前一類目標(biāo)內(nèi)容對(duì)后一類目標(biāo)的正遷移作用,后一類目標(biāo)內(nèi)容是前一類目標(biāo)內(nèi)容作用下的必然發(fā)展結(jié)果,往往顯示一種質(zhì)的跳進(jìn);而疊層性強(qiáng)調(diào)的是后一類目標(biāo)的基礎(chǔ)因素是前一類目標(biāo)的基礎(chǔ)因素的重復(fù)、積累和擴(kuò)展,顯示出量的疊加。(二)測(cè)驗(yàn)題型的確定1封閉式(1)選擇型:是非題、配對(duì)題、選擇題(單向選擇題、多向選擇題)。(2)提供型:填空題、改錯(cuò)題、名詞解釋題、簡(jiǎn)

21、答題。2開(kāi)放式(1)計(jì)算題(2)證明題(3)論述題(4)寫(xiě)作題(5)設(shè)計(jì)題(6)翻譯題(三)命題設(shè)計(jì)1命題雙向細(xì)目表命題雙向細(xì)目表是設(shè)計(jì)試卷的藍(lán)圖。它包括兩個(gè)緯度(雙向)的表格。較常見(jiàn)的雙向細(xì)目表有:(1)反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)關(guān)系的。(2)反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)、題型之間關(guān)系的。(3)反映題型與難度、測(cè)驗(yàn)內(nèi)容之間關(guān)系的。(4)反映題型與難度、測(cè)驗(yàn)?zāi)繕?biāo)之間關(guān)系的。2命題設(shè)計(jì)的實(shí)施 (1)內(nèi)容類測(cè)驗(yàn)?zāi)繕?biāo)模型的構(gòu)建。內(nèi)容類測(cè)驗(yàn)?zāi)繕?biāo)模型有三部分組成:內(nèi)容類維、目標(biāo)層次維、兩維之交叉。“內(nèi)容類”是指將測(cè)驗(yàn)內(nèi)容分成若干不同特質(zhì)的類型,一般分為35類。如分為“實(shí)事”、“概念”、“技能”、“原理”、“問(wèn)題”

22、等五類。不同學(xué)科,其分類可能有差異?!澳繕?biāo)層次”是指測(cè)驗(yàn)?zāi)繕?biāo)的高低層次。一般以布盧姆的教育目標(biāo)分類法為基礎(chǔ),分為36類?!皟删S之交叉”是指內(nèi)容與目標(biāo)層次的縱橫交接處,它表明各類測(cè)驗(yàn)內(nèi)容(教學(xué)內(nèi)容)應(yīng)達(dá)到的測(cè)驗(yàn)?zāi)繕?biāo)(教學(xué)目標(biāo))層次。如何設(shè)計(jì)兩維之交叉,關(guān)鍵是準(zhǔn)確地確定各類測(cè)驗(yàn)內(nèi)容應(yīng)達(dá)到的最高目標(biāo)層次。這要根據(jù)教學(xué)大綱所規(guī)定的教學(xué)目標(biāo)去確定。根據(jù)以上論述,不同學(xué)科不同教學(xué)目標(biāo),所構(gòu)建的內(nèi)容類模型是允許有差異的。內(nèi)容類模型是測(cè)驗(yàn)命題設(shè)計(jì)的重要工具,它的科學(xué)設(shè)計(jì)和構(gòu)建,是提高試題效度的第一步。(2)內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)表的確定。內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)表由教學(xué)內(nèi)容和測(cè)驗(yàn)?zāi)繕?biāo)兩個(gè)系列構(gòu)成。教學(xué)內(nèi)容的設(shè)計(jì)應(yīng)以教學(xué)內(nèi)容的分

23、析為基礎(chǔ)。教學(xué)內(nèi)容主要指教科書(shū)的內(nèi)容,此外,還包括與學(xué)科課程有關(guān)系的其他內(nèi)容。為了便于設(shè)計(jì)和測(cè)量,可將教學(xué)內(nèi)容總體分成內(nèi)容快,然后再分解為內(nèi)容點(diǎn)。無(wú)論內(nèi)容總體、內(nèi)容快,還是內(nèi)容點(diǎn),都包含著教科書(shū)知識(shí)和其他內(nèi)容。所以說(shuō),教學(xué)內(nèi)容總體不等于單純教科書(shū)知識(shí),內(nèi)容塊不等于知識(shí)塊,內(nèi)容點(diǎn)不等于知識(shí)點(diǎn)。一個(gè)內(nèi)容點(diǎn)可能只設(shè)計(jì)一個(gè)層次的測(cè)驗(yàn)?zāi)繕?biāo),也可能設(shè)計(jì)幾個(gè)層次的測(cè)驗(yàn)?zāi)繕?biāo),這要在分析內(nèi)容點(diǎn)內(nèi)涵特質(zhì)的基礎(chǔ)上去確定。設(shè)計(jì)內(nèi)容系列的測(cè)驗(yàn)?zāi)繕?biāo)時(shí)必須依據(jù)教學(xué)大納、內(nèi)容類模型和考生實(shí)際。之所以要依據(jù)教學(xué)大綱,是因?yàn)榻虒W(xué)大綱是命題的出發(fā)點(diǎn),是根本依據(jù)。內(nèi)容點(diǎn)表是教學(xué)大綱中教學(xué)內(nèi)容和目標(biāo)的具體反映或有效細(xì)化(將“大”綱轉(zhuǎn)變

24、成“細(xì)”目)。之所以要依據(jù)內(nèi)容類模型,是因?yàn)閮?nèi)容類模型是教學(xué)大綱與內(nèi)容點(diǎn)表之間的中介,它是抽象概括的教學(xué)內(nèi)容和目標(biāo)轉(zhuǎn)化為具體細(xì)致的內(nèi)容點(diǎn)表的橋梁。它將教學(xué)內(nèi)容過(guò)渡到測(cè)驗(yàn)內(nèi)容,將宏觀的類層界線過(guò)渡到微觀的類層界線,將模糊的教學(xué)目標(biāo)過(guò)渡到精確的測(cè)驗(yàn)?zāi)繕?biāo)。之所以要依據(jù)考生的實(shí)際,是因?yàn)閷⒔虒W(xué)大綱轉(zhuǎn)化為“內(nèi)容點(diǎn)表”并不意味著將教學(xué)大綱中設(shè)定的教學(xué)內(nèi)容全盤(pán)照搬或機(jī)械轉(zhuǎn)運(yùn)到內(nèi)容表中。教學(xué)目標(biāo)是通過(guò)教學(xué)效果來(lái)體現(xiàn)的,教學(xué)的良好效果表現(xiàn)在教學(xué)內(nèi)容給學(xué)生的增益,因?yàn)椴皇撬薪虒W(xué)內(nèi)容都會(huì)對(duì)學(xué)生產(chǎn)生增益,只有對(duì)學(xué)生產(chǎn)生增益的那些內(nèi)容點(diǎn),才可能測(cè)量到教學(xué)目標(biāo)的實(shí)現(xiàn)程度。所以,應(yīng)從考生實(shí)際出發(fā),在充分分析考生原有水平的

25、基礎(chǔ)上去確定測(cè)驗(yàn)內(nèi)容點(diǎn)及其目標(biāo)層次。在設(shè)計(jì)程序上,要首先從考生實(shí)際出發(fā),分析哪些內(nèi)容點(diǎn)該確定為測(cè)驗(yàn)?zāi)繕?biāo),哪些內(nèi)容點(diǎn)該忽略。只有對(duì)考生產(chǎn)生增益值的內(nèi)容點(diǎn),才按上述方法設(shè)計(jì)測(cè)驗(yàn)?zāi)繕?biāo)層次。同時(shí),根據(jù)教學(xué)內(nèi)容的性質(zhì)類別按內(nèi)容類模型的設(shè)計(jì)去確定的測(cè)驗(yàn)?zāi)繕?biāo),有時(shí)不一定與教學(xué)大綱中規(guī)定要達(dá)到目標(biāo)相一致,因?yàn)榻虒W(xué)大綱制定者在確定教學(xué)總目標(biāo)及教學(xué)內(nèi)容時(shí),存在著誤差,教學(xué)內(nèi)容可能不完全為教學(xué)目標(biāo)服務(wù),因此,我們不能機(jī)械地使用內(nèi)容類模型。內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)層次的確定,首先依據(jù)的應(yīng)是教學(xué)大綱中規(guī)定的教學(xué)目的和任務(wù),然后才靈活地使用內(nèi)容類模型。當(dāng)初步擬定各內(nèi)容點(diǎn)的測(cè)驗(yàn)?zāi)繕?biāo)后,應(yīng)將各內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)綜合起來(lái),整體上分析評(píng)價(jià)所擬

26、定的測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)大綱規(guī)定的教學(xué)目標(biāo)和任務(wù)是否一致 ,若不一致,則應(yīng)根據(jù)內(nèi)容類模型與考生情況進(jìn)行適當(dāng)調(diào)整,經(jīng)反復(fù)調(diào)查,最后才將每個(gè)內(nèi)容點(diǎn)的測(cè)驗(yàn)?zāi)繕?biāo)確定下來(lái)。3 命題方案表的設(shè)計(jì)內(nèi)容點(diǎn)表的設(shè)計(jì),只是從定性分析和主觀判斷上去尋求測(cè)驗(yàn)內(nèi)容與教學(xué)內(nèi)容的一致性及測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)的一致性,但試卷總是以一定的量化形式出現(xiàn),如分值、題量等,所以,測(cè)驗(yàn)內(nèi)容與教學(xué)內(nèi)容的一致性及測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)的一致性,還應(yīng)以一定的量化形式表現(xiàn)出來(lái),命題方案表的設(shè)計(jì)就是要解決這個(gè)問(wèn)題。命題方案表是內(nèi)容點(diǎn)表的繼續(xù)。應(yīng)結(jié)合內(nèi)容類模型和內(nèi)容點(diǎn)表,依次設(shè)計(jì)出如下兩種命題方案表:(1)反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)關(guān)系的設(shè)計(jì)細(xì)目表。(2)反映測(cè)

27、驗(yàn)內(nèi)容與題型、目標(biāo)關(guān)系的設(shè)計(jì)細(xì)目表。表中內(nèi)容比例的確定有兩種方法:一種是計(jì)算法。即根據(jù)在測(cè)驗(yàn)內(nèi)容系列上或測(cè)驗(yàn)?zāi)繕?biāo)層次上各項(xiàng)所用的教學(xué)時(shí)數(shù)確定各項(xiàng)的比例。各項(xiàng)比例的計(jì)算方法可根據(jù)各內(nèi)容快的實(shí)際教學(xué)時(shí)數(shù)或教學(xué)大綱中規(guī)定的教學(xué)時(shí)數(shù)。一般來(lái)說(shuō),學(xué)校平時(shí)的測(cè)驗(yàn)可根據(jù)內(nèi)容快的實(shí)際教學(xué)時(shí)計(jì)算,統(tǒng)考可根據(jù)教學(xué)大綱中規(guī)定的教學(xué)時(shí)數(shù)計(jì)算。另一種是判斷法。即根據(jù)內(nèi)容系列上各項(xiàng)在整體上的重要性來(lái)確定各項(xiàng)測(cè)驗(yàn)內(nèi)容的比例。這種方法要求命題設(shè)計(jì)者不僅要熟悉教學(xué)大綱,深入研究教材和測(cè)驗(yàn)?zāi)繕?biāo),而且要有豐富的命題經(jīng)驗(yàn)。(四)試題的編制1試題編制的質(zhì)量要求 (1)明確測(cè)驗(yàn)?zāi)繕?biāo)。要根據(jù)教學(xué)大綱的要求去確定測(cè)驗(yàn)?zāi)繕?biāo),應(yīng)以測(cè)驗(yàn)考生的基本

28、知識(shí)、基本理論和基本技能為主,注重考生分析問(wèn)題和解決問(wèn)題能力,以及理論知識(shí)的應(yīng)用能力和科學(xué)創(chuàng)造能力。整份試題的結(jié)構(gòu)要有合理的目標(biāo)層次。一份試卷中,試題一般包括三個(gè)至五個(gè)層次水平。例如,根據(jù)布盧姆的有關(guān)分類,結(jié)合我國(guó)教育的實(shí)際,我們將試題分為如下五個(gè)層次:知識(shí);理解;簡(jiǎn)單應(yīng)用;綜合運(yùn)用;創(chuàng)新。各層次試題的比例可根據(jù)不同課程的特點(diǎn)和要求而具體確定。(2)題量盡可能大、試題的蓋面盡量寬。測(cè)驗(yàn)是從課程全部?jī)?nèi)容中抽取部分樣本考查考生對(duì)本門(mén)課程的掌握情況,從課程中抽取的樣本數(shù)量越大,試題越有代表性。因此,一般而言,題數(shù)多一點(diǎn)比少一點(diǎn)好。為了確保測(cè)驗(yàn)題目的代表性,提高測(cè)驗(yàn)的內(nèi)容效度,要擴(kuò)大考查面,各章、節(jié),

29、各方面知識(shí)都兼顧到。同時(shí),還要突出重點(diǎn),加大重點(diǎn)內(nèi)容題量和覆蓋密度,做到試題的測(cè)驗(yàn)重點(diǎn)與課程教學(xué)的重點(diǎn)相一致。(3)掌握好試題的區(qū)分度和難度。試題的區(qū)分度盡可能大,應(yīng)基本上能區(qū)分出考生的上、中、下三種水平。從總體來(lái)說(shuō),平時(shí)用功、復(fù)習(xí)花時(shí)間多、水平較高的考生應(yīng)考出高分?jǐn)?shù),而平時(shí)不用功、復(fù)習(xí)花時(shí)間少、水平較低的考生應(yīng)考低分?jǐn)?shù),中等生應(yīng)考出中等分?jǐn)?shù)。試題應(yīng)把不同水平考生在相同知識(shí)點(diǎn)上掌握程度的差異區(qū)分出來(lái)。試題難度的掌握,大體上可分為較易、適中、較難和最難四等。在一般情況下,較易的試題占20%左右,適中和較難的試題各占30%,最難的試題約占20%左右。(4)注意改進(jìn)題型。 一套試題的題型一般不應(yīng)少于四種,分值比例要恰當(dāng),客觀題約占60%左右,主觀題約占40%左右,題型盡可能靈活多樣,要靈活運(yùn)用教材中已闡明的原理或公式,聯(lián)系實(shí)際命題,以便于考查考生了解和應(yīng)用知識(shí)的能力。一道題,既可以只測(cè)驗(yàn)一個(gè)內(nèi)容點(diǎn),也可以測(cè)驗(yàn)不同章節(jié)的幾個(gè)內(nèi)容點(diǎn);對(duì)于同一個(gè)測(cè)驗(yàn)內(nèi)容點(diǎn),也可以從不同角度選用不同題型去編制試題。(5)每道試題的編寫(xiě)要講究科學(xué)性。試題的內(nèi)容要正確,不能出現(xiàn)知識(shí)性的錯(cuò)誤。有爭(zhēng)議的問(wèn)題不要編入試題;文字表達(dá)明確、簡(jiǎn)練、規(guī)范、通順,標(biāo)點(diǎn)符號(hào)正確;圖表清晰,計(jì)算條件充分;不能出現(xiàn)語(yǔ)法上或用詞上的錯(cuò)誤;試題的分值要合理;各題必須彼此獨(dú)立,不能出現(xiàn)相同或近似的試

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論