教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制

上傳人：a*** IP屬地：河南上傳時(shí)間：2021-10-12 格式：DOC 頁(yè)數(shù)：8 大小：60KB 積分：14 舉報(bào) 版權(quán)申訴

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第2頁(yè)

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第3頁(yè)

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第4頁(yè)

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制_第5頁(yè)

已閱讀5頁(yè)，還剩3頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制一、教育測(cè)量的質(zhì)量指標(biāo) (一) 信度信度的概念信度指的是測(cè)量結(jié)果的穩(wěn)定性或可靠的程度，亦即測(cè)量的結(jié)果是否真實(shí)、客觀地反映了考生的實(shí)際水平。信度是任何一個(gè)測(cè)量的必要條件，對(duì)于教育測(cè)量來(lái)說(shuō)，它具有更為重要的意義。只有高信度的測(cè)量才能成為教育工作有用的工具。否則，測(cè)量的結(jié)果是無(wú)意義的、無(wú)效的。（1）信度指實(shí)測(cè)量值和真值的相差程度。由于種種原因，實(shí)測(cè)值一般不會(huì)完全等于真值，兩者之差稱為測(cè)量誤差，測(cè)量的誤差越小，測(cè)量的信度就越高。用一個(gè)等式表示如下：X=T+E式中，X為實(shí)測(cè)值，T為真值，E為誤差。由于測(cè)量的真值是未知的，誤差也就無(wú)法求出，所以，這種理解無(wú)法求出信度。（2）

2、信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度。統(tǒng)計(jì)量和參數(shù)是統(tǒng)計(jì)學(xué)中的兩個(gè)基本概念。統(tǒng)計(jì)量是指樣本上的各種數(shù)字特征（如樣本的平均數(shù)、標(biāo)準(zhǔn)差等）；參數(shù)是指總體上的各種數(shù)字特征（如總體的平均數(shù)、標(biāo)準(zhǔn)差等）。統(tǒng)計(jì)量越接近參數(shù)，其可靠性越高，信度就越高。但這種理解也無(wú)法求出信度。（3）信度指兩次重復(fù)測(cè)量或等值測(cè)量之間關(guān)聯(lián)程度。如果對(duì)同一對(duì)象進(jìn)行兩次重復(fù)測(cè)量或等值測(cè)量后，計(jì)算兩次測(cè)量的相關(guān)系數(shù)，相關(guān)系數(shù)越高，說(shuō)明測(cè)量的信度越高；相關(guān)系數(shù)越低，說(shuō)明測(cè)量的信度越低。對(duì)于信度的這種理解，有利于信度的計(jì)算。但重復(fù)測(cè)量會(huì)受被測(cè)對(duì)象經(jīng)驗(yàn)、知識(shí)增長(zhǎng)等因素的影響，等值測(cè)量又較難編制，因此用這種方法計(jì)算信度也是有誤差的。信度的理論公

3、式根據(jù)實(shí)得分?jǐn)?shù)的分解，可將實(shí)得分?jǐn)?shù)的方差分解為真分?jǐn)?shù)的方差與隨機(jī)誤差的方差之和，信度等于真分?jǐn)?shù)的方差與實(shí)得分?jǐn)?shù)的方差之比或減去隨機(jī)誤差的方差與實(shí)得分?jǐn)?shù)的方差之比。所以，隨機(jī)誤差的方差越小，測(cè)量的信度越高。信度的取值范圍為01。信度的類型（1）穩(wěn)定性系數(shù)。穩(wěn)定性系數(shù)又稱重測(cè)信度。它是指用同一測(cè)驗(yàn)試卷，在先后兩個(gè)不同時(shí)間內(nèi)對(duì)同一組被試進(jìn)行測(cè)驗(yàn)，兩次測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)。（2）等值性系數(shù)。等值系數(shù)又稱復(fù)本信度。其方法是，先實(shí)施第一次測(cè)驗(yàn)，然后在最短的時(shí)間內(nèi)實(shí)施第二份等值測(cè)驗(yàn)，再求它們得分的相關(guān)系數(shù)。這個(gè)相關(guān)系數(shù)即為信度的等值性系數(shù)。（3）內(nèi)部一致性系數(shù)。內(nèi)部一致性系數(shù)是用一次測(cè)驗(yàn)來(lái)計(jì)算測(cè)驗(yàn)的信

4、度。按照分成兩個(gè)部分的不同，計(jì)算內(nèi)部一致性系數(shù)有兩種方法。一是分半信度：這種方法是將一次測(cè)驗(yàn)分成假定相等而獨(dú)立的兩部分來(lái)記分，通常是以題目的奇數(shù)為一組，偶數(shù)為一組，計(jì)算兩組的相關(guān)系數(shù)，最后用斯皮爾曼布朗公式校正，求得整個(gè)測(cè)驗(yàn)的信度系數(shù)。二是庫(kù)德?tīng)柪聿樯椒ǎ哼@種方法只要測(cè)驗(yàn)一次，然后以各個(gè)問(wèn)題的正確反應(yīng)數(shù)為基礎(chǔ)（此可視為各題難度的信息），或根據(jù)各個(gè)總分的平均數(shù)和標(biāo)準(zhǔn)差，計(jì)算信度系數(shù)。（4）論文式測(cè)驗(yàn)的信度系數(shù)。論文式測(cè)驗(yàn)的評(píng)分沒(méi)有嚴(yán)格的評(píng)分標(biāo)準(zhǔn)，以致同樣一個(gè)題目，不同應(yīng)試者的回答和得分都不一樣，所以無(wú)法用前面的公式，而要用克龍巴赫所創(chuàng)的系數(shù)公式。（5）評(píng)分者的信度系數(shù)。一般論文式測(cè)驗(yàn)，只能提

5、供參考答案而無(wú)標(biāo)準(zhǔn)答案，因而不同的評(píng)分者對(duì)同一份試卷往往給分不同，甚至差別很大。評(píng)分者間的評(píng)分不一致，說(shuō)明評(píng)分信度不高，評(píng)分者所評(píng)的分?jǐn)?shù)越一致，評(píng)分信度越高。要計(jì)算評(píng)分者的一致性系數(shù)，需區(qū)分評(píng)分者的人次數(shù)。若為2人評(píng)N份試卷，可用斯皮爾曼等級(jí)相關(guān)的公式計(jì)算；若三個(gè)以上的評(píng)分者評(píng)N份試卷時(shí)，則需計(jì)算肯德?tīng)柡椭C系數(shù)（參見(jiàn)有關(guān)教育統(tǒng)計(jì)學(xué)的教材）。4提高信度系數(shù)的方法（1）信度系數(shù)以多大為宜。信度系數(shù)究竟以多大為好，沒(méi)有明確的標(biāo)準(zhǔn)，要看測(cè)驗(yàn)的目的和類型。對(duì)于學(xué)科測(cè)驗(yàn)，信度系數(shù)要求達(dá)到0.9以上。（2）誤差的來(lái)源。誤差的來(lái)源基本可以分為三類：一是測(cè)驗(yàn)本身所引起的誤差，如：測(cè)驗(yàn)的題型、題數(shù)、難度、時(shí)間、題

6、目一致性等。二是測(cè)驗(yàn)的實(shí)施所引起的誤差，如：環(huán)境、程序、主考、主考、評(píng)卷等。三是被試所引起的誤差，如動(dòng)機(jī)、心理、生理、經(jīng)驗(yàn)、身體等。（3）提高測(cè)驗(yàn)信度的方法。根據(jù)上述影響測(cè)量誤差的因素，我們可以采用如下方法提高信度：適當(dāng)增加測(cè)驗(yàn)題目的數(shù)量；盡量使測(cè)驗(yàn)的難度適中；測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì)；測(cè)驗(yàn)的程序應(yīng)統(tǒng)一；測(cè)驗(yàn)的時(shí)間要充分；評(píng)分要做到客觀化，養(yǎng)少評(píng)分誤差。（二）效度1 效度的概念效度是指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度，對(duì)所要評(píng)價(jià)的事物實(shí)際上評(píng)價(jià)到的程度，也就是測(cè)量是否達(dá)到了預(yù)期的目的。我們可以從以下幾個(gè)方面來(lái)理解效度：首先, 測(cè)量的效度始終是對(duì)一定的測(cè)量目的而言；其次, 測(cè)量的效度也是對(duì)測(cè)量的結(jié)果而

7、言；第三，測(cè)量的效度只是高或低的的問(wèn)題；第四，在教育測(cè)量中，效度問(wèn)題比在其他領(lǐng)域的測(cè)量更為重要。2 效度的理論公式實(shí)得分?jǐn)?shù)的方差可以進(jìn)一步分解為潛在真分?jǐn)?shù)的方差、系統(tǒng)誤差的方差和隨機(jī)誤差的方差之和，效度等于潛在真分?jǐn)?shù)的方差與實(shí)得分?jǐn)?shù)的方差之比。由效度的計(jì)算公式可以看出，如果隨機(jī)誤差的方差和系統(tǒng)誤差的方差之和越小，則效度越高。由以上實(shí)得分?jǐn)?shù)方差的分解，可以看出信度和效度之間有三種關(guān)系：第一種是高效度、高信度；第二種是高信度、低效度；第三種是低信度、低效度。因此，在效度與信度之間，首先要重點(diǎn)保證是高效度，因?yàn)?，高效度必然高信度；反之，則不然。特別是對(duì)于教育測(cè)量而言，效度問(wèn)題尤為重要。效度的估計(jì)效

8、度有內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和結(jié)構(gòu)效度三種，在學(xué)科測(cè)驗(yàn)中一般采用內(nèi)容效度。內(nèi)容效度是指測(cè)驗(yàn)?zāi)康拇硭霚y(cè)量的內(nèi)容和引起預(yù)期反應(yīng)所達(dá)到的程度，也就是測(cè)量?jī)?nèi)容的代表性程度，或者說(shuō)實(shí)際評(píng)價(jià)的內(nèi)容、范圍與所要評(píng)價(jià)的內(nèi)容、范圍相符合的程度。在編制測(cè)驗(yàn)時(shí)，內(nèi)容效度是一個(gè)相當(dāng)復(fù)雜和不易解決的問(wèn)題。估計(jì)內(nèi)容效度的方法有兩個(gè)：（1）邏輯分析的方法。就是根據(jù)教育學(xué)和心理學(xué)理論，以及教學(xué)大綱的要求，勾畫(huà)出學(xué)生應(yīng)掌握知識(shí)內(nèi)容的范圍和深度，提出應(yīng)形成的技能名稱等，然后以邏輯分析的方法估計(jì)測(cè)驗(yàn)在多大程度上代表了這些內(nèi)容，在多大程度上能夠測(cè)量出所要測(cè)量的特性和功能。（2）用測(cè)驗(yàn)題目與教材內(nèi)容比較的方法。這需要先制定兩個(gè)雙向

9、細(xì)目表：一個(gè)是測(cè)驗(yàn)的雙向細(xì)目表，要分別列出各單元教材內(nèi)容在測(cè)驗(yàn)中所占的百分比和所要求的各種行為反應(yīng)在全部反應(yīng)中的百分比；另一個(gè)是測(cè)驗(yàn)試題分類雙向細(xì)目表，要根據(jù)各單元教材內(nèi)容列出試題，并注明各題所要求的行為反應(yīng)及所占的百分比。然后對(duì)照雙向細(xì)目表，根據(jù)各部分的復(fù)合程度，判斷內(nèi)容效度的高低。提高效度的方法（1）各種效度系數(shù)的要求。不同的測(cè)驗(yàn)對(duì)效度系數(shù)有不同的要求。對(duì)效度系數(shù)大小的要求，也受原測(cè)驗(yàn)與獲得效標(biāo)的測(cè)驗(yàn)之間相似性的制約。若兩者不相似，則效度系數(shù)偏低；若相似，則效度系數(shù)會(huì)高些。所以，有的測(cè)驗(yàn)效度系數(shù)達(dá)到0.35即已符合要求，有的測(cè)驗(yàn)卻要達(dá)到0.65 0.77才能被認(rèn)為是有效的。（2）影響效度的

10、因素。效度的高低受到很多因素的影響：測(cè)驗(yàn)的組成方面：如測(cè)驗(yàn)的取材、長(zhǎng)度，試題的難度、區(qū)分度及編排方式等；測(cè)驗(yàn)的實(shí)施方面：如考場(chǎng)的布置、材料的準(zhǔn)備、答題的說(shuō)明和時(shí)間的限制等；考生主觀狀態(tài)方面：如考生的興趣、動(dòng)機(jī)、情緒、態(tài)度和健康狀況等；估計(jì)效度所依循的效標(biāo)：如選擇效標(biāo)不當(dāng)?shù)?；樣本方面：如樣本的大小及代表性等?？傊?，為了增進(jìn)測(cè)驗(yàn)的效度，必須要求測(cè)驗(yàn)編制和實(shí)施程序的標(biāo)準(zhǔn)化，注意考生在測(cè)驗(yàn)情境中的行為反應(yīng)，并顧及適當(dāng)樣本和效標(biāo)的選擇，以建立符合測(cè)驗(yàn)?zāi)康暮凸δ艿男Ф?。?）提高效度的方法。控制系統(tǒng)誤差：如儀器沒(méi)有校準(zhǔn)、題目和指導(dǎo)語(yǔ)有暗示性、答案有明顯組形等；精心編制試題：如測(cè)驗(yàn)內(nèi)容要能反映測(cè)驗(yàn)?zāi)康模?/p>

11、題目表述要清晰、簡(jiǎn)明，所用字、詞、句能為考生理解，排列應(yīng)該由易到難，題目難度要合適，并有足夠的區(qū)分度，試卷印刷要清晰無(wú)誤等；妥善組織測(cè)驗(yàn)：如嚴(yán)格按照考試手冊(cè)進(jìn)行，不作超出規(guī)定的解釋，掌握好考試時(shí)間，遵照評(píng)分標(biāo)準(zhǔn)評(píng)分，認(rèn)真仔細(xì)登分等；擴(kuò)充樣本的容量和代表性：加大樣本的容量，可增加樣本對(duì)總體的代表性，減小隨機(jī)誤差，使測(cè)驗(yàn)更加可靠；合理處理效度和信度的關(guān)系：因?yàn)樾哦雀咝Ф炔灰欢ǜ撸Ф雀咝哦纫欢ǜ?，所以在處理效度和信度的關(guān)系上，首先要保證效度；適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度：增加測(cè)驗(yàn)的長(zhǎng)度可以提高信度，而效度的最大值與信度有關(guān)，所以也可以提高效度。（三）難度1 難度的概念難度是指測(cè)驗(yàn)試題的難易程度。難度是試題

12、對(duì)學(xué)生知識(shí)和能力水平適合程度的指標(biāo)。試題的難度不僅對(duì)題目的區(qū)分度有很大的影響，而且對(duì)試卷的信度和效度也有較大的影響。難度是一個(gè)相對(duì)的概念，難度的高低與考生的水平直接相關(guān)。也就是說(shuō)，難度是由參與測(cè)驗(yàn)的考生群體的整體水平?jīng)Q定的。難度的計(jì)算客觀試題的難度為答對(duì)該題的人數(shù)與總?cè)藬?shù)之比，即試題的通過(guò)率。難度系數(shù)越大題目越容易；主觀試題的難度為所有考生對(duì)該題的平均分與該題的滿分之比。同樣，難度系數(shù)越大題目越容易。難度對(duì)測(cè)驗(yàn)的影響（1）測(cè)驗(yàn)難度影響測(cè)驗(yàn)分?jǐn)?shù)的分布形態(tài)。難度系數(shù)過(guò)大或過(guò)小，都會(huì)造成測(cè)驗(yàn)分?jǐn)?shù)的偏態(tài)分布。難度系數(shù)越接近0，測(cè)驗(yàn)的難度越大，答對(duì)題的人數(shù)越少，測(cè)驗(yàn)分?jǐn)?shù)就越集中在低分段，其分?jǐn)?shù)呈正偏態(tài)分

13、布。相反，難度系數(shù)越接近1，測(cè)驗(yàn)的難度越小，答對(duì)題的人數(shù)越多，測(cè)驗(yàn)分?jǐn)?shù)就越集中在高分段，其分?jǐn)?shù)呈負(fù)偏態(tài)分布。（2）測(cè)驗(yàn)難度影響測(cè)驗(yàn)分?jǐn)?shù)的離散程度。因?yàn)殡y度系數(shù)過(guò)大或過(guò)小，測(cè)驗(yàn)分?jǐn)?shù)都呈偏態(tài)分布，從而縮小了考生的差距，所以難度系數(shù)直接影響測(cè)驗(yàn)分?jǐn)?shù)的離散程度。（3）測(cè)驗(yàn)難度影響測(cè)驗(yàn)的鑒別能力。難度系數(shù)過(guò)大或過(guò)小，會(huì)使考生都得高分或低分，從而不能區(qū)分考生的實(shí)際水平，影響測(cè)驗(yàn)的鑒別能力。測(cè)驗(yàn)的適宜難度從難度的計(jì)算公式，我們可以得出難度的取值范圍為：0P1，當(dāng)P=0時(shí)，試題的實(shí)際困難程度最大（所有的考生都得0分）；當(dāng)P=1時(shí)，試題的實(shí)際難度最?。ㄋ锌忌既珜?duì)）。在常模參照性測(cè)驗(yàn)中要求試題難度適中，即題

14、目的難度在0.30.7之間，少數(shù)題目可以在這一范圍之兩邊且題數(shù)（或題分）大體相當(dāng)，使整個(gè)試卷的平均難度為0.5左右（0.45 0.55之間）。對(duì)于其他類型的測(cè)驗(yàn)，目的不同對(duì)難度的要求也不同?？刂祁}目難度的基本方法一般說(shuō)來(lái)影響題目難度的主要因素有：（）考查知識(shí)點(diǎn)的多少；（）考查能力的復(fù)雜程度或?qū)哟蔚母叩?；（）考生?duì)題目的熟悉程度（如本來(lái)較易的題目會(huì)因考生均未注意而造成很難，或本來(lái)較難的題目會(huì)因?yàn)榭忌毡榫毩?xí)而變得較容易）；（）命題的技巧性（如對(duì)同一個(gè)問(wèn)題，可以命得容易，也可以命得較難）。除了上述因素，還可以通過(guò)其他方法來(lái)控制。如預(yù)測(cè)或教師在比較了解情況時(shí)的主觀經(jīng)驗(yàn)等。（四）區(qū)分度1. 區(qū)分度的

15、概念區(qū)分度是指測(cè)驗(yàn)對(duì)考生實(shí)際水平的區(qū)分程度，用符號(hào)D表示。具有良好區(qū)分度的測(cè)驗(yàn)，實(shí)際水平高的學(xué)生應(yīng)該得高分，實(shí)際水平低的學(xué)生應(yīng)該得低分。所以區(qū)分度又稱為鑒別力。它是評(píng)價(jià)試題質(zhì)量，篩選試題的主要指標(biāo)和依據(jù)。區(qū)分又分為正區(qū)分（D），零區(qū)分（）和負(fù)區(qū)分（），正區(qū)分又稱為積極區(qū)分，負(fù)區(qū)分又稱為消極區(qū)分。2 區(qū)分度與測(cè)驗(yàn)信度、難度的關(guān)系（1）區(qū)分度與信度的關(guān)系。區(qū)分度越高，測(cè)驗(yàn)的信度越高。當(dāng)區(qū)分度為0.1225時(shí), 信度系數(shù)為0, 當(dāng)區(qū)分度為0.5時(shí), 信度系數(shù)為0.949。（2）區(qū)分度與難度的關(guān)系。題目的難度系數(shù)過(guò)大或過(guò)小，都會(huì)降低區(qū)分度，只有難度系數(shù)適中的題目，才會(huì)有較高的區(qū)分度。當(dāng)難度系數(shù)為0或1

16、時(shí), 區(qū)分度的值為0，當(dāng)難度系數(shù)為0.5時(shí), 區(qū)分度的值會(huì)達(dá)到1。（3）區(qū)分度的計(jì)算。一是用極端分組法計(jì)算；二是用內(nèi)部一致性系數(shù)計(jì)算。在標(biāo)準(zhǔn)化或大規(guī)模測(cè)驗(yàn)中，一般采用相關(guān)分析法分析試題的區(qū)分度。計(jì)算時(shí)可以采用點(diǎn)二列相關(guān)、兩列相關(guān)、相關(guān)系數(shù)等方法。點(diǎn)二列相關(guān)系數(shù)適用于計(jì)算客觀題的區(qū)分度；二列相關(guān)系數(shù)適用于計(jì)算多重選擇題的區(qū)分度；相關(guān)系數(shù)系數(shù)適用于計(jì)算二個(gè)變量都是二分名義變量的區(qū)分度。3 提高區(qū)分度的方法（1）使題目的難度和整個(gè)測(cè)驗(yàn)的難度適中。使難度適中是提高區(qū)分度的重要方法。（2）著重考察復(fù)雜的學(xué)習(xí)結(jié)果。著重考察復(fù)雜的學(xué)習(xí)結(jié)果，使實(shí)際水平高的學(xué)生得高分或最高分，實(shí)際水平低的學(xué)生得低分甚至最低分，

17、使分?jǐn)?shù)盡量分布在整個(gè)分?jǐn)?shù)量尺上。這樣，可以提高區(qū)分度。4 區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn) 區(qū)分度當(dāng)然是越高越好，但做到這一點(diǎn)較難。對(duì)于有些要求不高的測(cè)驗(yàn)，有些試題的區(qū)分度低一些也是允許的。二、測(cè)驗(yàn)的編制（一）測(cè)驗(yàn)?zāi)繕?biāo)的確定1教育目標(biāo)的分類美國(guó)的布盧姆把教育目標(biāo)分為認(rèn)知領(lǐng)域、動(dòng)作技能領(lǐng)域和情感領(lǐng)域；又把認(rèn)知領(lǐng)域分為知識(shí)、理解、應(yīng)用、分析、綜合、評(píng)價(jià)五個(gè)類目，把動(dòng)作技能領(lǐng)域分為觀察、模仿、練習(xí)、適應(yīng)四個(gè)類目，把情感領(lǐng)域分為接受、反應(yīng)、形成價(jià)值觀念、組織價(jià)值體系、形成價(jià)值情結(jié)五個(gè)類目。我國(guó)把認(rèn)知領(lǐng)域的教育目標(biāo)分為知識(shí)、理解、應(yīng)用、分析與綜合、創(chuàng)造五個(gè)類目，或分為知識(shí)、理解、簡(jiǎn)單應(yīng)用、綜合應(yīng)用、創(chuàng)造五個(gè)類目，還有的

18、分為知識(shí)、理解、簡(jiǎn)單應(yīng)用、綜合應(yīng)用四個(gè)類目。2 確定測(cè)驗(yàn)?zāi)繕?biāo)應(yīng)注意的問(wèn)題。（1）深入分析課程教學(xué)目標(biāo)。確定測(cè)驗(yàn)?zāi)繕?biāo)時(shí)，應(yīng)在深入研究并弄清課程教學(xué)目標(biāo)的基本上進(jìn)行，做到測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)或?qū)W習(xí)目標(biāo)相一致。教學(xué)目標(biāo)是指教學(xué)活動(dòng)所預(yù)期達(dá)到的標(biāo)準(zhǔn)，它是進(jìn)一步具體化的教育目標(biāo)。行為目標(biāo)是教學(xué)設(shè)計(jì)中一種更具體的、可觀察的教學(xué)目標(biāo)，又稱為學(xué)習(xí)目標(biāo)，是對(duì)學(xué)生通過(guò)教學(xué)以后能做什么的一種明確的、具體的表述。行為目標(biāo)是目標(biāo)教學(xué)系統(tǒng)的一個(gè)有機(jī)組成部分，不能脫離目標(biāo)教學(xué)系統(tǒng)的整體，孤立地編寫(xiě)行為目標(biāo)。行為目標(biāo)的陳述應(yīng)十分具體明確，具有可觀察、可測(cè)量的性質(zhì)。它包括：行為、條件、標(biāo)準(zhǔn)三要素。（2）選擇目標(biāo)領(lǐng)域及其類目。這個(gè)

19、問(wèn)題實(shí)質(zhì)上是對(duì)不同的學(xué)科應(yīng)確立什么樣的測(cè)驗(yàn)?zāi)繕?biāo)的問(wèn)題。是否所有學(xué)科的測(cè)驗(yàn)?zāi)繕?biāo)都包括認(rèn)知、技能、態(tài)度三個(gè)目標(biāo)領(lǐng)域和相同的目標(biāo)類目？應(yīng)根據(jù)社會(huì)要求和學(xué)科課程的性質(zhì)去確定，學(xué)科性質(zhì)不同，著眼點(diǎn)也不同。類目數(shù)的確定，常與最高測(cè)驗(yàn)?zāi)繕?biāo)的確定以及目標(biāo)分類的粗細(xì)有關(guān)。由此可見(jiàn)，根據(jù)教學(xué)大綱中的教學(xué)目標(biāo)去選擇測(cè)驗(yàn)領(lǐng)域和設(shè)計(jì)類目層次，關(guān)鍵在于測(cè)驗(yàn)編制者對(duì)教學(xué)目標(biāo)內(nèi)涵理解的準(zhǔn)確程度和透徹程度。理解越準(zhǔn)確、越透徹，測(cè)驗(yàn)?zāi)繕?biāo)的確定就越有效。（3）正確理解各類目標(biāo)之間的關(guān)系。當(dāng)我們?cè)谀骋荒繕?biāo)領(lǐng)域進(jìn)行分類時(shí)，要充分考慮各類目標(biāo)之間的疊層性或序?qū)有?。在各類目?biāo)中，起基礎(chǔ)作用的因素，由單一到多元，重疊遞進(jìn)，形成一定類別層次，

20、這就是目標(biāo)類目的疊層性。所謂序?qū)有裕侵父黝惸繕?biāo)按一定的邏輯順序排列，形成一定的類別層次。序?qū)有耘c疊層性共同之處是：前一類目標(biāo)是后一類目標(biāo)的基礎(chǔ)，而后一類目標(biāo)是前一類目標(biāo)的必然發(fā)展和高層；前一類目標(biāo)較容易達(dá)到，而后一類目標(biāo)則較難達(dá)到。區(qū)別是：序?qū)有詮?qiáng)調(diào)的是前一類目標(biāo)內(nèi)容對(duì)后一類目標(biāo)的正遷移作用，后一類目標(biāo)內(nèi)容是前一類目標(biāo)內(nèi)容作用下的必然發(fā)展結(jié)果，往往顯示一種質(zhì)的跳進(jìn)；而疊層性強(qiáng)調(diào)的是后一類目標(biāo)的基礎(chǔ)因素是前一類目標(biāo)的基礎(chǔ)因素的重復(fù)、積累和擴(kuò)展，顯示出量的疊加。（二）測(cè)驗(yàn)題型的確定1封閉式（1）選擇型：是非題、配對(duì)題、選擇題（單向選擇題、多向選擇題）。（2）提供型：填空題、改錯(cuò)題、名詞解釋題、簡(jiǎn)

21、答題。2開(kāi)放式（1）計(jì)算題（2）證明題（3）論述題（4）寫(xiě)作題（5）設(shè)計(jì)題（6）翻譯題（三）命題設(shè)計(jì)1命題雙向細(xì)目表命題雙向細(xì)目表是設(shè)計(jì)試卷的藍(lán)圖。它包括兩個(gè)緯度（雙向）的表格。較常見(jiàn)的雙向細(xì)目表有：（1）反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)關(guān)系的。（2）反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)、題型之間關(guān)系的。（3）反映題型與難度、測(cè)驗(yàn)內(nèi)容之間關(guān)系的。（4）反映題型與難度、測(cè)驗(yàn)?zāi)繕?biāo)之間關(guān)系的。2命題設(shè)計(jì)的實(shí)施（1）內(nèi)容類測(cè)驗(yàn)?zāi)繕?biāo)模型的構(gòu)建。內(nèi)容類測(cè)驗(yàn)?zāi)繕?biāo)模型有三部分組成：內(nèi)容類維、目標(biāo)層次維、兩維之交叉。“內(nèi)容類”是指將測(cè)驗(yàn)內(nèi)容分成若干不同特質(zhì)的類型，一般分為35類。如分為“實(shí)事”、“概念”、“技能”、“原理”、“問(wèn)題”

22、等五類。不同學(xué)科，其分類可能有差異?！澳繕?biāo)層次”是指測(cè)驗(yàn)?zāi)繕?biāo)的高低層次。一般以布盧姆的教育目標(biāo)分類法為基礎(chǔ)，分為36類?！皟删S之交叉”是指內(nèi)容與目標(biāo)層次的縱橫交接處，它表明各類測(cè)驗(yàn)內(nèi)容（教學(xué)內(nèi)容）應(yīng)達(dá)到的測(cè)驗(yàn)?zāi)繕?biāo)（教學(xué)目標(biāo)）層次。如何設(shè)計(jì)兩維之交叉，關(guān)鍵是準(zhǔn)確地確定各類測(cè)驗(yàn)內(nèi)容應(yīng)達(dá)到的最高目標(biāo)層次。這要根據(jù)教學(xué)大綱所規(guī)定的教學(xué)目標(biāo)去確定。根據(jù)以上論述，不同學(xué)科不同教學(xué)目標(biāo)，所構(gòu)建的內(nèi)容類模型是允許有差異的。內(nèi)容類模型是測(cè)驗(yàn)命題設(shè)計(jì)的重要工具，它的科學(xué)設(shè)計(jì)和構(gòu)建，是提高試題效度的第一步。（2）內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)表的確定。內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)表由教學(xué)內(nèi)容和測(cè)驗(yàn)?zāi)繕?biāo)兩個(gè)系列構(gòu)成。教學(xué)內(nèi)容的設(shè)計(jì)應(yīng)以教學(xué)內(nèi)容的分

23、析為基礎(chǔ)。教學(xué)內(nèi)容主要指教科書(shū)的內(nèi)容，此外，還包括與學(xué)科課程有關(guān)系的其他內(nèi)容。為了便于設(shè)計(jì)和測(cè)量，可將教學(xué)內(nèi)容總體分成內(nèi)容快，然后再分解為內(nèi)容點(diǎn)。無(wú)論內(nèi)容總體、內(nèi)容快，還是內(nèi)容點(diǎn)，都包含著教科書(shū)知識(shí)和其他內(nèi)容。所以說(shuō)，教學(xué)內(nèi)容總體不等于單純教科書(shū)知識(shí)，內(nèi)容塊不等于知識(shí)塊，內(nèi)容點(diǎn)不等于知識(shí)點(diǎn)。一個(gè)內(nèi)容點(diǎn)可能只設(shè)計(jì)一個(gè)層次的測(cè)驗(yàn)?zāi)繕?biāo)，也可能設(shè)計(jì)幾個(gè)層次的測(cè)驗(yàn)?zāi)繕?biāo)，這要在分析內(nèi)容點(diǎn)內(nèi)涵特質(zhì)的基礎(chǔ)上去確定。設(shè)計(jì)內(nèi)容系列的測(cè)驗(yàn)?zāi)繕?biāo)時(shí)必須依據(jù)教學(xué)大納、內(nèi)容類模型和考生實(shí)際。之所以要依據(jù)教學(xué)大綱，是因?yàn)榻虒W(xué)大綱是命題的出發(fā)點(diǎn)，是根本依據(jù)。內(nèi)容點(diǎn)表是教學(xué)大綱中教學(xué)內(nèi)容和目標(biāo)的具體反映或有效細(xì)化（將“大”綱轉(zhuǎn)變

24、成“細(xì)”目）。之所以要依據(jù)內(nèi)容類模型，是因?yàn)閮?nèi)容類模型是教學(xué)大綱與內(nèi)容點(diǎn)表之間的中介，它是抽象概括的教學(xué)內(nèi)容和目標(biāo)轉(zhuǎn)化為具體細(xì)致的內(nèi)容點(diǎn)表的橋梁。它將教學(xué)內(nèi)容過(guò)渡到測(cè)驗(yàn)內(nèi)容，將宏觀的類層界線過(guò)渡到微觀的類層界線，將模糊的教學(xué)目標(biāo)過(guò)渡到精確的測(cè)驗(yàn)?zāi)繕?biāo)。之所以要依據(jù)考生的實(shí)際，是因?yàn)閷⒔虒W(xué)大綱轉(zhuǎn)化為“內(nèi)容點(diǎn)表”并不意味著將教學(xué)大綱中設(shè)定的教學(xué)內(nèi)容全盤(pán)照搬或機(jī)械轉(zhuǎn)運(yùn)到內(nèi)容表中。教學(xué)目標(biāo)是通過(guò)教學(xué)效果來(lái)體現(xiàn)的，教學(xué)的良好效果表現(xiàn)在教學(xué)內(nèi)容給學(xué)生的增益，因?yàn)椴皇撬薪虒W(xué)內(nèi)容都會(huì)對(duì)學(xué)生產(chǎn)生增益，只有對(duì)學(xué)生產(chǎn)生增益的那些內(nèi)容點(diǎn)，才可能測(cè)量到教學(xué)目標(biāo)的實(shí)現(xiàn)程度。所以，應(yīng)從考生實(shí)際出發(fā)，在充分分析考生原有水平的

25、基礎(chǔ)上去確定測(cè)驗(yàn)內(nèi)容點(diǎn)及其目標(biāo)層次。在設(shè)計(jì)程序上，要首先從考生實(shí)際出發(fā)，分析哪些內(nèi)容點(diǎn)該確定為測(cè)驗(yàn)?zāi)繕?biāo)，哪些內(nèi)容點(diǎn)該忽略。只有對(duì)考生產(chǎn)生增益值的內(nèi)容點(diǎn)，才按上述方法設(shè)計(jì)測(cè)驗(yàn)?zāi)繕?biāo)層次。同時(shí)，根據(jù)教學(xué)內(nèi)容的性質(zhì)類別按內(nèi)容類模型的設(shè)計(jì)去確定的測(cè)驗(yàn)?zāi)繕?biāo)，有時(shí)不一定與教學(xué)大綱中規(guī)定要達(dá)到目標(biāo)相一致，因?yàn)榻虒W(xué)大綱制定者在確定教學(xué)總目標(biāo)及教學(xué)內(nèi)容時(shí)，存在著誤差，教學(xué)內(nèi)容可能不完全為教學(xué)目標(biāo)服務(wù)，因此，我們不能機(jī)械地使用內(nèi)容類模型。內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)層次的確定，首先依據(jù)的應(yīng)是教學(xué)大綱中規(guī)定的教學(xué)目的和任務(wù)，然后才靈活地使用內(nèi)容類模型。當(dāng)初步擬定各內(nèi)容點(diǎn)的測(cè)驗(yàn)?zāi)繕?biāo)后，應(yīng)將各內(nèi)容點(diǎn)測(cè)驗(yàn)?zāi)繕?biāo)綜合起來(lái)，整體上分析評(píng)價(jià)所擬

26、定的測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)大綱規(guī)定的教學(xué)目標(biāo)和任務(wù)是否一致，若不一致，則應(yīng)根據(jù)內(nèi)容類模型與考生情況進(jìn)行適當(dāng)調(diào)整，經(jīng)反復(fù)調(diào)查，最后才將每個(gè)內(nèi)容點(diǎn)的測(cè)驗(yàn)?zāi)繕?biāo)確定下來(lái)。3 命題方案表的設(shè)計(jì)內(nèi)容點(diǎn)表的設(shè)計(jì)，只是從定性分析和主觀判斷上去尋求測(cè)驗(yàn)內(nèi)容與教學(xué)內(nèi)容的一致性及測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)的一致性，但試卷總是以一定的量化形式出現(xiàn)，如分值、題量等，所以，測(cè)驗(yàn)內(nèi)容與教學(xué)內(nèi)容的一致性及測(cè)驗(yàn)?zāi)繕?biāo)與教學(xué)目標(biāo)的一致性，還應(yīng)以一定的量化形式表現(xiàn)出來(lái)，命題方案表的設(shè)計(jì)就是要解決這個(gè)問(wèn)題。命題方案表是內(nèi)容點(diǎn)表的繼續(xù)。應(yīng)結(jié)合內(nèi)容類模型和內(nèi)容點(diǎn)表，依次設(shè)計(jì)出如下兩種命題方案表：（1）反映測(cè)驗(yàn)內(nèi)容與測(cè)驗(yàn)?zāi)繕?biāo)關(guān)系的設(shè)計(jì)細(xì)目表。（2）反映測(cè)

27、驗(yàn)內(nèi)容與題型、目標(biāo)關(guān)系的設(shè)計(jì)細(xì)目表。表中內(nèi)容比例的確定有兩種方法：一種是計(jì)算法。即根據(jù)在測(cè)驗(yàn)內(nèi)容系列上或測(cè)驗(yàn)?zāi)繕?biāo)層次上各項(xiàng)所用的教學(xué)時(shí)數(shù)確定各項(xiàng)的比例。各項(xiàng)比例的計(jì)算方法可根據(jù)各內(nèi)容快的實(shí)際教學(xué)時(shí)數(shù)或教學(xué)大綱中規(guī)定的教學(xué)時(shí)數(shù)。一般來(lái)說(shuō)，學(xué)校平時(shí)的測(cè)驗(yàn)可根據(jù)內(nèi)容快的實(shí)際教學(xué)時(shí)計(jì)算，統(tǒng)考可根據(jù)教學(xué)大綱中規(guī)定的教學(xué)時(shí)數(shù)計(jì)算。另一種是判斷法。即根據(jù)內(nèi)容系列上各項(xiàng)在整體上的重要性來(lái)確定各項(xiàng)測(cè)驗(yàn)內(nèi)容的比例。這種方法要求命題設(shè)計(jì)者不僅要熟悉教學(xué)大綱，深入研究教材和測(cè)驗(yàn)?zāi)繕?biāo)，而且要有豐富的命題經(jīng)驗(yàn)。（四）試題的編制1試題編制的質(zhì)量要求（1）明確測(cè)驗(yàn)?zāi)繕?biāo)。要根據(jù)教學(xué)大綱的要求去確定測(cè)驗(yàn)?zāi)繕?biāo)，應(yīng)以測(cè)驗(yàn)考生的基本

28、知識(shí)、基本理論和基本技能為主，注重考生分析問(wèn)題和解決問(wèn)題能力，以及理論知識(shí)的應(yīng)用能力和科學(xué)創(chuàng)造能力。整份試題的結(jié)構(gòu)要有合理的目標(biāo)層次。一份試卷中，試題一般包括三個(gè)至五個(gè)層次水平。例如，根據(jù)布盧姆的有關(guān)分類，結(jié)合我國(guó)教育的實(shí)際，我們將試題分為如下五個(gè)層次：知識(shí)；理解；簡(jiǎn)單應(yīng)用；綜合運(yùn)用；創(chuàng)新。各層次試題的比例可根據(jù)不同課程的特點(diǎn)和要求而具體確定。（2）題量盡可能大、試題的蓋面盡量寬。測(cè)驗(yàn)是從課程全部?jī)?nèi)容中抽取部分樣本考查考生對(duì)本門(mén)課程的掌握情況，從課程中抽取的樣本數(shù)量越大，試題越有代表性。因此，一般而言，題數(shù)多一點(diǎn)比少一點(diǎn)好。為了確保測(cè)驗(yàn)題目的代表性，提高測(cè)驗(yàn)的內(nèi)容效度，要擴(kuò)大考查面，各章、節(jié)，

29、各方面知識(shí)都兼顧到。同時(shí)，還要突出重點(diǎn)，加大重點(diǎn)內(nèi)容題量和覆蓋密度，做到試題的測(cè)驗(yàn)重點(diǎn)與課程教學(xué)的重點(diǎn)相一致。（3）掌握好試題的區(qū)分度和難度。試題的區(qū)分度盡可能大，應(yīng)基本上能區(qū)分出考生的上、中、下三種水平。從總體來(lái)說(shuō)，平時(shí)用功、復(fù)習(xí)花時(shí)間多、水平較高的考生應(yīng)考出高分?jǐn)?shù)，而平時(shí)不用功、復(fù)習(xí)花時(shí)間少、水平較低的考生應(yīng)考低分?jǐn)?shù)，中等生應(yīng)考出中等分?jǐn)?shù)。試題應(yīng)把不同水平考生在相同知識(shí)點(diǎn)上掌握程度的差異區(qū)分出來(lái)。試題難度的掌握，大體上可分為較易、適中、較難和最難四等。在一般情況下，較易的試題占20%左右，適中和較難的試題各占30%，最難的試題約占20%左右。（4）注意改進(jìn)題型。一套試題的題型一般不應(yīng)少于四種，分值比例要恰當(dāng)，客觀題約占60%左右，主觀題約占40%左右，題型盡可能靈活多樣，要靈活運(yùn)用教材中已闡明的原理或公式，聯(lián)系實(shí)際命題，以便于考查考生了解和應(yīng)用知識(shí)的能力。一道題，既可以只測(cè)驗(yàn)一個(gè)內(nèi)容點(diǎn)，也可以測(cè)驗(yàn)不同章節(jié)的幾個(gè)內(nèi)容點(diǎn)；對(duì)于同一個(gè)測(cè)驗(yàn)內(nèi)容點(diǎn)，也可以從不同角度選用不同題型去編制試題。（5）每道試題的編寫(xiě)要講究科學(xué)性。試題的內(nèi)容要正確，不能出現(xiàn)知識(shí)性的錯(cuò)誤。有爭(zhēng)議的問(wèn)題不要編入試題；文字表達(dá)明確、簡(jiǎn)練、規(guī)范、通順，標(biāo)點(diǎn)符號(hào)正確；圖表清晰，計(jì)算條件充分；不能出現(xiàn)語(yǔ)法上或用詞上的錯(cuò)誤；試題的分值要合理；各題必須彼此獨(dú)立，不能出現(xiàn)相同或近似的試

人人文庫(kù)> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

教育測(cè)量的質(zhì)量指標(biāo)與測(cè)驗(yàn)的編制

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔