0144《教育測量與評價》2020年6

上傳人：t*** IP屬地：天津上傳時間：2023-03-05 格式：DOCX 頁數(shù)：18 大?。?6.88KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩13頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

0144《教育測量與評價》2020年6-7月期末考試指導一、考試說明（一）考試說明滿分為100分，考試時間為90分鐘，考試形式為閉卷。（二）包含的題型及各題型相應的答題技巧單選題答題技巧：選擇你認為正確的一個選項到括號里，答案與講義與課件中的知識點一致。簡答題答題技巧：答出講義與課件中的重要知識點要點即可。論述題答題技巧：答題時注意結(jié)合相關的知識點，首先找到題目對應的知識點，再闡述自己的認識，然后圍繞此觀點從幾方面展開論述，闡述對某一問題的認識和看法，需要比較詳細的展開論述。二、復習重點內(nèi)容第一章教育測量與評價的學科發(fā)展1.測量的含義所謂測量，就是根據(jù)某些法則與程序，用數(shù)字對事物在量上的規(guī)定性予以確定和描述的過程測量的要素測量的量具、測量的單位和測量的參照點，是測量的三個基本要素或三個基本條件。用數(shù)字對事物在量上的規(guī)定性予以確定，就需要有一個測量或計算的起點，這個起點叫參照點。教育測量的特點（1）測量結(jié)果的間接性（2）度量單位的相對性（3）測量對象的復雜性（4）測量目的的針對性教育測量和教育評價（1）教育測量：就是針對學校教育影響下學生各方面的發(fā)展，側(cè)重從量的規(guī)定性上予以確定和描述的過程。（2）教育評價：按照一定的價值標準和教育目標，利用測量和非測量的種種方法系統(tǒng)收集資料信息，對學生的發(fā)展變化及其影響學生發(fā)展變化的各種要素進行價值分析和價值判斷，并為教育決策提供依據(jù)的過程。（3）“評價”概念的重點在于以教育目標為標準的價值判斷。（4）教育評價的特點包含如下幾個共同的要點：第一，強調(diào)以教育目標為標準的價值判斷過程。第二，強調(diào)用多種方法（測量和非測量）系統(tǒng)收集資料與信息。第三，教育評價的內(nèi)容既可以是教育計劃，也可以是課程；既可以是學生的學習結(jié)果，也可以是某種教育現(xiàn)象、教學活動、教育目的或教育程序。第四，強調(diào)為學生發(fā)展和教育決策服務。“行為目標評價模式”和“當代教育評價之父”美國心理學家桑代克的論著《精神與社會測量導論》一書，首次較系統(tǒng)地介紹了教育統(tǒng)計方法及編制測驗的基本原理，標志著教育測量理論的誕生。泰勒在1940年的“八年研究”報告書中，首次提出“教育評價”的概念，被稱為“當代教育評價之父”。第二章教育測量與評價的類型和功能教育測量與評價的類型（1）按測評在教學中運用的時機分類：形成性測量與評價、診斷性測量與評價、終結(jié)性測量與評價。診斷性測量與評價是對經(jīng)常表現(xiàn)出學習困難的學生所做的測量與評價，它的目的是對個人的問題行為及其原因進行診斷。（2）按解釋測評結(jié)果時的參照點分類：常模參照測量與評價、標準參照測量與評價、潛力參照測量與評價。常模參照測量與評價是將被試水平與測驗常模相比較，以評價被試在團體中的相對地位的一種測量與評價類型。潛力參照測量與評價，是將被試實際水平與其自身潛在水平（潛力）相比較，以評價被試有無充分發(fā)揮自身潛力為目的。（3）按測量與評價的內(nèi)容分類：智力測量與評價、能力傾向測量與評價、成就測量與評價、人格測量與評價。成就測量與評價常見的有兩種類型：一是學科成就測驗，旨在測量與評價被試在某一科目上的學習成就；二是綜合成就測驗，旨在測量與評價被試在多個學科或綜合學科上的學習成就。人格測量與評價也稱為個性測量與評價，其目的在于測量與評價被試的人格心理特征，諸如氣質(zhì)、性格、興趣、態(tài)度、動機、適應性等方面的心理特征。（4）按照測量與評價被試行為表現(xiàn)的性質(zhì)分類：最佳行為測量與評價、典型行為測量與評價。（5）其它分類：按測量對象可分為個別測量與評價和團體測量與評價；按測驗材料可分為文字測驗和非文字測驗；按量具的標準化程度可分為標準化測驗和非標準化測驗。非文字測驗的內(nèi)容是通過圖形、儀器、工具、實物、模型等形式表現(xiàn)的，被試通過指認、手工操作向主試提供答案，所以也稱為操作測驗。標準化測驗是指由測量專家嚴格按照測驗編制程序而編成的一種測驗。教育測量與評價的主要功能（1）實現(xiàn)教育判斷的功能教育測量與評價的最基本、最原始、最現(xiàn)實、最普遍的功能，就是實現(xiàn)教育判斷。教育測量與評價具有測量評定的功能，是因為這種判斷過程不是主觀隨意的。問題判斷的功能，如對學生學習困難的診斷；對學生心理問題的診斷；對兒童智力發(fā)展的診斷；對教師教學問題的診斷；對課程設置、課程計劃、課程實施的診斷；對教育管理機制的診斷；對辦學問題的診斷等。由于教育測量與評價具有問題診斷的功能。（2）改進教師教學的功能（3）促進學生學習的功能主要體現(xiàn)在如下幾個方面：①激勵學生的學習動機②幫助學生的記憶和促進遷移③促進學生自我評價。（4）行使教育管理的功能教育測量與教育評價概念辨析教育評價最根本的特征是做出價值判斷。而教育測量過程的完結(jié)，在給出數(shù)量事實的描述與判斷之后，不一定都要做出價值判斷。教育測量是教育評價的基礎；而教育評價往往是教育測量過程的延續(xù)，是對測量結(jié)果的解釋與應用。第三章教育測量與評價的質(zhì)量特性衡量測驗質(zhì)量的四個指標從教育測量的理論上來講，一個良好的測驗應該具備恰當?shù)碾y度和區(qū)分度，具備較高的信度和效度，也就是說，測驗的信度、效度、難度和區(qū)分度是衡量測驗質(zhì)量的基本指標。其中，前兩個指標主要是對整個測驗而言，后來兩個指標主要是對測量的項目而言。?信度（reliability）簡單地說就是測量結(jié)果的可信程度，指的是測量結(jié)果的穩(wěn)定性程度，記為rxx。具體地說，測驗的信度是指同一組學生用同一測驗實施兩次后所得分數(shù)的一致性，或者同一組學生經(jīng)過一次測驗后，用另一個同質(zhì)的測驗再測一次，這兩次測驗所得分數(shù)的一致性。估算測驗的信度有三種方法：重測信度、復本信度、同質(zhì)性信度。?效度是指測量結(jié)果的準確性和有效性的程度，亦即測量是否達到了預期的目的，理解為測量的結(jié)果正確反映所欲測量的特性或功能的程度。效度分為三大類：內(nèi)容效度、效標關聯(lián)效度和結(jié)構(gòu)效度。內(nèi)容效度是指測驗目的代表所欲測量的內(nèi)容和引起預期反應所達到的程度。預測效度是指測驗與將來的效標之間的關聯(lián)程度。所謂結(jié)構(gòu)效度，是指一個測量能實際測量出理論上的構(gòu)念或心理特性的程度。不同的測驗對效度系數(shù)有不同的要求。例如，智力測驗分數(shù)與教師對學生的等級評定之間的效度系數(shù)一般在0.30?0.50的范圍內(nèi)；兩種不同的智力測驗或標準測驗之間的相關系數(shù)應達到0.60—0.80，才能符合要求。?難度是指測驗的難易程度，是試題對學生知識和能力水平的適合程度的指標。在教育測量中，某測驗的難度一般是用正確解答該測驗題的人數(shù)與參與測驗的學生數(shù)的比值來刻畫的。用公式表示即：P=R/N,其中,P表示某測驗題的難度，R表示答案對該測驗題的人數(shù)，N表示參加測驗的人數(shù)。測驗題目的難度必須根據(jù)測驗的目的確定和評價。難度是試題對學生知識和能力水平的適合程度的指標，是由參與測量的被試群體的整體水平?jīng)Q定的。?區(qū)分度，又叫鑒別力，是指測驗對考生實際水平的區(qū)分程度，用符號D表示。區(qū)分又分為正區(qū)分（D〉0）、零區(qū)分（D=0）和負區(qū)分（D〈0）,正區(qū)分又稱積極區(qū)分，負區(qū)分又稱消極區(qū)分。所謂正區(qū)分是指實際水平高的考生得了高分，實際水平低的考生得了低分；信度的估算方法根據(jù)統(tǒng)計學的基本原理，估算測驗的信度有三種方法：重測信度、復本信度和同質(zhì)性信度。重測信度也叫穩(wěn)定性系數(shù)，它指的就是用同一量表（測驗或評價表）對同一組被試施測兩次所得結(jié)果的一致程度，其大小等于同一組被試在兩次測驗上所得分數(shù)的相關系數(shù)。一般而言，時間間隔越長，可能由于被試的身心成長發(fā)展、遺忘、施測情境改變等因素，而容易使信度降低。重測信度適用于速度測驗而不適用于難度測驗。所謂異質(zhì)性測驗就是說一個測驗包括幾個不同的部分，這幾個部分分別測量幾個不同的心理特質(zhì)，它們之間可能并不存在相關或相關較低。所謂復本測驗是指在試題格式、題數(shù)、難度、指導語說明、施測要求等方面都相當，并且都用來測量相同潛在特質(zhì)或?qū)傩?，但試題又是不相同的測驗。復本測驗也稱作平行測驗。復本信度指的是兩個平行測驗測量同一批被試所得結(jié)果的一致性程度，其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關系數(shù)。同質(zhì)性信度也叫內(nèi)部一致性信度，它是指測驗內(nèi)部所有題目間的一致性程度。分半信度的計算方法和等值復本信度的方法類似，必須用斯皮爾曼一布朗公式加以校正：rxx=2rhh/（l+rhh）式中，rxx為整個測驗的信度系數(shù)；rhh為兩個“半測驗”上得分的相關系數(shù)。注意：由于對實施指導語的錯誤理解，對答案紙的錯劃，時間記錄的錯誤以及一些不能預見的干擾等，都會產(chǎn)生誤差。對一組被試實施測驗不是同一個主試，而是由很多的主試實施，以及主試本身在安排測驗上有較多的余地，這些也會引起誤差。此外，記分也會產(chǎn)生誤差，如論文式的測驗和其他自由反應的測題格式，記分就很難做到完全客觀，從而產(chǎn)生誤差。提高測驗信度的方法（l）適當增加測驗題目的數(shù)量；（2）測驗的難度要適中（測驗的難度適中，能使測驗的信度達到最大，也能使測驗的區(qū)分度達到最大，所以，必須使測驗的難度適中）；（3）測驗的內(nèi)容應盡量同質(zhì)；（4）測驗的程序應統(tǒng)一；（5）測驗的時間要充分；（6）評分要盡量做到客觀化、減少評分誤差；（7）應試者參加測驗的動機水平、積極性、疲勞程度也會影響測驗分數(shù)，從而影響信度。引起應試者參加測驗的強烈動機，提高其積極性，使其保持旺盛的精力，都對提高測驗信度有一定作用。信度和效度的關系在效度和信度之間，首先要重點保證是高效度，因為，高效度必然高信度；反之，則不然。特別是對于教育測量而言，效度問題顯得更為重要。在處理信度與效度的關系問題上，首先要保證高的效度。因為，高效度必然高信度；反之，則不然。信度是效度的必要條件。雖然信度高的測驗效度不一定高，但效度高的測驗，信度卻一定比較高。效度和信度的關系是：效度的最大值等于信度的平方根。難度（1）難度對測驗的影響：影響測驗分數(shù)的分布狀態(tài)、影響測驗分數(shù)的離散程度、影響測驗的鑒別能力。難度值過大或過小，都會造成測驗分數(shù)的偏態(tài)分布。難度值越接近0，測驗的難度就越大，正確回答試題的人數(shù)就越少，測驗分數(shù)就越是集中在低分段，其分數(shù)分布呈正偏態(tài)。測驗難度直接影響測驗分數(shù)的離散程度，因為難度過大或過小，測驗分數(shù)的分布都呈偏態(tài)分布，亦即測驗分數(shù)都分布在高分段或低分段，這樣，測驗分數(shù)的離散程度就變小了。適中的難度可使試題的區(qū)分度達到最大。（2）影響題目難度的因素：考查知識點的多少、考查能力的復雜程度或?qū)哟蔚母叩?、考生對題目的熟悉程度、命題的技巧、利用經(jīng)驗判斷或者通過預測調(diào)整難度。對于其他類型的測驗，目的不同對難度的要求也不同。區(qū)分度與測驗信度、難度的關系（1）區(qū)分度與信度的關系：提高區(qū)分度可以達到理想的測驗信度。（2）區(qū)分度與難度的關系：難度適中，可使區(qū)分度達到最大值。難度為1時，區(qū)分度為0。第四章編制教育測驗的一般原理與方法1.測驗題目基本上分為兩大類：選擇型和供答型。前者一般要求被試在幾個選項中選擇正確的答案，如是非題、匹配題、選擇題等，后者要求被試自己提供答案，如論文題、簡答題、填空題等。根據(jù)被試作答的范圍和評分方法不同，測驗題目又可分為主觀性試題和客觀性試題。在編制配合題時，相對于選項而言，題干的詞語應較長些。并且每一試題的配對數(shù)目不能超過10個，通常以4到7個配對數(shù)目最為合適。填空題可用來考查被試對知識的記憶和理解能力，在診斷性測驗中特別適用。布盧姆的教育目標分類布盧姆等人首先把教育目標分為認知、情感和動作技能三個領域。認知領域的目標分類布盧姆將認知領域的目標分為六個類別，按照由低級到高級的難易程度形成一種遞進的等級關系，前一類別是后一類別的基礎，后一類別又涵蓋了前面的類別。（1）知識/知道。這是最低等級的認知目標。此處的知識是指對具體事物和普遍原理的回憶，對方法和過程的回憶，或者對一種模式、結(jié)構(gòu)或框架的回憶。（2）領會。這是最低層次的理解，指個人把某種材料與其他材料聯(lián)系起來，也不必弄清它的最充分的含義，便知道正在交流什么，并能夠運用正在交流的這種材料和觀點。（3）運用。運用是指將抽象概念用于特定、具體的情境。這些抽象的概念，可能是以一般的觀念、程序的規(guī)則或概括化的方法等形式表現(xiàn)出來的，也可能是那些必須記住、能夠?qū)ｉT運用的原理、觀念和理論。（4）分析。分析是指把材料分解成各個組成部分，弄清各部分之間的相互關系及其構(gòu)成的方式，以指出那些用來傳遞意義或確定交流結(jié)果的技術(shù)和手段。（5）綜合。綜合是指將各種要素和組成部分組合起來，以形成一個整體。它是對各種要素和組成部分等進行加工的過程，是一個用這種方式將它們組合起來，以構(gòu)成一種原先不那么清楚的模式或結(jié)構(gòu)的過程。（6）評價。評價是指為了某種目的，對觀念、作品、答案、方法和資料的價值及符合準則的程度作定量和定性的判斷。情感領域的目標分類（1）接受（2）反應（3）價值評價（4）組織（5）由價值或價值復合體形成的性格化，是情感領域教育目標的最高境界。表述得當?shù)慕逃繕吮仨毞舷铝幸螅海?）以學生為行為主體。如“培養(yǎng)學生的能力”、“促進學生技能的提高”這樣的目標表述是不恰當?shù)模?）表述明確、具體（3）反映學習結(jié)果的層次性（4）表達教育工作者的意圖確立教育目標的原則（1）服務性原則（2）適應性原則（3）層次性原則（4）階段性原則（5）可測性原則對于標準化測驗而言，編制測驗的最后一步，就是編寫測驗說明書，也稱作測驗手冊。第五章教育測驗的常模及其建立方法數(shù)據(jù)的種類（1）按照數(shù)據(jù)的來源分，可將數(shù)據(jù)分為點計數(shù)據(jù)和度量數(shù)據(jù)度量數(shù)據(jù)是指用一定的工具或一定的標準測量所獲得的數(shù)據(jù)。例如，用某種智力測驗測得學生智商的數(shù)據(jù)，用某學科測驗獲得學生該科知識、能力情況的數(shù)據(jù)，用米尺測得學生身高的數(shù)據(jù)。（2）按照數(shù)據(jù)的連續(xù)與否，可將數(shù)據(jù)分為間斷性數(shù)據(jù)和連續(xù)性數(shù)據(jù)取值個數(shù)無限的（不可數(shù)的）數(shù)據(jù)，稱為連續(xù)型隨機變量的數(shù)據(jù)。學生的身高、體重、智商、用百分制分數(shù)表示的學科成績等，都屬于連續(xù)型隨機變量的數(shù)據(jù)。（3）按照數(shù)據(jù)的精確性程度，可將數(shù)據(jù)分為類別數(shù)據(jù)、等級數(shù)據(jù)、等距數(shù)據(jù)和比率數(shù)據(jù)。等距變量具有等級變量的特征，還要求連續(xù)數(shù)量之間的差距相等，亦即具有相等的單位。因此，等距變量可以作加減運算，不能作乘除運算（因為等距變量并沒有絕對零點）。教育測量數(shù)據(jù)的特點（1）教育科學研究中絕大部分數(shù)據(jù)屬于等級變量，可以比較大小，不能加減更不能乘除。（2）教育測量的多數(shù)數(shù)據(jù)從本質(zhì)上說是主觀的。（3）教育測量的數(shù)據(jù)還具有隨機性。（4）教育測量的數(shù)據(jù)也具有模糊性。加權(quán)求和權(quán)重是指各分變量在總變量中所占的比例或比重的大小。加權(quán)求和是將各次測量的結(jié)果按照一定的權(quán)重相加，采用所得結(jié)果作出判斷。根據(jù)權(quán)重的不同可分為下列幾種情況。（1）等權(quán)相加等權(quán)求和是加權(quán)求和的一種特殊情況，它是將各變量（題目、分測驗或測驗）的得分直接相加而獲得一個合成分數(shù)。（2）加權(quán)求和（3）多科測驗分數(shù)加權(quán)平均的標準化一個與被試同類的團體在相同測驗上得分的分布狀況與結(jié)構(gòu)模式，成為常模。測驗的常?？煞殖蓛深悾皇前l(fā)展常模，二是組內(nèi)常模。發(fā)展常模有年級常模和年齡常模之別。所謂年級常模，就是不同年級學生在某種測驗上的正常的一般的表現(xiàn)水平。常模參照測驗與標準參照測驗在教育與心理測驗中，可依據(jù)解釋測驗分數(shù)的參照點不同，把測驗分成常模參照測驗和標準參照測驗。即參照測驗的常模，對測驗的分數(shù)進行解釋與評價的測驗，稱為常模參照測驗；參照測驗的“標準”，對測驗的分數(shù)進行解釋與評價的測驗，稱為標準參照測驗。百分等級常模百分等級是一個地位量數(shù)，能夠反映某個測驗分數(shù)在一個次數(shù)據(jù)中的相對地位。它是把學生的原始分數(shù)放在該學生所在群體的成績中進行比較，以確定該學生在群體中的相對地位之高低。百分等級常模就是基于某個常模團體，為某種測驗的原始分數(shù)與百分等級之間建立起對應關系的組內(nèi)常模類型。標準分數(shù)常模標準分數(shù)是以標準差為單位表示測驗成績與平均分數(shù)之間的距離標準分數(shù)的使用是基于常模數(shù)據(jù)服從正態(tài)分布的假設。標準分數(shù)本身是關于原始分數(shù)的一種線性變換，因此，標準分數(shù)Z分數(shù)不改變原始分數(shù)的分布形態(tài)。標準分數(shù)Z分數(shù)具有較好的可比性和可加性。在現(xiàn)行試點使用的高考標準分數(shù)轉(zhuǎn)換方案中，一律采用正態(tài)化轉(zhuǎn)換方案。教育測量量表分類按照測量的精確程度，將測量量表從低到高分為稱名量表、順序量表、區(qū)間量表/等距量表和比率量表。等距變量等距變量具有等級變量的特征，還要求連續(xù)數(shù)量之間的差距相等，亦即具有相等的單位。因此，等距變量可以作加減運算，不能作乘除運算（因為等距變量并沒有絕對零點）。測驗藍圖的設計一般采取的步驟測驗的藍圖一般用反映測驗內(nèi)容和學習水平的命題雙向細目表表示。設計測驗藍圖主要采用以下步驟：（1）確定測驗內(nèi)容要目。如何確定測驗內(nèi)容要目，必須依據(jù)課程標準或教學大綱、教學目標和學生的實際而定。（2）確定該科目應考查的目標層次。把這些目標層次從低級到高級依次安排在表中頂端第一行的有關格上。（3）確定各項測驗內(nèi)容要目下的權(quán)重。根據(jù)課程標準或教學大綱所規(guī)定的教學時間和分配比例，以及測驗性質(zhì)和其他因素，對列入測驗范圍的內(nèi)容要目或內(nèi)容點，賦以合適的相對比重即權(quán)重。該比重是測驗試題數(shù)量、測驗時間、分數(shù)分配的依據(jù)。（4）形成命題雙向細目表。把每一項考試內(nèi)容的分數(shù)比重逐一分配到若干必要的測驗目標層次上去，形成網(wǎng)格狀的分數(shù)分配方案，即命題雙向細目表。第六章教育測驗的標準及其建立方法教育測驗標準的含義教育測驗的“標準”指的是教育測驗的成就標準，它對于編制標準參照測驗以及解釋標準參照測驗的分數(shù)具有重要的意義。領域參照測驗是建立在一套完善的題目匯編或內(nèi)容領域規(guī)范匯編基礎上用以檢查被試的素質(zhì)及發(fā)展水平的測驗。正確百分數(shù)正確百分數(shù)是以學生在標準參照測驗中答對題目的比例來解釋測驗分數(shù)或描述學生取得成就的方法。計算公式為：正確百分數(shù)=答對題目數(shù)/總題目數(shù)X100第七章制定教育評價表的一般方法和步驟教育評價表教育評價表是根據(jù)教育教學的特性編制而成的，它由評價指標、評價項目（條目）、評價標準、評定等級、指標權(quán)重等構(gòu)成。它是進行教育測量與評價的工具，為了使評價的結(jié)果更為可靠，需要對教育評價表進行更深入的研究。制定教育評價標的原則（1）科學性與導向性原則所謂科學性和導向性原則是指所建立的指標和標準必須能反映教育的發(fā)展目標和教學的客觀規(guī)律，找出影響和制約教育教學的關鍵性因素。（2）完備性與獨立性原則（3）發(fā)展性與整體性原則（4）操作性與可測性原則（5）可行性與可比性原則（6）超前性與持續(xù)性原則教育評價表的構(gòu)成要素（1）評價指標：就是根據(jù)評價的目標，由評價指標的設計者分解出來的，能夠反映評價對象某方面本質(zhì)特征的具體化、行為化的主要因素，是對評價對象進行價值判斷的依據(jù)。（2）指標權(quán)重：就是表示每項評價指標在指標體系中所占的重要性程度，并賦予相應的值，這個數(shù)值就叫做對應指標的權(quán)數(shù)，或叫做權(quán)重。（3）評價標準：衡量評價對象達到評價指標要求的尺度，是由強度和頻率、標號、標度三個要素構(gòu)成。強度是指指標達到項目要求的程度或各種規(guī)范行為的優(yōu)劣程度，又稱定性標準。例如，在等級評定中，達到什么要求評為好、較好、一般或差，都要有一定的規(guī)定。評價標準一般確定3—5個等級為宜。提出初擬評價指標的方法主要有以下幾種：（1）頭腦風暴法（2）因素分解法。因素分解法是一種將評價指標按照評價對象本身的邏輯結(jié)構(gòu)逐級進行分解，把分解出來的主要因素作為評價指標的方法。（3）理論推演法（4）典型研究法期望評語式編寫法這種編寫方法是指根據(jù)理想的要求，將評價指標體系的末級指標分為若干因素，又將每一個因素分為若干個等級，每個等級編制相應的期望評語。6.在評價中，根據(jù)所獲信息的性質(zhì)來分，調(diào)查又可分為：證實性調(diào)查、疑問性調(diào)查、評估性調(diào)查與經(jīng)驗性調(diào)查四種類型。評估性調(diào)查則要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷。第八章學生評價學生評價概述學生評價的類型按照在課堂教學活動中的作用，學生評價又有：定位性評價、形成性評價、診斷性評價與總結(jié)性評價等多種類型。（1）定位性評價：又稱安置性評價、預備性評價，主要是在特定的教學活動之前，判斷學生的前期準備。在這種評價里面要解決的問題是學生是否已經(jīng)掌握了參加預定活動所需要的知識和技能，在多大程度上已經(jīng)達到教學目標，學生的興趣等基本情況等等。（2）形成性評價：主要是指不斷地反映學生學習成功或者是失敗的信息，特別注重強化學生學習的成功之處，顯示學生學習過程中需要改進的具體的錯誤。（3）診斷性評價：診斷性評價對學生的學習進行進一步的評價，對于學習中錯誤的深層診斷。（4）總結(jié)性評價：在某個期末教師對學生的測驗和評價。對教學目標達到程度的判斷，同時也提供教學目標適當性和教學策略有效性的信息?，F(xiàn)代學生評價的特點（1）強調(diào)了評價功能的形成性現(xiàn)代教育評價的目的中強調(diào)參與和推動教育的發(fā)展。現(xiàn)代的學生評價，主要是用來診斷問題，改進教育，其目的則是創(chuàng)造適合兒童的教育。對評價形成性功能的重視又反過來是現(xiàn)代教育評價發(fā)展的一個重要動因。（2）重視評價內(nèi)容的全面性教育工作者要求評價須全面地反映教育目標，對學生認知、情感以及動作技能的發(fā)展做出全面的評價，以促進學生的全面發(fā)展。因而，評價活動對教育活動能提供更大的幫助。（3）重視評價類型的多樣性根據(jù)現(xiàn)代教育的需要，現(xiàn)代教育評價注意為教育提供全方位的服務，逐步地發(fā)展了包括定位性評價、形成性評價、診斷性評價在內(nèi)的多種評價。這種多樣性的評價，在學校教育的不同階段提供不同的評價服務，使得評價在推動教育的發(fā)展中能起到越來越大的作用。學生評價的原則現(xiàn)代學生評價的原則，是在現(xiàn)代教育評價觀指導下對評價工作者的要求；評價的基本步驟則是根據(jù)這一評價觀提出的操作程序。掌握現(xiàn)代教育評價的原則與步驟，對正確地開展評價具有重要意義。學生評價的基本原則：（1）發(fā)展性原則。學生評價要圍繞學生的發(fā)展，為學生的發(fā)展服務，這是發(fā)展性原則的核心思想。（2）全面性原則。學生評價要緊扣教育目標，全面地反映教育目標。學生評價不全面，必然會把學校教育引向片面。（3）明確性原則。評價的目的要明確，評價的要求也要明確，這是明確性原則的基本涵義。（4）過程性原則。學生評價作為促進學生發(fā)展的工具，要貫穿學生學習活動的全過程。要充分利用定位性評價、形成性評價、診斷性評價與總結(jié)性評價的不同功能，在學生學習的各個過程提供各種不同類型的評價服務。課業(yè)考評所謂課業(yè)考評，是指對學生的課程學業(yè)所取得的發(fā)展進步進行考核評價。在課業(yè)考評過程中，考試是最基本也是最常用的一種測量與評價手段。課業(yè)考評對學生發(fā)展起的作用：課業(yè)考評對促進學生發(fā)展起著重要的作用，尤其是以現(xiàn)代教育理念和教育評價理論為指導而建立起來的課業(yè)考評制度與方法。首先，合理的課業(yè)考評制度為學生發(fā)展提供較明確的目標和努力的方向。確立教育目標，這不僅是現(xiàn)代教育評價活動的起點，而且是現(xiàn)代課程教學活動的重要特點，它在教學過程中起著重要作用。其次，合理的課業(yè)考評制度將有助于評價學生的發(fā)展進步，從而對教與學雙方活動起著重要的控制、調(diào)節(jié)和促進等作用。再次，課業(yè)考評為學生心理發(fā)展和學習進步創(chuàng)造必要的背景和空間，誘發(fā)學生的學習動機和自主發(fā)展的動力。最后，課業(yè)考評在中小學生個體社會化進程中起著控制、調(diào)節(jié)、促進和加速的作用。檔案袋評價法檔案袋評價是“教師依據(jù)教學目標與計劃，請學生持續(xù)一段時間主動收集、組織與省思學習成果的檔案，以評定其努力、進步、成長情形”的一種評價方法。目前正在進行的課程改革對教育評價的要求是“建立促進學生全面發(fā)展的評價體系。對學生的評價不僅要關注學生的學業(yè)成績，而且要注重發(fā)現(xiàn)和發(fā)展學生多方面的潛能，了解學生發(fā)展中的需求，幫助學生認識自我，建立自信?！睂W生認知過程基本能力發(fā)展的測量與評價認知過程涉及心理過程的全部范圍，但觀察能力、記憶能力、思維能力和想象能力是其中的四種基本能力。?觀察是一種有目的、有計劃、持久的知覺活動，是知覺的高級形態(tài)。?想象是在原有的感性材料基礎上，經(jīng)過重組聯(lián)合等加工改造而創(chuàng)造出新形象的活動。想象按其目的性、意識性的程度，可以分為無意想象和有意想象兩種。想象過程，按照創(chuàng)造性的程度不同，可分為再造想象和創(chuàng)造想象。想象能力的測量與評價方法測量與評價學生的想象能力，大致有兩類常用的方法：一是作品分析評價法；二是心理測驗評價法。作品分析評價法：常見的有作圖法、完成法、課堂作業(yè)觀察評估法人格人格即指人與社會性聯(lián)系最為密切的心理特質(zhì)的總和。人格特征可以是外在的，也可以是隱藏在內(nèi)部的。人格的形成是由先天的遺傳因素和后天的環(huán)境和教育因素相互作用的結(jié)果。人格是在先天遺傳因素的自然基礎上形成和發(fā)展的，又主要由個體的生活史所決定，它受社會歷史條件的影響。人格有其不同的側(cè)面，通常包括：氣質(zhì)、性格、適應性、興趣、態(tài)度等，所以說人格很重要的方面是自我與現(xiàn)實之間的和諧，以及自我和理想的自我之間的和諧。（1）氣質(zhì)。氣質(zhì)是每個人獨特的行為心理特征，它決定于人的高級神經(jīng)活動，是人格形成的心理基礎。人們常常把氣質(zhì)分為四種典型的氣質(zhì)，即：膽汁質(zhì)、多血質(zhì)、粘液質(zhì)、抑郁質(zhì)。膽汁質(zhì)的人的特點：興奮和抑制反差大，是不均衡型。多血質(zhì)的人的特點：興奮和抑制是平衡型。屬于多血質(zhì)的人反應迅速，有靈活性，性情活潑，較善于交際，語言流利，易適應環(huán)境，情緒不穩(wěn)定，注意力易轉(zhuǎn)移，較粗枝大葉。自陳量表法，也稱問卷測驗法，多是以被試提供關于自己人格特征的自我報告的形式出現(xiàn)，所以稱為自陳量表，是人格測驗最常用的方式。人格測驗的種類繁多，不同類型的測驗有不同的測驗目的，適應不同的年齡范圍，各自描述不同方面的人格功能，也各有利弊。在現(xiàn)代社會中，具有健康人格的學生具有的特征：在現(xiàn)代社會中，青少年學生所具有的健康人格應是：能客觀地認識自我和外部世界；情感和態(tài)度上是開放的；對所承擔的學習和其他活動有勝任感；充分發(fā)揮自己潛能；對父母、朋友有顯示愛的能力；有安全感；喜歡創(chuàng)造；有能力管理自己的生活；有責任感等。課業(yè)考評存在的問題近幾年來，校內(nèi)考試制度與方法有許多重要的改進，但就學校教育整體來看，課業(yè)考評仍存在一些較嚴重的問題，主要表現(xiàn)在如下幾個方面：首先，課業(yè)考評指導思想與學校教育理念、目標不相適應，在考試設計及考試結(jié)果的使用過程中過分強調(diào)區(qū)分和選拔功能。許多學校的教育人員還常常利用考分去夸大學生之間的差異和許多低考分學生的弱點，并把低考分的學生列為差生或落后生，使其蒙受許多羞辱。在這樣一種以考試為導向的教學及其評價模式中，學生從小學開始便經(jīng)常接受考試的磨練，自覺不自覺地把學習的注意點和動機幾乎全押在考試之上?？梢韵氲剑趯W生成長過程中，一旦有些個體在考試歷程中屢遭挫折和失敗，這意味著激烈競爭的現(xiàn)實在學校中是以考試作為唯一標準對他們進行淘汰，也意味著現(xiàn)實教育價值觀體系及學校教育實踐對他們的否定，更意味著教育追求和教育模式在這些學生個體身上的失效。更令人痛心與不安的是，考試失敗給這些學生帶來“少年新煩惱”及意志消沉，而且他們還常因影響所在學校的升學率而遭一些人的嫌棄。所有這些極端的現(xiàn)象，與學校教育的理念、目標尤其是與基礎教育的性質(zhì)及要求是格格不入的。其次，課業(yè)考評方法單一，把考試的教育功能簡單化，考試的評定功能絕對化。長期以來，許多學校把書面考試作為學生課業(yè)和心智發(fā)展的唯一測評手段，而且考試設計和考試方法多局限于那些能夠用紙筆材料加以測評的知識技能，對于那些沒被測到的或者難以用紙筆測到高級心智技能，則在日常教學中不夠重視。這無形中強化了“分數(shù)至上”的人才評價觀，使教師、學生乃至家長都在為高分而努力；使學校的課程內(nèi)容變得更加狹窄，考試和教學關系異化；考試其他種種積極的教育功能受到弱化，背離了基礎教育所應秉持的教育理念。再次，課業(yè)考評抽象化和表征化。長期以來，學校課業(yè)考評只重視考試結(jié)果量化的分數(shù)表達，不重視分析研究每個學生的試卷，不重視學習過程和發(fā)展進步在質(zhì)性方面的描述評價；只重視對認知領域可測性內(nèi)容的考試測量，忽視了學校教育目標的廣泛性和學習內(nèi)容的豐富；只重視用抽象概括化的考分來評價學生的學習結(jié)果，不重視采用多種方法對學生發(fā)展進步作實質(zhì)性的描述評價；只注意學習的共性目標，不重視對學生學習特點、發(fā)展進步以及潛能結(jié)構(gòu)作個別化的評價。在這種單調(diào)和抽象的課業(yè)考評方法下，必然丟失學習過程及考試過程業(yè)已顯示出來的大量有用信息，并且把相同考分的學生看成相同的發(fā)展，忽視了學生心理發(fā)展和智能結(jié)構(gòu)差異的多面性和客觀性。第九章教師評價教師評價的種類成果評價、教學行為評價、素質(zhì)評價教師認知發(fā)展評價模式：由加利福尼亞州立大學科斯塔等人開發(fā)的評價方法，以不可觀察的教學技能作為被評因素。教師評價的方法研究結(jié)果表明，有多種途徑可用于教師評價：自我評價、家長評價、學生評教、同行評議、書面材料的收集與觀察以及教學成果等等。目前常用的教師評價方法主要有教師自評、學生評教、同行評議以及觀察與會談等。教師自評是教師評價中一個重要的方面，這不僅因為它是收集必要的信息的一個途徑，而且因為它也是教師自我診斷的一個重要方面。在一定意義上，甚至可以說，教師自我評價的過程就是教師自我激勵與自我提高的過程。在這多種資料的收集途徑中，學生對課堂教學的評價也是最有力的材料。同行評議不僅在形成性評價中有很大的潛在價值，而且對在教師中創(chuàng)造一種專業(yè)發(fā)展的氣氛也有重要意義。使用同行評議這一方法的基本觀點，是在評價教師能力方面同行具有較大的發(fā)言權(quán)?，F(xiàn)場觀察在教師評價中一直占有重要的位置，因為它具有相當?shù)目煽啃?。但研究表明，課堂觀察的可靠性與有用性，直接地依賴于觀察者在觀察之前所掌握的信息量與信息的類型。在實踐中還沒有任何一種方法，已被證明對總結(jié)性的判斷來說，已達到必要的信度的要求。然而，多渠道地收集信息，有助于提高評價的信度。投射效應：人們有一種傾向，往往假設他人與自己是相同的，特別在他人某方面的特點與自己相似時，這種傾向就更加強烈。心理學上把這種將自己的特性歸屬到他人身上的現(xiàn)象稱為投射效應。首因效應：這種最先獲得的信息對認識的影響，在心理學上稱為“首因效應”。近因效應：最后留下的信息常常給人以強烈的印象，并在相當程度上決定著人們的認識。首因效應與近因效應在認識中起作用，都有條件制約。在認識中，當信息資料較少時，首因效應起主要作用；如果信息資料較多的話，則近因效應起主要作用。第十章課程方案評價課程方案評價的內(nèi)容（1）課程計劃的評價；（2）學科教學大綱的評價；（3）教材的評價教材是教學大綱的具體化，因此，對教材的評價核心是教材與教學大綱的一致性、科學性與可讀性。課程方案評價的基本模式（1）梅特費賽爾模式梅特費賽爾模式是由美國學者在60年代后期提出的一種模式。這一模式在泰勒模式基礎上加以補充與完善，本質(zhì)上仍然是一種目標評價的模式，然而，它更強調(diào)了課程評價的持續(xù)性與課程的全面整體效果。這一模式是以目標為中心的，但是它強調(diào)了全體成員的參與、目標的寬泛性與對課程效果的持續(xù)觀察，這就使它在泰勒模式的基礎上有了進步。（2）CSE評價模式CSE評價模式是一種與CIPP最為接近的評價模式。包括四個步驟：需要評定、方案計劃、形成性評價、總結(jié)性評價。（3）反對者模式反對者模式是一種為了揭示方案正、反兩方面長短得失，而采取準法律過程評委會審議形式的評價模式。反對者模式十分重視聽取關于教育方案和教育活動的爭議意見，尤其是反對者的意見，這對各方面的情況能得到充分的反映提供保證。一般地說，這一評價的基本特點是它充分反映了各類人員“多元的”價值認識，是依靠人們直覺與經(jīng)驗的評價。（4）應答模式應答評價是通過評價者與同教育活動有關的各種人員接觸，了解他們的愿望，然后把它同實際活動進行比較，對教育決策或立案做出修改，對大多數(shù)人的愿望做出應答，以使教育能滿足各種人的需要。與泰勒模式相比，應答模式強調(diào)了“多元現(xiàn)實性”和價值觀念的發(fā)散性。在方法上，它注重與科學主義相對的自然主義方法，強調(diào)了非正式的觀察、交往、描述性的定性分析方法。（5）消費者導向模式消費者導向模式（consumer-orientedevaluation）是由斯克里文提出的。這里的“消費者”可以是教育活動的參與者或受教育者。根據(jù)斯克里文的觀點，評價是對事物的價值和優(yōu)缺點所作的系統(tǒng)判斷，而非只測量事物或決定目標是否達成。依照斯克里文的觀點，評價者不應接受制訂者提供的目標，而是要判斷所達成的目標是否對消費者的利益有貢獻。評價者須從消費者的觀點來確認真正的成果，以及這一成果的價值。這一評價模式與泰勒模式、CIPP模式的最大區(qū)別就在于：它做出評價結(jié)論的依據(jù)不是方案制訂者的目標，而是活動參與者的意圖。西方的評論家認為，這是一種較為民主的評價模式。教材評價的原則教材評價的原則有科學性原則、教育性原則、思想性原則、學科先進性和藝術(shù)性原則、技術(shù)性原則等。第十一章教學工作評價教學工作評價的功能教學工作評價的功能可以從不同角度去考察，主要有以下幾個方面：（1）檢查：教學工作評價是檢查教學工作的重要手段。（2）反饋：教學工作評價可以給教學工作提供科學的反饋信息，從而有利于教學工作的改進。（3）激勵：加強教學工作評價，也有利于激發(fā)教師的活動動機。（4）研究：教學工作評價有利于開展教育研究活動。（5）定向：教學工作評價的指標對教學工作具有指揮定向作用。（6）管理：教學工作評價中對教師的教學工作給予鑒定或評分，使教學管理部門更好地了解教師的教學質(zhì)量和水平，可作為教師晉升、評優(yōu)及使用的重要依據(jù)。教學工作評價應注意的問題（1）關于教學工作量與質(zhì)的關系問題在教學工作評價中，首先涉及的當是教學工作量與教學工作質(zhì)的關系問題，如何合理地將兩者綜合評價，難度相當大。所謂教學工作量，是指教學工作中所付出的勞動量，它大多表現(xiàn)在工作過程中，如教師出勤率，備課所付出的時間，教學時數(shù)，評改作業(yè)和課外輔導學生人次數(shù)和時間，學科實踐活動人次數(shù)和付出的時間，命題考試評卷所付出的時間，以及完成其他教學任務所付出的勞動時間。所謂教學工作質(zhì)，是指教師完成教學工作的好壞或優(yōu)劣程度，它既反映在教學工作過程中，也反映在教學工作的結(jié)果上，即反映在工作質(zhì)量與工作效果上。由于教學工作量和工作質(zhì)難以精確評價，一般只作大體估計和模糊描述。在教學工作評價中，注重教學工作量和工作質(zhì)的分析評價的同時，還要考察教師工作的態(tài)度、自覺性、積極性等評價的隱性內(nèi)容（這些內(nèi)容也是影響教師工作過程和效果的中介變量），綜合分析與教學工作量和工作質(zhì)密切相關的各種因素，令教學評價逐步邁向科學化。（2）關于他評價和自評價的關系問題他評價是一種外部的顯性的評價，它通過外人對教師教學工作進行明顯的（或看得見的眾所周知的）統(tǒng)計分析或文字描述，可給教師教學工作進行“寫真”。自我評價的過程有時是內(nèi)隱性的，它通過思想內(nèi)部的“反省”、“自查”、“檢討”、“總結(jié)”、“自判”等方式來進行；但有時也具有外顯性，如給自己的教學工作評分，或?qū)懗鲎栽u報告，給自己的思想品德寫出自我鑒定，等等。由于評價結(jié)果與被評者的榮譽或利益息息相關，加上許多人都有其不誠實的思想因素，因而自評往往不如他評結(jié)果可靠?？傊?，他評價與自評價各自有其獨特的功能。它們的局限性可以互補。開展教學工作評價應將他評價與自評價有機地結(jié)合起來。發(fā)展性教學評價的基本認識（1）教師唱主角的課不是好課（2）面面俱到的課不是好課（3）沒有教師教學機智的課不是好課（4）只是“教教材”，沒“用教材教”的課不是好課（5）中評不中用的課不是好課網(wǎng)絡教學評價具有傳統(tǒng)教學評價的所有因素，而且還包括特有的對學習支持與服務系統(tǒng)的評價，具有評價及時、評價對象廣泛、針對性強等特點。第十二章學校辦學評價學校教育質(zhì)量評價最重要的是辦學水平評價。學校辦學評價的特點有：（1）地區(qū)性、（2）綜合性、（3）復雜性。辦學評價與學生思想品德評價和教學工作評價相比，它具有地區(qū)性、綜合性和復雜性等特點。學校辦學水平的評價學校辦學水平的評價包括辦學條件、辦學水平、社會評價和獲獎情況等四方面的評價。它基本上涵蓋了教育質(zhì)量評價的主要指標。第十三章現(xiàn)代教育測量與評價的發(fā)展趨勢經(jīng)典測驗理論（簡稱CTT）是最早的測驗理論，也是最實用的測驗理論。題目反應理論現(xiàn)代測驗理論有許多模式，其中題目反應理論最具優(yōu)越性。題目反應理論認為：一個人的行為舉止就好像處于自身某些心理品質(zhì)的定量控制之中，要定量地估計個體在每一種特質(zhì)上的位置是心理測量的任務。反之，也可用所估計到的特質(zhì)的量去預測和解釋個體在相應情境中將會產(chǎn)生的行為反應。題目反應理論是建立在如下的假設中的：假設1：一維性（即考生的某一測驗結(jié)果只取決于一種潛在特質(zhì)或稱能力，其他能力的影響均可忽略）；假設2：局部獨立（即考生答題時不受其他試題影響）；假設3：適合的數(shù)學模型（須經(jīng)擬合度檢驗）。經(jīng)典測驗理論與現(xiàn)代測驗理論的比較（1）參數(shù)穩(wěn)定性經(jīng)典測驗理論使用的題目分析法所得的題目統(tǒng)計量數(shù)受樣本的抽樣影響較大?，F(xiàn)代測驗理論IRT的方法具有局部獨立和參數(shù)獨立等特點。題目參數(shù)估計是獨立于被試樣本和題目樣本。（2）能力的比較經(jīng)典測驗理論對被試能力間的比較只能在相同的測驗或平行復本的情況下進行。而現(xiàn)代測驗IRT是自適性測驗或電腦自適應測驗，它的處理較方便且靈活。（3）平行復本難實現(xiàn)經(jīng)典測驗理論最基本的概念是測驗的信度。而信度的設定來自平行復本的假設。但事實上平行測驗是很難達到的，被試不可能在兩次測驗中得到完全相同的結(jié)果。影響測驗結(jié)果的因素很多，如遺忘、學習新知識技能、動機及焦慮程度等。經(jīng)典測驗理論常依賴平行復本的假設，所以研究者在現(xiàn)實實施中只能接受下限的信度估計或具偏差的信度估計。（4）缺乏預測力經(jīng)典測驗理論無法預測被試在一個新的測驗中可能的表現(xiàn)?，F(xiàn)代測驗IRT就是使用概率的觀念來表示被試能力與項目的關系表示具有某種能力的被試答對某題的概率P。（5）測量標準誤經(jīng)典測驗理論是假定所有被試的測量標準誤都是相等的。事實上，不難發(fā)現(xiàn)，不同能力組表現(xiàn)在測驗上的穩(wěn)定性是不同的。如施測幾個復本，可能高能力組比中能力組穩(wěn)定性高。良好的測驗模式應能針對某一測驗得分或被試能力進行精確的估計，不同的得分或能力有其不同的概率誤差，而非統(tǒng)一的測量標準誤。除此之外，經(jīng)典測驗理論在測驗的設計、偏誤題的認定、測驗的等值問題上還沒有得到滿意的解決。三、重點習題（一）單選題測量的要素包括量具、（）和參照點。測量單位 B.測量環(huán)境 C.測量程序 D.測量時間與物理測量不同，教育測量數(shù)據(jù)大多數(shù)屬于等級變量，是主觀的，具有隨機性和（）。A.確定性 B.重復性 C.模糊性 D.多樣性網(wǎng)絡教學評價具有傳統(tǒng)教學評價的所有因素，而且還包括特有的（），具有評價及時、評價對象廣泛、針對性強等特點。學習資料評價 B.對學習支持與服務系統(tǒng)的評價C.學習方式評價 D.學習平臺評價

4?由加利福尼亞州立大學科斯塔（Costa,A.L.）等人開發(fā)的，以不可觀察的教學技能作為被評因素的教師評價的模式是（）。教師職責評價模式 B.教師活動評價模式C.教師教學評價模式 D.教師認知發(fā)展評價模式教育評價表在結(jié)構(gòu)上由評價指標、（）和評價標準三部分構(gòu)成，其中構(gòu)建評價指標是比較關鍵的內(nèi)容。評價方式 B.評價維度 C.指標權(quán)重 D.評價目標課程方案評價主要包括課程計劃的評價、學科教學大綱的評價和（）。A.課程結(jié)果評價 B.教材的評價 C.教學設計評價 D.教學評價（）是對經(jīng)常表現(xiàn)出學習困難的學生所做的測量與評價，它的目的是對個人的問題行為及其原因進行診斷。A.形成性測量與評價 B.診斷性測量與評價C.典型行為測量與評價 D.終結(jié)性測量與評價同一組學生用同一測驗實施兩次后所得分數(shù)的一致性，或者同一組學生經(jīng)過一次測驗后，用另一個同質(zhì)的測驗再測一次，這兩次測驗所得分數(shù)的一致性，這是測驗的（）。A.內(nèi)容效度 B.難度 C.信度 D.區(qū)分度（）是指在試題格式、題數(shù)、難度、指導語說明、施測要求等方面都相當，并且都用來測量相同潛在特質(zhì)或?qū)傩?，但試題又是不相同的測驗。復本測驗也稱作平行測驗。A.同質(zhì)性測驗 B.異質(zhì)性測驗 C.重復測驗 D.復本測驗一個測量能實際測量出理論上的構(gòu)念或心理特性的程度，稱為（）。A.結(jié)構(gòu)效度 B.效標關聯(lián)效度 C.同時效度 D.內(nèi)容效度以下哪一項不是人格評價的內(nèi)容（）。A.氣質(zhì) B.性格 C.適應性 D.交際人們有一種傾向，往往假設他人與自己是相同的，特別在他人某方面的特點與自己相似時，這種傾向就更加強烈。心理學上把這種將自己的特性歸屬到他人身上的現(xiàn)象稱為（）。A.投射效應 B.首因效應 C.近因效應 D.參照效應已知測驗的分半信度為0.6，原測驗的信度為（）。A.0.85 B.0.80 C.0.75 D.0.70將被試實際水平與其自身潛在水平（潛力）相比較，以評價被試有無充分發(fā)揮自身潛力為目的測量與評價稱為（）。A.形成性測量與評價 B.潛力參照測量與評價 C.診斷性測量與評價 D.終結(jié)性測量與評價兩種不同的智力測驗或標準測驗之間的相關系數(shù)應達到（）。A.0.60—0.80 B.0.30—0.5016.年齡常模是屬于（）。A.0.60—0.80 B.0.30—0.5016.年齡常模是屬于（）。A.發(fā)展常模 B.組內(nèi)常模C.0.60—0.70C.百分等級常模D.0.50-0.70D.標準分數(shù)常模將評價指標按照評價對象本身的邏輯結(jié)構(gòu)逐級進行分解，把分解出來的主要因素作為評價指標的方法，稱為（）。A.頭腦風暴法理論推演法因素分解法A.頭腦風暴法理論推演法因素分解法典型研究法要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷的調(diào)查方式是（）。A.評估性調(diào)查 B.證實性調(diào)查以下哪一項不屬于作品分析評價法（）要了解被調(diào)查者對某一事物或客體的主體感受與價值判斷的調(diào)查方式是（）。A.評估性調(diào)查 B.證實性調(diào)查以下哪一項不屬于作品分析評價法（）A.拼圖法 B.作圖法C.疑問性調(diào)查C.完成法在現(xiàn)行使用的高考標準分數(shù)轉(zhuǎn)換方案中，采用的是（）。A.對比參照方案 B.百分等級方案 C.常模參照方案D.經(jīng)驗性調(diào)查D.課堂作業(yè)觀察評估法D.正態(tài)化轉(zhuǎn)換方案教育測驗可以按照分數(shù)解釋的參照體系不同，分成常模參照測驗與（）兩大類。A.標準參照測驗 B.A.標準參照測驗 B.認知測驗C.診斷性測驗D.實驗參照測驗（）是試題對學生知識和能力水平的適合程度的指標。A.信度 B.效度 C.難度 D.區(qū)分度與物理測量相比,以下屬于教育測量特點的是（）。A.它一般是間接測量 B.它的度量單位是絕對的C.它的目的是特為測量服務的 D.它的作用是單一的用同一個量表（測驗或評價表）對同一組被試測兩次所得結(jié)果的一致性程度，其大小等于同一組被試在兩次測驗上所得分數(shù)的相關系數(shù)，這一概念是（）。A.復本信度 B.重測信度A.復本信度 B.重測信度25.衡量測量題目質(zhì)量的兩個重要指標是（A.信度與區(qū)分度 B.效度與信度C.同質(zhì)性信度）。C.難度與效度D.分半信度D.難度與區(qū)分度對于平均數(shù)來講，下列哪句表述是正確的？（）A.平均數(shù)易受極端數(shù)值的影響B(tài).平均數(shù)計算不準確A.平均數(shù)易受極端數(shù)值的影響B(tài).平均數(shù)計算不準確C.平均數(shù)位于數(shù)據(jù)的正中間D.平均數(shù)本身沒有意義TOC\o"1-5"\h\z根據(jù)題目答案的范圍和評分誤差的大小，可把測驗題目分成（）。A.選擇題和填空題 B.選擇題和簡答題C.論文題和操作題 D.客觀題和主觀題下列哪一項不屬于連續(xù)型隨機變量的數(shù)據(jù)？（）A身高體重 C.用百分制分數(shù)表示的學科成績 D.A身高（）是將各變量（題目.分測驗或測驗）的得分直接相加而獲得一個合成分數(shù)。A.等權(quán)相加 B.加權(quán)求和 C.加權(quán)平均 D.直接加權(quán)在現(xiàn)代測驗理論的諸多模式中，最具有優(yōu)越性的是（）。A.經(jīng)典測驗理論 B.題目反應理論 C.心理測驗理論 D.智力測驗理論（）是將被試水平與測驗常模相比較，以評價被試在團體中的相對地位的一種測量與評價類型。A.常模參照測量與評價A.常模參照測量與評價潛力參照測量與評價標準參照測量與評價診斷性測量與評價［答案］：A內(nèi)容是通過圖形、儀器、工具、實物、模型等形式表現(xiàn)的，被試通過指認、手工操作向主試提供答案，這種測驗是（）。A.文字測驗 A.文字測驗 B.非文字測驗［答案］：B教育測量與評價具有促進學生學習的功能A.激勵學生的學習動機促進學生自我評價［答案］：D兩個平行測驗測量同一批被試所得結(jié)果的得分數(shù)的相關系數(shù)，這種信度成為（）。A.重測信度 B.同質(zhì)性信度［答案］：C測量的實施所引起的誤差不包括（）。A.測驗題目的格式C.對答案紙的錯劃標準化測驗 D.計算機測驗以下幾種體現(xiàn)中不準確的是（）。幫助學生的記憶和促進遷移促進學生的班級管理致性程度，其大小等于同一批被試在兩個復本測驗上所復本信度 D.—致性信度B.對實施指導語的錯誤理解論文式測驗的記分［答案］：A（）是指測驗目的代表所欲測量的內(nèi)容和引起預期反應所達到的程度。A.效標關聯(lián)效度 B.結(jié)構(gòu)效度 C.內(nèi)容效度 D.測量效度［答案］:CA.知識B.領會C.運用D.分析［答案］：A38.用米尺測得學生身高的數(shù)據(jù)，屬于（）。A.點計數(shù)據(jù)B.度量數(shù)據(jù)C.類別數(shù)據(jù)D.間斷性數(shù)據(jù)［答案］：B39.（）是將各次測量的結(jié)果按照一定的權(quán)重相加，采用所得結(jié)果作出判斷。A.加權(quán)求和B.等權(quán)相加C.多重回歸D.加權(quán)平均的標準化［答案］：A40.（）是以學生在標準參照測驗中答對題目的比例來解釋

人人文庫> 全部分類> 行業(yè)資料 > 各類標準

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

0144《教育測量與評價》2020年6

文檔簡介

溫馨提示

最新文檔

評論

相關文檔