教育測量與評價第二講課件_第1頁
教育測量與評價第二講課件_第2頁
教育測量與評價第二講課件_第3頁
教育測量與評價第二講課件_第4頁
教育測量與評價第二講課件_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第2講 教育測量與評價一、教育測量(一)測量的定義由于事物屬性不同,以及所制定的規(guī)則不同,致使用數(shù)的特性來描述事物屬性所達到的程度也不同。這就產生了不同的測量水平。史蒂文斯將測量的水平分成四種,每一種測量水平都產生與其相應的測量量表。 1史蒂文斯(S.S.Stevens)于1951年曾給測量下了這樣的定義:從廣義而言,測量是根據(jù)法則給事物分派數(shù)字。 這一定義概括了物理(實物)測量、社會測量和心理測量的共性。測量這一定義包含了三個要素:1、事物屬性測量的對象或目標2、數(shù)字描述事物屬性的符號3、法則給事物的屬性分派數(shù)字的依據(jù)21、事物的屬性是測量的對象 我們對事物進行測量,確切地說,測量的對象是事

2、物的某種屬性。例如,物體的長度、重量、體積、溫度以及一個事件發(fā)生的時間長短等,都是事物的物理屬性。它們的存在形式比較具體,大多可以被人的感覺器官所直接感覺到,如看得見、聽得到、摸得著、嘗得出、嗅得到。但是,我們還往往需要測量人的心理屬性,如學生的智力、個性、品德、知識、技能、習慣、能力、態(tài)度、興趣、愛好等。它們的存在形式比較抽象,大多不能被人的感官直接感覺到。 32、數(shù)字是描述事物屬性的符號數(shù)字在未被用來表示事物的屬性之前,它僅僅是一個符號,它本身沒有量的意義。當數(shù)字被合理地用來描述事物的屬性時,我們才賦予它以量的意義,即從數(shù)字變成了數(shù)。數(shù)的特性為邏輯運算提供了許多可能性。數(shù)的系統(tǒng)是非常合乎邏

3、輯的。數(shù)的系統(tǒng)(指自然數(shù))有以下幾個特性:4(1)同一性和區(qū)分性所謂同一性就是指每一個數(shù)的獨特性。例如,用同一個數(shù)字表示的事物必定是相同的。既然每一個數(shù)都是獨特的,那么就沒有任何一個別的數(shù)與它完全相同。這就是數(shù)與數(shù)之間的區(qū)分性。是1就不是2,是2就不是1,用1和2分別表示的事物是不相同的兩個事物。數(shù)的同一性和區(qū)分性是一個問題的兩個方面。 5(4)等比性若一個數(shù)可以表示為是另一個數(shù)的倍數(shù),如桌子的長是寬的2倍,這類數(shù)具有等比性。上述數(shù)的特性從低到高排列。一個數(shù)若具有較高的特性,則必具有較低的特性。在實際測量中,由于測量的需要以及所欲測量的事物屬性的不同,有時并不需要讓數(shù)的各種特性同時具備。當然,

4、能多具備一些更好,因為測量中運用數(shù)的效果,確實也與這些數(shù)所包括的特性多少相關聯(lián)。7假如我們能用數(shù)合理地描述事物的屬性,并且在允許的條件下,對數(shù)進行運算,我們就可以通過運算的結果,對所要測量的屬性進行推測。如果事物的屬性和數(shù)的系統(tǒng)之間,在性質上或形式上存在著高度的類似性,我們就可以用數(shù)來描述事物的真實情況。8在數(shù)學上,函數(shù)就是把某一集合中的事物分派到另一集合事物之上的規(guī)則??梢哉f,任何測量都呈現(xiàn)函數(shù)關系,而任何函數(shù)關系都是建立一種順序配對的集合。一般來說,具體且穩(wěn)定的事物屬性,如性別、身高、體重等,其測量的規(guī)則就易于建立和使用;抽象且易變的事物屬性,如人的智力、知識、技能、人格、態(tài)度等心理屬性,

5、其測量規(guī)則就難以制定和使用。10(二)四種測量量表量表一般稱為測量工具。1、名稱量表(類別量表)最低水平的一種量表它只是用數(shù)字表明事物的類別或性質不同而已,沒有任何數(shù)量大小的意義,不能作數(shù)量化分析,也不能將之進行加減乘除運算。即屬于同一類的事物用同一個數(shù)字表示,屬于另一類的事物用另一個數(shù)字表示。用來描述各類事物的數(shù)字僅僅是事物的名稱:它只具有相同與不同的特性,沒有數(shù)量大小的含義。用這類數(shù)字表示的量表叫名稱量表。11例如,學生按性別進行分類,凡男生用1表示,女生用2表示。如果既按性別分類,又按對物理學科喜歡和不喜歡兩個標準進行分類,喜歡用1表示,不喜歡用0表示。于是男生喜歡者可表示為11;男生不

6、喜歡者可表示為10;女生喜歡者可表示為21;女生不喜歡者可表示為20等。122、等級量表(順序量表或位次量表)用來描述各個類別的數(shù)字,不僅具有區(qū)分性,而且還具有等級性(或順序性),因此,量表上的數(shù)字之間能表示事物大小的位次關系,但不具有等距性和可加性,也不能進行加減乘除運算。用這樣的數(shù)字表示的量表叫等級量表或位次量表。14例如,將學生的動能定理的應用能力分成甲、乙、丙三個等級。甲等用3表示,乙等用2表示,丙等用1表示。于是對于學生動能定理的應用能力的評定構成了321的位次關系。但是這些數(shù)字只能確定事物相等或不等的關系。在不等的情況下,只能確定大于或小于的關系,如32、21,則31的關系,卻不能

7、確定甲等的3比丙等的1大多少個相等的單位。因為3與2和2與1之間的差距是不相等的。因此對于量表上的這些數(shù)字不能進行加減乘除的運算。153、等距量表有相等單位和人定參照點的量表叫等距量表。這種量表上的數(shù)值不僅具有區(qū)分性、等級性,還具有等距性,這類量表上的數(shù)值只能作加減運算,不能作乘除運算。但是量表上的參照點(讀數(shù)的起點)不是絕對零點,而是人定的參照點。17例如,用攝氏溫度計測量的溫度,9與6之差等于6與3之差,即3。但是,這并不意味著9是3的3倍, 6是3 的兩倍。這是因為,攝氏溫度表是以冰點作為人定參照點。攝氏零度并不意味著沒有溫度,而攝氏溫度表上的絕對零點在零下273,即-273。時間量表上

8、的參照點也是人定的。鐘表上的零點,并不意味著沒有時間。這類量表上的數(shù)值只能作加減運算,不能作乘除運算。 它們所能適用的究計方法有算術平均數(shù)、標準差、積差相關系數(shù)以及Z、t、F檢驗等。184、比率量表最高水平的量表有相等單位和絕對零點的量表叫比率量表。這種量表上的數(shù)值不僅具有區(qū)分性、等級性、等距性,還具有等比性。量表數(shù)值可以進行加減乘除的四則運算。19因為量表上有絕對零點。所謂絕對零點,就是量表上標著0的地方,表示所要測量的屬性是無。這類量表上的數(shù)值既可以確定一個事物比另一事物大多少,又可以確定大多少倍。因此,量表值可以進行加減乘除四則運算。在物理測量中,長度、重量、開氏溫度量表(絕對溫度量表)

9、都屬于比率量表。例如,甲生身高143 cm,乙生身高130 cm,可以說甲生比乙生高13 cm,也可以說甲生身高是乙生的1.1倍。它所適用的統(tǒng)計方法,除了等距量表所適用的統(tǒng)計方法之外,還可以計算幾何平均數(shù)和差異系數(shù)。比率的測量,是測量的最高水平。 20以上四種量表是依從低到高的次序排列的。量表的次序越高,對于描述事物的數(shù)所能允許的算術運算也就越多。后面每一種量表的性質,除包括前面各種量表的性質之外,還具有其特殊的性質。 人們往往將運用名稱、等級量表進行的測量認為是定性測量;而將運用等距、比率量表進行的測量認為是定量測量。 21(三)什么是教育測量教育測量就是依據(jù)一定的法則,對教育活動中的某一現(xiàn)

10、象給予數(shù)量化的描述。從廣義來說,教育測量就是對于教育領域內的事物或現(xiàn)象,根據(jù)一定客觀標準,作縝密的考核,并依一定的規(guī)則將考核的結果予以數(shù)量的描述。從狹義來說,教育測量是指對學生某些學科經過學習和訓練之后,所獲得的知識、技能的測量,又稱成就測量、學業(yè)成績測量或學科測量。221904年,美國的桑代克發(fā)表了心理與社會測量導論一書,系統(tǒng)地介紹了統(tǒng)計方法和編制測驗的基本原理,為心理屬性測量的可能性提供了理論基礎。1、任何現(xiàn)象只要是存在的總有數(shù)量(桑代克)2、凡有數(shù)量的現(xiàn)象都可以測量(麥柯爾)以上兩個論斷為教育測量奠定了理論基礎,對教育測量學的建設與發(fā)展做出了巨大貢獻。24 (1)任何現(xiàn)象只要是存在的總有

11、數(shù)量這個原則是由美國心理學家桑代克(E.L. Thorndike) 提出的。他說:“凡物的存在必有其數(shù)量?!比说男睦憩F(xiàn)象雖然看不見,摸不著,但它是客觀存在的現(xiàn)實,是腦這塊高級物質的屬性,它也有數(shù)量的差異。例如,人的智力有高低之分,學生的學習成績有優(yōu)劣之別。這高低之間、優(yōu)劣之間,存在著程度的不同。所謂程度不同,就是數(shù)量的不同。25到目前為止,對于某些心理屬性,如智力、創(chuàng)造力、知識、技能、習慣、品德、理想、興趣、態(tài)度等,我們尚不能一一加以測量或測量得還不十分準確可靠。這是因為測驗學的發(fā)展歷史還很短,許多測量工具還沒有發(fā)明,已發(fā)明的測量工具還不十分完善。但是,我們不能因為某種心理現(xiàn)象的測量工具還沒有

12、發(fā)明,就說這種現(xiàn)象是無法測量的。 27教育測量的特點人的心理屬性,往往是難以明確規(guī)定的,有些甚至缺乏公認的定義。另外,它們易受條件的影響而發(fā)生變化,制約它們變化的因素也甚多。因此,測量的實現(xiàn)較為困難。測量結果的間接性和推斷性測量對象的復雜性和模糊性測量目的的針對性度量單位的相對性28二、什么是教育評價(一)教育評價的界定1、教育評價就是教育測驗;2、教育評價是一種專業(yè)判斷;3、教育評價是把實際表現(xiàn)與理想目標相比較的活動;4、教育評價是系統(tǒng)收集資料,為決策提供依據(jù)的活動。29教育評價:教育評價是根據(jù)一定的教育目標,運用可行的科學手段,通過系統(tǒng)地收集信息資料和分析整理,對教育活動、教育過程和教育結

13、果進行價值判斷,從而為教育決策提供依據(jù)的過程。30(二)教育評價的特征1、教育評價=事實判斷+價值判斷2、教育評價是對教育過程及其結果的評價3、教育評價必須以教育目標為基準4、教育評價是評價者與被評價者的雙邊合作活動31(三)在區(qū)別上理解教育評價1、教育評價與教育測量聯(lián)系:教育測量是教育評價的基礎,教育測量是對教育進行量的測定,所或得的結果是教育評價所需信息的主要的、可靠的來源,是對教育的狀態(tài)和價值進行客觀判斷的前提;教育測量的結果只有通過教育評價這個環(huán)節(jié)才能獲得實際意義,否則便成了一堆抽象而枯燥的數(shù)字。32區(qū)別:兩者著眼點不同:教育測量是為了取得數(shù)據(jù);教育評價是要分析解釋,對教育價值作出判斷

14、。兩者特點不同:教育測量是一種純客觀的過程,具有客觀性特點;教育評價具有客觀性與主體性相結合特點。兩者復雜程度不同:教育測量是對教育數(shù)量化的描述,關心量的獲得,活動較為單一;教育評價著眼于事物質的判定,含定性與定量分析,活動是多重的。332、教育評價與教學評價聯(lián)系:教學評價是以教學為對象的教育評價,只是教育評價的一個方面,用邏輯學術語講,教育評價是一個上位概念,而教學評價僅是一個下位概念。區(qū)別:教育評價的范圍比教學評價要廣得多,它不僅關注教學評價,還有學校管理評價、教師評價、學生評價、課程評價、總務評價等等。343、教育評價與教育督導聯(lián)系:兩者皆以黨和國家的教育方針、政策、法規(guī)為依據(jù);目的都是

15、為了加強對教育工作的科學管理,全面提高教育質量;督導工作過程主要有監(jiān)督、檢查、評價、指導、反饋若干環(huán)節(jié),評價是諸環(huán)節(jié)的核心,無論是監(jiān)督和檢查,還是指導和反饋,都離不開評價這個手段。35區(qū)別:評價只是督導工作內容的一部分,只構成督導工作的前提和基礎,而不是其全部;督導工作中所使用的評價即督導評價是一種自上而下的他人評價,只是教育評價的一種形式,而不是教育評價的全部。36(四)教育評價的類別1、從評價主體上分他人評價自我評價2、從評價標準上分相對評價絕對評價內差異評價373、從評價功能上分診斷性評價形成性評價總結性評價4、從評價方法上分定性評價定量評價38三、教育測評的發(fā)展階段(一)教育測評的發(fā)展

16、階段1、教育測評的萌芽階段(1864年以前)(1)中國古代教育測評A、中國是考試制度的發(fā)源地根據(jù)學記記載,早在我國的西周時期,就實行了教育考評。所以,教育測評發(fā)生的最早源頭在中國。39B、中國科舉制度的世界地位科舉考試始于隋,興盛完備于唐,廢于清末,是我國實行時間最長的一種選士制度,對我國乃至于對世界的考試制度有重要的影響??婆e制是通過分科考試來選取人才,科舉制自產生后,就不斷探索考試的方法,經過唐代200多年的發(fā)展,終于形成了貼經、口試、墨義、策問和詩賦五種方法測試考生。 40a、貼經把所試的經書任揭一頁,將其左右兩邊擋住,中間只開一行,再用紙?zhí)w住三字,令應試者填出來。貼經是各科考試中普遍

17、應用的方法。起初簡單,只要把經書及注釋熟讀熟記就可以應付。后來時間久了,許多經文及注釋都考過了,考生過多,需要淘汰,所以帖經的條目也愈來愈難。有的貼經條目甚至是讓帖年頭月尾,孤章絕句,完全是有意刁難考生。這種類似于現(xiàn)代填空的貼經,主要考察考生的記誦能力,對考生的其他能力是無法檢查的。41b、口試讓考生當場口頭回答問題。開始是由考官負責,問答時并不作記錄,后來出現(xiàn)了舞弊現(xiàn)象。建中二年(781年),中書舍知禮部貢舉趙贊曾奏請,以所問錄于紙上,各令直書其文。元和二年(807年),禮部貢院又清皇帝廢除口試。元和七年,權知禮部侍郎韋貫之奏請恢復口試。口試的方法比較靈活,但隨意性較大,確實有復查無憑的缺點

18、,容易給一些考官和考生提供聯(lián)合舞弊的機會。42c、墨義 一種簡單的筆試問答。不需要考生發(fā)揮自己的思想,只需熟讀熟記經文和注釋就能答出。這種方法主要考察考生的記憶能力,也較簡單,所以一問便是幾十條,甚至幾百條。如原問:“子謂子產有君子之道四焉。所謂四者何也?”對曰:“其行己也恭,其事上也敬,其養(yǎng)民也惠,其使命也義。謹對?!?43d、策問要求考生針對當時社會政治、經濟、文化等方面出現(xiàn)的問題,發(fā)表自己的看法,類似于政治性的論文。策問的方法是從西漢時期發(fā)展而來的,到了唐代更為人們做重視。44策問讓考生自由的發(fā)表自己的意見,相比口試、貼經和墨義來說,能夠考察出一個人治國安邦的才能,能夠促使考生開動腦筋去

19、思考一些現(xiàn)實問題,有利于人們思維水平的提高。正因為如此,唐代各科考試的最后取舍,大多取決于策問。但長期采用這種方法,造成了一般考生束書不觀,只拿綴輯的舊策習讀,以應付考試。就連李白這樣的名流,也未能脫俗。45e、詩賦要求考生當場寫作詩賦一篇,主要考察考生的文學修養(yǎng)和文學創(chuàng)作能力。詩賦考試駛于唐高宗永隆二年(681年),吏部考功員外郎劉思立以進士科考試只考時務策,知識太狹窄為由,要求加試雜文,于是下令加試雜文兩首。但此時考試仍以策問為主。至神龍元年(705年),才于策問之外增添了詩賦考試。后來唐朝的統(tǒng)治者也喜好詩賦,詩賦在考試中起的作用便日漸增大了。46詩賦考試在一定程度上推動了唐詩的繁榮發(fā)展,

20、唐詩的發(fā)展盛行也促使詩賦考試越來越為人們所重視.詩賦最終成為人們獲取功名利祿的便捷途徑,以至于發(fā)展成為專門注重詞藻、注重形式而不重思想內容的創(chuàng)作風格,造成了相互抄襲模仿的不良學風。47(2)西方教育測量的發(fā)展A、教育測量的誕生18世紀以前的西方各國,由于學校尚未普及,學??荚囍饕强谠?。1720年,英國劍橋大學首先以筆試替代口試,開西方學??荚嚬P試之先河。1845年,美國初等學校普及,學生人數(shù)激增,對畢業(yè)生一一口試已不可能,于是,美賀拉斯曼于1847年引進筆試,取代口試。48B、教育測量的蓬勃興起1864年,英國格林威治醫(yī)院附屬學校的教師費舍,收集了許多學生成績樣本,匯集了一本量表集,作為度量

21、學生各科成績的標準,這可以說是客觀標準化測量的萌芽。引起人們對測驗問題極大關注的是美萊斯博士的拼字測驗。20世紀初,比納智力量表推出,比納被稱為智力測量鼻祖。1904年,美國心理學家桑代克出版心理與社會測量學導論,桑代克被稱為教育測量鼻祖。491905年,法國心理學家比納和西蒙編制了第一個診斷異常兒童智力的測驗,即著名的“比納-西蒙量表”(Binet-Simon Scale)。該量表包括30個項目,從易到難排列,以通過題數(shù)的多少作為鑒別智力高低的標準。1908年和1911年作者對量表先后修訂了兩次,測驗項目增加到59個,并按年齡分組,從3歲到15歲。該量表首次采用心理年齡(mental age

22、,MA)即智齡來計算成績,兒童通過哪個年齡組的項目,便表明他的智力與幾歲兒童的平均智力水平相當。 50比納認為,智力是一種判斷的能力,創(chuàng)造的能力,適應環(huán)境的能力。因而他從復雜任務入手,著重測量判斷、理解、推理等高級心理過程,即智力中的普通因素。美國斯坦福大學教授推孟(L.M.Terman)在1916年修訂了比納西蒙量表,即斯坦福比納智力量表(Stanford-Binet Scale)。該測驗有90個項目,其最大特點是引入智力商數(shù)(intelligence quotient,IQ,簡稱智商)的概念。所謂智商,就是心理年齡(MA)與實足年齡(chronological age, CA)之比,也稱比率智商,作為比較人的聰明程度的相對指標。511937年、1960年推孟對斯坦福比納量表曾做過兩次修訂,1972年在測驗內容不變的情況下,對1960年修訂本重新做了標準化,常模是從更具代表性的新樣本中得到的。1960年修訂后的斯坦福比納量表共有100多個項目,這些項目被分為20個年齡組。25歲兒童每半歲為一組,每組有6個正式項目,一個備用項目;614歲每歲為一組,每組也有6個正式項目和一個備用項目。此外還有一個普通成人組和三個不同水平的優(yōu)秀成人組的項目。僅以3歲、6歲和10歲組為例,測驗包括以下內容。 523歲1穿珠:要求將48顆珠子穿在一起。2看圖說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論