![第四章 教育測量質(zhì)量指標-效度_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/18/226cf081-a027-414e-bc47-74c42a27b33a/226cf081-a027-414e-bc47-74c42a27b33a1.gif)
![第四章 教育測量質(zhì)量指標-效度_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/18/226cf081-a027-414e-bc47-74c42a27b33a/226cf081-a027-414e-bc47-74c42a27b33a2.gif)
![第四章 教育測量質(zhì)量指標-效度_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/18/226cf081-a027-414e-bc47-74c42a27b33a/226cf081-a027-414e-bc47-74c42a27b33a3.gif)
![第四章 教育測量質(zhì)量指標-效度_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/18/226cf081-a027-414e-bc47-74c42a27b33a/226cf081-a027-414e-bc47-74c42a27b33a4.gif)
![第四章 教育測量質(zhì)量指標-效度_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/18/226cf081-a027-414e-bc47-74c42a27b33a/226cf081-a027-414e-bc47-74c42a27b33a5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、一、效度的意義一、效度的意義 效度(效度(ValidityValidity)測量結果測量結果的的準確性準確性和和有效性有效性的的程度程度 一個測驗或量表實際能測出其所要測量的特性的程度 記為:r rxyxy一、效度的意義一、效度的意義 第一,效度始終是針對一定的測量目的而言的。第一,效度始終是針對一定的測量目的而言的。 第二,效度是針對測量結果而言的。第二,效度是針對測量結果而言的。 第三,效度只有高或低的程度上的差異。第三,效度只有高或低的程度上的差異。 第四,評價一個測量是否有效要多角度、多方第四,評價一個測量是否有效要多角度、多方面地收集證據(jù)。面地收集證據(jù)。 第五,教育測量中,效度問題比
2、在其他領域的第五,教育測量中,效度問題比在其他領域的測量中更為重要。測量中更為重要。一、效度的概念一、效度的概念 這是因為:這是因為: 教育測量的對象大多是精神現(xiàn)象,只能通過對其教育測量的對象大多是精神現(xiàn)象,只能通過對其具有可測性的外部表現(xiàn)(如語言或動作等)的測量,具有可測性的外部表現(xiàn)(如語言或動作等)的測量,以間接認識其心理活動、心理特征或知識水平等。以間接認識其心理活動、心理特征或知識水平等。 學生的心理活動、心理特征與其外部表現(xiàn)之間,學生的心理活動、心理特征與其外部表現(xiàn)之間,一般僅具有相關關系而無函數(shù)關系,外部行為并不一般僅具有相關關系而無函數(shù)關系,外部行為并不能準確無誤地反映某種心理狀
3、態(tài)。能準確無誤地反映某種心理狀態(tài)。 教育測量的對象不是物而是有主觀能動性的人。教育測量的對象不是物而是有主觀能動性的人。人能有意識地調(diào)節(jié)自己的外部行為,掩蓋自己的內(nèi)人能有意識地調(diào)節(jié)自己的外部行為,掩蓋自己的內(nèi)心活動,這就增加了認識其精神現(xiàn)象的難度。心活動,這就增加了認識其精神現(xiàn)象的難度。二、效度的統(tǒng)計定義及其與信度的關系二、效度的統(tǒng)計定義及其與信度的關系1 1、效度的統(tǒng)計學原理、效度的統(tǒng)計學原理w在實際測量中,影響效度的主要因素是系統(tǒng)誤差。在實際測量中,影響效度的主要因素是系統(tǒng)誤差。因而在討論效度時,還必須把真分數(shù)方差分解為兩因而在討論效度時,還必須把真分數(shù)方差分解為兩個部分,一是潛在真分數(shù)方
4、差(個部分,一是潛在真分數(shù)方差(V V2 2),另一部分),另一部分是系統(tǒng)誤差分數(shù)方差(是系統(tǒng)誤差分數(shù)方差(I I2 2) ,它與由隨機誤差引,它與由隨機誤差引起的變異(起的變異(E E2 2)不同。)不同。) 22() 12(2222222公式因而,公式EIVxIVT公式即:)之比,)實得分數(shù)方差(潛在真分數(shù)方差(定義為所以可以將效度222222222222x2V) 32(1)(xIxxxEIxEIxxVxyxyrrr2 2、效度與信度的關系、效度與信度的關系V2I2E2V2I2E2V2I2E2根據(jù)公式(根據(jù)公式(2-22-2)和()和(2-32-3),可將效度與信度的關),可將效度與信度的
5、關系圖解于后:系圖解于后:根據(jù)分析,可得結論如下根據(jù)分析,可得結論如下:1)1)高信度是高效度的必要條高信度是高效度的必要條件,而非充分條件。件,而非充分條件。2)2)效度系數(shù)不會大于信度系數(shù)的效度系數(shù)不會大于信度系數(shù)的平方根。平方根??梢杂孟率奖硎荆嚎梢杂孟率奖硎荆海┕剑?2xxxyrr高效度、高信度高效度、高信度低效度、高信度低效度、高信度低效度、低信度低效度、低信度三、效度的類別與分析驗證法三、效度的類別與分析驗證法 19741974年美國心理學會發(fā)行的年美國心理學會發(fā)行的教育和心教育和心理測量的標準理測量的標準一書將效度分為三大類:一書將效度分為三大類: 內(nèi)容效度:側重于測驗題目取樣
6、的代表性,內(nèi)容效度:側重于測驗題目取樣的代表性,考查這些題目對所欲測量的內(nèi)容和行為反應考查這些題目對所欲測量的內(nèi)容和行為反應測量的有效程度。測量的有效程度。 結構效度:側重于一個測驗的能夠測量到心結構效度:側重于一個測驗的能夠測量到心理學和教學理論上的抽象概念和特質(zhì)的程度。理學和教學理論上的抽象概念和特質(zhì)的程度。 效標效度:側重于測驗分數(shù)預測我們所關心效標效度:側重于測驗分數(shù)預測我們所關心的外在行為的準確程度。的外在行為的準確程度。三、效度的類別與分析驗證法三、效度的類別與分析驗證法 琳恩和格朗蘭德提出效度的四個向度,琳恩和格朗蘭德提出效度的四個向度,即內(nèi)容即內(nèi)容內(nèi)容效度、效標關聯(lián)效度、構想內(nèi)
7、容效度、效標關聯(lián)效度、構想效度和效度和結果效度結果效度。(一)內(nèi)容效度及其分析方法(一)內(nèi)容效度及其分析方法 內(nèi)容效度內(nèi)容效度(Content validityContent validity)又稱合理效度或邏輯程度,是指測驗內(nèi)容或行又稱合理效度或邏輯程度,是指測驗內(nèi)容或行為取樣的代表性和適當程度;即實測內(nèi)容和預為取樣的代表性和適當程度;即實測內(nèi)容和預定測驗內(nèi)容之間的一致性程度。定測驗內(nèi)容之間的一致性程度。 估計內(nèi)容效度的方法:估計內(nèi)容效度的方法: 邏輯分析法(定性的方法)邏輯分析法(定性的方法) 統(tǒng)計分析法(定量的方法)統(tǒng)計分析法(定量的方法)(一)內(nèi)容效度及其分析方法(一)內(nèi)容效度及其分析
8、方法 邏輯分析法(定性的方法)邏輯分析法(定性的方法) 依據(jù)教材內(nèi)容、教學大綱的范圍以及教學目標分析測驗內(nèi)容,依據(jù)教材內(nèi)容、教學大綱的范圍以及教學目標分析測驗內(nèi)容,檢查測驗內(nèi)容究竟在體現(xiàn)教材內(nèi)容和教學目標方面達到多大程檢查測驗內(nèi)容究竟在體現(xiàn)教材內(nèi)容和教學目標方面達到多大程度度 對每一道題目逐一進行審查,以此形成對每一道題目逐一進行審查,以此形成“題目雙向細目表題目雙向細目表” 與與“命題雙向細目表命題雙向細目表”加以對照,以確定試卷的效度加以對照,以確定試卷的效度 統(tǒng)計分析法(定量的方法)統(tǒng)計分析法(定量的方法) 克龍巴赫法(兩套測驗試題,對相同被試實施測試后,計算得克龍巴赫法(兩套測驗試題,
9、對相同被試實施測試后,計算得分的相關系數(shù))分的相關系數(shù)) 評分一致性考查法(不同評分者之間評分的一致性程度,即考評分一致性考查法(不同評分者之間評分的一致性程度,即考查評分者信度)查評分者信度) 前后測對比法(根據(jù)前后兩次測驗的差異顯著性,確定測驗的前后測對比法(根據(jù)前后兩次測驗的差異顯著性,確定測驗的內(nèi)容效度)內(nèi)容效度)(二)結構效度的驗證方法(二)結構效度的驗證方法 結構效度結構效度是指一個測量能實際測量出理論上的是指一個測量能實際測量出理論上的構想或心理特性的程度。它的目的在于用心理構想或心理特性的程度。它的目的在于用心理學的概念來說明分析測驗分數(shù)的意義,也就是學的概念來說明分析測驗分數(shù)
10、的意義,也就是說從心理學的理論觀點就測驗的結果加以解釋說從心理學的理論觀點就測驗的結果加以解釋和探討。和探討。 這里的這里的結構結構的含義是心理學理論所涉及的抽象的含義是心理學理論所涉及的抽象而屬假設性的概念、構想、特性或變量,如智而屬假設性的概念、構想、特性或變量,如智力、焦慮、機械能力傾向、成就、動機等。力、焦慮、機械能力傾向、成就、動機等。(二)結構效度的驗證方法(二)結構效度的驗證方法 建立理論框架建立理論框架 從理論框架出發(fā),提出各種假設從理論框架出發(fā),提出各種假設 根據(jù)假設編制測驗根據(jù)假設編制測驗 以邏輯及實證的方法,檢驗結果是否符合心理學的理以邏輯及實證的方法,檢驗結果是否符合心
11、理學的理論框架及其假設論框架及其假設 比如:中學生數(shù)學能力的研究比如:中學生數(shù)學能力的研究 數(shù)學能力由分析能力、綜合能力、歸納和演繹能力、數(shù)學能力由分析能力、綜合能力、歸納和演繹能力、運算能力、空間想象能力構成;數(shù)學能力與早期教運算能力、空間想象能力構成;數(shù)學能力與早期教育有關;數(shù)學能力與智力正相關。育有關;數(shù)學能力與智力正相關。 編制測驗,施測并收集測驗結果編制測驗,施測并收集測驗結果 分析測驗結果,考查測試的結構效度,考查測驗結分析測驗結果,考查測試的結構效度,考查測驗結果是否支持理論構想果是否支持理論構想(三)效標關聯(lián)效度的估計方法(三)效標關聯(lián)效度的估計方法 效標:檢驗測驗效度的外在的
12、、客觀的標準,效標:檢驗測驗效度的外在的、客觀的標準,即效度的標準即效度的標準 效標效度,也稱為效標關聯(lián)效度,也稱為實證效標效度,也稱為效標關聯(lián)效度,也稱為實證效度效度 驗證方法是指一個測驗對處于特定情境中的個驗證方法是指一個測驗對處于特定情境中的個體行為進行預測時的有效性體行為進行預測時的有效性 例:例: 高考成績預測大學學習成績高考成績預測大學學習成績 能力傾向測驗預測工作成效能力傾向測驗預測工作成效(三)效標關聯(lián)效度的估計方法(三)效標關聯(lián)效度的估計方法 分類:分類: 同時效度:測驗分數(shù)與效標資料的取得約在同一時同時效度:測驗分數(shù)與效標資料的取得約在同一時間內(nèi)連續(xù)完成,這兩種資料的相關系
13、數(shù)即為同時效間內(nèi)連續(xù)完成,這兩種資料的相關系數(shù)即為同時效度度 目的:診斷現(xiàn)狀目的:診斷現(xiàn)狀用全國高考的成績作為效標來檢驗高中畢業(yè)生會考的成績,計用全國高考的成績作為效標來檢驗高中畢業(yè)生會考的成績,計算兩者之間的相關系數(shù)就是會考的同時效度算兩者之間的相關系數(shù)就是會考的同時效度 預測效度:測驗分數(shù)取得一段時間后才獲得效標資預測效度:測驗分數(shù)取得一段時間后才獲得效標資料,計算這兩種資料間的相關系數(shù)料,計算這兩種資料間的相關系數(shù) 目的:預測某個個體將來的行為目的:預測某個個體將來的行為而用大學一年級的成績作為效標來檢驗高考的成績,計算兩者而用大學一年級的成績作為效標來檢驗高考的成績,計算兩者的相關系數(shù)
14、就是高考的預測效度。的相關系數(shù)就是高考的預測效度。效標效度的估計方法 相關法相關法直接計算測驗分數(shù)與效標分數(shù)的相關系數(shù)直接計算測驗分數(shù)與效標分數(shù)的相關系數(shù) 積差相關、等級相關、二列相關等積差相關、等級相關、二列相關等 顯著差異法顯著差異法根據(jù)效標測量將被試分為兩個極端組,檢驗這兩個組測驗分數(shù)是根據(jù)效標測量將被試分為兩個極端組,檢驗這兩個組測驗分數(shù)是否具有統(tǒng)計學上的差異顯著性否具有統(tǒng)計學上的差異顯著性 命中率命中率當測驗用作取舍決策時,常使用命中率當測驗用作取舍決策時,常使用命中率相關概念:總命中率、正命中率、負命中率相關概念:總命中率、正命中率、負命中率總命中率高,則測試的效度高總命中率高,則
15、測試的效度高例:例: 7070人參加的考試,通過測驗選取了人參加的考試,通過測驗選取了5050人,淘汰了人,淘汰了2020人;選出的人中有人;選出的人中有4040人合格,淘汰的人中有人合格,淘汰的人中有8 8人不合格。該測驗的總命中率、正命中率人不合格。該測驗的總命中率、正命中率和負命中率分別是多少?和負命中率分別是多少?1 1、用積差相關系數(shù)的方法估計效度、用積差相關系數(shù)的方法估計效度 積差相關積差相關,是計算兩個變量線性相關的一種方法,由英國統(tǒng)計,是計算兩個變量線性相關的一種方法,由英國統(tǒng)計學家學家皮爾遜皮爾遜提出,因此也稱為皮爾遜提出,因此也稱為皮爾遜(Pearson)(Pearson)
16、相關。要使用相關。要使用積差相關必須同時積差相關必須同時具備如下幾個條件具備如下幾個條件: 兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù),即等距或等比數(shù)據(jù)。兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù),即等距或等比數(shù)據(jù)。 兩個變量的總體都呈正態(tài)分布,或接近正態(tài)分布,至少是單兩個變量的總體都呈正態(tài)分布,或接近正態(tài)分布,至少是單峰對稱分布,當然樣本并不一定要正態(tài)。峰對稱分布,當然樣本并不一定要正態(tài)。 必須是成對的數(shù)據(jù),而且每對數(shù)據(jù)之間是相互獨立的,即各必須是成對的數(shù)據(jù),而且每對數(shù)據(jù)之間是相互獨立的,即各自互不影響,本條件是難以檢驗的。自互不影響,本條件是難以檢驗的。 兩個變量之間呈線性關系。一般用描繪散點圖的方式來觀
17、察,兩個變量之間呈線性關系。一般用描繪散點圖的方式來觀察,最好是先各自轉化為最好是先各自轉化為Z Z分數(shù),單位會統(tǒng)一些。分數(shù),單位會統(tǒng)一些。例:例: 某中學數(shù)學教研組的教師積多年的教學法經(jīng)驗,認為剛入某中學數(shù)學教研組的教師積多年的教學法經(jīng)驗,認為剛入高中的學生學習立體幾何感到困難的主要原因是空間想像力高中的學生學習立體幾何感到困難的主要原因是空間想像力弱。弱。 為了證明這個論點,他們讓剛入高中的為了證明這個論點,他們讓剛入高中的103103名學生作名學生作1010道道題,測量其空間想像力。為避免知道了某些學生的剛入高中題,測量其空間想像力。為避免知道了某些學生的剛入高中時的成績影響以后考試的評
18、分,試卷暫不評閱。立體幾何學時的成績影響以后考試的評分,試卷暫不評閱。立體幾何學完后,進行考試,按得分多少把成績分為五等(完后,進行考試,按得分多少把成績分為五等(A A、B B、C C、D D、E E)分別得)分別得5 5、4 4、3 3、2 2、1 1分。這時才評閱入學時的試卷,統(tǒng)分。這時才評閱入學時的試卷,統(tǒng)計出期末得計出期末得5 5、4 4、3 3、2 2、1 1分者在入學測驗中分別答對分者在入學測驗中分別答對1 1道題道題至至1010道題的人數(shù)(見表道題的人數(shù)(見表2-12-1)。)。 就現(xiàn)有資料,用什么方法可以判斷教師們的意見是否正確?就現(xiàn)有資料,用什么方法可以判斷教師們的意見是否
19、正確?表2-1:(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 1解:(1)設期末考試的等第為y,空間想像力測驗答對的題數(shù)為x,列出二重交叉次數(shù)分布表:X(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 Y所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 125313296合計2 4 10 14 20 20 17 9 5 2103(2)用
20、積差相關系數(shù)公式計算效度系數(shù):驗的得分和的題數(shù)與期末測是指剛入學測驗中答對標準差。是期末測驗各人得分的對題數(shù)的標準差,是剛入學的測驗各題答人得分平均數(shù),是期末測驗中的人數(shù)的平均數(shù),道題道題到是剛入學的測驗中答對式中公式fxySSyxssyxNfxyryxyx103101)42(/12. 1/)(58. 3103619232331425510394. 1103/ )55. 510(2)55. 52(4)55. 51 (255. 5103210591034221101/)(22222 NyyfSSyySxxNxxfSSyyxxx標準差。是期末測驗各人得分的)(人得分平均數(shù),是期末測驗中)(道題的人
21、數(shù)的平均數(shù),道題到是剛入學的測驗中答對對題數(shù)的標準差,是剛入學的測驗各題答式中預測效度,前者對后者有一定的學習成績有較高的相關體幾何間想像力測驗成績與立相關系數(shù)較大,表明空) 3(699. 012. 194. 158. 355. 5103/22032203) 15( 1) 510(2) 59(4) 58 ( 5) 57(10) 56( 3) 55( 1 xyrfxy二列相關二列相關 適用于兩個變量就其實際含義而言是適用于兩個變量就其實際含義而言是等距或等比數(shù)據(jù),它們服從正態(tài)分布,等距或等比數(shù)據(jù),它們服從正態(tài)分布,其中一列人為地劃分為兩類。其中一列人為地劃分為兩類。時的縱高。中從左到右概率值為指
22、的是在整個正態(tài)曲線。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標準差。是該例連續(xù)變量全部變平均數(shù)?!毕鄬倪B續(xù)變量的”或“是二分名稱變量中“或公式pypqpSXXypqSXXrtqptqpb1015)-(2 點二列相關點二列相關 適用于一列數(shù)據(jù)為等距或等比且總體服從正態(tài)分布(實適用于一列數(shù)據(jù)為等距或等比且總體服從正態(tài)分布(實際上只需要單峰對稱分布,如分布),另一列變量是際上只需要單峰對稱分布,如分布),另一列變量是按事物的性質(zhì)劃分為兩類的變量,也可以是一個雙峰分按事物的性質(zhì)劃分為兩類的變量,也可以是一個雙峰分布,人為劃分為兩類,如文盲與非文盲。這種相關系數(shù)布,人為劃分為兩類,如文盲與
23、非文盲。這種相關系數(shù)多用于測驗中評價題目的區(qū)分度。對選擇題、判斷題在多用于測驗中評價題目的區(qū)分度。對選擇題、判斷題在整個測量中作用作出判斷。整個測量中作用作出判斷。 基本計算公式:基本計算公式:。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標準差。是該例連續(xù)變量全部變平均數(shù)。”相對應的連續(xù)變量的”或“是二分名稱變量中“或公式pqpSXXpqSXXrtqptqppb1016)-(2 例:有一位教師自編了一套測驗題,用來預測學生例:有一位教師自編了一套測驗題,用來預測學生一年后的某科成績,自編測驗按百分制評分,一年一年后的某科成績,自編測驗按百分制評分,一年后考試評分只把學生分為及格者和不及
24、格者。試就后考試評分只把學生分為及格者和不及格者。試就所獲資料估計自編測驗的預測效度。所獲資料估計自編測驗的預測效度。 解:解:1)1)把兩次測驗成績成對排列:把兩次測驗成績成對排列:被試者被試者1 12 23 34 45 56 67 78 89 91010 1111121213131414自編測驗自編測驗的成績(的成績(X X)6767 1010 20 44 60 43 61 10 26 23 30 18 35 2320 44 60 43 61 10 26 23 30 18 35 23一年后考一年后考試成績(試成績(Y Y)1 1 1 0 0 1 1 0 1 0 0 1 1 11 1 1 0
25、 0 1 1 0 1 0 0 1 1 12)計算出二列相關公式所需統(tǒng)計量計算出二列相關公式所需統(tǒng)計量:績。不能用來預測學生的成極低,個測驗結果的預測效度相關系數(shù)極小,說明這)代入公式計算得:。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標準差。是該例連續(xù)變量全部變平均數(shù)?!毕鄬倪B續(xù)變量的”或“是二分名稱變量中“或公式0.007 36. 064. 0125.1840.3367.33336. 01,64. 01491125.1840.335302310604467.33923351067016)-(2 pbttqpqptqppbrpqppqpSSXXXXpqSXXr四、提高效度的方法四、
26、提高效度的方法 (一)各種效度系數(shù)的要求(一)各種效度系數(shù)的要求 (二)影響效度的因素(二)影響效度的因素 (三)提高效度的方法:(三)提高效度的方法: 1、控制系統(tǒng)誤差、控制系統(tǒng)誤差 2、精心編制量表、精心編制量表 3、妥善組織測驗、妥善組織測驗 4、擴充樣本的容量和代表性、擴充樣本的容量和代表性 5、合理處理效度和信度的關系、合理處理效度和信度的關系 6、適當增加測驗的長度適當增加測驗的長度表表2.1 測驗長度與信度和效度的關系測驗長度與信度和效度的關系題數(shù)題數(shù)與原測驗題數(shù)之比與原測驗題數(shù)之比信度系數(shù)信度系數(shù)效度系數(shù)效度系數(shù)1020306012014048012361214480.3000
27、.4620.5620.7200.8370.9110.9540.4000.4960.5480.6190.6680.6790.713第三節(jié) 難度及其計算 一、難度的概念一、難度的概念 1 1、難度是指測量試題的難易程度。、難度是指測量試題的難易程度。 在教育測量中,客觀題的難度一般用正確回在教育測量中,客觀題的難度一般用正確回答試題的人數(shù)與參加測驗的總人數(shù)的比值來答試題的人數(shù)與參加測驗的總人數(shù)的比值來表示。其公式為:表示。其公式為: 例如:在例如:在100100個學生中,答對第一題的個學生中,答對第一題的3030人,人,答對第二題的答對第二題的6060人,這兩道題的難度分別是人,這兩道題的難度分別
28、是多少?多少?NRp 2 2、難度對測驗的影響、難度對測驗的影響 1)測驗難度影響分數(shù)的分布形態(tài)。 難度值越接近0,測驗的難度就越大,測驗分數(shù)就越是集中在低分端,其分數(shù)分布越呈現(xiàn)正偏態(tài);反之,難度值越接近1.00,其難度就越小,測驗分數(shù)越集中在高分端,分數(shù)分布呈負偏態(tài)。 2)測驗難度影響測驗分數(shù)的離散程度 測驗難度過大過小,都會造成測驗分數(shù)偏離正態(tài)分布,從而使分數(shù)的全距縮小,使測驗分數(shù)的離散程度變小。 3)測驗難度影響測驗的鑒別能力 在測驗中,考生之間相互配對比較的可能性越多,就越有利于準確地鑒別考生的不同能力。3 3、測驗的適宜難度、測驗的適宜難度 難度在難度在0.500.50左右的試題能組
29、成考生之間最多的左右的試題能組成考生之間最多的配對比較次數(shù),能使測驗分數(shù)的離散指數(shù)達到配對比較次數(shù),能使測驗分數(shù)的離散指數(shù)達到最大值,并能有效地造成測驗分數(shù)的正態(tài)性。最大值,并能有效地造成測驗分數(shù)的正態(tài)性。這有兩層意思:這有兩層意思: 一是測驗中的各試題的難度,均應在一是測驗中的各試題的難度,均應在0.500.50左右;左右; 二是測驗中的試題的難度在二是測驗中的試題的難度在0.2-0.80.2-0.8之間,平之間,平均難度應在均難度應在0.500.50左右。左右。二、難度的計算 (一)計算難度的基本公式(一)計算難度的基本公式 3 3、整個試卷的難度計算、整個試卷的難度計算 試卷的難度是指一
30、份試卷的總體難易程度,其試卷的難度是指一份試卷的總體難易程度,其由試卷中每道題的難度決定。由試卷中每道題的難度決定。 其計算辦法為:將每道題目的難度與滿分值相其計算辦法為:將每道題目的難度與滿分值相乘的積相加,然后將其總和除以試卷的滿分值,乘的積相加,然后將其總和除以試卷的滿分值,所得的商即為整個試卷的難度。所得的商即為整個試卷的難度。二、難度的計算 (一)計算難度的基本公式(一)計算難度的基本公式 1 1、客觀題難度的計算、客觀題難度的計算 NRp 2 2、主觀題難度的計算、主觀題難度的計算表示此題的滿分。)題上的平均得分,表示所有考生在某一道(KKXXp P表示難度指標,N表示參加考試的總
31、人數(shù),R表示答對某道客觀題的人數(shù)。(二)用極端分組法計算試題的難度(二)用極端分組法計算試題的難度 1 1、用極端分組法計算客觀題的難度、用極端分組法計算客觀題的難度 具體步驟如下:具體步驟如下: 1 1)先按測驗總分的高低,按由高到低的順序依次排)先按測驗總分的高低,按由高到低的順序依次排列試卷。列試卷。 2 2)從得分最高的一份試卷開始依次向下選出全部試)從得分最高的一份試卷開始依次向下選出全部試卷的卷的27%27%作為高分組;從得分最低的一份試卷開始依作為高分組;從得分最低的一份試卷開始依次向上選出全部試卷的次向上選出全部試卷的27%27%作為低分組。作為低分組。 3 3)按計算公式計算
32、難度)按計算公式計算難度為低分組的難度)為高分組的難度,(L2pppppHLH例題例題:在在100100名學生中,高分組與低分組名學生中,高分組與低分組各有各有2727人。其中高分組答對第一題的有人。其中高分組答對第一題的有2020人,低分組答對第一題的有人,低分組答對第一題的有1010人。這人。這道題的難度為多少?道題的難度為多少?計算計算 解:依據(jù)客觀題極端分組法計算公式解:依據(jù)客觀題極端分組法計算公式0.56 227102720 2LHppp2 2、用極端分組法計算論文試題難度、用極端分組法計算論文試題難度步驟如下:步驟如下:1 1)按測驗得分排列試卷,確定高分組與低分組,)按測驗得分排
33、列試卷,確定高分組與低分組,各占總人數(shù)的各占總人數(shù)的25%25%(方法同前)。(方法同前)。2 2)分別為高分組、低分組編制每道試題的分析表。)分別為高分組、低分組編制每道試題的分析表。3 3)按下列公式計算難度,)按下列公式計算難度,為最低分。是這道題的最高分,表示總人數(shù)的為低分組得分總和,為高分組得分總和,LH%25X)(22LnXLHnnLXXpHLH例:某道論文題,高分組得分總某道論文題,高分組得分總和為和為4040分,低分組得分總和為分,低分組得分總和為1515分,有分,有4040人參加考試,這道題最人參加考試,這道題最高得分為高得分為8 8分,最低得分為分,最低得分為2 2分,分,
34、則此題的難度為多少?則此題的難度為多少?(0.125)計算計算 解:依據(jù)主觀題極端分組法計算公式解:依據(jù)主觀題極端分組法計算公式 =0.125 28%254022%254021540 )(22LHnnLXXpLH第四節(jié)區(qū)分度及其計算 一、區(qū)分度的意義一、區(qū)分度的意義 (一)區(qū)分度(一)區(qū)分度(Discrimination)是指測驗對考)是指測驗對考生實際水平的區(qū)分程度,用符號生實際水平的區(qū)分程度,用符號D表示。又叫鑒表示。又叫鑒別力,它是評價試題質(zhì)量,篩選試題的主要指標別力,它是評價試題質(zhì)量,篩選試題的主要指標與依據(jù)。與依據(jù)。 區(qū)分又分為正(或積極)區(qū)分(區(qū)分又分為正(或積極)區(qū)分(D0),零
35、區(qū)分),零區(qū)分(D0)和負(或消極)區(qū)分()和負(或消極)區(qū)分(D0)。)。 區(qū)分度的高低直接影響到測驗的信度和效度。區(qū)分度的高低直接影響到測驗的信度和效度。(二)區(qū)分度與測驗信度、難度的關系 1 1、區(qū)分度與信度的關系(見下表、區(qū)分度與信度的關系(見下表2.22.2) 這里是假定全部試題的難度均為這里是假定全部試題的難度均為0.500.50時所預測的信度系數(shù)。時所預測的信度系數(shù)。 區(qū)分度指的是平均值。區(qū)分度指的是平均值。 可見,要想達到理想的測驗信度,提高區(qū)分度是一可見,要想達到理想的測驗信度,提高區(qū)分度是一 個好辦法。個好辦法。區(qū)分度區(qū)分度信度信度0.12250.12250.160.160
36、.200.200.300.300.400.400.500.500.000.000.420.420.630.630.840.840.9150.9150.9490.949(二)區(qū)分度與難度的關系 表表2.32.3D D的最大值與試題難度的關系的最大值與試題難度的關系 由上表可知,難度適中,可使區(qū)分度達到最大值。由上表可知,難度適中,可使區(qū)分度達到最大值。難度難度區(qū)分度的最大值區(qū)分度的最大值1.001.00.90.90.70.70.50.50.30.30.10.10.00.00.00.00.20.20.60.601.001.00.60.60.20.200000二、區(qū)分度的計算 (一)用極端分組法計算
37、區(qū)分度(一)用極端分組法計算區(qū)分度 1、客觀題區(qū)分度的計算:、客觀題區(qū)分度的計算: DPH PL注:將被試依照總分從高到低排列,然后將總分最高的27%和最低的27%的被試分別定為高分組和低分組。) 2、主觀題區(qū)分度的計算:、主觀題區(qū)分度的計算:為最低分。是這道題的最高分,表示總人數(shù)的為低分組得分總和,為高分組得分總和,LH%25X)(LnXLHnXXDHLH二、區(qū)分度的計算 (一)用極端分組法計算區(qū)分度(一)用極端分組法計算區(qū)分度 1 1、客觀題區(qū)分度的計算:、客觀題區(qū)分度的計算: DPH PL(D D為區(qū)分度,為區(qū)分度,PhPh為高分組通過率,為高分組通過率,PlPl為低分組為低分組通過率。
38、)通過率。)(注:將被試依照總分從高到低排列,然后將總(注:將被試依照總分從高到低排列,然后將總分最高的分最高的27%27%和最低的和最低的27%27%的被試分別定為高分的被試分別定為高分組和低分組。)組和低分組。)二、區(qū)分度的計算二、區(qū)分度的計算 (一)用極端分組法計算區(qū)分度(一)用極端分組法計算區(qū)分度 3、整個試卷的區(qū)分度計算 試卷的區(qū)分度是指一份試卷總體對學生的區(qū)分程度。 其計算辦法為:將每道題目的區(qū)分度與滿分值相乘的積相加,然后將其總和除以試卷的滿分值,所得的商即為整個試卷的區(qū)分度。(二)用內(nèi)部一致性系數(shù)計算區(qū)分度(二)用內(nèi)部一致性系數(shù)計算區(qū)分度 極端分組法分析通常只在教師編制的課堂測
39、繪極端分組法分析通常只在教師編制的課堂測繪中使用。在標準化的或大規(guī)模的測驗中,多采中使用。在標準化的或大規(guī)模的測驗中,多采用相關法分析試題的內(nèi)部一致性。用相關法分析試題的內(nèi)部一致性。 由于測驗總分屬于連續(xù)變量,測驗項目(試題)由于測驗總分屬于連續(xù)變量,測驗項目(試題)多屬二分稱名變量(對、錯或通過、不通過),多屬二分稱名變量(對、錯或通過、不通過),所以,用相關法計算區(qū)分度時,多采用點二列所以,用相關法計算區(qū)分度時,多采用點二列相關、二列相關、相關、二列相關、系數(shù)等方法計算相關系數(shù)。系數(shù)等方法計算相關系數(shù)。P80P80頁第頁第1414題題某學科測驗,某學科測驗,1010名被試得分情況如表名被試
40、得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8P80P80頁第頁第1414題題某學科測驗,某學科測驗,1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 1 1、
41、計算第、計算第1 1、5 5題的難度與區(qū)分度;題的難度與區(qū)分度; 2 2、用高低分組法計算第、用高低分組法計算第2 2、6 6的難度與的難度與區(qū)分度。區(qū)分度。 3 3、計算該測驗的信度。、計算該測驗的信度。P80P80頁第頁第1414題題某學科測驗,某學科測驗,1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2
42、 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8總分總分34 48 30 36 50 14 41 30 30 34P80P80頁第頁第1414題題某學科測驗,某學科測驗,1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4總分總分34 48 30 36 50 14 41 30 30 341、計算第、計算第1、5題的難度與區(qū)分度;題的難度與區(qū)分度; P1=R/N=6/10=0.6;P5=4.6/7=(假定這道題的滿分為7分) 被試被試題目題目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4總分總分34 48 30 36 50 14 41 30 30 345 . 08 . 981.9410/ )3 . 67 .203 .153 . 137 . 43 .1327 . 0(5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年靜態(tài)澆鑄管項目投資價值分析報告
- 地毯、掛毯類工藝品項目風險識別與評估綜合報告
- 2025年度公司股東間借款及資產(chǎn)重組合同范本
- 2025年度國際貨運代理及清關服務合同
- 2025年度歷史文化名城保護監(jiān)理合同補充協(xié)議范本
- 2025年度機場圍界護欄安全防護合同
- 2025年度建筑行業(yè)專業(yè)技術人員勞動合同范本
- 2025年度化妝品行業(yè)培訓與咨詢合同模板
- 2025年度公路零擔運輸合同(含貨物跟蹤服務)
- 2025年家禽養(yǎng)殖廢棄物處理設施運營管理合同
- 《教育強國建設規(guī)劃綱要(2024-2035年)》解讀講座
- 重大事故隱患判定標準與相關事故案例培訓課件
- 2024年度節(jié)后復工建筑施工安全培訓交底
- 2023年云南省貴金屬新材料控股集團有限公司招聘筆試題庫及答案解析
- GB/T 1094.1-2013電力變壓器第1部分:總則
- 2023年益陽醫(yī)學高等??茖W校單招綜合素質(zhì)考試筆試題庫及答案解析
- 胸外科診療指南和操作規(guī)范
- 電網(wǎng)基本知識
- 民法原理與實務課程教學大綱
- 鋼筋混凝土框架結構工程監(jiān)理的質(zhì)量控制
- 變更戶主情況登記表
評論
0/150
提交評論