




已閱讀5頁,還剩72頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二章教育測量與評價的質(zhì)量特性 第一節(jié)教育測量與評價的信度 第二節(jié)教育測量與評價的效度 第三節(jié)教育測量與評價中項目的難度 第三節(jié)教育測量與評價中項目的區(qū)分度 第二章教育測量的質(zhì)量特性 衡量教育測量的質(zhì)量 可采用四個指標(biāo) 信度主要對整個測驗而言 效度難度主要對測驗項目而言 區(qū)分度 一 什么是信度 指測量結(jié)果的穩(wěn)定性或可靠性程度 一般地說 一個好的測量必須具有較高的信度 也就是說 一個好的測量工具 只要遵守操作規(guī)則 其結(jié)果就不應(yīng)隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化 第一節(jié)教育測量與評價的信度 對信度的理解 信度指實測值 X 和真值 T 相差的程度 考察信度系數(shù)時 常常采用相關(guān)系數(shù)作為信度指標(biāo) 測驗結(jié)果之間的相關(guān)程度越高 信度就越高 采用不同的方式計算相關(guān)系數(shù) 就得到不同類型的信度系數(shù) 心理測驗的信度值在0 1 00之間 當(dāng)信度系數(shù)等于1 00時 表示測驗完全可靠 當(dāng)信度系數(shù)等于0時 則表示測驗根本不可靠 問題 一個能力測驗用于人才招聘 經(jīng)檢驗它的信度為0 70 如何理解這個信度系數(shù)的含義 理解 0 70的信度系數(shù)表明 在不同的招聘候選人之間進(jìn)行比較 候選人測驗分?jǐn)?shù)的70 差別是由于個體之間真實的能力差異所導(dǎo)致的 而30 差別是由于隨機(jī)誤差所導(dǎo)致 二 信度的種類及估計方法 采用不同的方法來計算相關(guān)系數(shù) 就會得到不同類型的信度指標(biāo) 重測信度 復(fù)本信度 分半信度 同質(zhì)性信度 評分者信度 五種信度的含義和計算方法各異 我們在使用時要特別注意每一種信度的特定內(nèi)涵和適用范圍 一 重測信度 指同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度 其大小等于同一組被試在兩次測驗上所得分?jǐn)?shù)的相關(guān)系數(shù) 一般采用皮爾遜積差相關(guān)的公式來計算 施測 再施測 重測信度的計算 X 第一次測驗的實得分?jǐn)?shù) Y 第二次測驗的實得分?jǐn)?shù) N 被試人數(shù) 統(tǒng)計學(xué)上 我們通常把對同一組被試實施的兩次等值測驗的成績的相關(guān)系數(shù)作為這一測驗的信度 例一 用一個算術(shù)四則的速度測驗12個小學(xué)生 得分記為X 為了考察測量結(jié)果的可靠性 于3個月后再測一次 得分記為Y 問測驗結(jié)果是否可靠 學(xué)生序號123456789101112X202021222323232425262627Y202121202323252526262729 在使用重測法計算信度值時 應(yīng)注意以下問題 1 信度的取值范圍為 0 1 當(dāng)信度值較大時 說明前后兩次測量結(jié)果比較一致 2 兩次測驗之間的時間間隔要適宜 應(yīng)由測驗的性質(zhì) 測題類型 測題數(shù)量和被試特點(diǎn)所決定 3 重測法適用于速度測驗而不適用于難度測驗 4 應(yīng)注意提高被試者的積極性 重測信度與時間間隔 兩次測量之間的間隔時間不同 重測信度也不同 間隔時間太短 存在記憶效應(yīng) 間隔時間太長 影響測量的干擾因素增加 一般而言 時間間隔越長 信度系數(shù)越低 適宜的間隔時間因測驗性質(zhì) 被試特點(diǎn)而異 如 對兒童測量時間間隔相對短一些成人測量時間間隔可以長一些 一般以2周到4周較宜 最好不超過6個月 報告重測信度時要明確說明兩次測驗之間的時間間隔 并且 一個經(jīng)過良好評估的測驗應(yīng)當(dāng)具有多個時間間隔的重測信度 二 復(fù)本信度 指兩個平等的測驗測量同一批被試所得結(jié)果的一致性程度 其大小等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的相關(guān)系數(shù) 所謂復(fù)本測驗是指在性質(zhì) 內(nèi)容 題型 題數(shù) 難度等方面都一致 或相等 的兩份或多份測驗 施測A型 施測B型 例二 以A B兩型英語復(fù)本測驗對初中三年級10個學(xué)生施測 為避免由測驗施測順序所造成的誤差 其中5個學(xué)生先做A型測驗 休息15分鐘后 再做B型測驗 而另5個學(xué)生先做B型測驗 休息15分鐘后 再做A型測驗 10個學(xué)生A型測驗結(jié)果記為X B型測驗結(jié)果記為Y 其測驗的復(fù)本信度如何 學(xué)生序號12345678910X19191817161515141312Y20171818171513151212 復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn) 優(yōu)點(diǎn) 1 測驗的兩個復(fù)本 如果在不同的時間使用 其信度既可以反映在不同時間的穩(wěn)定性 又可以反映對于不同測題的一致性 2 兩個復(fù)本在同時使用時 可以避免再測信息的一些缺點(diǎn) 如首測時再測在記憶 練習(xí) 效果的影響 間隔期間獲得新知識的影響 兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響 以及為了應(yīng)付測驗所作訓(xùn)練的影響等 復(fù)本信度缺點(diǎn) 1 編制兩個完全相等的測驗是很困難的 如果兩個復(fù)本過分相似 則變成再測形式 而過分不相似 又使等值的條件不存在 2 兩個復(fù)本測驗有可能在某種程度上測量了不同的性質(zhì) 這就會低估測驗的信度 3 被試同時接受性質(zhì)相似的兩個測驗 可能減少完成測驗的積極性 4 雖然兩個復(fù)本測驗的題目材料不同 但被試一旦掌握了解題的某一模式 就能觸類旁通 有可能失去復(fù)本的意義 三 同質(zhì)性信度 同質(zhì)性信度 也稱內(nèi)部一致性信度 指測驗內(nèi)部所有題目之間的一致性程度 兩層意思 測驗所有題目測的是否為同一種心理特質(zhì) 測驗所有題目得分之間是否具有較高的正相關(guān) 基本假設(shè) 當(dāng)一個測驗具有較高的同質(zhì)性信度時 說明測驗主要測的是某一個單一心理特質(zhì) 由于眾多題目測試了同一心理特質(zhì) 那么實測結(jié)果就是該特質(zhì)水平的反映 估計方法 分半信度 p49 庫德 理查遜信度 p50 克龍巴赫系數(shù) 系數(shù) p52 荷伊特信度 p52 分半信度 將測驗分半 再求被試在每一半測驗上所得分?jǐn)?shù)的相關(guān)系數(shù) 首先根據(jù)內(nèi)容 形式 題數(shù) 平均數(shù) 標(biāo)準(zhǔn)差 難度 測題間相關(guān)以及分布形態(tài)相等的原則 將試題分成兩半 或者將從易到難排列的測題 按照測題序號 奇數(shù)測題為一組 偶數(shù)測題為一組 分成兩半 然后計算每個被試在兩個分半測驗分?jǐn)?shù)的相關(guān)系數(shù) 再用斯皮爾曼 布朗公式加以校正 p49 分半信度只需要一種測驗形式 實施一次測驗 它比重測信度和復(fù)本信度的操作更簡便 注意 當(dāng)一個測驗無法分成對等的兩半時 不宜使用分半信度 分半信度的計算方法 1 當(dāng)兩個半測驗分?jǐn)?shù)的方差相等時 計算兩個 半測驗 之間的皮爾遜積差相關(guān)系數(shù) 然后用斯皮爾曼 布朗公式校正 rxx 2rhh 1 rhh 其中rxx是整個測驗的分半信度 rhh是兩個半測驗之間的相關(guān)系數(shù) 2 當(dāng)兩個半測驗分?jǐn)?shù)的方差不相等時 采用弗朗那根公式和盧侖公式 弗朗那根公式 rxx 2 1 s2a s2b s2x 盧侖公式 rxx 1 s2d s2x其中 rxx 測驗的分半信度 s2a s2b 兩半測驗上得分的方差 s2x 整個測驗上得分的方差 s2d 兩半測驗上得分之差的方差 例三 對初中一年級學(xué)生進(jìn)行地理成績測驗 每答對1題得1分 答錯1題得0分 其測驗結(jié)果如下表 試估計該測驗的分半信度 學(xué)生序號題序12345611000002000100310100041100105100100611101171111018110110901100110111111 四 評分者信度 評分者信度 指多個評分者給同一批被試作答情況評分的一致性程度 它主要用于主觀性作品的評價過程中 如論述題評分 作文題評分 歌唱比賽的評分 設(shè)計作品的評分等 評分者信度的計算方法 1 當(dāng)評分者人數(shù) 2時 評分者信度等于兩者評分的相關(guān)系數(shù) 2 當(dāng)評分者人數(shù)大 2時 評分者信度采用肯德爾和諧系數(shù)計算 五 標(biāo)準(zhǔn)參照測驗的信度分析 1 百分比一致性指標(biāo) PA p54 2 一致性系數(shù) p55 3 指數(shù) p55 總結(jié)和比較1 五種信度的誤差來源 總結(jié)和比較2 測試次數(shù) 測試卷份數(shù)與信度系數(shù) 作業(yè) 1 用某量表測驗10名學(xué)生 得分記為X 為了考察結(jié)果的可靠性 于15天后用原量表對這10個學(xué)生重測一次 得分記為Y 問測驗結(jié)果是否可靠 學(xué)生序號12345678910X810961075794Y9101061084894 2 對10名應(yīng)試者先進(jìn)行某種測驗X 隔適當(dāng)時間后 半年 再進(jìn)行內(nèi)容 范圍 難度類似的第二次測驗Y 試求測驗的復(fù)本信度 應(yīng)試者12345678910X9101061084894Y4979435324 3 有一個由100題構(gòu)成的量表施行于10個高三學(xué)生 分?jǐn)?shù)見下表 測驗一次后 學(xué)生即畢業(yè)離校 現(xiàn)怎樣評價測驗結(jié)果的信度 學(xué)生序號12345678910奇X38373841403638394035偶Y37373639393438393936 信度的作用 1 信度是確定測驗工具好壞的指標(biāo)之一 注 表中數(shù)據(jù)來源 LewisR Aiken Psychologicaltestingandassessment eighthedition AllynandBacon Inc 1994 判斷原則 多年的研究結(jié)果 一般的能力測驗和成就測驗的信度系數(shù)都在0 90以上 有的可以達(dá)0 95 而人格測驗 興趣 態(tài)度 價值觀等測驗的信度一般在0 80 0 85或更高些 R原有的同類測驗或相似測驗 2 信度是測量過程中隨機(jī)誤差大小的反映 3 信度可以直接解釋真分?jǐn)?shù)與實得分?jǐn)?shù)之間的關(guān)系 明確告知測驗誤差的大小 測量標(biāo)準(zhǔn)誤可作為測量誤差大小的客觀指標(biāo) 4 下結(jié)論說某測驗比較可靠 必須依據(jù)情境 并經(jīng)多次證實 5 信度可以解釋 預(yù)測個人分?jǐn)?shù)的意義 三 提高信度的方法 一 影響測量信度的主要因素1 被試方面2 主試方面3 施測情境方面4 測量工具方面5 兩次施測的間隔時間方面 二 提高測量信度的常用方法 1 適當(dāng)增加測驗的長度2 測驗的難度要適中3 測驗的內(nèi)容應(yīng)盡量同質(zhì)4 測驗的程序應(yīng)統(tǒng)一5 測驗的時間要充分6 測驗的評分要盡量做到客觀化 減少評分誤差 一 什么是效度 指測量結(jié)果的準(zhǔn)確性和有效性的程度 也可以說是測量是否達(dá)到了預(yù)期的目的 1 效度是一個相對的概念 1 測量的效度是相對一定的測量目的而言的 2 測量的效度是相對測量的結(jié)果而言的2 一種測量的效度只是高或低的問題測量結(jié)果總是有一定效度的 只是效度高低不同罷了 第二節(jié)教育測量與評價的效度 根據(jù)測量目標(biāo)的不同 對測量工具進(jìn)行效度驗證的方法主要有三種 內(nèi)容效度 基于所測內(nèi)容的效度驗證方法 結(jié)構(gòu)效度 基于所測心理結(jié)構(gòu)的效度驗證方法 準(zhǔn)則關(guān)聯(lián)效度 基于效標(biāo)關(guān)聯(lián)性的效度驗證方法 二 效度的估計 1 什么是內(nèi)容效度 指測驗題目樣本對應(yīng)測內(nèi)容及行為領(lǐng)域的代表性程度 如果是教學(xué)情境下的成就測驗 那么其內(nèi)容效度就是看測驗題目樣本能體現(xiàn)教學(xué)目標(biāo)與教材要求的程度 例如 教師給學(xué)生做一份語文成就測驗 如果該測驗的題目涵蓋了語文教學(xué)所達(dá)到的各項目標(biāo)及教材的重要內(nèi)容 那么我們便說該測驗具有較高的內(nèi)容效度 為了使測驗的內(nèi)容具有有效性 成為所欲測量內(nèi)容的一個具有代表性的行為樣本 在編制測驗時 就要考慮建立內(nèi)容效度的問題 一 內(nèi)容效度 2 內(nèi)容效度的估計 1 邏輯分析法其工作思路是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的吻合程度作出判斷 以考試內(nèi)容效度分析來說 就是依靠專家來分析一份試卷的所有題目 把所有題目按考試內(nèi)容分布和考查目標(biāo)分布進(jìn)行雙向分類 形成實際的 題目雙向分類表 基于這個 題目雙向分類表 的分析 然后由專家對這次考試 測量 的內(nèi)容效度的滿意程度作出等級判斷或評語描述 這里不妨先提供一份測驗的命題雙向細(xì)目表 參見表3 9 p62 以增加讀者的感性認(rèn)識 2 量化分析法 p63 內(nèi)容效度主要應(yīng)用于成就測驗 學(xué)科測驗 選拔和分類職業(yè)測驗 內(nèi)容效度不適合用于能力傾向和人格測驗 二 結(jié)構(gòu)效度 結(jié)構(gòu) Construct 是指心理學(xué)或社會學(xué)上的一種理論構(gòu)想或特質(zhì) 它本身觀察不到 并且也無法直接測量到 但學(xué)術(shù)理論假設(shè)它是存在的 以便能夠來解釋和預(yù)測個人或團(tuán)體的行為表現(xiàn) 例如 智力就是心理學(xué)中的一種結(jié)構(gòu)結(jié)構(gòu)效度 指的就是測驗?zāi)軌驕y量到理論上 通常是心理學(xué)或社會學(xué) 所定義的某一心理結(jié)構(gòu)或特質(zhì)的程度 二 結(jié)構(gòu)效度 結(jié)構(gòu)效度 測驗對于人的心理特性或理論概念測量到的程度 通常用某種操作來定義 并用測驗來測量 例如 人的創(chuàng)造力可以分解為人的思維流暢性 靈活性和創(chuàng)造性三大特性 并根據(jù)這三大特性編制測驗 若有足夠的證據(jù)來證明該測驗確實可以測到這些特性 則認(rèn)為該測驗是個結(jié)構(gòu)效度較高的創(chuàng)造力測驗 1 結(jié)構(gòu)效度的特點(diǎn) 結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論 一旦人們對同一種心理特質(zhì)有著不同的定義或假設(shè) 則會使得關(guān)于特質(zhì)測驗的結(jié)構(gòu)效度的研究結(jié)果無法比較 當(dāng)實際測量的資料無法證實我們的理論假設(shè)時 并不一定就表明該測驗結(jié)構(gòu)效度高 因為還有可能出現(xiàn)理論假設(shè)不成立 或者該實驗設(shè)計不能對該假設(shè)作適當(dāng)?shù)臋z查等情況 這就使得結(jié)構(gòu)效度的獲取更為困難 2 建立結(jié)構(gòu)效度的步驟 A 提出理論假設(shè) B 根據(jù)假定結(jié)構(gòu)擬定測題 編制測驗 C 以測驗結(jié)果為根據(jù)來驗證假設(shè)結(jié)構(gòu)中的各種因素是否成立 3 結(jié)構(gòu)效度的估計 1 因素分析法其目的是把一些具有錯綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個綜合因素或稱共同因素 并以此測驗所測之特質(zhì)對測驗分?jǐn)?shù)作出解釋 2 多元特質(zhì)多重方法矩陣法是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評估方法 這種方法的設(shè)想 若采用兩種方法以上的方法去測量兩種以上的特質(zhì) 那么這些測量結(jié)果之間可以形成一個多元特質(zhì)多重方法矩陣 從理論上說 以不同方法測量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高 以相同方法測量不同特質(zhì)的相關(guān)次之 以不同方法測量特質(zhì)的相關(guān)為最低 與內(nèi)容效度不同 結(jié)構(gòu)效度主要用于智力測驗 人格測驗等一些心理測驗方面 三 效標(biāo)關(guān)聯(lián)效度 是以測驗分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗效度高低的方法 例如 某年全國高考物理學(xué)科的測驗效度 可用大學(xué)一年級物理學(xué)科的測驗分?jǐn)?shù)為效標(biāo) 然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān) 此相關(guān)系數(shù)就是該年高考物理測驗的效標(biāo)關(guān)聯(lián)效度系數(shù) 當(dāng)這個相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時 相關(guān)系數(shù)的值 正值 越大 效度就越高 相關(guān)系數(shù)的值越小 效度就越低 效標(biāo)不僅隨測驗的種類不同而不同 而且可能隨時間而改變 現(xiàn)在是一個好的成功的效標(biāo) 將來就不一定是 所以 為某個測驗選擇一個最有效的效標(biāo) 這是最重要的事情 教育測驗的效標(biāo) 可采用各學(xué)科成績和教師評定的結(jié)果 智力測驗的效標(biāo) 可采用學(xué)科成績 教師評判的結(jié)果 學(xué)生總成績 受教育年限 年齡以及其他事物 能力傾向測驗的效標(biāo) 可采用特殊課程或特殊訓(xùn)練的成績 職業(yè)興趣測驗的效標(biāo) 可采用從業(yè)人員實際服務(wù)成績或記錄 人格測驗的效標(biāo) 可采用編制者的主觀標(biāo)準(zhǔn) 或以被試以后行為或臨床資料 效標(biāo)關(guān)聯(lián)效度的估計方法 1 相關(guān)法由于測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)這兩個變量的類型不同 二者相關(guān)系數(shù)的計算方法也就不同 1 積差相關(guān)法 適用于兩個變量為連續(xù)變量進(jìn)行顯著性檢驗 自由度df N 2 檢驗的是兩個變量 都減去2 置信度取0 05 查相關(guān)系數(shù)界值表 尋找臨界值 結(jié)論 r 臨界值 說明顯著相關(guān) 效度高 r 臨界值 說明無相關(guān) 效度低 例二 用一套高中數(shù)學(xué)成就測驗對某校高一10個學(xué)生施測 其測驗分?jǐn)?shù)X如下 并以這些學(xué)生的物理學(xué)科考試成績?yōu)樾?biāo) 試估計高中數(shù)學(xué)成就測驗的效標(biāo)關(guān)聯(lián)效度系數(shù) 且檢驗數(shù)學(xué)和物理兩成績變量是否相關(guān) 效度如何 學(xué)生序號12345678910數(shù)學(xué)X88806860963232646475物理Y94785648703862787082 2 等級相關(guān)法 如找不到效標(biāo)分?jǐn)?shù) 可用等級分?jǐn)?shù) 即排名的次數(shù) 來替代適用于連續(xù)變量數(shù)據(jù)小于30 精確度稍差于積差相關(guān) 例三 高中一年級學(xué)生10個學(xué)生數(shù)學(xué)測驗與物理學(xué)科成績?nèi)缦卤?試計算數(shù)學(xué)測驗的效標(biāo)關(guān)聯(lián)效度系數(shù) 學(xué)生序號12345678910原始分X88806860963232646475數(shù)學(xué)等級Rx235819 59 56 56 54原始分Y94785648703862787082物理等級Ry13 5895 51073 55 52 3 點(diǎn)二列相關(guān)法 當(dāng)測驗分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個變量為連續(xù)變量 而另一個為真正的二分變量時 測驗的效標(biāo)關(guān)聯(lián)效度系數(shù)用點(diǎn)二列相關(guān)系數(shù)來表示 適用于兩變量 一列變量為連續(xù)變量 另一列變量為二分名義變量 例四 對16個學(xué)生的某一學(xué)科進(jìn)行測驗 所得測驗分?jǐn)?shù)如下 并從中探求學(xué)生的這次考試的成績與其預(yù)習(xí)與不預(yù)習(xí)的關(guān)系如何 也就是試估計學(xué)科成績測驗的效標(biāo)關(guān)聯(lián)效度 其中預(yù)習(xí)用1表示 不預(yù)習(xí)用0表示 學(xué)生12345678910111213141516成績97927568749978807064879654869380預(yù)習(xí)1010110101010110 2 區(qū)分法 該方法的思路是 被試接受測驗后 讓他們工作一段時間 再根據(jù)工作成績好壞分成兩組 然后再回過頭來分析這兩組被試原先接受測驗的分?jǐn)?shù)差異 若這兩種人的測驗分?jǐn)?shù)差異顯著 則說明該測驗有較高的效度 作業(yè) 1 用一套高中生成就測驗對某校高二15個學(xué)生施測 其測驗得分如下 并以這些學(xué)生校內(nèi)生物學(xué)科的期末成績?yōu)樾?biāo) 試估計高中生物成就測驗的效標(biāo)關(guān)聯(lián)效度 學(xué)生序號123456789101112131415測驗分?jǐn)?shù)X423850404248394541434636544442校內(nèi)成績Y726685707883698272757782908480 2 小學(xué)五年級12個學(xué)生閱讀理解能力測驗與平時閱讀作業(yè)成績?nèi)缦?試計算閱讀理解能力測驗的效標(biāo)關(guān)聯(lián)效度系數(shù) 學(xué)生序號123456789101112能力測驗323334343637383940414345平時成績86497113513141210 3 對20個學(xué)生進(jìn)行機(jī)械性向測驗 其男 以0表示 女 以1表示 學(xué)生測驗得分如下 試估計機(jī)械性向測驗的效標(biāo)關(guān)聯(lián)效度 學(xué)生1234567891011121314151617181920分?jǐn)?shù)1614141315182210121617191120111816211315男女00111001110110110011 三 提高測量效度的方法 1 影響測量效度的因素測驗的構(gòu)成 要素 測驗實施方面 過程 被試主觀狀態(tài)方面估計效度所依循的效標(biāo)樣本方面 2 提高測量效度的方法 控制系統(tǒng)誤差精心編制測驗量表擴(kuò)充樣本的容量和代表性合理處理效度和信度的關(guān)系妥善組織測驗適當(dāng)增加測驗長度 第三節(jié)教育測量與評價中項目的難度 一 什么是難度 是指試題的難易程度 一道試題 如果大部分被試都能答對 則該題的難度就小 如果大部分被試都不能答對 則該題的難度就大 一個題目的難度大小 除了所測的內(nèi)容本身的難易程度有關(guān)以外 還與測驗的編制技術(shù)和被試的知識經(jīng)驗有關(guān) 由于學(xué)得不清楚或者因被試沒學(xué)過 一個本來容易的題可能變難 這就是說測驗的難度具有相對性 正因為此 必須讓試題通過實踐來對難度作出檢驗 二 難度的計算 一 基本公式1 客觀題難度的計算P R NR為答對該試題人數(shù) N為參加測驗總?cè)藬?shù)例1 在100個學(xué)生中 答對第一題的30人 答對第二題的60人 求第一 二道題的難度 比較這兩道題誰比誰難 2 主觀題難度的計算 例2 某道論述題滿分12分 所有考生在這道題上的平均得分為3 6分 求該題的難度 例3 語文測驗第五題最高得分為12分 這道題考生的平均得分是8 5分 求該題難度 例4 60人參加考試 某題滿分為12分 正確得分累積是480分 求該題難度 二 極端分組法 步驟 將測驗總分進(jìn)行高低排序 由高到低 進(jìn)行高低分組 各取27 并計算某題的得分率求兩組的平均值公式 P PH PL 2PH為高分組答對該題的百分比 PL為低分組答對該題的百分比 例5 某區(qū)域1000人參加考試 試卷第一題高分組180人答對 低分組60人答對 求該題難度 如果該題滿分為10分 高分組得分總數(shù)為2100分 低分組得分總數(shù)為830分 求該題難度 三 難度的分析與控制 1 難度分析進(jìn)行難度分析的主要目的是為了篩選題目 1 測驗題目難度水平的確定測驗題目難度水平的適當(dāng)與否 取決于測驗的目的 性質(zhì)和題目的形成 當(dāng)P值接近于0或接近于1時 即被試在該題上全部答對或全部答錯 則該題無法提供個體的信息 而只當(dāng)P值接近于0 50時 題目才能把被試做最大的程度的區(qū)分 但在實際工作中 若每一題的難度值均為0 50 那么此測驗很可能只能區(qū)分出好與差兩種極端被試的差異 卻不能對各種被試作更精確的區(qū)分 因此 一般各題的難度可在0 50 0 20之間 2 測驗難度對分?jǐn)?shù)分布的影響 測驗的難度直接依賴于組成測驗的題目的難度 通過考察測驗分?jǐn)?shù)的分布 可以對測驗的難度做出直觀檢查 由于多數(shù)人的心理特性多數(shù)呈正態(tài)分布 因此當(dāng)測驗?zāi)康脑谟跍y量個體差異時 若被試樣本具有代表性 則其結(jié)果應(yīng)呈正態(tài)分布 測驗分?jǐn)?shù)背離正態(tài)分布有兩種情況 其一是題目難度普遍較大 被試得分普遍較低 使得低分端出現(xiàn)高峰 呈正偏態(tài) 其二是題目難度普遍較小 被試的得分普遍較高 使得高分端
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 格圍墻安裝方案(3篇)
- 消防執(zhí)勤試點(diǎn)方案(3篇)
- 銷售提點(diǎn)方案(3篇)
- 樓板加固策劃方案(3篇)
- 防治中藥協(xié)定方案(3篇)
- 母嬰教學(xué)護(hù)理課件
- 病生期末考試題及答案
- 易語言做教學(xué)課件
- 心臟腫瘤的核磁共振診斷與綜合評估
- 圖畫文章教學(xué)課件
- 人工智能算法與實踐-第16章 LSTM神經(jīng)網(wǎng)絡(luò)
- 數(shù)學(xué)史簡介課件可編輯全文
- 貴陽出租車駕駛員從業(yè)資格證(區(qū)域)考試總題庫(含答案)
- 金川公司社會招聘試題
- 建設(shè)銀行房產(chǎn)抵押貸款合同
- 福建省初中歷史八年級期末下冊通關(guān)試卷詳細(xì)答案和解析
- 2024CSCO結(jié)直腸癌診療指南解讀
- 項目駐地(營區(qū))風(fēng)險評估報告
- 文化市場營銷學(xué)智慧樹知到期末考試答案章節(jié)答案2024年四川音樂學(xué)院
- MOOC 憲法學(xué)-西南政法大學(xué) 中國大學(xué)慕課答案
- MOOC 犯罪心理學(xué)-中南財經(jīng)政法大學(xué) 中國大學(xué)慕課答案
評論
0/150
提交評論