題目難度淺析_第1頁
題目難度淺析_第2頁
題目難度淺析_第3頁
題目難度淺析_第4頁
題目難度淺析_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、題目難度淺析 余仁勝 題目難度是反映試題特征的一項(xiàng)重要指標(biāo)。題目難度顧名思義就是題目的難易程度,反映題目難易程度的指標(biāo)稱為題目的難度系數(shù),有時(shí)簡稱為題目難度。根據(jù)測量理論的不同,計(jì)算難度系數(shù)的方法也不同,我們所常見的難度系數(shù)主要有題目正確作答率、難度和利用題目反應(yīng)理論估計(jì)的題目難度等。1經(jīng)典測量理論(CTT)的題目難度的概念題目的難易程度是因人而異的。一個(gè)簡單的例子是:1+1=?。對所有小學(xué)以上水平的人來說,作出正確回答是不言而喻的,但對于一個(gè)對數(shù)字還不了解的嬰幼兒來說,就很難。任何一道試題對于本領(lǐng)域的專家來說是易的,而對于外行來說便是難題。這說明題目難易程度是相對的而不是絕對的。

2、經(jīng)典測量理論是通過試題的得分率或答對率作為難度定義的,又稱為題目的正確作答率。在每次考試以后,為了了解考生對試題的作答情況,需要進(jìn)行試題分析,其中一項(xiàng)重要內(nèi)容就是統(tǒng)計(jì)本次考試中每一道題有多少考生做對,有多少考生做錯(cuò),或者說平均得分情況。在這次考試中平均得分高的試題較易,平均得分低的試題較難。為了對各題難易程度進(jìn)行比較,在題目分析中一般就用題目的得分率或題目的答對率作為比較題目難度的依據(jù),這也就是經(jīng)典測量理論中題目難度定義。我們用P+表示題目難度,則P+= ,其中R是考生在該題上的平均得分,N是該題的滿分。0P+1。其難度值的范圍在0-1之間,難度值愈大,表明題目的得分率愈高,試題愈容易,反之,

3、難度值愈小,表明題目的得分率愈低,試題愈難。其優(yōu)點(diǎn)是意義直觀,便于理解,在命題中便于專家控制,在題目分析中,可比較直觀地反映各種類型試題得分情況和題目難易程度。其缺點(diǎn)是題目的難度系數(shù)與考生樣本水平直接相關(guān),考生群體變化、題目的難度系數(shù)變化,難以實(shí)現(xiàn)題目參數(shù)的等值。經(jīng)典測量理論題目難度是主客觀相互作用的結(jié)果。主觀主要體現(xiàn)為考生群體的水平,客觀主要體現(xiàn)在試題考查內(nèi)容的深度、廣度以及問題解決復(fù)雜程度。當(dāng)考生群體水平?jīng)]有發(fā)生變化時(shí),試題間難度值的差異反映試題考查內(nèi)容的深度和廣度的差異或不同;考生群體水平發(fā)生變化時(shí),試題難度值反映考生水平的變化或差異。正因?yàn)槿绱?,試題難度的預(yù)測必須建立在預(yù)測群體水平與實(shí)

4、考群體水平大體一致的前提下,否則,所估計(jì)的題目難度意義不大。 2題目難度與認(rèn)知層次的關(guān)系題目難度和認(rèn)知層次是衡量試題質(zhì)量的兩個(gè)重要指標(biāo)。它們之間既相互區(qū)別又相互聯(lián)系。題目難度是指試題的難易程度,而認(rèn)知層次是在認(rèn)知領(lǐng)域根據(jù)諸多教育(考試)目標(biāo)之間的共同特征或內(nèi)在聯(lián)系把教育(考試)目標(biāo)分類的結(jié)果。由此可知,題目難度和認(rèn)知層次完全是兩個(gè)不同的概念,切不可將它們混為一談。這是二者之間的區(qū)別。它們之間也有聯(lián)系。通常我們采用B·S布魯姆的分類法,把教育(考試)目標(biāo)置于一種有層次的框架之中,在認(rèn)知領(lǐng)域,這些層次按照從簡單到復(fù)雜,由低級到高級的順序排列。其中,后一個(gè)層次比前一個(gè)層次包含更復(fù)雜、更抽象

5、或更高的要求,或者說,前一個(gè)層次是后一個(gè)層次的基礎(chǔ),后一個(gè)層次是在前一個(gè)層次基礎(chǔ)上的提高或發(fā)展,因此,一般情況下,認(rèn)知層次高的試題,其難度也較大,或者難度大的試題,其認(rèn)知層次也較高。這是二者之間的聯(lián)系。但是,難度和認(rèn)知層次畢竟不是同一概念。事實(shí)上,不同認(rèn)知層次的試題,特別是相鄰認(rèn)知層次的試題,其難度是相互交叉的。譬如:屬于領(lǐng)會(huì)類別的大難度試題往往比運(yùn)用(應(yīng)用)類別的小難度試題其難度要大,這在考核不同的知識內(nèi)容的試題中是常見的。綜上所述,在命制試題和組配試卷的過程中,難度和認(rèn)知層次的作用是不可相互替代的,二者缺一不可。 3命題過程中試題難度的控制對于大規(guī)??荚嚩裕热绺呖?、研究生考試等,保持歷

6、年間同一課程的試題難度的穩(wěn)定是非常重要的,能否有效控制試題難度是命題水平的重要標(biāo)志。由于在大規(guī)模考試中不同年份間考生群體水平是相對穩(wěn)定的,此時(shí),經(jīng)典測量理論的題目難度是很有價(jià)值的,因?yàn)橥瑯釉囶}在不同年份考試中統(tǒng)計(jì)的難度值基本一致。我們對研究生數(shù)學(xué)考試的試題進(jìn)行過研究,發(fā)現(xiàn)同一類型的試題在不同年份或同一年份不同試卷中出現(xiàn)時(shí)得分率大致相同,同一試題在不同的試卷中使用得分率基本一致。這說明對于考生水平相對穩(wěn)定的考生群體而言相同試題的得分率也相對穩(wěn)定,這是我們命題活動(dòng)中控制題目難度的理論基礎(chǔ)。 由于大規(guī)模考試試題保密要求很高,一般不通過普通的試測方法估計(jì)題目難度,而是充分利用命題專家組多年命題的經(jīng)驗(yàn)并

7、參照往年題目難度數(shù)據(jù)預(yù)估各題的難度值,并通過控制試卷平均分的辦法,來實(shí)現(xiàn)控制整份試卷的試題難度目標(biāo)。其方法是,首先估計(jì)題目的難度值,然后將每題的題分乘以該題的難度,然后相加即得到該卷的估計(jì)平均分。如果估計(jì)平均分與期望達(dá)到的平均分基本一致,則這份試卷難度水平是合格的。不然的話,則通過修改試題,改變試題難度的方法使試卷的估計(jì)平均分達(dá)到要求。 題目難度的專家估計(jì)方法主要有兩種,一種是若干專家分別估計(jì),用其平均值作為題目難度的估計(jì)值;一種是若干專家在一起共同研究試題,集體估計(jì)題目難度。這兩種方法各有所長,第一種方法,每個(gè)教師可以充分體現(xiàn)自己的思想,估計(jì)難度受權(quán)威人物的影響小。第二種方法,集體思維,大家

8、在一起把各種可能都考慮到,有效地避免了因個(gè)人專業(yè)性向和對考生水平估計(jì)的偏差的影響。在研究生數(shù)學(xué)命題中,這兩種方法,我們都使用,各有所長,但專家集體估計(jì)的精度更高些。 在評估的過程中,專家主要從以下幾個(gè)方面進(jìn)行綜合考慮,一是題目考查的內(nèi)容深度、考核能力的層次、完成題目的復(fù)雜程度;二是同類試題在以往考試中出現(xiàn)的頻次,在教學(xué)過程中學(xué)生掌握熟練程度;三是考生水平的變化因素。 4經(jīng)典測量理論題目難度的等值根據(jù)上述分析,我們知道題目難度是與考生水平有關(guān)的,是難以實(shí)現(xiàn)等值的。為了實(shí)現(xiàn)題目難度的等值,美國ETS的做法是將其轉(zhuǎn)化到DELTA量表(), (又稱為難度)。難度與P+的關(guān)系是:=134-1(P+)中,

9、(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),-1 (x)是其反函數(shù)。難度是將正確答對率難度轉(zhuǎn)化為標(biāo)準(zhǔn)難度。-1 (P+)實(shí)際上是下圖標(biāo)準(zhǔn)正態(tài)曲線下面積P+所對應(yīng)的z值。P+值與難度的對照表如下表所示,從表中可以看出,量表上每下降一個(gè)單位相當(dāng)于正確答對率提高10。難度可以實(shí)現(xiàn)等值,具體方法是從題庫中選取m道試題(其難度分別記為e1,e2,em)和新的試題構(gòu)成新的試卷,經(jīng)測試后,計(jì)算出這m道試題的難度(分別記為1,2,m),由此求出兩者的回歸直線方程:e=a+b。將其它試題的難度帶入此公式中,即可得到這些試題的等值的難度,并放入題庫中。5題目反應(yīng)理論(IRT)中題目難度題目反應(yīng)理論認(rèn)為:能力水平為的考生群體正確作答

10、難度為b,區(qū)分度為a,猜測參數(shù)為c的01記分的選擇題的概率P()可以用邏輯斯蒂Logistic數(shù)學(xué)模型表示,即P()=c+ 。這個(gè)模型稱為三參數(shù)邏輯斯蒂模型,假定c為零時(shí),此模型稱為兩參數(shù)邏輯斯蒂模型;假定c為零,且a為常數(shù)時(shí),稱為單參數(shù)邏輯斯蒂模型,又稱Rasch模型。在題目反應(yīng)理論中核心的參數(shù)有兩個(gè),一個(gè)是能力參數(shù),一個(gè)是題目難度參數(shù)b。題目難度的直觀意義是:答對概率為 (若c=0,則答對概率為 的考生群體的能力,就是該題的難度。根據(jù)數(shù)學(xué)模型的定義,能力參數(shù)和題目難度參數(shù)b定義在同一量表上,且難度參數(shù)與考生樣本無關(guān)。中難度參數(shù)不是通過比率(或概率)定義的,而是通過具有某種要求的考生能力定義

11、的,如果一道題很難,要求答對概率達(dá)到 的考生群體的能力就越高,則題目的難度就越大。題目反應(yīng)理論提出了題目信息量和測驗(yàn)信息量的概念,測驗(yàn)信息量是各題信息量之和,各題的信息量與題目難度有直接的關(guān)系,當(dāng)題目難度與考生能力水平接近時(shí)題目的信息量最大。因此,利用項(xiàng)目反應(yīng)理論的題庫構(gòu)造測驗(yàn)時(shí)選擇難度與考生能力水平相當(dāng)?shù)脑囶}就可以用最少的題量獲得目標(biāo)要求的信息量,這也就是自適應(yīng)考試的理論基礎(chǔ)。項(xiàng)目反應(yīng)理論的難度定義與經(jīng)典測量理論難度定義相比有質(zhì)的飛躍。項(xiàng)目反應(yīng)理論回答了經(jīng)典測量理論一直困惑著人們認(rèn)識的兩個(gè)難題:一是題目難度與考生能力水平之間的關(guān)系;二是測驗(yàn)信息量與各題信息量之間關(guān)系。項(xiàng)目反應(yīng)理論的發(fā)明確實(shí)是教育測量理論的重要革命。事物總有兩重性,盡管我們非常清楚,項(xiàng)目反應(yīng)理論是較經(jīng)典測量理論更為先進(jìn)的理論,但在我國的考試實(shí)踐中,目前經(jīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論