中學(xué)多重成就測驗的設(shè)計與實施_第1頁
中學(xué)多重成就測驗的設(shè)計與實施_第2頁
中學(xué)多重成就測驗的設(shè)計與實施_第3頁
中學(xué)多重成就測驗的設(shè)計與實施_第4頁
中學(xué)多重成就測驗的設(shè)計與實施_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

中學(xué)多重成就測驗的設(shè)計與實施

成就是指通過學(xué)習(xí)和培訓(xùn)獲得的知識和技能。成就測驗對經(jīng)過學(xué)習(xí)和訓(xùn)練后所獲得的知識和技能進行測驗,以認(rèn)定學(xué)習(xí)和訓(xùn)練的成效。它有明確的、相對限定的范圍。通常用于測量受試者對某項學(xué)科或某組學(xué)科經(jīng)過學(xué)習(xí)和訓(xùn)練所獲得的知識和技能。成就測驗通常分為教育成就測驗和診斷性成就測驗,分別適用于教育情景下和對學(xué)習(xí)成就有關(guān)問題的臨床診斷中。我國近些年來在發(fā)展心理方面,關(guān)于Cattell和Horn所提出的流體—晶體智力理論在實際當(dāng)中的研究較多。研究認(rèn)為,在人的一生中,總的發(fā)展趨勢是:隨著年齡的增長,流體智力越來越少,作用也越來越小;而晶體智力則逐漸變大,所起作用也越來越大。晶體智力主要代表需要經(jīng)過教育培養(yǎng)而獲得的能力,其受文化、教育和環(huán)境的影響較大。在學(xué)校情景下的晶體智力的增長和變化情況,可通過標(biāo)準(zhǔn)化的成就測驗以及其他形式的成就測驗而獲得,但還需可適用于不同年齡段的成就測驗以研究人們晶體智力的變化情況。增齡(aging)問題是近些年來相關(guān)學(xué)科研究的熱點問題。人類壽命的不斷延長和出生率下降,使世界各國的人口結(jié)構(gòu)逐漸老化。人口老化帶來了養(yǎng)老、看護等一系列社會福利問題,同時也使老年病的發(fā)病率增加。如老年性癡呆的發(fā)病率在60~69歲為1‰左右,70~79歲為5~16‰,80~90歲為10~20‰。老年性癡呆的心理障礙主要是認(rèn)知功能受損,早期以記憶障礙最為明顯,并且從近記憶發(fā)展到遠(yuǎn)記憶。近記憶由于與現(xiàn)在的日常生活緊密相連,有無障礙易于發(fā)現(xiàn);而遠(yuǎn)記憶真實與否很難核實,其鑒定、測量都較難,尤其是采用自傳法,需要完整和清晰的證明材料,所以研究遠(yuǎn)不如近記憶的進展迅速。成就測驗則可以以易于核對的學(xué)科知識為材料,測量老年人的記憶變化情況。其它神經(jīng)心理測驗在臨床上使用的頻率很高,而神經(jīng)心理測驗通常還要結(jié)合記憶、智力和成就測驗。而我國還沒有合適的可結(jié)合的成就測驗。隨著科技的發(fā)展,社會的進步,社會對人才的需要越來越緊迫,這就要通過成就測驗來測定、評估、選拔人才;同時,個人也需要通過成就測驗來表現(xiàn)自己知識和技能的程度,以求不同層次、級別以及各種專門學(xué)校的培養(yǎng)和社會各個不同部門的接納。教育的研究和發(fā)展最先增長了測驗的指導(dǎo)價值,也正如Haney(1985)所說,“使測驗更富教育性”。國外的教育成就測驗在整個測驗領(lǐng)域中一直占有很重要的地位。在測驗的標(biāo)準(zhǔn)化方面,教育成就測驗也是做得最好的一種測驗。而使用頻率上,在英國,成就測驗是所有測驗中應(yīng)用最為廣泛的測驗。據(jù)估計,公立學(xué)校的每個學(xué)生每年平均要進行2.5個測驗,其中主要是成就測驗。我國自20世紀(jì)七十年代末期開始的高考,是國家主辦的、每年都要投入大量的人、財、物力的一項規(guī)模巨大、政策性、技術(shù)性都很強的國家考試,為高校選拔幾十萬新生,也屬于一種教育成就測驗。但是,在一般學(xué)校里一直使用的是教師自編測驗。教師自編測驗雖然有其優(yōu)點,但絕大部分教師未受過教育心理方面的專業(yè)訓(xùn)練,不懂測驗學(xué)的理論和技術(shù),所編測驗的質(zhì)量不能令人滿意,且多為單科測驗。也就是說學(xué)校教育中,也無真正標(biāo)準(zhǔn)化的成就測驗,無論是綜合還是單科的都缺乏。由于上述發(fā)展心理、臨床應(yīng)用、人才選拔以及教育方面的需要,而目前國內(nèi)未見此類合適的測驗,所以我們設(shè)計并編制了本測驗。目的是測量晶體智力(能力)在不同年齡、不同教育水平的發(fā)展?fàn)顩r;在臨床上,用于診斷智力損害的狀況;人事上,用于人才的選拔;教育上,可用于學(xué)科成績的估計。本測驗的編制策略是根據(jù)教材,但又不完全拘泥于教材,而是根據(jù)編制測驗的目的,以國家統(tǒng)編中學(xué)教材做效標(biāo)(國家標(biāo)準(zhǔn)的效標(biāo))與(中學(xué)專科教師和我們的)經(jīng)驗相結(jié)合的策略。本研究是用MATs預(yù)試本在山西省太原市和太原市附近城市的一個有代表性的樣本(1448人)中所做的進一步測試,本文是這一工作的初步總結(jié)。1方法1.1量表的配置1.1.1多重成就測驗根據(jù)測驗編制的目的,確定測驗的性質(zhì)為多學(xué)科、多年級適用的成就測驗,即多重成就測驗。全量表分為五大部分,也就是五個分量表:語文、化學(xué)、物理、歷史和數(shù)學(xué)。1.1.2分布式任務(wù)2包括確定條目形式和條目編制二方面:(1)條目的形式:根據(jù)測驗的內(nèi)容和團體測驗的要求,在題型方面主要采用是非題、選擇題(分單項選擇和多項選擇)和填空題等幾種便于紙筆測驗的題型。語文內(nèi)容豐富,形式多樣,在MATs中,也努力反映語文的特點:還采取了注音填空,句中改錯別字,斷句加標(biāo)點等形式。(2)條目的收集:首先,請有關(guān)課程的具有豐富經(jīng)驗和十分熟悉不同時期教材內(nèi)容變化的中學(xué)專科老師,按照編者的要求,根據(jù)中學(xué)的教材內(nèi)容和經(jīng)驗收集條目。其中,語文根據(jù)中學(xué)教師收集的條目,做出條目范圍的確定和題型設(shè)計的參考,我們還增加了現(xiàn)代文章和雜志中的常用詞語、知識和閱讀材料。歷史的內(nèi)容主要根據(jù)中國通史和初、高中歷史教材,盡量編制能反映重大歷史事件和重要文史資料的內(nèi)容。1.1.3化學(xué)、化學(xué)、環(huán)保、文化通過以上的工作,基本確定了測驗的內(nèi)容和結(jié)構(gòu)?,F(xiàn)將各分量表、分測驗所測內(nèi)容簡要介紹如下:(1)語文分量表,包括五個分測驗:(1)名人名著、名句出處和詞語解釋。(2)漢語拼音注音。(3)改錯別字。(4)閱讀理解。(5)斷句和加標(biāo)點。(2)化學(xué)分量表,包括四個分測驗:(1)基本概念和理論:a.物質(zhì)的組成和表示;b.周期表和周期律;c.物質(zhì)的分類;d.物質(zhì)的變化和表示;e.物質(zhì)的化學(xué)量;f.關(guān)于溶液、膠體和電離理論;g.化學(xué)反應(yīng)速度及化學(xué)平衡。(2)常見元素及重要的化合物:a.非金屬元素及單質(zhì);b.金屬元素及單質(zhì);c.氧化物;d.氫化物;e.酸;f.堿;g.鹽。(3)有機化學(xué):a.有機化學(xué)的基本概念;b.重要的有機物。(4)化學(xué)實驗:a.物質(zhì)的制備;b.物質(zhì)的檢驗。(3)物理分量表,包括五個分測驗:(1)力學(xué):a.運動學(xué);b.靜力學(xué);c.運動定律;d.沖量和動量;e.功和能;f.萬有引力;g.機械振動和機械波(包括聲學(xué))。(2)熱學(xué):a.分子運動論基礎(chǔ);b.熱和功;c.氣體的性質(zhì);d.固體和液體的性質(zhì);f.物態(tài)變化。(3)電學(xué):a.靜電場;b.穩(wěn)恒電流;c.交流電。(4)光學(xué):a.幾何光學(xué);b.光的本質(zhì)。(5)原子和原子核:a.原子;b.原子核。(4)歷史分量表,包括兩個分測驗:(1)中國歷史部分:a.中國重大歷史事件;b.重要文史資料。(2)世界歷史部分a.世界重大歷史事件;b.重要文史資。(5)數(shù)學(xué)分量表,包括兩個分測驗:(1)代數(shù):a.數(shù);b.代數(shù)式;c.方程和方程組;d.不等式;e.集合和函數(shù);f.三角函數(shù);g.數(shù)列和數(shù)學(xué)歸納法;h.排列、組合、二項式定理。(2)幾何:a.平面幾何;b.立體幾何;c.平面解析幾何。語文、歷史和數(shù)學(xué)分量表用于初一至大一年級,物理分量表用于初二以上年級,化學(xué)分量表用于初三以上年級。1.1.4第一次預(yù)測驗算經(jīng)以上工作,將所有符合要求的題目集成一個整套題本。根據(jù)條目內(nèi)容,兼顧其形式又分成甲、乙兩套,在山西省太原市附近的陽泉市的兩所中學(xué)進行了第一次預(yù)測驗。甲乙兩套隨機抽取各100名學(xué)生的答卷進行了難度計算。根據(jù)計算結(jié)果,將題目按難度進行排列,刪除少部分形式欠佳的題目,并確定了分量表時限。1.2測量樣本2結(jié)果2.1各學(xué)期的原始分類各年級的原始分見表1。結(jié)果表明,各年級的各分量表分、學(xué)科分和總分都隨年級的升高而升高。2.2項目分析2.2.1按分測驗平均難度計算在這里是以通過率來表示難度。通過率是每一條目回答正確的比率。即難度(P)等于正確回答人數(shù)(R)除以作答總?cè)藬?shù)(N),P=/。用公式:P=X/Xmax,X代表被試在某一條目上的平均得分,Xmax為該項目的滿分。先計算出每一條目的難度,再計算其分測驗和分量表的平均難度。按分測驗平均難度計算的結(jié)果見表2。表2表明,絕大多數(shù)分測驗的平均難度值都在.20~.80之間。只有乙套物理分量表中的原子和原子核分測驗的難度過大以外,甲乙共36個分測驗中,35個符合測驗學(xué)的要求。2.2.2區(qū)分度測定區(qū)分度是指測驗條目的區(qū)分能力。即某一條目在總測驗中得高分的受試者通過此條目的人數(shù)比率也高;相反,總測驗得分低的人中,通過此條目的人數(shù)比例也很低,這便說明此條目的區(qū)分度高,區(qū)分度指數(shù)用d表示。計算d的方法因答題方法而不同。我們用計算測驗各個條目與該測驗總分相關(guān)的方法計算了各條目的區(qū)分度。同時又仿照Ebel(1972)提出的試題區(qū)分度指數(shù)的評價標(biāo)準(zhǔn),將區(qū)分度d<.20的條目數(shù)也列于表2中。表2表明,所有分測驗的區(qū)分度都在.20以上,但甲套的化學(xué)較乙套的稍低,而歷史和數(shù)學(xué)又較高。3討論3.1對傳統(tǒng)測驗理論和方法的考察成就測驗的內(nèi)容要能代表學(xué)科的主要內(nèi)容,同時也要結(jié)合測驗的目的和實施方法而定。本測驗的目的是用中學(xué)主要課程的知識、以團體測驗的方法測量中學(xué)生對課程知識的記憶和成人晶體能力的發(fā)展趨勢。因此將量表內(nèi)容確定為:語文、歷史、化學(xué)、物理和數(shù)學(xué),條目則是這些學(xué)科內(nèi)的重要知識點。條目的收集主要依據(jù)國家統(tǒng)編中學(xué)教材,以及資深中學(xué)教師和我們的經(jīng)驗;測驗條目的形式是根據(jù)團體測驗的要求確定的。我們的測驗有別于一般教育成就測驗,不是完全根據(jù)教學(xué)大綱測量學(xué)生對教材內(nèi)容的掌握情況的,因而我們的條目與一般成就測驗條目所考察的學(xué)科內(nèi)容是有差異的。如語文,中學(xué)教學(xué)要求學(xué)生通過語文學(xué)習(xí),掌握語文基礎(chǔ)知識和養(yǎng)成作文能力,而作文能力的養(yǎng)成,有知識記憶的作用,但更重要的是一種思維、想象甚至是創(chuàng)造的過程,并且無法用團體測驗的形式進行測量,因而我們的量表中無此內(nèi)容;中外歷史的內(nèi)容浩如煙海,十分豐富,但測驗時間有限,學(xué)生學(xué)習(xí)歷史的時間也較短(高二理科班就已不學(xué)歷史),所學(xué)的歷史知識也不系統(tǒng),所以只能測驗一般認(rèn)為是重大的歷史事件、重要的文化史料等;數(shù)學(xué)當(dāng)中有大量的計算和作圖等,我們只選擇了其中主要的定義、定理、公式以及用來證明這些定義、定理和公式的簡單計算條目;理、化當(dāng)中更有許多操作方面的內(nèi)容,如化學(xué)中的有機化學(xué)實驗、化學(xué)儀器,物理中的磁場、電磁感應(yīng)等,我們的測驗都未涉及。另外,在條目多少的分布上,也考慮到比例問題,如化學(xué)中的基本概念和理論、常見元素和重要化合物的條目較多,而有機化學(xué)和化學(xué)實驗較少,物理中的力學(xué)和電學(xué)較多,原子和原子核部分卻很少,這一方面是基于各部分在教材中所占比例;另一方面則是根據(jù)我們的測驗?zāi)康暮头椒紤]的。將測驗分為甲乙套,在施測過程中,可避免舞弊和相互干擾。甲乙套從總體上講,測量的是同一種心理品質(zhì),條目數(shù)相同,形式相同,內(nèi)容相近。此次測驗則是在同時、同地、同校和同班當(dāng)中進行的,所以甲乙套可作為相互的替代本,為以后的追蹤研究服務(wù)。3.2條目的區(qū)分度難度通常以難度P值的大小來衡量。P值越大,難度越小:P值越小,則難度越大。理論上認(rèn)為,項目難度指數(shù)值以0.50為宜,難度分布以窄一點為好,各題難度不要小于0.20和大于0.80。本測驗的難度計算結(jié)果,分測驗的平均難度除了乙套的原子物理分測驗難度稍大以外(0.13),其它分測驗的難度值都在0.20~0.80之間,基本符合以上要求。在整個測驗的難度上,難的條目隨著年齡的增長而后移,前面較易的條目對低年級學(xué)生有鑒別意義,但對高年級學(xué)生來說,卻通過率很高;相反地,后面難的條目對高年級學(xué)生較適合而對低年級學(xué)生無意義。在每一個階段里,都體現(xiàn)出通過率隨年級增長而提高的趨勢,但后一階段的起始不一定比前一階段結(jié)束時的通過率更高,換句話說,高一的通過率不一定比初三的高,大一的通過率不一定比高二的通過率高,這一點甲套比乙套表現(xiàn)得明確。原因可能是現(xiàn)行教育對于不同年級的學(xué)生重視程度不同;也可能是因為地方教育政策中將學(xué)生過早分成文理科班,對不同學(xué)科學(xué)生的不同科目重視程度不同(如高二文科班不學(xué)物理和化學(xué),理科班不學(xué)歷史和地理)而造成的。測驗條目不僅要有好的難度指數(shù),還要有好的區(qū)分度指數(shù)。具有良好區(qū)分度的條目,能將不同水平的被試區(qū)分開來,所以測驗專家們把條目的區(qū)分度稱為測驗是否具有效度的“指示器”,并作為評價條目質(zhì)量,篩選條目的主要指標(biāo)和依據(jù)。區(qū)分度的計算方法因測驗的計分方法不同而有異。根據(jù)本測驗的條目計分方法,我們采取相關(guān)法計算了條目的區(qū)分度。Ebel認(rèn)為,區(qū)分度指數(shù)d在0.20以上的條目即達到可接受水平,0.30~0.39為良好,修改后會更好,0.40以上為很好;而Aken則認(rèn)為區(qū)分度指數(shù)在0.30以上的條目較為理想,但對偏離平均難度較大的條目,稍低于0.30也可接受。本測驗的各分測驗區(qū)分度指數(shù)均在0.20以上,基本符合要求。在甲乙套化學(xué)分量表的有機化學(xué)、化學(xué)實驗,物理分量表中的熱學(xué)、光學(xué)和甲套物理中的電學(xué)等分測驗區(qū)分度指數(shù)在0.30以下,在甲乙套總和的36個分測驗中,有9個,占總數(shù)的25%。余下的28個分測驗,占75%,達到了很好的水平。3.3試驗的可靠性和效率1.1.5測量量和信效度是測定測試的一個重要方法之一,對于難點第二試測題本是在第一次預(yù)測的基礎(chǔ)上修改重排而成的。兩套測題各包括5個分量表18個分測驗265道(乙套263道)測題。在山西省的太原市和太原市附近的忻州市,采用分層按比例整群抽樣的方法,即按照學(xué)校為一類(重點中學(xué))、二類(普通中學(xué))、三類(較差中學(xué)),根據(jù)其所在類別抽出一定比例的班級;還注意學(xué)生的家庭背景和父母的受教育程度以及家庭經(jīng)濟狀況等因素要具有一定的代表性等原則,在兩市共抽取8所中學(xué)21個班,其中一類和三類各兩所,二類四所。剔除無效問卷后,余有效問卷1196份,其中甲套610份,乙套586份;還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論