【畢業(yè)學(xué)位論文】(Word原稿)DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第1頁
【畢業(yè)學(xué)位論文】(Word原稿)DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第2頁
【畢業(yè)學(xué)位論文】(Word原稿)DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第3頁
【畢業(yè)學(xué)位論文】(Word原稿)DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第4頁
【畢業(yè)學(xué)位論文】(Word原稿)DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

i RT of RT of n of of 010 of so of in IF RT to IF of on of a IF In IF of on on of IF is on IF is -H RT RT is in In 5% in of of of in is in IF IF 錄 1 文獻(xiàn)綜述 . 錯誤 !未定義書簽。 驗(yàn)效度 . 錯誤 !未定義書簽。 統(tǒng)效度理論以及結(jié)構(gòu)效度 . 錯誤 !未定義書簽。 代的效度理論 . 4 典測量理論與誤差 . 5 代測量理論 . 6 論 . 6 典測量理論與現(xiàn)代測量理論 . 7 驗(yàn)偏差( 法 . 錯誤 !未定義書簽。 目功能差異 . 9 成 影響因素 . 9 論范疇中的 析 . 10 論范疇中的 析 . 13 述 . 14 度分析 . 14 2 研究目的與假設(shè) . 錯誤 !未定義書簽。 3 研究方法 . 18 試與工具 . 18 法 . 19 型假設(shè) . 19 型方法 . 19 法 . 20 型假設(shè) . 20 型方法 . 20 4 結(jié)果與分析 . 22 五個問題的回答 . 錯誤 !未定義書簽。 題一,在 S 維度,是否存在性別的顯著 . 22 題二,在 S 維度,是否存在學(xué)科的顯著 . 24 題三,在 N 維度,是否存在性別的顯著 . 26 題四,在 N 維度,是否存在學(xué)科的顯著 . 27 題五, , S 維度的 量與 N 維度相比是否有顯著差異 . 28 結(jié)與分析 . 錯誤 !未定義書簽。 較 . 29 v 法比較 . 29 究假設(shè)的證明 . 30 5 討論與總結(jié) . 31 論與探索 . 31 試中性別分組 S 維度與 N 維度的 目比例過大 . 31 法與 法探測到的 目數(shù)量差異 . 32 法與 法探測到的 好矛盾 . 32 法上的進(jìn)一步細(xì)化 . 33 究的發(fā)現(xiàn) . 35 維度 和 N 維度上,性別分組間有顯著的 . 35 維度和 N 維度上,學(xué)科分組間沒有顯著的 . 36 法與 法比較, 法更加敏感 . 36 法與 法比較,在 目的分組偏好上有一些矛盾 . 36 維度和 N 維度 索中, 對潛質(zhì)的分層不影響探測結(jié)果 . 37 結(jié) . 37 究不足與未來展望 . 38 附 錄 . 39 附錄 1 性別 目 比 . 39 附錄 2 學(xué)科 目 比 . 42 附錄 3 性別 目 比 . 43 附錄 4 學(xué)科 目 比 . 45 參考文獻(xiàn) . 47 感 謝 . 49 1 by of by 1999; to or by is to be so in is of is an An IF a is a as a IF is It be IF in to in or 值得注意的是, 偏差( 是完全相同的概念。偏差,特別是日常意義上的偏差,指的是一個測驗(yàn)在某些情況下對一個群體不公平。 一個 統(tǒng)計(jì)指標(biāo),指的是同樣潛質(zhì)(比如能力)的不同組中 成員在測試中 的表現(xiàn) 差異。偏差的一個表現(xiàn)是產(chǎn)生了 是探測到 不能說明測驗(yàn)有偏差。 測驗(yàn)在不同的被試組(性別、民族、專業(yè)背景等)間產(chǎn)生顯著差異,其原因并不一 定是由于測驗(yàn)的不公平。很多的外部原因,比如課程接受水平,教育師資差異等,都可能造成測驗(yàn)結(jié)果的差異( 2005)。因此,在解釋組間項(xiàng)目差異 (時候,需要格外注意。判斷一個測驗(yàn)項(xiàng)目的公平性,需要綜合考慮測驗(yàn)中內(nèi)部外部的各種影響情況以加以判斷,不能僅靠一個大的 ,就認(rèn)為項(xiàng)目不公平( 2 本研究討論的是一個高賭注測驗(yàn) “ 簡稱,由美國心理學(xué)家 兒)和 親)根據(jù)榮格的心理類型學(xué)理 論設(shè)計(jì)編制而成,正式形成和發(fā)行于 1976 年,也稱母 目前世界上近 20 年來應(yīng)用最廣泛的測驗(yàn)之一,它主要用于考察人在組織中的貢獻(xiàn)、領(lǐng)導(dǎo)風(fēng)格、偏好的工作環(huán)境、潛在的缺陷等個體特征與潛力,以及組織中人與人之間的溝通、團(tuán)隊(duì)組建等。因此在應(yīng)聘與招聘的過程中, 驗(yàn)被廣泛應(yīng)用。由于 測試結(jié)果對應(yīng)聘者有很大的影響,因此它也是一個高賭注測試。 在本研究中,作者就 S 維度(感覺型)與 N 維度(直覺型)針對男 /女分組以及文科 /理工科分組兩個不同的分組組合進(jìn)行 析,以提供 度的證據(jù)。 本 章節(jié)共分為六個部分。分別是 1) 測驗(yàn)效度; 2) 經(jīng)典測量理論與誤差; 3) 現(xiàn)代測量理論; 4) 偏差與 ) 項(xiàng)目功能差異( ,以及 6) 述。 文章的文獻(xiàn)綜述部分將先從效度的討論入手。因?yàn)?偏差是效度的差異 , 充分了解效度的定義是進(jìn)行偏差分析的基礎(chǔ) ,而對偏差有了充分的了解,就能對 差的一種表現(xiàn)有明確的認(rèn)識 。在回顧了效度的定義以及其發(fā)展后,作者從經(jīng)典測量理論和現(xiàn)代測量理論的理論框架中總結(jié)對測量誤差和偏差的理解。在第四部分,作者比較偏差與 概念,并且在第五部 分提供在不同理論架構(gòu)中對 分析方法。最后, 將簡單的敘述 測量結(jié)構(gòu)、測量特點(diǎn)以及其各個維度的理解分析。 驗(yàn)的效度是測驗(yàn)非常重要的指標(biāo)。沒有一個良好的效度,測驗(yàn)得到的分?jǐn)?shù)是無法解釋的、可能引起誤解的。這種情況下測驗(yàn)也失去了意義。 正是因?yàn)樾Ф鹊闹匾裕?在過去的幾十年中, 心理測量學(xué)家不斷地對效度的理論和操作進(jìn)行探索。隨著理論和技術(shù)的進(jìn)步,對測驗(yàn)效度的認(rèn)識 也 逐漸發(fā)生了變化。下面從主要測量偏差的角度對效度進(jìn)行解釋 3 驗(yàn)的效度是測驗(yàn)價(jià)值的核心。一個測驗(yàn)沒有良好的效度,那么 對這個測驗(yàn)結(jié)果的解釋就是沒有意義的。對測驗(yàn)效度的定義、測量以及改進(jìn)是設(shè)計(jì)以及修訂測驗(yàn)的重要步驟。只有有了明確的效度指標(biāo),一個測驗(yàn)的結(jié)果才能被正確的解釋和預(yù)測,并在一定范圍內(nèi)推廣。 近年來在心理測量領(lǐng)域?qū)πФ鹊母拍詈徒忉層泻芏嘈碌乃伎?。這些思考很多來自于對于傳統(tǒng)效度概念的延伸,以及對測驗(yàn)的本質(zhì)和過程的認(rèn)知。在傳統(tǒng)的效度概念中,關(guān)于效度的概念主要集中在下面幾點(diǎn)上( 1999): 是否測驗(yàn)所得到的是 希望 測量的東西 信度是效度的充分條件,但不是必要條件 效度是測驗(yàn)的是否恰當(dāng)?shù)墓ぞ咝灾笜?biāo) 效度是一種統(tǒng)計(jì)方 法學(xué)的工具,有固定的標(biāo)準(zhǔn) 根據(jù)標(biāo)準(zhǔn),一個測驗(yàn)可以被認(rèn)為是有效的,或是無效的,以及 有不同的效度指標(biāo)。主要分為三種,如下: 內(nèi)容效度:測驗(yàn)的內(nèi)容與相關(guān)內(nèi)容或行為的取樣的適當(dāng)性。主要根據(jù)專家的經(jīng)驗(yàn)判斷測驗(yàn)內(nèi)容是否有效; 實(shí)證效度:一個測驗(yàn)對處于特定情境中的個體的行為進(jìn)行預(yù)測時的有效性,分為同時效度和預(yù)測效度,分別是根據(jù)測驗(yàn)與現(xiàn)在或可預(yù)測的效標(biāo)相關(guān)來判斷測驗(yàn)效度; 結(jié)構(gòu)效度:綜合來說,結(jié)構(gòu)效度是各種測驗(yàn)有效的證據(jù)的集合,它主要證實(shí)的是測驗(yàn)對某一理論概念或某一特制特量的程度。結(jié)構(gòu)效度可以用多種方法進(jìn)行分析。比如,相 容效度,聚合與區(qū)分效度,因素效度等。 根據(jù)各種不同效度的操作定義,在實(shí)際操作中,可以選擇恰當(dāng)?shù)男Ф戎笜?biāo),對測驗(yàn)進(jìn)行分析。經(jīng)過大量的研究, 1989)在分析了大量的文獻(xiàn)后,對效度進(jìn)行了總結(jié),提出了以下的問題, 是否有統(tǒng)一的效度指標(biāo); 對效度的分析應(yīng)該細(xì)致到每一次測驗(yàn)的分析; 效度分析中的證據(jù)都包括是什么,以及; 效度與測試的價(jià)值是怎樣的關(guān)系。 作為對這幾個問題的回答, 結(jié)到,由于內(nèi)容效度和實(shí)證效度在效度分析中表現(xiàn)出來的冗雜和分析效果不理想(見 203 頁, P. R. 著),心理測量學(xué)家愈發(fā)傾向于下面的理解 : 結(jié)構(gòu)效度作為整個效度定義的框架; 作為結(jié)構(gòu)效度的證據(jù),其他的效度,包括內(nèi)容效度和實(shí)證效度,都包含在框架中; 4 結(jié)構(gòu)效度必須根植于測試的條件以及環(huán)境。對于被試的自然條件,測試的目的等都需要考慮在結(jié)構(gòu)效度的范疇之內(nèi) 對于結(jié)構(gòu)效度的證據(jù),包括邏輯與實(shí)踐證據(jù)、聚合與區(qū)分證據(jù);應(yīng)該綜合各種各樣的證據(jù)已進(jìn)行分析,以避免似是而非的答案。 其中,偏差作為對于結(jié)構(gòu)效度的邏輯與內(nèi)部分析的證據(jù),在一個測驗(yàn)的效度分析中具有重要的作用。 經(jīng)過長期的研究和探索,以及不斷的思考,心理測量學(xué)家逐漸發(fā)展了傳統(tǒng)的效度定義,這就是現(xiàn)代效度理論。 代的效度理論 首先要說明 的是,現(xiàn)代的效度并不是對傳統(tǒng)效度理論的顛覆。相反的,現(xiàn)代效度理論是傳統(tǒng)效度理論的延伸?,F(xiàn)代理論對效度的定義,是在傳統(tǒng)效度理論的框架中所形成 并完善 的。 對應(yīng)傳統(tǒng)效度理論中總結(jié)的幾條,現(xiàn)代效度理論有如下的特點(diǎn)( 1999): 結(jié)構(gòu)效度是效度最核心的概念。在體現(xiàn)測驗(yàn)的效度的時候必須體現(xiàn)結(jié)構(gòu)效度; 對于信度與效度的關(guān)系有了爭論。越來越多的心理測量學(xué)家認(rèn)為信度與效度的關(guān)系不再是充分 不必要條件。相反的,很多心理測量學(xué)家認(rèn)為效度相對于信度是一個更加寬泛的概念。 2005)認(rèn)為,如果把一個測驗(yàn)比作地球的話,信度是地殼,效度就像是大氣層,覆蓋所有的東西。 1999)的觀點(diǎn)是,一個好的信度是恰當(dāng)解釋測試的重要條件,但并不必要; 效度不再是測驗(yàn)恰當(dāng)性的指標(biāo);而是解釋測驗(yàn)結(jié)果的工具; 效度是一個連續(xù)性的概念,不再是全或無; 效度不再是統(tǒng)計(jì)方法學(xué)的工具,而是對測驗(yàn)的詳細(xì)理論和方法的支持; 測試的設(shè)計(jì)和施測過程是效度過程的核心; 所有的不同的效度都進(jìn)入結(jié)構(gòu)效度的框架中,內(nèi)容 效度和實(shí)證效度構(gòu)成結(jié)構(gòu)效度的證據(jù)。在展示測試的效度的時候,只需要展示結(jié)構(gòu)效度的證據(jù)。 在現(xiàn)代的效度理論中,效度作為對測驗(yàn)的解釋受到了相當(dāng)?shù)闹匾?。另外效度的情景性也被重點(diǎn)提出。展示一個測驗(yàn)的效度的時候,更加偏重施測對象的自然屬性,以及組間的差異性。作為組間項(xiàng)目 表現(xiàn) 差 異 的指標(biāo), 成為結(jié)構(gòu)效度的重要指標(biāo),是效度分析中的重要依據(jù)。 5 典測量理論與誤差 經(jīng)典測量理論( 關(guān)注的是真分?jǐn)?shù)和測量誤差。在超過150 年的研究中,經(jīng)典測量理論憑借其自身理論的穩(wěn)固性, 即使在計(jì)算技術(shù)高度發(fā)展、現(xiàn)代測量理論輩出的今天,仍然在測量領(lǐng)域有著強(qiáng)大的生命力( 2005)。在經(jīng)典測量理論中,真分?jǐn)?shù)是觀測值與隨機(jī)誤差的差項(xiàng)( 2002)。但是隨機(jī)誤差是無法測量到的。因此各種心理測量學(xué)的技術(shù)以及關(guān)注點(diǎn)就是減少隨機(jī)誤差的影響;另外,即使采用了各種選擇被試、以及統(tǒng)計(jì)方面的技術(shù),隨機(jī)誤差也不能全部消除,只能在最大限度上減少隨機(jī)誤差對觀測值的影響( 2005)。一般對誤差的理解是對測驗(yàn)結(jié)果產(chǎn)生影響的,與測量潛質(zhì)無關(guān)的維度( 2005)。 對于測量誤差,有多種方式對其進(jìn)行分類和分析。 1978)把誤差的來源分為五類: 1)時間的影響; 2)測驗(yàn)內(nèi)容影響; 3)評分影響; 4)被試狀態(tài),以及 5)被試本身。 2005)從人因?qū)W的觀點(diǎn)總結(jié)了測驗(yàn)中的誤差,主要從人類自身信息分析是容易產(chǎn)生的錯誤來解釋誤差的成因。它們主要是 1)不穩(wěn)定精神狀態(tài)引起的非正常反應(yīng),比如生病、生理周期等; 2)對測驗(yàn)中題目的錯誤理解。 根據(jù) 1994),測驗(yàn)誤差是觀測值與真分?jǐn)?shù)之間的差異;測驗(yàn)誤差可以分為兩類:隨機(jī)誤差和系統(tǒng)誤差。兩者的差別在于系統(tǒng)誤差對所有的被試產(chǎn)生同方向的影響,而隨機(jī)誤差產(chǎn)生的影響不同向。因此,隨機(jī)誤差是個人的反應(yīng),而系統(tǒng)誤差 是 分組的反應(yīng);隨機(jī)誤差是個人的真分?jǐn)?shù)與觀測值的偏 差,而系統(tǒng)誤差則更多的暗示了分組的特性對所測量的特質(zhì)的影響( 2005)。一般認(rèn)為,隨機(jī)誤差更加常見,并且相對于系統(tǒng)誤差來說,隨機(jī)誤差不會引起世俗以及法律上的糾紛( 1994, 2005)。 由于經(jīng)典測 量理論的 局限,對于隨機(jī)誤差 來說,經(jīng)典測量理論的分析不可能得到每一個個體的誤差值;相反的,經(jīng)典測量理論默認(rèn)每個被試有著相同的隨機(jī)誤差,并這種 假設(shè)下使用 各種 技術(shù)和方法把隨機(jī)誤差控制到最小 ; 另一個局限就是很難確定系統(tǒng)誤差。對于系統(tǒng)誤差的分析也就顯得更加的模糊 和 似是而非。需要注意的是項(xiàng)目表現(xiàn)差異,包括 映項(xiàng)目表現(xiàn)跨時間穩(wěn)定性的指標(biāo)),只是系統(tǒng)誤差的一個可能性,發(fā)生系統(tǒng)誤差并不一定表現(xiàn)在項(xiàng)目表現(xiàn)差異上。另外由于“偏差”的概念所引起的誤解, 2005)建議在描述 組間的差異的時候,更多使用“項(xiàng)目表現(xiàn)差異”,而避免使用“偏差”,以避免糾紛。另外他強(qiáng)調(diào)( 2005),項(xiàng)目表現(xiàn)差異更多體現(xiàn)的是統(tǒng)計(jì)得到的結(jié)果,是否產(chǎn)生真正意義上的偏差,還需要更多理論實(shí)踐的分析。 綜上所述,系統(tǒng)誤差是偏差存在的原因之一。 1994)一書中對偏差的概念作了如下定義:“偏差是針對某個特定分組中的被試的系統(tǒng)誤差或錯誤效度?!绷硪环矫妫捎?分析系統(tǒng)誤差是沒有強(qiáng)有力的理論支持,因此在經(jīng)典測量理論的框架中分析 時候,多采用近似估計(jì)的方法,缺乏相對的理論 6 支持。 代測量理論 論 項(xiàng)目反應(yīng)理論( 注的是心理測量中被測潛質(zhì)( 被試的應(yīng)激表現(xiàn)( 2005)。相對 說, 先進(jìn)之處在于它采用了復(fù)雜的統(tǒng)計(jì)技術(shù),以及在對 數(shù)據(jù)的解釋 的時候更加的精細(xì)和有力 。 1991)認(rèn)為, 的 特性 有幾點(diǎn) 。首先,被試的潛質(zhì)可以預(yù)測其在考試項(xiàng)目中的表現(xiàn);其次,被試 的潛質(zhì)以及其項(xiàng)目表現(xiàn)的關(guān)系可以通過項(xiàng)目特征曲線( 來模擬。最后, 法雖然更多的基于 心理測量統(tǒng)計(jì)學(xué),但它是一個理論的框架 ,而不單純是一個統(tǒng)計(jì)的過程 ( 2005) 。 根據(jù) 2005)的描述,“項(xiàng)目反應(yīng)理論并不是拋棄了經(jīng)典測量理論 去 對心理測驗(yàn)做一個新的理解,也不能取代經(jīng)典測量理論。事實(shí)上,對經(jīng)典測量理論的精確 把握 是理解 項(xiàng)目反應(yīng)理論的基礎(chǔ)。項(xiàng)目反應(yīng)理論基于經(jīng)典測量理論,在項(xiàng)目反應(yīng)理論中,很多觀點(diǎn)直接繼承于經(jīng)典測量理論。項(xiàng)目 反應(yīng)理論是在經(jīng)典測量理論的基礎(chǔ)上加強(qiáng)了統(tǒng)計(jì)的效力,更多地強(qiáng)調(diào)認(rèn)知科學(xué)在心理測量中的作用,并且通過一系列的數(shù)學(xué)統(tǒng)計(jì)方法 使測量理論更加 完善?!?在項(xiàng)目反應(yīng) 理論 模型中( 人, 1991),被試特性與項(xiàng)目特性可以分離開來。判斷被試的潛質(zhì) 時可以不受特定測試的影響; 在較難測試中的低分表現(xiàn),和較易測試中的高分表現(xiàn) 都 不影響對被試特性(潛質(zhì))的判斷。相對的,對于測試的特性(比如難度),也不會因?yàn)椴煌谋辉嚱M而變化。無論是高能組的高分表現(xiàn)和低能組的低分表現(xiàn), 都不能影響對測驗(yàn) 特性的分析。這樣就解決了經(jīng)典測量理論中 被試特性與測試特性循環(huán)論證的弊端。 在經(jīng)典測量理論中,根據(jù)被試的反應(yīng)來確定考試的難度,反過來,又根據(jù)考試的難度來鑒別被試的能力。 根據(jù)項(xiàng)目反應(yīng)理論 的這些特點(diǎn),項(xiàng)目表現(xiàn)差異很容易被確定。例如比較直觀的方法,對比不同組的項(xiàng)目特征曲線,當(dāng)不同組的項(xiàng)目特征曲線顯著的不同,說明在相同的潛質(zhì)下,不同組的表現(xiàn)不同,有 此相對經(jīng)典測量理論, 論對于項(xiàng)目功能差異( 探測有明確的理論基礎(chǔ),也更加準(zhǔn)確。 項(xiàng)目反應(yīng)理論的模型有三類,分別是 1P( 型, 只考慮 b 參數(shù),也就是項(xiàng)目難度參數(shù)的分析模型 ; 2P 模型,分別考慮 b(項(xiàng)目難度)參數(shù),以及 a(區(qū)分度)參數(shù); 3P 模型納入的是 型的全部三個參數(shù), a(區(qū)分度), b(項(xiàng)目難度),以及 c(猜 7 測指數(shù))。在這三類模型中, 1P 模型的使用最廣泛。在 析中,也只采用 1P 模型進(jìn)行分析。 典測量理論與現(xiàn)代測量理論 經(jīng)典測量理論與現(xiàn)代測量理論相比,哪一種理論框架更好。很多人討論過這個問題。 1994) 對比了經(jīng)典測量理論與現(xiàn)代測量理論(潛質(zhì)理論、概化理論),并研究了大量案例之后,認(rèn)為很難比較這兩種理論的優(yōu)劣。 2005)認(rèn)為,雖然經(jīng)典測量理論在百年來都少有變化,證明了其良好的適用性及生命力,但是仍有下面兩點(diǎn)理由來推廣和研究現(xiàn)代測量理論:主要的原因來自于現(xiàn)代測量理論可以有區(qū)別的分析誤差;另一個理由就是在現(xiàn)代測量理論中,被試特質(zhì)與測驗(yàn)特制不再互相牽制,難以區(qū)分。經(jīng)典測量理論雖然在誤差分析等方面有諸多劣勢,但是相對于復(fù)雜的需要借助現(xiàn)代計(jì)算工具來完成的現(xiàn)代測量理論,它具有 理論基礎(chǔ)深厚, 理解簡單,便于計(jì)算和推廣的特點(diǎn)。 在 分析中,經(jīng)典測量理論和現(xiàn)代測量理論都提供了相當(dāng)?shù)姆椒ê屠碚搧磉M(jìn)行析。在下一部分,將主 要介紹 概念以及其分析方法。 么是測量誤差( 心理測量學(xué)家從系統(tǒng)誤差和效度的等不同的角度給了定義。 1994)認(rèn)為偏差是“針對特定被試組中成員的效度不良或系統(tǒng)偏差”。根據(jù) 1989)的定義,偏差( 對定義明確的相關(guān)分組中被試分?jǐn)?shù)解釋的效度 不良 。因此 總結(jié)到 ,偏差不是針對單獨(dú)的被試,而發(fā)生在某一個被試組中。當(dāng)某一個特定分組的成員,他們的在測試,或 某一個測試項(xiàng)目上的得分與其他分組的成員的得分有顯著差異,而這個差異并不是由所測驗(yàn)的特質(zhì)的差異所引起的,那么就可以認(rèn)為在測驗(yàn)或者測驗(yàn)項(xiàng)目中產(chǎn)生了偏差。這種情況說明在測驗(yàn)或者項(xiàng)目中,所測試的不單是希望測驗(yàn)的特質(zhì),還有其他的維度影響了測驗(yàn)的成績。一個比較簡單的例子是,選取漢族和少數(shù)民族的小學(xué)生進(jìn)行數(shù)學(xué)測驗(yàn),以測試他們的數(shù)學(xué)能力。但是如果最后的測驗(yàn)結(jié)果表明少數(shù)民族學(xué)生的測試成績顯著低于漢族學(xué)生,并不一定能說明他們的數(shù)學(xué)水平低于漢族學(xué)生。有一個可能性是他們在閱讀漢語的數(shù)學(xué)題目的時候產(chǎn)生了困難,從而影響了測試的成績。因 此對漢語的熟悉程度成為影響他們數(shù)學(xué)測驗(yàn)成績的重要因素。對于這個數(shù)學(xué)測驗(yàn)來說,它是有偏差的。 偏差產(chǎn)生的原因可能是外部的,比如施測環(huán)境不同,指導(dǎo)語差異;也可能是內(nèi)部的,比如測驗(yàn)的效度方面的問題 ( 1989) 。另外偏差可能針對整套測驗(yàn)(測驗(yàn)偏差),也可能只出現(xiàn)在測驗(yàn)的幾個項(xiàng)目中( 比如 因此在解釋偏差的時候,應(yīng)該非常謹(jǐn)慎,綜合考慮可能產(chǎn)生偏差的各種原因。僅憑用復(fù)雜統(tǒng)計(jì)工具所得到的 值來說明問題, 8 必然會產(chǎn)生這樣或者那樣的誤解或誤導(dǎo)。 20 世紀(jì) 60 年代早期,隨著婦女運(yùn)動以及民權(quán) 運(yùn)動的興起,考試的公平性研究日益引起心理以及測量學(xué)家的重視 (1993)。在這些研究中,研究者逐步把視野集中在測試的內(nèi)部差異,以及針對項(xiàng)目的測試差異上。隨著這一類研究的日益增多, 術(shù)日益成熟,并逐步擴(kuò)大影響,以至直接或間接的影響了美國教育以及雇員結(jié)構(gòu)的格局 (1989)。而在中國,考試項(xiàng)目差異也受到了越來越多的關(guān)注。漢語職業(yè)資格考試( 試就在其設(shè)計(jì)以及施測和解釋的過程中結(jié)合應(yīng)用 理論和方法,以確保對考試成績的公平性。 分類主要有兩種。規(guī)則( 情況下,在同等潛質(zhì)條件,某一份組的項(xiàng)目得分始終顯著高于另一分組,見圖 片來源, 1999)。而在非規(guī)則( 況下,同等潛質(zhì)條件,某一分組在低分區(qū)的項(xiàng)目得分高于另一分組,而在高分區(qū)的項(xiàng)目得分低于另一分組,見圖 圖片來源, 1999)。 圖 同潛質(zhì)下,藍(lán)線組的項(xiàng)目得分始終高于紅線組 9 圖 分區(qū)藍(lán)線組的分高于紅線組,而在 高分區(qū)相反 對 分析,經(jīng)典測試?yán)碚摲较蛑饕捎玫氖呛唵闻判蚍ㄒ约?法。這兩種方法由于計(jì)算簡單,計(jì)算結(jié)果相對穩(wěn)定而在早期廣泛應(yīng)用。直到今天, 法仍然是醫(yī)學(xué)領(lǐng)域比較研究時最常采用的方法。而隨著計(jì)算機(jī)技術(shù)的發(fā)展,近年來 法也逐漸受到了重視。這些方法計(jì)算復(fù)雜,但是它可以處理五分量表、七分量表等排序數(shù)據(jù),因此成功地把 析從單純的成就測驗(yàn)領(lǐng)域引進(jìn)到了人格測驗(yàn)的領(lǐng)域( 1999)。而在現(xiàn)代測量理論的領(lǐng)域,主要采用的是 法分析 目功能差異 項(xiàng)目功能差異 ( 是比較 一個測驗(yàn)中 同質(zhì)(相同潛質(zhì))組間對項(xiàng)目的表現(xiàn)的差異的方法。 通過 析 來辨別偏差 不但包括了統(tǒng)計(jì)方法 的計(jì)算,也包括一系列的專家分析。因?yàn)?偏差的證據(jù)不但包括實(shí)踐與理論的證據(jù),也包括專家的專業(yè)判斷。在 分析中,法與 法的本質(zhì)是相同的,都是比較不同組別(如性別、種族)的被試在項(xiàng)目中的反應(yīng) (回答正確率) 差異。 當(dāng)這些相對的子分組的成員在項(xiàng)目上的表現(xiàn)出現(xiàn)不相等的情況,表明存在 果這個組間表現(xiàn)的差異不是測驗(yàn)設(shè)計(jì)所探知的,說明這 個項(xiàng)目融入了其他的變量維度。當(dāng)然也有一種可能性是這個差異所表現(xiàn)的正是測驗(yàn)所測量的目的?;氐?前面 的漢族小學(xué)生和少數(shù)民族小學(xué)生的測驗(yàn)。如果在數(shù)學(xué)測驗(yàn)上的差異是由語言方面的理解障礙造成的,說明有項(xiàng)目差異的存在;如果這是一個語文測驗(yàn),那么這個測驗(yàn)很好的表明了漢族小學(xué)生和少數(shù)民族小學(xué)生在語言方面的差別,否認(rèn)項(xiàng)目差異的存在。 成 影響因素 造成 影響因素主要來源于下面幾點(diǎn):語義因素、環(huán)境以及身體條件因素、文化因素和語言因素( 2005)。 語義因素 :諸多研究證實(shí),文字與其表述意義之間的聯(lián)系的 差異,是產(chǎn)生 原因之一( 1992; 1988)。在他們 的研究中, 針對白種人與西班牙人的 在 10 驗(yàn)中的反應(yīng)。研究表明 ,同字不同義,以及類似的字不同義的情況在兩種相近的語言中會很大的困擾被試。 環(huán)境以及身體條件因素 :有研究表明,環(huán)境因素也會對被試的表現(xiàn)產(chǎn)生影響( 1971; 1975)。 例如 1992)在對比了夏威夷群島的被試和美國本土的被試表現(xiàn)后發(fā)現(xiàn),他們對樹、以及下雪的理解有很大的出入,這種差異 即使 是在高信息量的社會, 有書報(bào)、電視、互聯(lián)網(wǎng) 等 媒體的介入 后 也沒有發(fā)生變化 ,差異依然存在 。 文化因素 :盡管文化因素的影響一直被認(rèn)為是產(chǎn)生 重要因素,但是很多研究表明,文化差異并不一定會產(chǎn)生 2005, 第 66 頁)。這些研究表明,某些測驗(yàn)只會在某些 的 文化差異下產(chǎn)生 這個結(jié)論既沒有推廣到所有的測驗(yàn),也沒有產(chǎn)生在所有的文化 差異 中。可能的解釋是大部分的測驗(yàn)類型比較相似(比如,大部分采用多選題),因此對各種文化下的被試都是熟悉的( 2005)。 語言因素 :語言因素產(chǎn)生 要是因?yàn)樵诖蟛糠值恼Z言中 ,書面表達(dá)語言與口語表達(dá)語言都有一部分差異。而對于一個 使用 非母語 測試 的被試來說,這種差異難以把握,因此會發(fā)生語言理解不明,或者表述不清的情況( 1992)。 除了以上幾個方面之外,造成 影響因素還可能來自于其他方面,比如題目順序,難度分布等( 1987),都有可能對一些被試組產(chǎn)生 影響。 論范疇中的 析 在經(jīng)典測量理論的框架中,確定 方法主要有下面的幾種: 1) 法; 2)項(xiàng)目難度轉(zhuǎn)換法; 3)相關(guān)表格方法; 4) 法。除了這幾種方法之外,也有 其他方法 進(jìn)行 分析 。 1) 法 法的原理時,進(jìn)行 析 時 ,兩組(或多組)同時進(jìn)行測驗(yàn),對測量結(jié)果中的 各個 項(xiàng)目做 析,特別關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論