【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)

上傳人：O*** IP屬地：四川上傳時(shí)間：2016-07-04 格式：DOC 頁數(shù)：54 大小：3.94MB 積分：24 舉報(bào) 版權(quán)申訴

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第2頁

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第3頁

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第4頁

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)_第5頁

已閱讀5頁，還剩49頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

i RT of RT of n of of 010 of so of in IF RT to IF of on of a IF In IF of on on of IF is on IF is -H RT RT is in In 5% in of of of in is in IF IF 錄 1 文獻(xiàn)綜述 . 錯(cuò)誤 !未定義書簽。驗(yàn)效度 . 錯(cuò)誤 !未定義書簽。統(tǒng)效度理論以及結(jié)構(gòu)效度 . 錯(cuò)誤 !未定義書簽。代的效度理論 . 4 典測量理論與誤差 . 5 代測量理論 . 6 論 . 6 典測量理論與現(xiàn)代測量理論 . 7 驗(yàn)偏差（法 . 錯(cuò)誤 !未定義書簽。目功能差異 . 9 成影響因素 . 9 論范疇中的析 . 10 論范疇中的析 . 13 述 . 14 度分析 . 14 2 研究目的與假設(shè) . 錯(cuò)誤 !未定義書簽。 3 研究方法 . 18 試與工具 . 18 法 . 19 型假設(shè) . 19 型方法 . 19 法 . 20 型假設(shè) . 20 型方法 . 20 4 結(jié)果與分析 . 22 五個(gè)問題的回答 . 錯(cuò)誤 !未定義書簽。題一，在 S 維度，是否存在性別的顯著 . 22 題二，在 S 維度，是否存在學(xué)科的顯著 . 24 題三，在 N 維度，是否存在性別的顯著 . 26 題四，在 N 維度，是否存在學(xué)科的顯著 . 27 題五，， S 維度的量與 N 維度相比是否有顯著差異 . 28 結(jié)與分析 . 錯(cuò)誤 !未定義書簽。較 . 29 v 法比較 . 29 究假設(shè)的證明 . 30 5 討論與總結(jié) . 31 論與探索 . 31 試中性別分組 S 維度與 N 維度的目比例過大 . 31 法與法探測到的目數(shù)量差異 . 32 法與法探測到的好矛盾 . 32 法上的進(jìn)一步細(xì)化 . 33 究的發(fā)現(xiàn) . 35 維度和 N 維度上，性別分組間有顯著的 . 35 維度和 N 維度上，學(xué)科分組間沒有顯著的 . 36 法與法比較，法更加敏感 . 36 法與法比較，在目的分組偏好上有一些矛盾 . 36 維度和 N 維度索中，對(duì)潛質(zhì)的分層不影響探測結(jié)果 . 37 結(jié) . 37 究不足與未來展望 . 38 附錄 . 39 附錄 1 性別目比 . 39 附錄 2 學(xué)科目比 . 42 附錄 3 性別目比 . 43 附錄 4 學(xué)科目比 . 45 參考文獻(xiàn) . 47 感謝 . 49 1 by of by 1999; to or by is to be so in is of is an An IF a is a as a IF is It be IF in to in or 值得注意的是，偏差（是完全相同的概念。偏差，特別是日常意義上的偏差，指的是一個(gè)測驗(yàn)在某些情況下對(duì)一個(gè)群體不公平。一個(gè) 統(tǒng)計(jì)指標(biāo)，指的是同樣潛質(zhì)（比如能力）的不同組中成員在測試中的表現(xiàn) 差異。偏差的一個(gè)表現(xiàn)是產(chǎn)生了是探測到不能說明測驗(yàn)有偏差。測驗(yàn)在不同的被試組（性別、民族、專業(yè)背景等）間產(chǎn)生顯著差異，其原因并不一定是由于測驗(yàn)的不公平。很多的外部原因，比如課程接受水平，教育師資差異等，都可能造成測驗(yàn)結(jié)果的差異（ 2005）。因此，在解釋組間項(xiàng)目差異 (時(shí)候，需要格外注意。判斷一個(gè)測驗(yàn)項(xiàng)目的公平性，需要綜合考慮測驗(yàn)中內(nèi)部外部的各種影響情況以加以判斷，不能僅靠一個(gè)大的，就認(rèn)為項(xiàng)目不公平( 2 本研究討論的是一個(gè)高賭注測驗(yàn) “ 簡稱，由美國心理學(xué)家兒）和親）根據(jù)榮格的心理類型學(xué)理論設(shè)計(jì)編制而成，正式形成和發(fā)行于 1976 年，也稱母目前世界上近 20 年來應(yīng)用最廣泛的測驗(yàn)之一，它主要用于考察人在組織中的貢獻(xiàn)、領(lǐng)導(dǎo)風(fēng)格、偏好的工作環(huán)境、潛在的缺陷等個(gè)體特征與潛力，以及組織中人與人之間的溝通、團(tuán)隊(duì)組建等。因此在應(yīng)聘與招聘的過程中，驗(yàn)被廣泛應(yīng)用。由于測試結(jié)果對(duì)應(yīng)聘者有很大的影響，因此它也是一個(gè)高賭注測試。在本研究中，作者就 S 維度（感覺型）與 N 維度（直覺型）針對(duì)男 /女分組以及文科 /理工科分組兩個(gè)不同的分組組合進(jìn)行析，以提供度的證據(jù)。本章節(jié)共分為六個(gè)部分。分別是 1）測驗(yàn)效度； 2）經(jīng)典測量理論與誤差； 3）現(xiàn)代測量理論； 4）偏差與）項(xiàng)目功能差異（，以及 6）述。文章的文獻(xiàn)綜述部分將先從效度的討論入手。因?yàn)?偏差是效度的差異，充分了解效度的定義是進(jìn)行偏差分析的基礎(chǔ) ，而對(duì)偏差有了充分的了解，就能對(duì) 差的一種表現(xiàn)有明確的認(rèn)識(shí) 。在回顧了效度的定義以及其發(fā)展后，作者從經(jīng)典測量理論和現(xiàn)代測量理論的理論框架中總結(jié)對(duì)測量誤差和偏差的理解。在第四部分，作者比較偏差與概念，并且在第五部分提供在不同理論架構(gòu)中對(duì) 分析方法。最后，將簡單的敘述測量結(jié)構(gòu)、測量特點(diǎn)以及其各個(gè)維度的理解分析。驗(yàn)的效度是測驗(yàn)非常重要的指標(biāo)。沒有一個(gè)良好的效度，測驗(yàn)得到的分?jǐn)?shù)是無法解釋的、可能引起誤解的。這種情況下測驗(yàn)也失去了意義。正是因?yàn)樾Ф鹊闹匾裕?在過去的幾十年中，心理測量學(xué)家不斷地對(duì)效度的理論和操作進(jìn)行探索。隨著理論和技術(shù)的進(jìn)步，對(duì)測驗(yàn)效度的認(rèn)識(shí) 也逐漸發(fā)生了變化。下面從主要測量偏差的角度對(duì)效度進(jìn)行解釋 3 驗(yàn)的效度是測驗(yàn)價(jià)值的核心。一個(gè)測驗(yàn)沒有良好的效度，那么對(duì)這個(gè)測驗(yàn)結(jié)果的解釋就是沒有意義的。對(duì)測驗(yàn)效度的定義、測量以及改進(jìn)是設(shè)計(jì)以及修訂測驗(yàn)的重要步驟。只有有了明確的效度指標(biāo)，一個(gè)測驗(yàn)的結(jié)果才能被正確的解釋和預(yù)測，并在一定范圍內(nèi)推廣。近年來在心理測量領(lǐng)域?qū)πФ鹊母拍詈徒忉層泻芏嘈碌乃伎?。這些思考很多來自于對(duì)于傳統(tǒng)效度概念的延伸，以及對(duì)測驗(yàn)的本質(zhì)和過程的認(rèn)知。在傳統(tǒng)的效度概念中，關(guān)于效度的概念主要集中在下面幾點(diǎn)上（ 1999）：是否測驗(yàn)所得到的是希望測量的東西信度是效度的充分條件，但不是必要條件效度是測驗(yàn)的是否恰當(dāng)?shù)墓ぞ咝灾笜?biāo) 效度是一種統(tǒng)計(jì)方法學(xué)的工具，有固定的標(biāo)準(zhǔn) 根據(jù)標(biāo)準(zhǔn)，一個(gè)測驗(yàn)可以被認(rèn)為是有效的，或是無效的，以及有不同的效度指標(biāo)。主要分為三種，如下：內(nèi)容效度：測驗(yàn)的內(nèi)容與相關(guān)內(nèi)容或行為的取樣的適當(dāng)性。主要根據(jù)專家的經(jīng)驗(yàn)判斷測驗(yàn)內(nèi)容是否有效；實(shí)證效度：一個(gè)測驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行預(yù)測時(shí)的有效性，分為同時(shí)效度和預(yù)測效度，分別是根據(jù)測驗(yàn)與現(xiàn)在或可預(yù)測的效標(biāo)相關(guān)來判斷測驗(yàn)效度；結(jié)構(gòu)效度：綜合來說，結(jié)構(gòu)效度是各種測驗(yàn)有效的證據(jù)的集合，它主要證實(shí)的是測驗(yàn)對(duì)某一理論概念或某一特制特量的程度。結(jié)構(gòu)效度可以用多種方法進(jìn)行分析。比如，相容效度，聚合與區(qū)分效度，因素效度等。根據(jù)各種不同效度的操作定義，在實(shí)際操作中，可以選擇恰當(dāng)?shù)男Ф戎笜?biāo)，對(duì)測驗(yàn)進(jìn)行分析。經(jīng)過大量的研究， 1989）在分析了大量的文獻(xiàn)后，對(duì)效度進(jìn)行了總結(jié)，提出了以下的問題，是否有統(tǒng)一的效度指標(biāo)；對(duì)效度的分析應(yīng)該細(xì)致到每一次測驗(yàn)的分析；效度分析中的證據(jù)都包括是什么，以及；效度與測試的價(jià)值是怎樣的關(guān)系。作為對(duì)這幾個(gè)問題的回答，結(jié)到，由于內(nèi)容效度和實(shí)證效度在效度分析中表現(xiàn)出來的冗雜和分析效果不理想（見 203 頁， P. R. 著），心理測量學(xué)家愈發(fā)傾向于下面的理解：結(jié)構(gòu)效度作為整個(gè)效度定義的框架；作為結(jié)構(gòu)效度的證據(jù)，其他的效度，包括內(nèi)容效度和實(shí)證效度，都包含在框架中； 4 結(jié)構(gòu)效度必須根植于測試的條件以及環(huán)境。對(duì)于被試的自然條件，測試的目的等都需要考慮在結(jié)構(gòu)效度的范疇之內(nèi) 對(duì)于結(jié)構(gòu)效度的證據(jù)，包括邏輯與實(shí)踐證據(jù)、聚合與區(qū)分證據(jù)；應(yīng)該綜合各種各樣的證據(jù)已進(jìn)行分析，以避免似是而非的答案。其中，偏差作為對(duì)于結(jié)構(gòu)效度的邏輯與內(nèi)部分析的證據(jù)，在一個(gè)測驗(yàn)的效度分析中具有重要的作用。經(jīng)過長期的研究和探索，以及不斷的思考，心理測量學(xué)家逐漸發(fā)展了傳統(tǒng)的效度定義，這就是現(xiàn)代效度理論。代的效度理論首先要說明的是，現(xiàn)代的效度并不是對(duì)傳統(tǒng)效度理論的顛覆。相反的，現(xiàn)代效度理論是傳統(tǒng)效度理論的延伸?，F(xiàn)代理論對(duì)效度的定義，是在傳統(tǒng)效度理論的框架中所形成并完善的。對(duì)應(yīng)傳統(tǒng)效度理論中總結(jié)的幾條，現(xiàn)代效度理論有如下的特點(diǎn)（ 1999）：結(jié)構(gòu)效度是效度最核心的概念。在體現(xiàn)測驗(yàn)的效度的時(shí)候必須體現(xiàn)結(jié)構(gòu)效度；對(duì)于信度與效度的關(guān)系有了爭論。越來越多的心理測量學(xué)家認(rèn)為信度與效度的關(guān)系不再是充分不必要條件。相反的，很多心理測量學(xué)家認(rèn)為效度相對(duì)于信度是一個(gè)更加寬泛的概念。 2005）認(rèn)為，如果把一個(gè)測驗(yàn)比作地球的話，信度是地殼，效度就像是大氣層，覆蓋所有的東西。 1999）的觀點(diǎn)是，一個(gè)好的信度是恰當(dāng)解釋測試的重要條件，但并不必要；效度不再是測驗(yàn)恰當(dāng)性的指標(biāo)；而是解釋測驗(yàn)結(jié)果的工具；效度是一個(gè)連續(xù)性的概念，不再是全或無；效度不再是統(tǒng)計(jì)方法學(xué)的工具，而是對(duì)測驗(yàn)的詳細(xì)理論和方法的支持；測試的設(shè)計(jì)和施測過程是效度過程的核心；所有的不同的效度都進(jìn)入結(jié)構(gòu)效度的框架中，內(nèi)容效度和實(shí)證效度構(gòu)成結(jié)構(gòu)效度的證據(jù)。在展示測試的效度的時(shí)候，只需要展示結(jié)構(gòu)效度的證據(jù)。在現(xiàn)代的效度理論中，效度作為對(duì)測驗(yàn)的解釋受到了相當(dāng)?shù)闹匾?。另外效度的情景性也被重點(diǎn)提出。展示一個(gè)測驗(yàn)的效度的時(shí)候，更加偏重施測對(duì)象的自然屬性，以及組間的差異性。作為組間項(xiàng)目表現(xiàn) 差異的指標(biāo)，成為結(jié)構(gòu)效度的重要指標(biāo)，是效度分析中的重要依據(jù)。 5 典測量理論與誤差經(jīng)典測量理論（關(guān)注的是真分?jǐn)?shù)和測量誤差。在超過150 年的研究中，經(jīng)典測量理論憑借其自身理論的穩(wěn)固性，即使在計(jì)算技術(shù)高度發(fā)展、現(xiàn)代測量理論輩出的今天，仍然在測量領(lǐng)域有著強(qiáng)大的生命力（ 2005）。在經(jīng)典測量理論中，真分?jǐn)?shù)是觀測值與隨機(jī)誤差的差項(xiàng)（ 2002）。但是隨機(jī)誤差是無法測量到的。因此各種心理測量學(xué)的技術(shù)以及關(guān)注點(diǎn)就是減少隨機(jī)誤差的影響；另外，即使采用了各種選擇被試、以及統(tǒng)計(jì)方面的技術(shù)，隨機(jī)誤差也不能全部消除，只能在最大限度上減少隨機(jī)誤差對(duì)觀測值的影響（ 2005）。一般對(duì)誤差的理解是對(duì)測驗(yàn)結(jié)果產(chǎn)生影響的，與測量潛質(zhì)無關(guān)的維度（ 2005）。對(duì)于測量誤差，有多種方式對(duì)其進(jìn)行分類和分析。 1978）把誤差的來源分為五類： 1）時(shí)間的影響； 2）測驗(yàn)內(nèi)容影響； 3）評(píng)分影響； 4）被試狀態(tài)，以及 5）被試本身。 2005）從人因?qū)W的觀點(diǎn)總結(jié)了測驗(yàn)中的誤差，主要從人類自身信息分析是容易產(chǎn)生的錯(cuò)誤來解釋誤差的成因。它們主要是 1）不穩(wěn)定精神狀態(tài)引起的非正常反應(yīng)，比如生病、生理周期等； 2）對(duì)測驗(yàn)中題目的錯(cuò)誤理解。根據(jù) 1994)，測驗(yàn)誤差是觀測值與真分?jǐn)?shù)之間的差異；測驗(yàn)誤差可以分為兩類：隨機(jī)誤差和系統(tǒng)誤差。兩者的差別在于系統(tǒng)誤差對(duì)所有的被試產(chǎn)生同方向的影響，而隨機(jī)誤差產(chǎn)生的影響不同向。因此，隨機(jī)誤差是個(gè)人的反應(yīng)，而系統(tǒng)誤差是分組的反應(yīng)；隨機(jī)誤差是個(gè)人的真分?jǐn)?shù)與觀測值的偏差，而系統(tǒng)誤差則更多的暗示了分組的特性對(duì)所測量的特質(zhì)的影響（ 2005）。一般認(rèn)為，隨機(jī)誤差更加常見，并且相對(duì)于系統(tǒng)誤差來說，隨機(jī)誤差不會(huì)引起世俗以及法律上的糾紛（ 1994, 2005）。由于經(jīng)典測量理論的局限，對(duì)于隨機(jī)誤差來說，經(jīng)典測量理論的分析不可能得到每一個(gè)個(gè)體的誤差值；相反的，經(jīng)典測量理論默認(rèn)每個(gè)被試有著相同的隨機(jī)誤差，并這種假設(shè)下使用各種技術(shù)和方法把隨機(jī)誤差控制到最小；另一個(gè)局限就是很難確定系統(tǒng)誤差。對(duì)于系統(tǒng)誤差的分析也就顯得更加的模糊和似是而非。需要注意的是項(xiàng)目表現(xiàn)差異，包括映項(xiàng)目表現(xiàn)跨時(shí)間穩(wěn)定性的指標(biāo)），只是系統(tǒng)誤差的一個(gè)可能性，發(fā)生系統(tǒng)誤差并不一定表現(xiàn)在項(xiàng)目表現(xiàn)差異上。另外由于“偏差”的概念所引起的誤解， 2005）建議在描述組間的差異的時(shí)候，更多使用“項(xiàng)目表現(xiàn)差異”，而避免使用“偏差”，以避免糾紛。另外他強(qiáng)調(diào)（ 2005），項(xiàng)目表現(xiàn)差異更多體現(xiàn)的是統(tǒng)計(jì)得到的結(jié)果，是否產(chǎn)生真正意義上的偏差，還需要更多理論實(shí)踐的分析。綜上所述，系統(tǒng)誤差是偏差存在的原因之一。 1994）一書中對(duì)偏差的概念作了如下定義：“偏差是針對(duì)某個(gè)特定分組中的被試的系統(tǒng)誤差或錯(cuò)誤效度。”另一方面，由于分析系統(tǒng)誤差是沒有強(qiáng)有力的理論支持，因此在經(jīng)典測量理論的框架中分析時(shí)候，多采用近似估計(jì)的方法，缺乏相對(duì)的理論 6 支持。代測量理論論項(xiàng)目反應(yīng)理論（注的是心理測量中被測潛質(zhì)（被試的應(yīng)激表現(xiàn)（ 2005）。相對(duì) 說，先進(jìn)之處在于它采用了復(fù)雜的統(tǒng)計(jì)技術(shù)，以及在對(duì) 數(shù)據(jù)的解釋的時(shí)候更加的精細(xì)和有力。 1991）認(rèn)為，的特性有幾點(diǎn) 。首先，被試的潛質(zhì)可以預(yù)測其在考試項(xiàng)目中的表現(xiàn)；其次，被試的潛質(zhì)以及其項(xiàng)目表現(xiàn)的關(guān)系可以通過項(xiàng)目特征曲線（來模擬。最后，法雖然更多的基于心理測量統(tǒng)計(jì)學(xué)，但它是一個(gè)理論的框架，而不單純是一個(gè)統(tǒng)計(jì)的過程（ 2005）。根據(jù) 2005）的描述，“項(xiàng)目反應(yīng)理論并不是拋棄了經(jīng)典測量理論去對(duì)心理測驗(yàn)做一個(gè)新的理解，也不能取代經(jīng)典測量理論。事實(shí)上，對(duì)經(jīng)典測量理論的精確把握是理解項(xiàng)目反應(yīng)理論的基礎(chǔ)。項(xiàng)目反應(yīng)理論基于經(jīng)典測量理論，在項(xiàng)目反應(yīng)理論中，很多觀點(diǎn)直接繼承于經(jīng)典測量理論。項(xiàng)目反應(yīng)理論是在經(jīng)典測量理論的基礎(chǔ)上加強(qiáng)了統(tǒng)計(jì)的效力，更多地強(qiáng)調(diào)認(rèn)知科學(xué)在心理測量中的作用，并且通過一系列的數(shù)學(xué)統(tǒng)計(jì)方法使測量理論更加完善?！?在項(xiàng)目反應(yīng) 理論模型中（人， 1991），被試特性與項(xiàng)目特性可以分離開來。判斷被試的潛質(zhì) 時(shí)可以不受特定測試的影響；在較難測試中的低分表現(xiàn)，和較易測試中的高分表現(xiàn) 都不影響對(duì)被試特性（潛質(zhì)）的判斷。相對(duì)的，對(duì)于測試的特性（比如難度），也不會(huì)因?yàn)椴煌谋辉嚱M而變化。無論是高能組的高分表現(xiàn)和低能組的低分表現(xiàn)，都不能影響對(duì)測驗(yàn) 特性的分析。這樣就解決了經(jīng)典測量理論中被試特性與測試特性循環(huán)論證的弊端。在經(jīng)典測量理論中，根據(jù)被試的反應(yīng)來確定考試的難度，反過來，又根據(jù)考試的難度來鑒別被試的能力。根據(jù)項(xiàng)目反應(yīng)理論的這些特點(diǎn)，項(xiàng)目表現(xiàn)差異很容易被確定。例如比較直觀的方法，對(duì)比不同組的項(xiàng)目特征曲線，當(dāng)不同組的項(xiàng)目特征曲線顯著的不同，說明在相同的潛質(zhì)下，不同組的表現(xiàn)不同，有此相對(duì)經(jīng)典測量理論，論對(duì)于項(xiàng)目功能差異（探測有明確的理論基礎(chǔ)，也更加準(zhǔn)確。項(xiàng)目反應(yīng)理論的模型有三類，分別是 1P（型，只考慮 b 參數(shù)，也就是項(xiàng)目難度參數(shù)的分析模型； 2P 模型，分別考慮 b（項(xiàng)目難度）參數(shù)，以及 a（區(qū)分度）參數(shù)； 3P 模型納入的是型的全部三個(gè)參數(shù)， a（區(qū)分度）， b（項(xiàng)目難度），以及 c（猜 7 測指數(shù)）。在這三類模型中， 1P 模型的使用最廣泛。在析中，也只采用 1P 模型進(jìn)行分析。典測量理論與現(xiàn)代測量理論經(jīng)典測量理論與現(xiàn)代測量理論相比，哪一種理論框架更好。很多人討論過這個(gè)問題。 1994）對(duì)比了經(jīng)典測量理論與現(xiàn)代測量理論（潛質(zhì)理論、概化理論），并研究了大量案例之后，認(rèn)為很難比較這兩種理論的優(yōu)劣。 2005）認(rèn)為，雖然經(jīng)典測量理論在百年來都少有變化，證明了其良好的適用性及生命力，但是仍有下面兩點(diǎn)理由來推廣和研究現(xiàn)代測量理論：主要的原因來自于現(xiàn)代測量理論可以有區(qū)別的分析誤差；另一個(gè)理由就是在現(xiàn)代測量理論中，被試特質(zhì)與測驗(yàn)特制不再互相牽制，難以區(qū)分。經(jīng)典測量理論雖然在誤差分析等方面有諸多劣勢，但是相對(duì)于復(fù)雜的需要借助現(xiàn)代計(jì)算工具來完成的現(xiàn)代測量理論，它具有理論基礎(chǔ)深厚，理解簡單，便于計(jì)算和推廣的特點(diǎn)。在分析中，經(jīng)典測量理論和現(xiàn)代測量理論都提供了相當(dāng)?shù)姆椒ê屠碚搧磉M(jìn)行析。在下一部分，將主要介紹概念以及其分析方法。么是測量誤差（心理測量學(xué)家從系統(tǒng)誤差和效度的等不同的角度給了定義。 1994）認(rèn)為偏差是“針對(duì)特定被試組中成員的效度不良或系統(tǒng)偏差”。根據(jù) 1989）的定義，偏差（對(duì)定義明確的相關(guān)分組中被試分?jǐn)?shù)解釋的效度不良。因此總結(jié)到，偏差不是針對(duì)單獨(dú)的被試，而發(fā)生在某一個(gè)被試組中。當(dāng)某一個(gè)特定分組的成員，他們的在測試，或某一個(gè)測試項(xiàng)目上的得分與其他分組的成員的得分有顯著差異，而這個(gè)差異并不是由所測驗(yàn)的特質(zhì)的差異所引起的，那么就可以認(rèn)為在測驗(yàn)或者測驗(yàn)項(xiàng)目中產(chǎn)生了偏差。這種情況說明在測驗(yàn)或者項(xiàng)目中，所測試的不單是希望測驗(yàn)的特質(zhì)，還有其他的維度影響了測驗(yàn)的成績。一個(gè)比較簡單的例子是，選取漢族和少數(shù)民族的小學(xué)生進(jìn)行數(shù)學(xué)測驗(yàn)，以測試他們的數(shù)學(xué)能力。但是如果最后的測驗(yàn)結(jié)果表明少數(shù)民族學(xué)生的測試成績顯著低于漢族學(xué)生，并不一定能說明他們的數(shù)學(xué)水平低于漢族學(xué)生。有一個(gè)可能性是他們在閱讀漢語的數(shù)學(xué)題目的時(shí)候產(chǎn)生了困難，從而影響了測試的成績。因此對(duì)漢語的熟悉程度成為影響他們數(shù)學(xué)測驗(yàn)成績的重要因素。對(duì)于這個(gè)數(shù)學(xué)測驗(yàn)來說，它是有偏差的。偏差產(chǎn)生的原因可能是外部的，比如施測環(huán)境不同，指導(dǎo)語差異；也可能是內(nèi)部的，比如測驗(yàn)的效度方面的問題（ 1989）。另外偏差可能針對(duì)整套測驗(yàn)（測驗(yàn)偏差），也可能只出現(xiàn)在測驗(yàn)的幾個(gè)項(xiàng)目中（比如因此在解釋偏差的時(shí)候，應(yīng)該非常謹(jǐn)慎，綜合考慮可能產(chǎn)生偏差的各種原因。僅憑用復(fù)雜統(tǒng)計(jì)工具所得到的值來說明問題， 8 必然會(huì)產(chǎn)生這樣或者那樣的誤解或誤導(dǎo)。 20 世紀(jì) 60 年代早期，隨著婦女運(yùn)動(dòng)以及民權(quán) 運(yùn)動(dòng)的興起，考試的公平性研究日益引起心理以及測量學(xué)家的重視 (1993)。在這些研究中，研究者逐步把視野集中在測試的內(nèi)部差異，以及針對(duì)項(xiàng)目的測試差異上。隨著這一類研究的日益增多，術(shù)日益成熟，并逐步擴(kuò)大影響，以至直接或間接的影響了美國教育以及雇員結(jié)構(gòu)的格局 (1989)。而在中國，考試項(xiàng)目差異也受到了越來越多的關(guān)注。漢語職業(yè)資格考試（試就在其設(shè)計(jì)以及施測和解釋的過程中結(jié)合應(yīng)用理論和方法，以確保對(duì)考試成績的公平性。分類主要有兩種。規(guī)則（情況下，在同等潛質(zhì)條件，某一份組的項(xiàng)目得分始終顯著高于另一分組，見圖片來源， 1999）。而在非規(guī)則（況下，同等潛質(zhì)條件，某一分組在低分區(qū)的項(xiàng)目得分高于另一分組，而在高分區(qū)的項(xiàng)目得分低于另一分組，見圖圖片來源， 1999）。圖同潛質(zhì)下，藍(lán)線組的項(xiàng)目得分始終高于紅線組 9 圖分區(qū)藍(lán)線組的分高于紅線組，而在高分區(qū)相反對(duì) 分析，經(jīng)典測試?yán)碚摲较蛑饕捎玫氖呛唵闻判蚍ㄒ约?法。這兩種方法由于計(jì)算簡單，計(jì)算結(jié)果相對(duì)穩(wěn)定而在早期廣泛應(yīng)用。直到今天，法仍然是醫(yī)學(xué)領(lǐng)域比較研究時(shí)最常采用的方法。而隨著計(jì)算機(jī)技術(shù)的發(fā)展，近年來法也逐漸受到了重視。這些方法計(jì)算復(fù)雜，但是它可以處理五分量表、七分量表等排序數(shù)據(jù)，因此成功地把析從單純的成就測驗(yàn)領(lǐng)域引進(jìn)到了人格測驗(yàn)的領(lǐng)域（ 1999）。而在現(xiàn)代測量理論的領(lǐng)域，主要采用的是法分析目功能差異項(xiàng)目功能差異（是比較一個(gè)測驗(yàn)中同質(zhì)（相同潛質(zhì)）組間對(duì)項(xiàng)目的表現(xiàn)的差異的方法。通過析來辨別偏差不但包括了統(tǒng)計(jì)方法的計(jì)算，也包括一系列的專家分析。因?yàn)?偏差的證據(jù)不但包括實(shí)踐與理論的證據(jù)，也包括專家的專業(yè)判斷。在分析中，法與法的本質(zhì)是相同的，都是比較不同組別（如性別、種族）的被試在項(xiàng)目中的反應(yīng) （回答正確率）差異。當(dāng)這些相對(duì)的子分組的成員在項(xiàng)目上的表現(xiàn)出現(xiàn)不相等的情況，表明存在果這個(gè)組間表現(xiàn)的差異不是測驗(yàn)設(shè)計(jì)所探知的，說明這個(gè)項(xiàng)目融入了其他的變量維度。當(dāng)然也有一種可能性是這個(gè)差異所表現(xiàn)的正是測驗(yàn)所測量的目的?；氐?前面的漢族小學(xué)生和少數(shù)民族小學(xué)生的測驗(yàn)。如果在數(shù)學(xué)測驗(yàn)上的差異是由語言方面的理解障礙造成的，說明有項(xiàng)目差異的存在；如果這是一個(gè)語文測驗(yàn)，那么這個(gè)測驗(yàn)很好的表明了漢族小學(xué)生和少數(shù)民族小學(xué)生在語言方面的差別，否認(rèn)項(xiàng)目差異的存在。成影響因素造成影響因素主要來源于下面幾點(diǎn)：語義因素、環(huán)境以及身體條件因素、文化因素和語言因素（ 2005）。語義因素：諸多研究證實(shí)，文字與其表述意義之間的聯(lián)系的差異，是產(chǎn)生原因之一（ 1992; 1988）。在他們的研究中，針對(duì)白種人與西班牙人的在 10 驗(yàn)中的反應(yīng)。研究表明，同字不同義，以及類似的字不同義的情況在兩種相近的語言中會(huì)很大的困擾被試。環(huán)境以及身體條件因素：有研究表明，環(huán)境因素也會(huì)對(duì)被試的表現(xiàn)產(chǎn)生影響（ 1971; 1975）。例如 1992）在對(duì)比了夏威夷群島的被試和美國本土的被試表現(xiàn)后發(fā)現(xiàn)，他們對(duì)樹、以及下雪的理解有很大的出入，這種差異即使是在高信息量的社會(huì)，有書報(bào)、電視、互聯(lián)網(wǎng) 等媒體的介入后也沒有發(fā)生變化，差異依然存在。文化因素：盡管文化因素的影響一直被認(rèn)為是產(chǎn)生重要因素，但是很多研究表明，文化差異并不一定會(huì)產(chǎn)生 2005, 第 66 頁）。這些研究表明，某些測驗(yàn)只會(huì)在某些的文化差異下產(chǎn)生這個(gè)結(jié)論既沒有推廣到所有的測驗(yàn)，也沒有產(chǎn)生在所有的文化差異中?？赡艿慕忉屖谴蟛糠值臏y驗(yàn)類型比較相似（比如，大部分采用多選題），因此對(duì)各種文化下的被試都是熟悉的（ 2005）。語言因素：語言因素產(chǎn)生要是因?yàn)樵诖蟛糠值恼Z言中，書面表達(dá)語言與口語表達(dá)語言都有一部分差異。而對(duì)于一個(gè) 使用非母語測試的被試來說，這種差異難以把握，因此會(huì)發(fā)生語言理解不明，或者表述不清的情況（ 1992）。除了以上幾個(gè)方面之外，造成影響因素還可能來自于其他方面，比如題目順序，難度分布等（ 1987），都有可能對(duì)一些被試組產(chǎn)生影響。論范疇中的析在經(jīng)典測量理論的框架中，確定方法主要有下面的幾種： 1）法； 2）項(xiàng)目難度轉(zhuǎn)換法； 3）相關(guān)表格方法； 4）法。除了這幾種方法之外，也有其他方法進(jìn)行分析。 1）法法的原理時(shí)，進(jìn)行析時(shí) ，兩組（或多組）同時(shí)進(jìn)行測驗(yàn)，對(duì)測量結(jié)果中的各個(gè) 項(xiàng)目做析，特別關(guān)

人人文庫> 全部分類> 畢業(yè)設(shè)計(jì) > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)

文檔簡介

溫馨提示

最新文檔

評(píng)論

【畢業(yè)學(xué)位論文】（Word原稿）DIF檢測中 Mantel-Haenszel法和IRT方法的比較-測量理論與統(tǒng)計(jì)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔