心理與教育測量重點總結(jié)

上傳人：d*** IP屬地：天津上傳時間：2022-10-27 格式：DOCX 頁數(shù)：16 大?。?8.16KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

心理與教育測量

第一章心理與教育測量概論

（一）一般測量概論

測量：依據(jù)一定的法則使用量尺對事物的屬性進行定量描述的過程。

測量的基本要素：

（1）參照點：

絕對參照點：以絕對的零點作為測量的起點，如長度測量

相對參照點：以人為確定的零點為測量的起點，如對地勢高度的測量。

（2）測量的單位：

要有確定的意義，即對同一單位，所有人的理解都是相同的。

要有相等的價值，即第一個單位與第二個單位之間的距離等于第二個單位與第三個單位之間的距離。

測量的量表：能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體。

陳名量表--用數(shù)字代表事物的成分或用數(shù)字對事物經(jīng)行分類，但該類數(shù)字沒有數(shù)量的意義?？杉毞譃閮煞N形式，一是命名量表（用數(shù)字指代個別事物，如用數(shù)字給運動員編號）二是類別量表（用數(shù)字指代事物的種類，如用1、2、3分別代表不同的職業(yè)類型）。其適用的統(tǒng)計方法有百分比、次數(shù)、眾數(shù)和卡方檢驗。

順序量表--其中的數(shù)字不僅能夠指代類別，而且能夠表明不同類別的大小、等級或事物具有某種特征的程度，它既沒有相等距離的單位，也沒有固定的測量原點。適用的統(tǒng)計方法有中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)和肯德爾和諧系數(shù)等。

等距量表--不僅能夠指代事物的類別和等級，而且具有相等距離的測量單位。沒有絕對的零點，適用的統(tǒng)計方法有平均數(shù)、標準差、積差相關(guān)系數(shù)、等級相關(guān)系數(shù)以及t檢驗和F檢驗。

比率量表--具有類別、等級和等距的特征外，還具有絕對的零點或固定的原點。適用的統(tǒng)計方法除了與等距量表相同外，還與幾何平均數(shù)、變異系數(shù)相同。

（二）心理與教育測量的性質(zhì)

心理與教育測量的定義：依據(jù)一定的心理學和教育學理論在測驗上對人的心理特質(zhì)和教育成就進行定量描述的過程。

心理與教育測量的量表屬于順序量表的原因：

從所使用的參照點來說，教育測量和心理測量領(lǐng)域的參照點均為相對零點。

從所使用的單位來說，教育與心理測量的單位遠沒有其他測量的單位成熟和完善。

標準化需具備的條件：①測驗內(nèi)容的標準化②施測條件的標準化③評分規(guī)則的標準化④測驗常模的標準化

心理與教育測驗的種類：

（1） ①常模參照測驗--以常模為參照編制的測驗（如高考只有百分之幾的人可以進入重點大學）

②標準參照測驗（目標參照測驗）--以標準為參照編制的測驗（如，視力測驗、考駕照）

（2） ①智力測驗--測量個人的智力（一般認知能力）水平的高低

能力傾向測驗--測量個人的潛在才能，預測個人的能力發(fā)展傾向

成就測驗--測量個人在接受教育后的學業(yè)成

（3） ①個別測驗--同一主試在同一時間只能測量一個被試

②團體測驗--同一主試在同一時間內(nèi)能夠測量許多被試

（4） ①難度測驗--識別個人能夠達到的最高水平

②速度測驗--識別個人做題的最快速度

第二章心理與教育測量簡史

高爾頓：把統(tǒng)計方法應用到對個別差異資料的分析之中

卡特爾：

首次提出“心理測驗”這個術(shù)語

認為心理學只有立足于實驗與測量，才能達到如同自然科學一樣的準確性

認為心理測驗只有建立普遍的統(tǒng)一標準，并與常模相比較，才能充分地實現(xiàn)其科學價值和實用價值

比內(nèi)：

1903年，《智力的實驗研究》問世，提出了智力的定義，認為智力是高級心理過程，包括推理、判斷以及運用已知知識解決新問題的能力

1904年與其助手西蒙合作完成了世界上第一個智力測驗量表----比內(nèi)--西蒙量表，因此成為了心理測驗的鼻祖

智力測驗的發(fā)展：

最著名的的是推孟于1916年修訂的斯坦福--比內(nèi)量表。其中影響最為深遠的變動是推孟采用了比率智商的概念來表示智力水平的高低

第一個團體測驗--陸軍甲種測驗和陸軍乙種測驗

30年代后，瑞文相繼編制了瑞文標準推理測驗、瑞文彩色推理測驗、瑞文高級推理測驗

韋克斯勒舍棄了比率智商，而用離差智商代之，從而克服了比率智商的局限；他編制的智力量表分為言語量表和操作量表兩部分

能力傾向測驗的發(fā)展：最初被稱為“學業(yè)能力傾向測驗”，后來進一步擴展到職業(yè)咨詢、工業(yè)部門及軍事領(lǐng)域的人才選拔和安置工作領(lǐng)域。在編制成套能力傾向測驗的過程中，因素分析方法起了重要的作用。

成就測驗的發(fā)展：

20世紀初，桑代克編制了第一個標準化的教育成就測驗。因此而被公推為教育測量的鼻祖。

1923年，凱利、魯奇和推孟合作編制了第一個成套成就測驗----斯坦福成就測驗

20世紀30年代后期，在美國出現(xiàn)了跨州、跨區(qū)域乃至全國的測驗程序

人格測驗的發(fā)展：

20世紀初葉，出現(xiàn)了自陳人格問卷。伍德沃斯用自陳問卷法編制了適用于診斷士兵神經(jīng)癥的個人資料調(diào)查表；卡特爾編制了卡特爾16種人格問卷；埃森克編制成埃森克人格問卷；美國明尼蘇達大學的哈撒韋和莫墾利編制成明尼蘇達多項人格調(diào)查表。

另一種技術(shù)是投射測驗。羅夏克墨跡測驗；哈羅爾編制了以團體方式實施的墨跡測驗。

第三章經(jīng)典測驗理論的基本假設(shè)

心理特質(zhì)：表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式

測量誤差：

（1）含義：在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準確或不一致的測量效應

（2）種類：

隨機誤差--由與測量目的無關(guān)的偶然因素引起的而又不易控制的誤差，其方向和大小的變化完全是隨機的。例如在進行手槍射擊時，新手往往很難控制手臂的輕微擺動。

系統(tǒng)誤差--由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應。例如，在設(shè)計過程中，盡管射擊手非常優(yōu)秀，每次結(jié)果都很一致，但若是槍的準心有點兒毛病，則其射擊結(jié)果將會有穩(wěn)定的偏差。

（3）來源：①測量工具：心理測量量表是否穩(wěn)定、是否真正測到了我們所要測的東西是測量工具造

成誤差的兩種主要原因。

測量對象：主要原因是受測者的真正水平是否得到真正發(fā)揮。

施測過程：主要是一些偶然因素（恒定因素較易控制）

真分數(shù)：

（1）概念：反映被試某種心理特質(zhì)真正水平的那個數(shù)值稱作該特質(zhì)的真分數(shù)（簡稱T分數(shù)），真分數(shù)是一

個在理論上構(gòu)想出來的抽象概念，在實際測量中是很難得到的。

（2）數(shù)學模型：觀察分數(shù)（記為X）與真分數(shù)（T）之間是一種線性關(guān)系，并只相差一個隨機誤差（記之

為E）o即X=T+E

（3）假設(shè)：①若一個人的某種心理特質(zhì)可以用平行的測驗反復測量足夠多次，則其觀察分數(shù)的平均值會

接近于真分數(shù)。

真分數(shù)和誤差分數(shù)之間的相關(guān)為零。

各平行測驗上的誤差分數(shù)之間相關(guān)為零。

（4）推導：S2x=S2t+S2e即在一次測量中，被試觀察分數(shù)的方差等于其真分數(shù)方差與誤差分數(shù)方差之

和。

第四章測量信度

概念：測量結(jié)果的穩(wěn)定性程度。也是一致性，可靠性。

定義：①信度（信度系數(shù)）是一個被測團體的真分數(shù)的變異數(shù)與實得分數(shù)的變異數(shù)之比，

即s=S^/S2XXY TX

信度是一個被試團體的真分數(shù)與實得分數(shù)的相關(guān)系數(shù)的平方。

即rXY=p2xT

信度是一個測驗x（A卷）與它的任意一個“平行測驗”x’（B卷）的相關(guān)系數(shù)，

即rXY=Pxx，

作用：

（1）信度是測量過程中所存在的隨機誤差大小的反映

（2）信度可以用來解釋個人測驗分數(shù)的意義

標準誤：每個人兩次測量的分數(shù)之差可以構(gòu)成一個新的分布，這個分布的標準差就是測量的標準誤，

它是此次測量中誤差大小的客觀指標，有了這一指標，我們就可以對團體中任何一個人的測驗成績做出恰當?shù)慕忉尅?/p>

公式： SE=SXv1-rxx,（Se是標準誤，Sx是實得分標準差，rxx，是信度）

置信區(qū)間：當測驗滿足經(jīng)典測驗理論的三大假設(shè)時，根據(jù)以上估計的測量標準誤便可用以下方法構(gòu)

建測驗真分數(shù)估計的置信區(qū)間：

公式：x-ZCSEWTWx+ZCSE（x是被試的觀測分數(shù)，Se為測量標準誤，ZC是對應于某個統(tǒng)計檢驗顯著性水平的標準正態(tài)分布下的臨界值）

注：例題參考P52最上面。

信度的估計方法：

（1）重測信度：

定義--用同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次

￡（X-X）（y-y）

測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)： r='￡（X-X）2（y-y）2 （X和是-第

XX:

一次測量的實得分數(shù)及實得分數(shù)的平均值；y和y是第二次測量的實得分數(shù)及實得分數(shù)的平均值，

XX是重測信度。公式不要求記，但要會用）

使用的前提--A所測量的心理特性必須是穩(wěn)定的

B遺忘和練習的效果基本上相互抵消

C在兩次實測的間隔期內(nèi)，被試在所要測查的心理特質(zhì)方面沒有獲得更多的學習和訓練

誤差來源------A測驗本身

B被試方面（個體差異）

C偶發(fā)因素干擾

優(yōu)缺點 A能提供測驗結(jié)果是否隨時間而變化的資料，可作為預測被試特定行為的依據(jù)。

B易受練習和記憶的影響

意義 A反應的是在測驗時間上的等值性

B適用于速度測驗與人格測驗，不適用于難度測驗

（2）復本信度：

定義---A復本信度--指兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被

試在兩個副本測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。（同上面）

B等值性系數(shù)--兩個復本測驗是同時連續(xù)施測的。

C穩(wěn)定性與等值性系數(shù)--兩個復本測驗相距一段時間分兩次施測。

D平衡設(shè)計--為低效施測的順序效應，隨機地選出一半被試先做A卷后再做B卷，另一半被試先做B卷再做A卷。

使用的前提--A首先要構(gòu)造出兩份或兩份以上真正平行的測驗（即A、B卷）

B被試要有條件接受兩個測驗。

誤差來源---A測驗的兩種形式是否等值（是否是平行測驗）

B被試情緒波動，動機變化等測驗情景變化、偶發(fā)因素干擾。

優(yōu)缺點------A代表性強，信度準，避免練習、記憶效應

B編制復本難，影響積極性，被試容易觸類旁通

意義 A反應的是在測驗內(nèi)容上的等值性

（3）分半信度：

定義--將一個測驗分成對等的兩半后，所有被試在這兩半上所得分數(shù)的一致性程度。由于描述的是兩半題目間的一致性，所以有時也稱內(nèi)部一致性系數(shù)。

計算--A方法與復本信度的類似，但是被試在兩半測驗上的得分的相關(guān)系數(shù)只是半個測驗的信度，所

以還要用斯皮爾曼-布朗公式矯正：

2r r r一工，*

0=訂廠（\是兩個分數(shù)間的相關(guān)系數(shù)，hh是整個測驗的信度值）hh

B上式只有在兩半測驗分數(shù)的變異數(shù)（即總體方差）相等時才能使用，否則，就用下面的弗朗那根公式或盧倫公式。

r=2（1-S:S）（Sa和Sb分別表示所有被試在兩半測驗上的得分的

XX S2

變異數(shù)，S;表示全體被試在整個測驗上總得分的變異數(shù)）

r=1-S2/S2（qd表示同一組被試在兩半測驗上得分之差的變異數(shù)，

xx dx

其他與上式相同）

使用前提---A在只能施測一次或沒有復本的情況下使用

B當一個測驗無法分成對等的兩半時，不宜使用

C常用的分半方法有奇偶分半、按題目難度分半等

注：速度測驗不適合分半信度

（4）同質(zhì)性信度：

定義-A-也叫做內(nèi)部一致性系數(shù)，是指測驗內(nèi)部所有題目間的一致性程度。所謂一致性，是指所有題

目測的都是同一種心理特質(zhì)以及所有題目得分之間都具有較高的正相關(guān)。

B-如果一個測驗的同質(zhì)性信度不高，則說明結(jié)果可能是幾種心理特質(zhì)的綜合反映，所以結(jié)果不好解釋。一種好辦的方法就是把一個異質(zhì)的測驗分解成多個具有同質(zhì)性的測驗，再根據(jù)被試在分測驗上的得分分別做出解釋。

C-同質(zhì)性高才是測驗測的單一特質(zhì)的充分條件。即一些表面上看起來是測量同一種心理特質(zhì)的題目，如果其題目間不具有較高的正相關(guān)，則不能認為它們具有同質(zhì)性。

計算--克龍巴赫a系數(shù)：

K￡S2 S2 S2

A公式：a=k=（1-二7工）（K是題目數(shù)，七是所有被試在第i題上的分數(shù)變異，七是測驗

K-1S2

總分的變異）

B適用范圍：不要求測驗題目僅是（0、1）記分，可以處理任何測驗的內(nèi)部一致性系數(shù)的計算問題，此外，a值還是所有可能的分半信度的平均值，它只是測量信度下界的一個估計值

C計算過程和例子：參考P58

（5）評分者信度：

定義--多個評分者給同一批人的答卷進行評分的一致性程度。（通常要求成對的受過訓練的評分者之間平均一致性達到0.9以上，才算公平。）

計算--當評分者人數(shù)多于兩個時，評分者信度可用肯德爾和諧系數(shù)進行估計：

￡儻R）

（K是評分者人數(shù)，N是被評的對象數(shù)，Ri是第i個被評對象

乙R2-―N^K2N3-N）

的水平等級之和）

B若評分中有相同等級出現(xiàn)，

個數(shù)）

例題及計算方法：參考P60

影響測量信度的因素：

（1）被試方面：①單個被試--身心健康狀況、應試動機、注意力、耐心、求勝心、態(tài)度

②被試團體--整個團體內(nèi)部水平的離散程度以及團體的平均水平

（2）主試方面：①就施測者而言，不按指導手冊規(guī)定施測

②就閱讀評分者而言，評分標準掌握不一

（3）施測情境：考場環(huán)境、設(shè)備是否良好、空間寬窄是否恰當?shù)鹊?/p>

（4）測量工具：①試題取樣--利用斯皮爾曼-布朗公式可以預測試題長度與信度的關(guān)系：

公式：P，=1+31）（K為改變后的測驗長度與原來長度之比，「如為原測驗的

XX'

信度，P次'為測驗長度增加為K倍后的測驗信度）

試題之間的同質(zhì)性程度

試題的難度

（5）兩次施測的間隔時間：間隔時間越短，信度值越大，反之亦然。

提高測量信度的方法：

（1）適當增加測驗的長度：①新增項目必須與試卷中原有的項目同質(zhì)

②新增項目的數(shù)量必須適度

（2）使測驗中所有的試題的難度接近正態(tài)分布，并控制在中等水平

（3）努力提高測驗試題的區(qū)分度

（4）選取恰當?shù)谋辉噲F體

（5）主試者要嚴格執(zhí)行實測規(guī)程，評分者要嚴格按標準給分。

第五章測量效度

概念：指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。準確性+有效性。

定義：（1）效度是一個相對的概念：①效度是相對于一定的測量目的而言的

②心理測量只能達到某種程度上的準確

（2）效度是測量的隨機誤差和系統(tǒng)誤差的綜合反映

（3）判斷一個測量是否有效要從多方面搜集證據(jù)：在測量理論中，效度被定義為在一列測量中，與測量目的有關(guān)的真實變異數(shù)（由所要測量的變因引起的有效變異）與總變異數(shù)（實得變異

r2 S 2r ― S2 S2

數(shù)）的比率，通常用xy表示，其定義為：r2—V（xy是效度系數(shù)，V是有效變異數(shù)，X是

XXS2

總變異數(shù)）

與信度的關(guān)系：

信度高是效度高的必要而非充分條件，即效度高一定信度高，反之不一定。（比如，用標準米尺來量身高是有效也是可信的，但是如果用英文來考一批母語為中文孩子的數(shù)學，雖然多次測量的結(jié)果可能很一致（即信度高），但是它的測量效度未必高，因為考生的英文水平會影響數(shù)學水平的發(fā)揮。）

測驗的效度受它的信度制約。信度總是大于效度的。

效度的評估:

（1）內(nèi)容效度：

定義--指一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。

測量內(nèi)容包括--A欲測的知識范圍

B該范圍內(nèi)各知識點所要求掌握的程度

適用與不適用：A適用于成就測驗和某些用于選拔和分類的職業(yè)測驗

B不適用于能力傾向測驗和人格測驗

與表面效度不同：表面效度不能算是一種效度，它不反應測驗實際測量的東西，它是外行人對某

個測驗從表面上好像是測某種心理特質(zhì)的一種現(xiàn)象。當外行人認為某測驗能有效地測得某種心理特質(zhì)時，該測驗就被認為有較高的表面效度。一般來說，最佳行為測驗（答案有正誤之分、主試與被試目的一致，如高考）往往表面效度高，其他測驗則希望表面效度低。

確定方法：A邏輯分析法--a明確欲測內(nèi)容的范圍，包括知識范圍和能力要求兩個方面。

b確定每個題目所要測的內(nèi)容，并與雙向細目表（考試藍圖）對照c制定評定量表，對整個測驗的有效性做出總的評價

B統(tǒng)計分析法--從同一個教學內(nèi)容總體中抽取兩套獨立的平行測驗，用著兩個測驗來測同一批被試，求其相關(guān)

C再測法--在被試學習某種知識之前做一次測驗，在學過該知識后再做同樣的測驗

（2）結(jié)構(gòu)效度：

定義：一個測驗實際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度，或者說它是指測驗分數(shù)能夠說明心理學理論的某種結(jié)構(gòu)或特質(zhì)的程度。（也就是測驗結(jié)果是否能夠證實或解釋某一理論、術(shù)語或構(gòu)想，其解釋的程度如何）

特點：A結(jié)構(gòu)效度的大小首先取決于事先假定的心理特質(zhì)理論

B當實際測量的資料無法證實我們的理論假設(shè)時，并不一定就表明該測驗結(jié)構(gòu)效度不高C不可能有單一的數(shù)量指標來描述結(jié)構(gòu)效度。主要應用于智力測驗和人格測驗

估計方法：

A測驗內(nèi)部尋找證據(jù)法--a考查該測驗的內(nèi)容效度

b分析被試的答題過程

c計算測驗的同質(zhì)性信度

B測驗之間尋找證據(jù)法--a相容效度法-考查新編測驗與某個已知的能有效測量相同特質(zhì)的舊測驗之間的相關(guān)，若相關(guān)高，則新測驗有較高效度。

b區(qū)分效度法-考查新編測驗與某個已知的能有效測量不同特質(zhì)的舊測驗之間的相關(guān)，若相關(guān)高，則新測驗效度不高。

c因素分析法-通過對一組測驗進行因素分析，找出影響測驗的共同因素，每個測驗在共同因素上的負荷量（即測驗與各因素的相關(guān)）就是測驗的因素效度，測驗分數(shù)總變異中來自有關(guān)因素的比例就是該測驗結(jié)構(gòu)效度的指標。

C考查測驗的實證效度法-a根據(jù)校標把人分成兩類，考查其得分的差異。（如，一組被公認性格外向的人在測驗中得分高，一組被公認性格內(nèi)向的人在測驗中得分低，則說明測驗能區(qū)分人的內(nèi)外向特征，進而說明該測驗在測量人的性格內(nèi)外向方面有較高的結(jié)構(gòu)效度）

b根據(jù)測驗得分把人分成高分組和低分組，考查這兩組人在所測特質(zhì)方面是否確有差異。若差異顯著，則結(jié)構(gòu)效度高。

D多種特質(zhì)--多種方法矩陣法：參考P74例子

E因素分析法--探索性因素分析和驗證性因素分析

（3）實證效度：

概念：一個測驗對于特定情境中的個體的行為進行估計的有效性。即一個測驗是否有效，應該以實

踐的效果作為檢驗的標準。也叫，校標關(guān)聯(lián)效度。

分類：A同時效度-校標資料與測驗分數(shù)同時搜集的

B預測效度-校標資料是在測驗之后根據(jù)實際工作成績來確定的

校標：A概念-衡量一個測驗是否有效的外在標準，它是獨立于測驗并可以從實踐中直接獲得我們所

感興趣的行為。但我們所感興趣的行為往往是一個觀念上的東西（觀念校標）它必須用一個數(shù)字或等級來表達（效標測量）

B特性--多樣性、復雜性、特殊性和時間性。所以如果效標測量想要較好地體現(xiàn)觀念校標，效標測量本身就必須是有效的、可靠的、客觀和實用。

C常用校標--學業(yè)成就、等級評定、臨床診斷、專門的訓練成績。

確定方法：明確觀念校標一確定校標測量一考查測驗分數(shù)與校標測量的關(guān)系

A相關(guān)法-計算測驗分數(shù)與校標測量的相關(guān)系數(shù)

B區(qū)分法-被試接受測驗后，讓他們工作一段時間，再根據(jù)工作成績（校標測量）的好壞分成兩組。再回頭分析這兩組被試原先接受測驗的分數(shù)差異，若差異顯著，則說明測驗的效度較高。

C命中率--a正命中率-被測驗選出來的人真正被選對的人數(shù)的比率

b負命中率-測驗所淘汰的人中真正應該被淘汰的人數(shù)的比率

c總命中率-測驗選對了的人數(shù)和被淘汰了的人數(shù)之和與總?cè)藬?shù)之比

D其他---a基礎(chǔ)率-符合篩選要求的群體在整個人群總體中所占的比率

b靈敏度-所有真正符合要求的人能被測驗鑒別出來的人數(shù)的比率

c確認度-所有不合要求的人能被測驗真正淘汰的人數(shù)的比率

d當基礎(chǔ)率較低時，選用靈敏度高的測驗才能比較有效。當基礎(chǔ)率很高時，選用確認度高的測量工具比較有效。

e功利率-使用測驗所帶來的好處應大大高于使用測驗所耗費的時間、精力和經(jīng)費。

影響效度的因素：A測驗的構(gòu)成

B測驗的實測過程

C接受測驗的被試

D所選校標的性質(zhì)

E測量的信度

提高效度的方法：A精心編制測驗量表，避免出現(xiàn)較大的系統(tǒng)誤差

B妥善組織測驗，控制隨機誤差

C創(chuàng)設(shè)標準的應試情境，讓每個被試都能發(fā)揮正常水平

D選好正確的校標，定好恰當?shù)男藴y量，正確使用有關(guān)公式。

第六章測驗的項目分析

測驗項目的難度

（1）概念：被試完成測驗項目任務時所遇到的困難程度

（2）計算：

二分法記分項目的難度（結(jié)果只有對或錯）

A通過率：不考慮被試作答是否因為猜測成功的機遇：

P=R（P是項目難度，N是全體被試數(shù)，R為答對該項目的人數(shù)）

B極端分組法：被試人數(shù)較多時，將被試依照測驗總分分為三組，總分最高的27%為高分組（），總分最低的27%為低分組，分別計算高低分組的通過率，再求難度。

P=PH^PL或P=1f害+g」（Ph、PL分別表示高低分組的通過率；七、RL分別表示

2 2"N N）

高低分組通過該項目的人數(shù)；Nh、Nl分別表示高低分組的人數(shù)）

非二分法記分項目的難度（結(jié)果從滿分至零多種可能）

八 X G 十， , 、十，斗

P=—（X是被試在某一項目上的平均得分，Xma是該項目的滿分）

max

（3）難度水平的確定：取決于測驗的目的與測驗的性質(zhì)

一般的標準化常模參照測驗：難度值應盡量接近0.50

標準參照測驗：A如果測驗目的是為了解被試對某方面知識技能的掌握情況，則可以不必過多地

考慮難度，只要教育者認為是重要的內(nèi)容就可以選用。

B如果測驗目的是為了選拔和錄用人員，就應該講項目的難度控制在接近錄取率左右

測驗性質(zhì)不同：速度測驗難度不宜太高，難度測驗則在0.50左右。

測驗的區(qū)分度

（1）概念：指測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力

（2）范圍：介于-1.00至+1.00之間。D為正值則為積極區(qū)分，負值為小雞區(qū)分，0為無區(qū)分

（3）計算：

項目鑒別指數(shù)法

A鑒別指數(shù)的計算：當測驗總分是連續(xù)變量時，從分數(shù)分布的兩端選出高低分組（同上面的分法一

樣），計算高低分組的通過率，兩者之差就是鑒別指數(shù)。D=Ph-Pl

B極端組的劃分：取27%的高分段被試組成高分組，27%的低分段被試組成低分組，其余的46%不作分析。若團體人數(shù)較少（少于100）則用50%的規(guī)則。

相關(guān)法（知道什么樣的數(shù)據(jù)用什么樣的方法，公式和例題參考P91-95）

A點二列相關(guān)系數(shù)：適用項目是0、1記分（或二分變量），而校標或測驗總分是連續(xù)變量的數(shù)量資料。什么是校標分數(shù)

B二列相關(guān)：適用于連續(xù)的測量變量，但其中一個變量因為某種原因被人為地分成兩類。例如一個測驗的項目分數(shù)是連續(xù)的，但測驗總分被分為及格或不及格兩類。

C"fai”（不知道怎么打出那個字母）相關(guān)：適用于兩個變量是二點分配的資料，即兩個變量都是二分名義變量。

D積差相關(guān)：當項目分數(shù)服從正態(tài)分布時，用項目得分與校標分數(shù)求積差相關(guān)系數(shù)，得到項目的區(qū)分度。

（4）與難度的關(guān)系：難度D越接近于0.50，項目的潛在區(qū)分度越大。而難度D越接近于1.00或0，項目

的潛在區(qū)分度越小。（參考P96表格）

（5）相對性：A不同的計算方法，所得區(qū)分度值不同

B樣本容量大小影響相關(guān)法區(qū)分度值的大小

C分組標準影響鑒別指數(shù)值（D）

D被試樣本的同質(zhì)性程度影響區(qū)分度值的大小

第七章測驗常模

分數(shù)轉(zhuǎn)換

（1）原始分數(shù)：被試在接受測驗后，根據(jù)測驗的記分標準，對照被試的反應所計算出來的測驗分數(shù)。

（2）導出分數(shù)：在原始分數(shù)轉(zhuǎn)換的基礎(chǔ)上，按照一定的規(guī)則，經(jīng)過統(tǒng)計處理后獲得的具有一定參考點和單位，且可以相互比較的分數(shù)量表或符號系統(tǒng)。

（3）為何轉(zhuǎn)換：原始分數(shù)一般不能直接反映出被試之間的差異狀況，不能體現(xiàn)出被試相互比較后所處的地位，也不能說明被試在其他等值測驗上應獲得什么樣的分數(shù)。所以，為了使原始分數(shù)本身具有意義，使不同測驗的分數(shù)可以相互比較，須將原始分數(shù)轉(zhuǎn)換成導出分數(shù)。

百分等級分數(shù)

（1）概念：在一個群體的測驗分數(shù)中，得分低于這個分數(shù)的人數(shù)的百分比。

（2）計算與評價：參考書本P106-108不是重點。

標準分數(shù)

（1）概念：一種具有相等單位的量數(shù)，又稱Z分數(shù)。它是將原始分數(shù)與團體的平均數(shù)之差除以標準差所得的商數(shù)，是以標準差為單位度量原始分數(shù)離開其平均數(shù)的分數(shù)至上多少個標準差，或是在平均數(shù)之下多少個標準差。

（2）計算及評估：參考書本P109-110.

T分數(shù)

（1）概念：由標準分數(shù)轉(zhuǎn)換而來，將Z分數(shù)擴大10倍（以消除小數(shù)）再加上50（消除負號）。T在［0，100］之間，平均數(shù)為50，標準差是10。T=10xZ+50

（2）評價：①具有等單位的特點，便于進一步統(tǒng)計分析工作

在正態(tài)分布下，可以利用正態(tài)分布表將各種導出分數(shù)與百分等級分數(shù)作換算

在正態(tài)分布下，運用某種變式分數(shù)可以將幾個測驗上的分數(shù)作直接比較

分數(shù)過于抽象，不易理解

在非正態(tài)分布下，分布形態(tài)不同的變式分數(shù)，仍然不可以作相互比較及求和

常模編制

（1）常模概念：根據(jù)標準化樣本的測驗分數(shù)經(jīng)過統(tǒng)計處理而建立起來的具有參照點和單位的測驗量表

（2）確定常模團體的注意事項：①群體構(gòu)成的界限必須明確

常模團體必須是所測群體的一個代表性樣本

取樣過程必須明確且有詳盡的描述

樣本大小要適當

常模團體必須是近時的

注意一般常模與特殊常模的結(jié)合

第八章心理與教育測驗的編制與實施

基本程序

（1）確定測驗目的：①明確測量對象②明確測量目標③明確測量用途

（2）制定編題計劃

（3）編輯測驗項目：①收集測驗資料②選擇項目形式③編寫測驗項目

（4）預測與項目分析：①預測②項目分析

（5）合成測驗：①測驗項目的選擇

②測驗項目的編排：總的原則是由易到難。常見排列方式如下：

A并列直進式--將整個測驗按測驗項目材料的性質(zhì)歸為若干分測驗，在同一分測驗的測驗項目中，由易到難排列

B混合螺旋式--將各類測驗項目依難度分成若干不同的層次，再將不同性質(zhì)的測驗項目語義組合，做交叉式排列，難度漸次升進。

編制復本

（6）測驗標準化：指測驗的編制、施測、評分以及解釋測驗分數(shù)的程序的一致性。

測驗內(nèi)容標準化

施測過程標準化

測驗評分標準化：不同評分者的一致性達到90%以上

測驗分數(shù)的解釋標準化

（7）鑒定測驗：①信度-指測驗的可靠性，即用同一測驗多次測量同一團體，所得測驗結(jié)果之間具有一致

性

效度--指測驗的有效性，即一個測驗在多大程度上能夠測得它所要測得的東西。

測驗量表與常模

（8）編寫測驗說明書

第十一章學績測驗

整一章都沒有說到有重點，所以。。。自己看吧。

第十二章能力測驗（上）

智力的心理測量學理論

（1）智力二因素論：斯皮爾曼發(fā)現(xiàn)一系列心理能力測驗之間存在普通的正相關(guān)，他利用因素分析方法，將這些相關(guān)歸因于一種一般因素或共同因素的作用。他稱這種因素為G因素，并從三個方面對它定義：經(jīng)驗的領(lǐng)會、關(guān)系推斷和相關(guān)推理。他認為G因素對于同一個體是穩(wěn)定的，它滲透于所有與智力行為有關(guān)的任務重，是一切心智活動的主題，個體間智力的差異就決定于個體擁有G因素量的多寡。由于測驗間并非完全相關(guān)，因而出于統(tǒng)計上相關(guān)分析的需要，他提出還存在特殊因素（S因素），由此構(gòu)成了他的智力二因素論。但他始終強調(diào)G因素才是智力的核心，而S因素只有在某些特殊情況下才會表現(xiàn)出來。

（2）智力多因素論：瑟斯頓利用多重因素分析法提出

（3）智力層次理論：弗農(nóng)提出智力三層次模型

智力的可變性：①隨年齡成熟而發(fā)展（記住智力成長曲線p218）

A智力發(fā)展在十二三歲以前呈直線上升趨勢，13歲后開始減慢

B一般智力高者發(fā)展速度快停止年齡晚，低者發(fā)展速度慢停止年齡早

C一般人的智力在16~18歲達到頂峰，近期研究結(jié)果又推遲至25歲

個體智力測驗：

（1）比內(nèi)量表：①比內(nèi)?西蒙量表：診斷異常兒童智力，于1905年編制的世界上第一個智力量表

②斯坦福?比內(nèi)量表：最富盛名

（2）韋克斯勒量表：①應用最廣泛的智力量表

有成人、兒童、幼兒三個量表

成人智力量表的結(jié)構(gòu)包括言語量表和操作量表

團體智力測驗：

（1）陸軍測驗：①第一個團體智力測驗

陸軍甲種測驗--文字測驗

陸軍乙種測驗--非文字測驗

（2）瑞文推理測驗：是非文字型的圖形測驗，具有跨文化一致性，優(yōu)點在于測驗對象不受文化、種族與語言等條件的限制，適用的年齡范圍也很廣，而且不排除一些生理缺陷者。

第十三章能力測驗（下）

能力傾向測驗：需知道哪些是能力傾向測驗。如學術(shù)能力傾向測驗SAT）、分辨能力傾向測驗（DAT）、

一般能力傾向成套測驗（GATB）、行政職業(yè)能力傾向測驗等等。

吉爾福特的基本觀點：

智力操作中存在聚合與發(fā)散兩種不同類型的思維

發(fā)散思維在行為上表現(xiàn)出流暢性、變通性、獨特性這三種特性

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

心理與教育測量重點總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

心理與教育測量重點總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔