自考教育統(tǒng)計與測量(復習資料)微縮排版_第1頁
自考教育統(tǒng)計與測量(復習資料)微縮排版_第2頁
自考教育統(tǒng)計與測量(復習資料)微縮排版_第3頁
自考教育統(tǒng)計與測量(復習資料)微縮排版_第4頁
自考教育統(tǒng)計與測量(復習資料)微縮排版_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育統(tǒng)計與測量:名詞解釋題0.1.統(tǒng)計:對事物某方面的特性的量的取值從總體上加以把握和認識就叫統(tǒng)計。0.2.教育統(tǒng)計:就是對教育領域各種現(xiàn)象量的取值從總體上的把握與認識。0.3.測量:就是按一定規(guī)則給對象在某種性質的量尺上指定值。0.4.教育測量:給所考察研究的教育現(xiàn)象,按一定規(guī)則在某種性質的量尺上指定值。0.5.測驗(標準化測驗):在測量中,如果測量工具、施測與評分程序、解釋分數(shù)的參照系(或標準)都已科學地實現(xiàn)標準化,像這樣對代表性樣本的宏觀而標準化的測量,就是標準化測驗,簡稱測驗。0.6.量表:在標準化測驗中,測量工具(考卷或心理測試項目的集合)和分數(shù)解釋的常模(或標準),都有物化的形態(tài)(如常模表),它們合在一起被稱為量表。0.7.標準化考試:在標準化測驗時,如果所測的心理特質是學業(yè)成就,這樣的標準化測驗又稱為標準化考試。1.1.數(shù)據:用數(shù)量或數(shù)字表示的資料事實。1.2.稱名變量數(shù)據:只說明某一事物與其他事物在名稱、類別或屬性上的不同,并不說明事物與事物之間差異的大小、順序的先后及質的優(yōu)劣的數(shù)據。1.3.人工編碼數(shù)據:按一定的規(guī)則給不同類別的事物指派適當?shù)奶柎a后所形成的數(shù)據。1.4.次數(shù)分布:一批數(shù)據中各個不同數(shù)值所出現(xiàn)的次數(shù)多少情況,或者是這批數(shù)據在數(shù)軸上各個區(qū)間內所出現(xiàn)的次數(shù)多少的情況。1.5.次數(shù)直方圖:由若干寬度相等、高度不一的直方條緊密排列在同一基線上構成的圖形。1.6.次數(shù)多邊形:利用閉合折線構成多邊形以反映次數(shù)變化情況的一種圖示方法。1.7.散點圖:用平面直角坐標系上的點的散布圖形來表示兩種事物之間的相關性及聯(lián)系模式。1.8.線形圖:以起伏的折線來表示某種事物發(fā)展變化及演變趨勢的統(tǒng)計圖。1.9.條形圖:用寬度相同的長條來表示各個統(tǒng)計事項之間數(shù)量關系的統(tǒng)計圖。1.10.圓形圖:以單位圓內各扇形面積占整個圓形面積的百分比來表示各統(tǒng)計事項在其總體中所占相應比例的一種圖示方法。2.1.集中量數(shù):觀測數(shù)據具有向某點集中的趨勢,反映次數(shù)分布集中趨勢的量數(shù)叫集中量數(shù)。2.2.算術平均數(shù):一批數(shù)據的總和除以總次數(shù)后所得的商數(shù)。2.3.加權和:在考慮到各個數(shù)據的重要性(即權重)后再相加求和就是加權和。2.4.加權平均數(shù):加權和除以所有權重之和所得的商數(shù)。2.5.中位數(shù):又稱中數(shù),是位于數(shù)據分布正中間位置上的那個數(shù)。2.6.眾數(shù):一個次數(shù)分布中出現(xiàn)次數(shù)最多的那個數(shù)。2.7.差異量數(shù):反映一組數(shù)據離散程度的量。2.8.離中趨勢:數(shù)據具有偏離中心位置的趨勢,它反映了一組數(shù)據本身的離散程度和變異性程度。.2.9.平均差:各數(shù)據與其平均數(shù)的離差絕對值的平均值。2.10.方差:指一組數(shù)據的離差平方數(shù)的算術平均數(shù)。2.11.差異系數(shù):把差異量數(shù)和集中量數(shù)兩相對比后所形成的相對差異量數(shù)。2.12.地位量數(shù):反映次數(shù)分布中各數(shù)據所處地位的量。2.13.百分等級:指某個觀測分數(shù)以下數(shù)據個數(shù)占總個數(shù)的比例的百分數(shù),在0到100間取值。3.1.相關:指兩個變量的成對觀測數(shù)據在乎面直角坐標系上描點構成的散點圖環(huán)繞在某一直線附近分布。3.2.相關系數(shù):用來定量描述兩個變量之間的直線性相關的強度與方向的數(shù)。3.3.積差相關:對兩個連續(xù)變量之間的相關情況進行定量分析的一種應用最普遍、最基本的相關分析方法。3.4.等級相關:根據兩列順序變量數(shù)據中各對等級數(shù)據的差數(shù)來計算相關系數(shù)的方法。3.5.點雙列相關:用來研究的兩個變量中,一個是連續(xù)變量數(shù)據,另一個是二分類的稱名變量數(shù)據,對這兩個變量進行相關分析的方法是點雙列相關。4.1.分數(shù):通過測量獲得的、描述測量對象身心特性水平的數(shù)字。4.2.原始分數(shù):在測量工具上直接得到的測值(數(shù)字)。4.3.導出分數(shù):由原始分數(shù)出發(fā),推導出的與原始分數(shù)對應的其他等值數(shù)。4.4.相對評分分數(shù):通過被試間的相互比較而確定意義的分數(shù)。4.5.絕對評分分數(shù):通過拿被試測值與應有標準作比較來確定其意義的分數(shù)。4.6.常模:一定人群在測驗所測特性上的普遍水平或水平分布狀況。4.7.常模組:從清楚而明確地定義的“特定人群”總體中抽取到的容量足夠大,并確具代表性的被試樣組。4.8.發(fā)展常模:某類個體正常發(fā)展進程各特定階段的一般水平。4.9.組內常模:被試所屬那類群體(實際上即常模組被試)在所測特性上的測驗取值(也就是分數(shù))的分布狀況。4.10.比例智商:通過求取被試的智力年齡與生理年齡的比而得到的智商。4.11.標準分數(shù):以一個測驗分數(shù)所屬分數(shù)組的標準差為單位,與它所屬分數(shù)組的平均數(shù)的距離。4.12.標準分數(shù)常模:就是用被試所得測驗分數(shù)轉換成的標準分數(shù)來揭示其在常模團體中的相對地位的組內常模。4.13.線性變換后的標準分數(shù):將一個標準分數(shù)乘以同一確定值,再加上另一確定值后所得到的另一個標準分數(shù)。4.14.離差智商:通過求取被試在智力測驗中所得分數(shù)的標準分數(shù)而得到的智商值。5.1.測驗項目難度:就是被試完成項目作答任務時所遇到的困難程度。5.2.項目難度指數(shù):定量刻畫一個測驗項目的被試作答困難程度的量數(shù)。5.3.項目區(qū)分度:項目區(qū)分被試水平高低的能力的量度。5.4.測驗信度:測驗在測量它所測特質時得到的分數(shù)(測值)的一致性。5.5.觀察分數(shù):從測驗實施過程中實際得到的被試分數(shù)。5.6.真分數(shù):被試在所測特質上客觀具有的水平值。5.7.穩(wěn)定性系數(shù):用重測法求得的信度系數(shù)。5.8.等值性系數(shù):用平行形式相關求得的信度系數(shù)。5.9.測量標準誤:實際測驗中所測值偏離真分數(shù)的程度。5.10.測驗效度:就是測驗實際上測到它打算要測的東西的程度。5.11.內容效度:通過對測驗所含項目作內容的系統(tǒng)考察,以確定由這些項目所構成的測驗,是否是測驗應測特質行為領域的代表性樣本。5.12.表面效度:從被試或非專業(yè)人員看來,測驗表現(xiàn)得是否在有效地測驗著應測的東西。5.13.效標關聯(lián)效度:測驗預測個體在類似或某種特定情境下行為表現(xiàn)的有效性。5.15.效標污染:效標測量值的評定受到了測驗分數(shù)值的信息的影響。5.16.結構效度:測驗測得心理學理論所定義的某一心理結構或特質的程度。6.1.學業(yè)成就測驗:是一類廣泛用于檢查學習者學習任務、掌握知識的廣度與深度以及取得學業(yè)進步情況的教育測驗。6.2.安置性測驗:在學期教學開始或單元教學開始時,確定學生實有水平以便針對性地做好教學安排而經常使用的測驗。6.3.形成性測驗:在教學過程中實施的用于檢查學生掌握知識和進步情況的測驗。6.4.診斷性測驗:為探測與確定學習困難原因而施測的一類測驗。6.5.終結性測驗:在課程結束或教學大周期結束時,用于確定教學目標達到程度和學生對預期學習結果掌握程度的一類測驗。6.6.常模參照測驗:參照著常模使用相對位置來描述測驗成績的一種測驗。6.7.標準參照測驗:與一組明確的知識能力標準或教學目標內容相比時,對學習者的測驗成績作出解釋的一類測驗。6.8.標準化成就測驗:由專家編制的按照系統(tǒng)的科學組織實施、建立統(tǒng)一的標準并對測驗誤差作了嚴格控制的學業(yè)成就測驗。6.1O.心理測驗:是通過對一組標準刺激所引起的行為樣組的客觀分析,對人們的心理特征及個別差異進行估測、描述和診斷的一種方法。6.11.智力測驗:測量一個人理解、處理和適應其周圍世界的最一般能力的心理測驗。6.12.能力傾向測驗:測量一個人獲得新的知識、能力和技能的內在潛力,旨在預測未來成功可能性的一種心理測驗。6.14.學習能力傾向測驗:是測量一個人的一般的學習能力和潛力的心理測驗。6.15.創(chuàng)造力:指獨創(chuàng)地解決問題的能力,即產生新的想法、發(fā)現(xiàn)新的問題、創(chuàng)造新的事物方面的能力。6.17.投射測驗法:呈現(xiàn)給被試一定的刺激材料,讓被試根據材料說出自由聯(lián)想到的事物,以此測得被試人格的一種方法。6.19.評定量表法:以自然觀察為基礎,通過評定量表來量化觀察印象的一種人格測驗方法。6.20.人格:指人的性格、氣質、興趣、態(tài)度、價值觀、動機、適應、理想、信念、品德等心理特征與意識傾向性的總和。7.1.隨機現(xiàn)象:又稱不確定現(xiàn)象,指在相同條件下其結果卻不一定相同的現(xiàn)象。7.2.隨機試驗:對隨機現(xiàn)象的一次演示或觀察稱為做了一次隨機試驗。7.3.隨機變量:記錄各種隨機試驗結果的變量。7.4.頻率:在一輪隨機實驗中,某一事件A發(fā)生的次數(shù)f與總試驗次數(shù)N之比被稱為該輪試驗中事件A發(fā)生的頻率。7.5.概率:隨著隨機試驗次數(shù)的增多,某事件發(fā)生的頻率值會越來越接近于一個固定數(shù)值,我們把這個數(shù)值稱為該事件發(fā)生的概率。7.6.必然事件:如果某事件發(fā)生的概率是1,表示該事件肯定會發(fā)生,這樣的事件稱為必然事件。7.7.不可能事件:如果某事件發(fā)生的概率為D,表示該事件不可能發(fā)生,我們稱這樣的事件為不可能事件。7.8.小概率事件:指發(fā)生概率很小的事件,一般概率小于0.05或0.01,就稱為小概率事件。7.9.概率分布:指隨機變量所有取值點或取值區(qū)間上概率取值的分布情況。7.lO.總體:客觀世界中具有某種共同特征的元素的全體稱為總體。7.11.樣本:從總體中抽取的部分個體組成的群體稱為樣本。7.12.參數(shù):在總體數(shù)據基礎上求取的各種特征量數(shù)稱為參數(shù)。7.13.統(tǒng)計量:應用樣本數(shù)據計算的各種特征量數(shù)稱為統(tǒng)計量。7.14.抽樣分布:從一個總體中隨機抽取若干個等容量的樣本,計算每個樣本的某個特征量數(shù),由這些特征量數(shù)形成的分布,稱為這個特征量數(shù)的抽樣分布。8.2.顯著性水平:在統(tǒng)計假設檢驗中,公認的小概率事件的概率值被稱為統(tǒng)計假設檢驗的顯著性水平。8.3.虛無假設:又稱原假設、零假設,是作為檢驗的已知條件使用的帶有“等于什么”成分的陳述性命題。8.4.備擇假設:又稱解消假設、研究假設,是備以待擇,是虛無假設被拒絕后被人們采擇的假設。8.6.臨界值:統(tǒng)計上根據顯著性水平α求出的,提供比較標準的值。8.7.危機域:在抽樣分布區(qū)線中,臨界值以遠的抽樣分布曲線下的區(qū)域。8.8.I型錯誤:虛無假設屬真而被拒絕的錯誤,又稱“拒真”錯誤。8.9.Ⅱ型錯誤:虛無假設屬實偽而未被拒絕的錯誤,又稱“納偽”錯誤。8.lO.單側檢驗:為了推斷某個總體參數(shù)是否大于或小于某個定值,或者是為了推斷某兩個總體參數(shù)之間有無大于或小于關系,從而采用的一種假設檢驗方法。8.11.雙側檢驗:為了判斷某個總體參數(shù)是否等于某個定值,或者是為了推斷某兩個總體參數(shù)是否相等,從而采用的一種假設檢驗方法。8.12.檢驗靈敏度:檢驗出差異的靈敏程度。8.13.方差齊性檢驗:在統(tǒng)計學中檢驗兩個或兩個以上總體方差是否相等被稱為方差齊性檢驗。簡答題0.1.教育統(tǒng)計學包括哪兩部分內容,它們的含義分別是什么?(1)教育統(tǒng)計學包括描述統(tǒng)計和推斷統(tǒng)計兩部分內容。(2)含義分別是:①描述統(tǒng)計就是把調查所獲得的數(shù)據進行整理、概括和表述,使數(shù)據隱含的信息明確地揭示出來。②推斷統(tǒng)計就是利用實際獲得的樣本數(shù)據資料,依據數(shù)理統(tǒng)計所提供的理論方法,對總體作出推論判斷。0.2.測量三要素分別是什么?(1)測量工具;(2)施測與評分程序;(3)結果解釋參照系和參照物。0.3.教育測量的特點是什么?怎樣理解它的間接性特點?(1)教育測量的特點是:①間接性;②要抽樣進行。(2)所謂間接性特點,指的是測量的對象為受教育者的心理特質,不能直接測量,只有通過設置一定的情景,施以特定刺激,引發(fā)出代表性的行為樣本,再對之按一定規(guī)則,在某種性質的量尺上指定值。0.4.教育測量學包括哪兩部分內容?(1)測驗工具編制、施測與評分程序確定,常模與標準建立的一般理論和方法,包括項目分析與測驗質量檢驗的具體理論和技術。(2)各種類型教育與心理測驗的具體編制與使用。1.1.數(shù)據可以分為哪些種類?(1)從數(shù)據來源劃分,可以分為:①計數(shù)數(shù)據;②測量評估數(shù)據;③人工編碼數(shù)據。(2)根據數(shù)據所反映的變量的性質,可分為:①稱名變量數(shù)據;②順序變量數(shù)據;③等距變量數(shù)據;④比率變量數(shù)據。1.2.數(shù)據有哪些特點?(1)數(shù)據的離散性:數(shù)據通常以一個個分散的有一定間隔的數(shù)字形式出現(xiàn)。(2)數(shù)據的變異性:指人們在得到數(shù)據的過程中,數(shù)據總是在一定的范圍內以變化的形式出現(xiàn)。(3)數(shù)據的規(guī)律性:一定范圍內變化著的一組觀測數(shù)據潛存著某些規(guī)律。1.3.簡述次數(shù)直方圖與次數(shù)多邊形的聯(lián)系與區(qū)別。(1)次數(shù)直方圖和次數(shù)多邊圖都是次數(shù)分布圖,是為了更直觀形象地表達一個次數(shù)分布的結構形態(tài)和特征。(2)區(qū)別在于,前者是以寬度相等、高度不一的直方條來表達次數(shù)分布情況;后者則是以閉合折線構成多邊形來反映次數(shù)變化情況的一種圖示方法。2.1.常用的集中量數(shù)有哪些?如何求取?(1)常用的集中量數(shù)有:算術平均數(shù)、加權算術平均數(shù)、中位數(shù)和眾數(shù)。(2)它們通:過下列方法求?。核阈g平均數(shù)加權算術平均數(shù):中位數(shù):觀察法或求兩數(shù)平均數(shù)。眾數(shù):觀察法或用經驗公式:2.2.算術平均數(shù)作為集中量數(shù)有哪些優(yōu)缺點?(1)優(yōu)點:反應靈敏、確定嚴密、簡明易懂、概括直觀、計算簡便,并能進一步作代數(shù)運算。(2)缺點:個別數(shù)據缺失時無法進行計算,而且還易受極端數(shù)據影響。2.3.簡述算術平均數(shù)據的性質。(1)各數(shù)據與該組數(shù)據的平均數(shù)之差求和等于0。(2)每一觀測值加上相同常數(shù)c后,新一組數(shù)據的平均數(shù)是原平均數(shù)加上C后所得的數(shù)。(3)每一觀測值乘以C后,所得新一組數(shù)據的平均數(shù)等于原平均數(shù)的C倍。(4)對每一觀測值作線性變換,即乘上相同的常數(shù)C,再加上另一常數(shù)d,則變換后所得數(shù)據的平均數(shù)等于原平均數(shù)乘以c后再加d所得的數(shù)。2.4.集中量數(shù)有哪些作用?(1)向人們提供整個分布中多數(shù)數(shù)據的集結點位置;(2)集中反映一批數(shù)據在整體上的數(shù)量大?。?3)是一批數(shù)據的典型代表值。2.5.中位數(shù)在哪些情況下有較好的應用價值?(1)當數(shù)據分布列中有個別異常值或極端值出現(xiàn)時;(2)在次數(shù)分布的某端或兩端數(shù)據只有次數(shù)而沒有確切數(shù)量時;(3)在一些態(tài)度測驗、價值測驗或民意問卷測試中,調查對象對一些事項進行排序,常用中數(shù)來代表各事項的排序結果。2.6.常用的差異量數(shù)有哪些?如何表示?(1)平均差,用符號AD表示;(2)方差S2,用符號s表示;(3)標準差,用符號S表示;(4)差異系數(shù),用符號CV表示。2.7.百分等級的意義是什么?在不同的次數(shù)分布中,數(shù)值相等的同一數(shù)據在其分布中所處地位是不相同的,為了確切地表示出該數(shù)據在所處團體中的位置情況,統(tǒng)計學中引入地位量數(shù),其中百分等級是一種典型的地位量數(shù)。2.8.差異量數(shù)有何作用?次數(shù)分布中的數(shù)據不但具有集中趨勢,而且還有離中趨勢,為了更全面和更客觀地描述一組數(shù)據或比較兩組數(shù)據,我們常用差異量數(shù)來表示數(shù)據的離散程度和變異性程度。數(shù)據離散程度越小,說明越集中;離散程度越大,說明越分散。2.9.標準差有何運算性質?(1)全組數(shù)據每一觀測值都加上一個相同的常數(shù)c后,計算得到的標準差不變。(2)若每一觀測值都乘以一個非零常數(shù)c后,所得數(shù)據的標準差與原標準差乘以c所得的數(shù)相等。(3)每一觀測值都乘以同一非零常數(shù)c,再加上另一常數(shù)d,所得數(shù)據的標準差等于原標準差乘以這個常數(shù)c。2.10.未歸類數(shù)據計算百分等級的步驟是什么?(1)對觀測值從大到小排列;(2)統(tǒng)計每個觀測值的次數(shù);(3)從低到高的順序,逐個計算各觀測點數(shù)據以下的累積次數(shù)(不包括本得分點次數(shù));(4)計算各觀測點數(shù)據的“以下累積相對次數(shù)”即比例數(shù);(5)把各數(shù)據的“以下累積相對次數(shù)”乘上100,就得到百分等級PR。3.1.相關的統(tǒng)計學意義是什么?許多教育現(xiàn)象或教育行為之間存在著一定的相互聯(lián)系,這些聯(lián)系具有復雜性。兩個高度相關的變量,它們之間可能存在明顯的因果關系,也可能只具有部分因果關系,還可能沒有直接因果關系。而相關系數(shù)接近零,只是表示這兩個變量不存在明顯的直線性相關模式,但不能肯定地說兩個變量之間沒有規(guī)律性聯(lián)系。3.2.積差相關的計算方法是什么?(1)計算兩個變量的平均值和;(2)計算離差值和;(3)計算各對離差值乘積以及乘積和。;(4)計算數(shù)據的離差平方和,即;(5)計算數(shù)據的離差平方和,即;(6)把上述有關結果代入公式,求出rxy。3.3.等級相關有哪些適用范圍?(1)兩列觀測數(shù)據都是順序變量數(shù)據,或其中一列數(shù)據是順序變量數(shù)據,另一列數(shù)據是連續(xù)變量數(shù)據。(2)兩個連續(xù)變量的觀測數(shù)據,其中有一列或兩列數(shù)據的獲得,主要依靠非測量方法進行粗略評估得到。3.4.點雙列相關的適用范圍及基本公式分別是什么?(1)點雙列相關適用于雙變量數(shù)據中,有一列是連續(xù)變量數(shù)據,另一列是二分變量數(shù)據。(2)基本公式p、q分別是二分類數(shù)據中二類事物所占比例,Sx是全部連續(xù)變量的標準差。3.5.相關的兩類事物有因果關系嗎?兩類事物高度相關時:(1)它們之間可能具有明顯的因果關系;(2)也可能只具有部分因果關系;(3)還可能沒有直接的因果關系,其數(shù)量上的相互關聯(lián),只是它們共同受到其他第三變量支配的結果。4.1.相對評分分數(shù)和絕對評分分數(shù)的含義是什么?(1)相對評分分數(shù)是通過被試之間相互比較而確定意義的分數(shù),即分數(shù)的意義是與其他被試相互比較而確立下來的。(2)絕對評分分數(shù):拿被試測值與要求達到的標準相比較而確定意義的分數(shù),其他被試達標與否絲毫不影響該被試測驗分數(shù)的意義。4.2.原始分數(shù)與導出分數(shù)的含義是什么?(1)原始分數(shù)是直接從測驗卷面上讀到的分數(shù),沒有經過任何的轉換。(2)導出分數(shù)足從原始分數(shù)出發(fā),考慮其他因素并經轉換后得到的與原始分數(shù)對應的其他分數(shù)。4.3.可以確定原始分數(shù)含意的參照系的種類有哪些?(1)其他被試的測值,即其他被試在測驗特性上的普遍水平或水平分布狀態(tài)。(2)社會在所測特性上的客觀要求,即被試在所測特性上發(fā)展應該達到程度的標準。4.4.建立常模的步驟是什么?(1)要科學抽樣,從清楚而明確地定義的“特定人群”總體中,抽取到容量足夠大,并確具代表性的被試樣組。(2)用擬建立常模的測驗,對常模組(標準化樣組)采用規(guī)范化手續(xù)施測。(3)對收集到的全部資料進行統(tǒng)計分析處理,真正把握被試樣組在測驗上的普遍水平或水平分布狀況。4.6.年級常模有哪些不足?(1)許多學科學校不連年授課,無法求取年級常模,即使多年連續(xù)授課,重點內容也不斷轉移。(2)所測年級等值易引起誤解,如一個四年級學生獲得年級等級6.9,并不意味著他已為升入初中作好了一切知識準備。4.7.組內常模和發(fā)展常模各有何作用?(1)組內常模可以確定某測驗分數(shù)在測驗團體中所處的位置,進而確定分數(shù)的含義。(2)發(fā)展常??梢源_定某個體在發(fā)展過程中處在同類總體中的相對位置。4.8.為什么說百分等級不是等單位量度?心理與教育測驗分數(shù)的分布狀態(tài),一般都呈正態(tài)分布,“中間大兩頭小”的形狀,對于曲線下任一百分等級差,據其在曲線下位置的不同,曲線的高度也不同,因任一百分等級差可用曲線下的面積表示,故高度越大,面積一定時長度越小,即中部百分等級密度大,兩端小。4.9.如何建立標準分數(shù)常模?(1)從明確界定好的該測驗應該測查的被試總體中,抽取一個容量足夠大的代表性樣組,即建立起常模組。(2)對該代表性樣組按應有規(guī)范施測,獲得代表性樣組中每一被試的測驗分數(shù),得到常模團體的測驗分數(shù)組。(3)求取常模團體測驗分數(shù)組的平均數(shù)與標準差,按公式求取從-3.000到3.000這一區(qū)間上若干個點的標準分數(shù)(z值)與原始分數(shù)的對照表,就得到了標準分數(shù)常模表。4.10.不同測驗間的分數(shù)如何比較?比較不同測驗問的分數(shù),不能直接用原始分數(shù),可用下列兩種方法:(1)求取兩個測驗中各原始分數(shù)的標準分數(shù),標準分數(shù)大者越優(yōu)越。(2)求取兩個測驗分數(shù)在各自總體中的百分等級PR,等級數(shù)越大越優(yōu)越。5.1.分析一個測驗的質量應從哪兩個方面進行?(1)考察整個測驗的質量指標,即考察測驗效度與信度。(2)考察所含項目(題目)的質量指標,即考察測驗項目的難度和區(qū)分度。5.2.求取整個測驗的難度指數(shù)有哪些方法?(1)所有項目滿分值都相等時,求各個項目的難度的算術平均數(shù)。(2)各項目的滿分值并不相等時,用各項目的滿分作權重求取加權平均數(shù)。(3)求取各個被試總分的平均數(shù),除以全測驗各項目的滿分即得測驗難度指數(shù)。5.3.教育與心理測驗的誤差主要來源是什么?(1)可能是由于測驗項目抽樣不妥;(2)語言表達引起誤解;(3)施測環(huán)境影響;(4)施測時指導語,完成時限、主被試關系的影響或評分過程的偏向與誤差;(5)被試的動機或情緒等因素。5.4.觀察分數(shù)、真分數(shù)、誤差分數(shù)的關系怎樣?觀察分數(shù)是測驗實際得到的被試分數(shù),而被試實際具有的水平值是真分數(shù),真分數(shù)與觀察分數(shù)的差距是誤差分數(shù),即真分數(shù)等于觀察分數(shù)與誤差分數(shù)的代數(shù)和。5.5.信度系數(shù)為何只能估計?由于信度是測驗分數(shù)的一致性程度,受誤差控制的影響,對誤差控制能力的大小不能定量描述,只能大致估出,故信度系數(shù)也就只能估計。5.6.穩(wěn)定性系數(shù)的適用范圍與不足?(1)穩(wěn)定性系數(shù)用重測相關法測得,故適用于前后兩次施測的特性相對比較穩(wěn)定,即多用于預測性測驗上。(2)由于重測法十分強調特質的穩(wěn)定性,不適用于練習效應明顯或能引起重測時厭煩的測驗,再編一個等值測驗很不容易。5.7.利用單一測驗估計信度系數(shù)的必要性是什么?(1)在利用重測法或平行相關法求信度系數(shù)時,已編成一個測驗后,要再編一個與之完全平行等值的測驗,事實上是很困難的;(2)另外,兩個平行形式測驗先后實施,要消除前測對后測的影響是很困難的;.(3)要求創(chuàng)新能力的項目,在找到辦法后,其他類似的題目可以套用這種辦法。5.8.說明何種類型的測驗適用使用何種信度系數(shù)?(1)穩(wěn)定性系數(shù):適用于智力、能力傾向和人格特點等預測性測驗上:(2)等值性系數(shù):適于學生成績測驗;(3)內部一致性系數(shù):適于所有項目都測查同一特質的系數(shù)。5.9.效度有哪些種類?試舉例說明。(1)內容效度:測驗項目構成應測行為領域代表性樣本的程度,主要分析測驗項目所考核的知識技能覆蓋面、能力水平考核情況,以及各部分內容的深度和結構比例。(2)效標關聯(lián)效度:測驗預測個體在類似或特定情境下行為表現(xiàn)的有效性。例如,參照韋氏智力測驗編制一個能團體施測的紙筆形式的智力測驗,要考核其效度,使用到效標關聯(lián)效度。(3)結構效度:測驗測得心理學理論所定義的某一心理結構或特質的程度。如:測智力、人格結構焦慮等。6.1.學業(yè)成就測驗如何分類?(1)根據課堂運用測驗的一般順序,可分為:①安置性測驗;②形成性測驗;③診斷陛測驗;④終結性測驗。(2)根據解釋測驗的方法的不同,可分為:①常模參照測驗;②標準參照測驗。(3)根據成就測驗的實施方式和測驗載體,分為:①口頭測驗;②紙筆測驗;③操作測驗。(4)根據測驗編制程序的嚴格程序,分為:①標準化成就測驗;②教師自編課堂成就測驗。6.2.測驗標準化包括哪四個環(huán)節(jié)?(1)命題標準化;(2)施測標準化;(3)評分標準化;(4)分數(shù)使用解釋的標準化。6.3.形成性測驗、診斷性測驗、終結性測驗的主要應用特點分別是什么?(1)形成性測驗主要應用于改進學習與教學,為師生雙方提供有關學習成敗的連續(xù)反饋信息。(2)診斷性測驗:用以針對性地發(fā)現(xiàn)那些用形成性測驗難以準確辨別的學習困難或周期性出現(xiàn)的認知缺陷。(3)終結性測驗:用于確定教學目標達到程度和學生對預期學習結果掌握程度。6.4.診斷性測驗與其他成就測驗的區(qū)別在哪里?(1)一般注重于與診斷相關的目標,對每一特定目標需要包括大量題目,每一題目之問只有很小差異。(2)測驗題目依據于對成功學習特殊技巧的詳細分析以及常見的學習錯誤的分析研究。(3)題目難度一般較低,重在確定學生所犯學習錯誤的類型以及學習困難根源所在。(4)該測驗一般限于課程教學中有限部分內容,且通常按若干部分的測驗分數(shù)與測驗記錄來分析,很少用于測驗全部內容。6.5.常模參照測驗的主要用途是什么?(1)鑒別與評價學生能力發(fā)展水平,這種發(fā)展水平是一種相對比較的結果,有利于個別差異的診斷與研究,可在班內、校內、地區(qū)內、國內或同齡人群內進行。(2)用于教育工作中的選拔與分流方面的決策。6.6.標準參照測驗的主要用途是什么?(1)說明學習者掌握所規(guī)定的教學內容的程度,以便作出掌握與未掌握、合格與未合格的分類決策。(2)通過標準參照測驗給學習者一個成績,以提供出學習者個人學習經歷和已達水平的證明資料。(3)評價課堂教學與課程編制的有效性。6.7.口頭測驗的應用領域及常用方法分別是什么?(1)應用領域:①使用特定語言回答問題的能力;②綜合有關信息提出問題的能力;③闡述觀點并為自己的觀點作解釋與辯護的能力;④口頭表達時邏輯思維及概括能力;⑤知識理解的廣度與深度;⑥態(tài)度氣質與情感方面的特殊表現(xiàn)。(2)常用方法:①高聲朗讀;②教師提問;③在一些題目簽中隨機抽選加以回答;④按預先設計的問題進行專題發(fā)言;⑤小組討論;⑥師生一般會談;⑦根據圖片或特別設置的情景講故事;⑧角色扮演,如課文劇等。6.8.實驗技能考核的三條原則是什么?(1)實踐性為主的原則:即應以動手操作為主,不能停留在筆試形式下考核實驗操作知識的方式上。(2)全面性原則:要盡力考核到實驗操作及其前后的各個環(huán)節(jié),必要時,結合口試筆試和演示進行。(3)客觀化原則:要建立在行為觀察為基礎上,客觀地評價學生的實驗技能。6.9.布盧姆把認知領域中的教育目標從低到高分為哪幾個層次?(1)知識(識記);(2)領會;(3)應用;(4)分析;(5)綜合;(6)評價。6.10.簡述客觀題的常用題型。(1)填空題;(2)簡答題;(3)是非題;(4)匹配題;(5)選擇題。6.11.主觀題有哪些優(yōu)點?有哪些局限性?(1)優(yōu)點:①不允許簡單猜測,適于考查分析綜合能力、組織表達能力及計算與推論等較為復雜的心智技能;②提倡自由反應,有利于考查應用能力乃至創(chuàng)造能力;③可以獲得較為豐富的作答反應過程資料,便于分析被試的技能策略和知識缺陷等;④內容和形式更為接近教學與實踐中的問題情形,被試不陌生好接受,教師命題比較方便?!?2)局限性:①作答反應費事,有大量的書寫任務,造成被試“忙于寫而無暇想”,“手指累而頭腦松”②單位時間內施測的問題量減少,限制了測驗內容的覆蓋面,不利于測驗效率提高。③允許被試以文字技巧或作答風格來搪塞胡弄主試,靠“模棱兩可的詞句”與“面面俱到的分析”來賺得高分。④評分易受閱卷人主觀因素的影響。6.12.心理測驗有哪些主要用途?(1)人才選拔。(2)人員安置和人事管理。(3)臨床心理學研究。(4)學校心理服務。(5)建立和檢驗假設。6.13.心理測驗的分類方法及相應的分類結果是什么?(1)根據測驗編制程序是否系統(tǒng)、科學和完備,可以把心理測驗分為標準化測驗和非標準化測驗。(2)根據施測時每次測試一個人還是可同時測試一批人,可以把心理測驗分為個別心理測驗和團體心理測驗。(3)根據測驗有先嚴格的時問限制,可以分為限時測驗和非限時測驗。(4)根據心理測驗材料(刺激)是語言文字形式還是非語言文字形式,可以把心理測驗分為文字式心理測驗和非文字式心理測驗。(5)根據測驗引起的被試反應的特點,可以把心理測驗分為最高成就測驗和典型作為測驗。(6)按測驗內容的性質劃分,可以分為智力測驗,能力傾向測驗、創(chuàng)造力測驗以及人格測驗。6.14.最高成就測驗與典型作為測驗的區(qū)別是什么?(1)最高成就測驗要求被試盡其所能,測量出人的最高能力水平限度。故能力型和成就型測驗屬于這一類。(2)典型作為測驗要求被試按照各自喜好、興趣、態(tài)度與準則等,對測驗中的刺激作出典型或習慣的反應,如人格測驗中多數(shù)內容屬典型作為測驗。6.15.目前國內常見的幾種智力測驗是什么?常見的幾種智力測驗是中國比納智力測驗、斯坦?!燃{智力測驗、韋克斯勒智力測驗、瑞文推理測驗、中小學生團體智力篩選測驗。6.16.韋克斯勒兒童智力測驗的各個分測驗的測量目標是什么?(1)常識:測量被試的知識廣度。(2)填圖:測量視覺記憶及理解性。(3)類同:測量兒童的概括抽象能力。(4)圖片排列:測量被試的社會情景理解能力和統(tǒng)整綜合能力。(5)算術:測量被試運算推理能力。(6)積木:測量兒童視覺與分析圖形結構的能力。(7)詞匯:測量兒童的語詞及理解性。(8)拼圖:測量兒童處理部分與整體關系的能力。(9)問題理解:測量兒童的實際知識與理解能力。(10)譯碼:測量被試學習領會與書寫速度。(11)背數(shù):測量被試的注意力及機械記憶能力。(12)迷宮:補救性測驗,即判斷智力測驗結果。6.17.瑞文標準推理測驗有哪些特色?(1)該測驗是一種非文字智力測驗,是由大小圖形組成的。(2)瑞文標準推理測驗包括A、B、C、D、E五組,每組12題共60題,適用于6歲以上的兒童及成人。(3)該測驗適用的年齡范圍寬,測量對象不受文化、種族、語言的限制,并可用于一些生理缺陷者。(4)測驗可分別進行也可團體施測,省時省力,使用方便,且有較高的信度和效度。(5)該測驗是用百分等級來評定人的智力發(fā)展水平,評價時分為五個等級。6.18.能力傾向測驗同一般的智力測驗和學業(yè)成就測驗之間的區(qū)別是什么?能力傾向測驗是一種旨在預測未來成功可能性的一種測驗,是一種潛能測驗,這種潛能不同于人的一般能力即智力,也不同于在教育訓練下獲得的某方面的專業(yè)知識技能,因此能力傾向測驗同一般的智力測驗和學業(yè)成就測驗的測量目標是不同的。6.19.學習能力傾向測驗(SAT)的主要功能與特點是什么?(1)學習能力傾向測驗的主要功能是用于測量一般的學習能力和潛力,即是否具有進一步學習與研究的潛在能力,而不是已在學校中學到多少知識。(2)英國的大學學習能力傾向測驗(SAT)是經過精心設計的標準化測驗,評分采用標準分,成績是參照全國常模加以評定的,故具有逐平可比,全國可比的特點。sAT測驗一般為客觀題。6.20.發(fā)散性思維的特征是什么?(1)流暢性:即心智活動流利暢達,左右逢源,能在單位時間內表達出比常人多得多的觀點,其反應迅速且眾多。(2)變通性:指思維靈活多變,可舉一反三,觸類旁通,較少受心理定勢影響。(3)獨特性:即表現(xiàn)出異乎尋常,新穎獨到的見解。6.21.什么叫自陳量表法?有哪些典型測驗?(1)自陳量表法又稱問卷法,通常是以問卷的形式提出一系列題目,每個問題陳述一種人的心理或行為上的典型表現(xiàn),要求被試判斷所陳述的情況在多大程度上符合自己的情況,并作出相應的回答,借此測定人的人格特征。(2)自陳量表法的典型測驗是艾森克人格測驗(EPQ)和卡特爾十六種人格測驗(16PF)等。6.22.投射測驗可分為哪四種技術?(1)聯(lián)想技術,其特征是要求被試對測驗刺激所引發(fā)的第一個字詞或意象作出反應。(2)構造技術,要求被試對某圖形構建一個故事。(3)完成技術,讓被試針對測驗刺激之未完成的語句、文字段落、故事情節(jié)等加以完成。(4)表達技術,要求被試進行一種表達性活動。6.23.艾森克人格量表的依據是什么?它有幾個量表組成?(1)艾森克人格量表是以艾森克的人格三維理論為依據,即認為人格的三個因素是內外傾性(E)、情緒性(N)、精神性(P),這三個方面的不同傾向和不同表現(xiàn)程度,構成了千姿百態(tài)的人格類型。(2)艾森克人格量表由四個量表組成:①E(內外傾性)量表;②N(情緒穩(wěn)定性)量表;③P(精神病態(tài))量表;④L(有效性)量表。7.1.頻率與概率有什么區(qū)別與聯(lián)系?(1)區(qū)別。①頻率是一個變化的值,而概率對某事件來說卻是相對固定的。②頻率是對一定的總試驗次數(shù)N來說的,而概率是在總實驗次數(shù)趨于無窮大或足夠大的情況下確定下來的。③對于某一事件A發(fā)生頻率與概率往往是不同的。(2)聯(lián)系。①頻率與概率的取值范圍都是[O,1]。②當某一事件的頻率值趨于一個穩(wěn)定的數(shù)值時,該頻率值就變成了概率值。③某一事件發(fā)生的頻率總是圍繞概率上下波動。7.2.什么叫概率分布。概率分布有哪些表示方法?(1)概率分布包括兩類,一是離散性隨機變量概率分布,即指該隨機變量所有取值點的概率分布情況。二是連續(xù)性隨機變量的概率分布,指連續(xù)性隨機變量所有取值區(qū)間上概率取值的分布情況。(2)概率分布有三種表示方法。①對離散性隨機變量,可以順序地列出全部取值的概率。②用概率分布表表示概率分布。③用概率分布的密度函數(shù)圖表示。7.3.正態(tài)分布是如何形成的?正態(tài)分布是連續(xù)性隨機變量中常見的一種概率分布形態(tài),如果影響該隨機變量的因素很多,而在這些因素中又沒有哪個因素能起決定性作用,那么這個隨機變量最終就會形成正態(tài)分布。7.4.正態(tài)分布有什么形態(tài)特征?什么是標準正態(tài)分布?(1)在形態(tài)上,正態(tài)分布是一條單峰、對稱呈鐘形的曲線,其對稱軸為過x=μ的縱線。從x=μ開始曲線向正負兩個方向遞減延伸,不斷向x軸逼近,但永不與x軸相交,即曲線在正負兩個方向上都以x軸為漸近線。(2)標準正態(tài)分布是正態(tài)分布的一個典型代表,它的平均數(shù)是0,標準差為1,其它各種正態(tài)分布都可以通過一定的數(shù)學方法與它相互轉化。7.5.總體與樣本有什么區(qū)別和聯(lián)系?(1)區(qū)別:總體包含了具有同一特征的所有個體,而樣本則只包含了這些具有同一特征的所有個體中的一部分。(2)聯(lián)系:總體與樣本所包含的元素具有一些共同的特征,樣本在數(shù)量上小于總體,是對總體的代表,故總體只有一個,樣本則可以產生很多。每一個樣本統(tǒng)計量的值都是在總體參數(shù)上下波動,存在一定的抽樣誤差。7.6.參數(shù)與統(tǒng)計量有何區(qū)別與聯(lián)系?(1)區(qū)別:參數(shù)是在總體基礎上求取的特征量數(shù),統(tǒng)計量是關于樣本的特征描述。(2)聯(lián)系:參數(shù)不易獲得,可以通過樣本統(tǒng)計量經過推斷統(tǒng)計得到。7.7.如何進行簡單隨機抽樣?(1)抽簽法:預先在簽條上寫好入樣或不入樣,然后隨機抽取分發(fā)給每個元素,樣本自然生成。(2)用隨機數(shù)碼表作簡單隨機抽樣:①對總體所有元素編號,一般以0或l開始。②根據最大編號的位數(shù)確定隨機數(shù)碼的使用位數(shù)。在隨機數(shù)碼表中任意指定一個起始數(shù)并且報告這個起始數(shù)在表中確切位置,并規(guī)定使用隨機數(shù)碼第幾列到第幾列的位數(shù)。③按從上至下或其他明確順序,抄錄隨機數(shù)碼表中不大于總體最大編號的所有隨機數(shù),直至抄滿個數(shù)等于入樣元素數(shù)。④按抄錄的數(shù)碼從總體中將對應元素取出組成所需樣本。7.8.平均數(shù)抽樣分布有哪三種情況?(1)原總體正態(tài),總體方差已知情況下的平均數(shù)抽樣分布,此時該抽樣分布呈正態(tài)分布。(2)原總體正態(tài),總體方差未知情況下,平均數(shù)的抽樣分布,這種平均數(shù)抽樣分布呈t分布。(3)原總體非正態(tài),但樣本較大情況下平均數(shù)抽樣分布,這種平均數(shù)抽樣分布呈漸近正態(tài)分布。8.1.什么是小概率事件原理?在教育統(tǒng)計中,常常把概率取值小于O.05或0.01的隨機事件稱為小概率事件,我們常常認為小概率事件在一次試驗中不可能發(fā)生,這就是小概率事件原理,這是一種科學的思維方式。8.2.統(tǒng)計假設檢驗的反證法與一般的數(shù)學反證法的差異是什么?(1)數(shù)學反證法最終推翻假設的依據一定是出現(xiàn)了百分之百的謬誤,因此推翻假設的決策無論是從決策邏輯還是從決策內容看都是100%正確的。而統(tǒng)計假設檢驗的反證法最終推翻虛無假設的依據是一個小概率事件,從決策邏輯角度看是100%正確的,但決策內容卻是有可能出錯的。(2)數(shù)學中的反證法最終一定是推翻原假設,而統(tǒng)計假設檢驗的反證法最終結果卻可能無充分理由推翻原虛無假設。8.3.統(tǒng)計假設檢驗的步驟有哪些?(1)根據題目的設問提出檢驗假設;(2)選定顯著性水平α;(3)根據檢驗目的和已知條件找到相應的抽樣分布;(4)寫出檢驗統(tǒng)計量計算公式并按照已知條件計算檢驗統(tǒng)計量的值;(5)根據顯著性水平α在抽樣分布中確定臨界值和危機域;(6)將求得的檢驗統(tǒng)計量值與臨界值作比較,根據其是否進入危機域而作出是否拒絕虛無假設的統(tǒng)計結論。8.4.顯著性水平僅與臨界值危機域的關系怎樣?顯著性水平α越高,α的值越小,臨界值就越遠離零點,危機域的面積也越小。相反,顯著性水平α越低,α值越大,臨界值越靠近零點,危機域的面積也越大。教育統(tǒng)計常用0.05和0.01兩個顯著性水平,O.01的水平要高于0.05的顯著性水平。0.05的顯著性水平α=0.05,臨界值為±1.96(雙側),危機域在正態(tài)曲線下-1.96和1.96之外。0.01的顯著性水平α=0.01,臨界值為±2.58(雙側),危機域在-2.58與2.58之外的正態(tài)曲線下。8.5.影響Ⅱ型錯誤概率大小的因素是什么?(1)客觀的真值與假設的偽值兩者之間的差異。如果我們假設的偽值與真值很近,犯Ⅱ型錯誤的概率就大,如果假設的偽值與真值很遠,犯Ⅱ型錯誤的概率就小,即將偽當真的可能性就小。(2)僅值的大小影響Ⅱ型錯誤的概率。d值越大,犯Ⅱ型錯誤的概率就越小,即β越小,α值越小,犯Ⅱ型錯誤的概率就越大,即β越大,但β≠1-α。(3)樣本容量。樣本容量越大,犯Ⅱ型錯誤的概率越小,樣本容量越小,犯Ⅱ型錯誤的概率越大。8.6.單側檢驗和雙側檢驗有何不同?(1)單側檢驗只有一個危機域,檢驗靈敏度較高,雙側檢驗則有二個危機域,分別位于抽樣分布曲線兩側,檢驗靈敏度較低。(2)單側檢驗的目的是為了推斷某個總體參數(shù)是否大于或小于某個定值,或者是為了推斷某兩個總體參數(shù)之間有無大于或小于關系。雙側檢驗的目的是為了判斷某個總體參數(shù)是否等于某個定值,或者是為了推斷某兩個總體參數(shù)是否相等。8.7.兩總體平均數(shù)差異的抽樣分布形態(tài)以及它的各種參數(shù)估計公式受哪四個因素影響?(1)兩個總體是否相關;(2)兩個總體的分布是否正態(tài);(3)兩個總體的方差是否已知或相等;(4)所抽樣本容量大小。8.8.在什么情況下兩總體相關?(1)所檢驗的兩列分數(shù)如果是同一批實驗對象,那么這兩列分數(shù)總體是相關總體;(2)如果是一一嚴格配對的兩批實驗對象的兩列分數(shù),此時一對對的實驗對象基本上可以視為同一實驗對象,因此這樣的兩列分數(shù)總體也視為相關總體。8.9.平均數(shù)差異顯著性檢驗分為哪四種情況對待?(1)總體方差已知,兩獨立正態(tài)總體的平均數(shù)差異顯著性檢驗,平均數(shù)差異的抽樣分布為正態(tài)。(2)總體方差未知但相等,兩獨立正態(tài)總體的平均數(shù)差異顯著性檢驗,平均數(shù)差異的抽樣分布服從t分布。(3)兩獨立總體分布形態(tài)不明或不服從正態(tài)分布,若抽樣樣本容量大于30,可以按近似正態(tài)分布計算。(4)兩相關總體平均數(shù)差異顯著性檢驗。8.1O.F分布有哪些形態(tài)特征?有何用途?(1)形態(tài)上,F(xiàn)分布是一個正偏態(tài)分布,F(xiàn)隨均為正值,處于正半軸一邊,其最小值為0,最大值可為正無窮,F(xiàn)分布的上尾側以橫軸為漸近線。F分布同時受到兩個自由度的制約。(2)研究發(fā)現(xiàn),隨機抽取的兩樣本方差之比服從F分布,故可以用F分布理論來進行方差差異顯著性檢驗。9.1.x2統(tǒng)計量的一般表達式是什么?它表示什么意義?(1)一般表達式是:(2)x2統(tǒng)計量表示實際觀測次數(shù)與理論期待次數(shù)之間差異程度,當實際觀測次數(shù),和理論期待次數(shù)廠相差較大時,x2值也越大,這表明觀測次數(shù)分布與設想的總體理論次數(shù)分布之間的差異也越大。9.2.x2分布有哪些特點?(1)x2≥0,即x2值從0到止無窮大;(2)當自由度df≥3時,x2分布是單峰正偏態(tài)分布,各曲線的尾部都向右(正方面)無限延伸,但終不與橫軸相交;(3)當自由度df≥30時,x2分布曲線基本上是對稱分布,且隨著自由度df增大,越來越接近正態(tài)分布;(4)x2分布具有可加性,即不同自由度的若干個x2分布相加后還是x2分布,且自由度也是若干個不同自由度所疊加的結果。(5)當自由度df=1時的x2分布;它與標準正態(tài)分布z值的平方正好相等,即df=1時,x2=z2。9.3.x2檢驗的主要作用是什么?(1)總體分布的擬合良度檢驗:檢驗某抽樣觀測數(shù)據的分布是否與某一理論分布相一致。(2)獨立性檢驗:檢驗雙向分類列聯(lián)表數(shù)據下,兩個分數(shù)特征(即兩個因素變量)之間是彼此相關還是相互獨立的問題。9.4.x2檢驗的一般步驟是什么?(1)根據所存在問題的實際特點,提出虛無假設(H0),即“沒有顯著性差異”的假定或“兩個變量相互獨立”的假定。(2)從虛無假設出發(fā),確定各類事物的理論期待次數(shù),這是x2檢驗最重要關鍵的一步。一般要求任何一類的理論次數(shù)都不應小于5,若某類事物的理論次數(shù)小于5,則可將相鄰的類合并起來(觀測次數(shù)也相應地合并)。(3)根據x2統(tǒng)計量公式計算實得X2值。(4)選取適當?shù)娘@著性水平α值,并確定自由度df,然后在x2值表中找到臨界值x2。(5)做出接受虛無假設或拒絕虛無假設的統(tǒng)計決策。其原則是:①當x2值大于臨界值時,我們可以拒絕虛無假設(H0),并接受研究假設(H1)。②當x2值小于臨界值時,我們便沒有充分理由拒絕虛無假設(H0),故暫認為虛無假設成立。10.1.方差分析的目的是什么?單向方差分析的數(shù)據形式怎樣?(1)方差分析的目的就是同時對多于兩個的總體平均數(shù)有無顯著性差異作出檢驗。(2)單向方差分析的數(shù)據只有一個維度方面,在這個方向上可以分為k個總體水平。10.2.單向方差分析的步驟有哪些?(1)建立假設。H0:μ1=μ2=…=μk;H1:至少有一對μ不相等(2)計算各個離均差平方和。①求取總離均差平方和ss總公式為:②求取組內離均差平方和ss內,公式為:③求取組問離均差平方和,公式為:SS間=SS總一ss內(3)編制方差分析表,完成檢驗統(tǒng)計量的計算。(4)作統(tǒng)計結論。如果,各水平總體均數(shù)無顯著差異;如果,拒絕虛無假設,即各水平中至少有兩個水平的總體均數(shù)是有顯著差異的。10.3.如何判斷方差分析前提條件中,總體正態(tài)性和方差齊性是否得到滿足?(1)各子樣本所來自的總體是否正態(tài)性,從理論上講我們應該應用x2檢驗對數(shù)據作正態(tài)擬合性檢驗,只有檢驗確認各子樣本的總體服從正態(tài)分布,才能進行方差分析。但在實際工作中,如果根據以往的經驗可以判斷條件符合,也可以不作檢驗。(2)各子樣本的總體方差是否齊性,在有經驗信息時,可以根據經驗信息作出判斷,在無經驗信息或信息不足時,要作方差齊性檢驗,具體方法是用Hartley最大F值法:或k個總體方差齊性。:至少有一對不等,或k個總體方差非齊性。所有k個樣本方差中最大的方差與最小的方差之比:,然后查臨界值表確定總體方差是否齊性。論述題0.1.學習教育統(tǒng)計與測量有何意義?(1)教育統(tǒng)計與測量是教學科學管理的重要手段。我國教育正處在深刻的變革之中,一些重要教育現(xiàn)象和特別問題,都要通過統(tǒng)計調查加以分析研究,確定對策,改革措施的落實情況也要進行統(tǒng)計分析。因此科學地運用教育測量與統(tǒng)計手段,對改革和發(fā)展有重要促進作用。(2)教育統(tǒng)計與測量是教育研究的重要工具。要想認識教育現(xiàn)象的本質與規(guī)律,可以作定性的研究,也應作定量的分析。統(tǒng)計與測量就是強調實際,從事實資料出發(fā),專門來作深入的量的探討,通過量化分析來認識事物的本質與規(guī)律。(3)通過學習可以鍛煉思想方法,掌握專門化的術語和符號,提高科學素養(yǎng)。教育統(tǒng)計與測量學不僅要求我們善于處理確定性現(xiàn)象,更注重去處理隨機性現(xiàn)象;不但采用正面論證方法,而且十分重視使用反證法,通過證偽來求知;不僅力求用好數(shù)學手段來建立數(shù)學模型,還非常重視把這些數(shù)學形式的測量模型與認知心理學的實質理論結合起來。學習這些能很好地鍛煉我們的思想。同時,學習統(tǒng)計與測量,能夠使我們掌握專門化的統(tǒng)計語言,便于閱讀教育教研文獻。0.2.怎樣學好教育統(tǒng)計與測量?(1)切實下功夫掌握好基本概念和原理,弄懂內在的邏輯和方法、概念和原理是基礎,只有首先掌握它們,才能進行更深層次的學習。.(2)堅持理論聯(lián)系實際,認真做好練習,并力爭用新學知識來解決一些實際問題。一些基本計算方法和邏輯思想,必須通過實踐與練習才能掌握。(3)要重視掌握計算工具,特別是具備統(tǒng)計功能的計算器的使用,能給我們帶來很多的方便,而且計算也比手算更準確。1.1.試述簡單次數(shù)、相對次數(shù)、累積次數(shù)及累積相對次數(shù)的意義。(1)簡單次數(shù)是數(shù)據經過分組后,落在該組中的數(shù)據的個數(shù),各組簡單次數(shù)相加求和便是數(shù)據的總個數(shù)。(2)相對次數(shù)是一組數(shù)據的簡單次數(shù)與總次數(shù)(即數(shù)據總個數(shù))的比值,相對次數(shù)為小于l的小數(shù),各組相對次數(shù)之和為1。(3)累積次數(shù)分“以下”累積次數(shù)和“以上”累積次數(shù)。分別表示從該組數(shù)據向下或向上累加,所得的總次數(shù),都包括該組的次數(shù)。所得的總次數(shù)便是該組的“以下”或“以上”累積次數(shù)。(4)累積相對次數(shù)同累積次數(shù)意義基本相同,不同的是,累積相對次數(shù)累加的是相對次數(shù)而非簡單次數(shù)。累積相對次數(shù)也是小數(shù),累積的最終值是1;累積相對次數(shù)也分“以下”累積相對次數(shù)和“以上”累積相對次數(shù)。2.1.分析平均差與平均數(shù)兩者之間的區(qū)別。(1)意義不同。平均差是一個差異量數(shù),它表示的是一組數(shù)據的離散程度。它以平均數(shù)作為中心位置,求各個數(shù)據與平均數(shù)的平均距離,以表示數(shù)據的離散性。平均數(shù)是一個集中量數(shù),它表示一組數(shù)據的集中程度,算術平均數(shù)是最基本的特征量數(shù)。(2)計算方法不同。平均差的計算公式為:或。即各個數(shù)據與平均數(shù)差的絕對值求和,再除以數(shù)據個數(shù)。平均數(shù)分為算術平均數(shù)和加權算術平均數(shù)。算術平均數(shù)的計算公式:加權算術平均數(shù):(3)應用特點不同。平均差從平均的角度反映了各個數(shù)據偏離中心位置的整體差異程度,比較直觀,易于理解,科學性較強,實用性較好,在許多領域中得到廣泛應用。但是,平均差指標計算中含有絕對值計算,這種計算一方面不利于計算器來快速處理大批數(shù)據,另一方面不便于作進一步的代數(shù)運算和處理。平均數(shù)特別是算術平均數(shù)具有反應靈敏、確定嚴密、簡明易懂、概括直觀、計算簡便,并能作進一步代數(shù)運算等優(yōu)點,足應用最普遍的集中量數(shù)。因此在大多數(shù)情況下,人們喜歡使用平均數(shù)這一指標來代表一批數(shù)據或用它來反映大量事物的整體水平,但是算術平均數(shù)需要每一個數(shù)據都加入運算,因此在數(shù)據有個別缺失的情況下,無法準確計算。特別是算術平均數(shù)宜受極端數(shù)據影響。3.1.試述積差相關、等級相關、點雙列相關的聯(lián)系與區(qū)別。(1)聯(lián)系:①三種相關都可以描述兩列變量的相關情況。只是適用范圍不同。②描述積差相關的兩個變量,如各自排列等級后,亦可按等級相關求取相關系數(shù),但不夠精確,故能計算積差相關系數(shù)時,不計算按等級求得的相關系數(shù)。③按各種方法求得的相關系數(shù),其統(tǒng)計學意義相同。(2)區(qū)別:三種相關的區(qū)別主要表現(xiàn)在適用范圍上。①積差相關是一種應最普遍、最基本的相關分析方法,尤其適用于兩列連續(xù)變量的定量分析。②等級相關是在無法得到準確的連續(xù)變量數(shù)據時使用,計算時首先把非等級變量數(shù)據排成等級,按等級求兩列變量的相關。③點二列相關主要應用于求含稱名變量數(shù)據的相關系數(shù),變量中一列為稱名變量.另一列是與之對應的連續(xù)變量數(shù)據。4.1.百分等級常模與標準分數(shù)常模的異同。(1)相同點:由于不同測驗的原始分數(shù)不能直接比較,看不出那個更優(yōu)越,用百分等級常模和標準分數(shù)常模,可以把它們轉化成都沒有數(shù)量單位(米、千克、分等)的數(shù)字進行比較,以獲得有意義的資料。(2)不同點:①表示方法不同:百分等級常模用0~100的數(shù)字來表示,標準分數(shù)常模一般用-3.000~3.000的數(shù)字表示。②意義不相同:百分等級常模用小于該分數(shù)的人數(shù)或次數(shù)占總人數(shù)或次數(shù)的百分數(shù)來表示,標準分數(shù)的意義是某分數(shù)在同類群體中距平均數(shù)的遠近。③功能作用不完全相同:百分等級常模只用于比較,而不能求和;標準分數(shù)常模除了能比較不同測驗分數(shù)的優(yōu)劣之外,還能對不同測驗成績求和,獲取總成績。4.2.試述對標準分數(shù)進行線性變換的必要性。(1)一組分數(shù)中,總有不少的分數(shù)會比平均數(shù)小,所以轉換成z值后有不少負值。(2)由于全組分數(shù)的z值,常會落在六個標準差r離平均數(shù)正負、各三個標準差)范圍之內,要精確地標明其位置,z值的數(shù)字形式還必須帶有多位小數(shù)。(3)帶負號和多位小數(shù)的數(shù)字,對一般學校師生和社會公眾來說,很不好理解,甚至可能引起誤解,所以不方便使用。基于以上三條原因,需要對標準分數(shù)變換形式而不改變實質,線性變換實現(xiàn)了這種可能性。5.1試述什么是測驗項目的恰當難度分布。(1)一般的標準化常模測驗,目的是盡可能地把握住被試的個別差異,即希望測驗后所有被試的分數(shù)“盡可能地拉開距離”,這樣測驗項目的恰當難度就應該盡量使p值接近0.50,而其難度分布,就是圍繞p:O.50這個點,盡量作窄全距分布。同時考慮到希望在考試開始時施測一些低難度試題,末尾測驗一些高難度試題。因此,測驗項目的難度分布在o.40至0.60之間或0.30至0.70之間較合適。(2)有一些測驗,其目的是要考察被試水平是否達到應有要求。故此,測驗項目的難度,便由測驗項目的考核要求是否體現(xiàn)了應有標準來決定。相應地其難度分布便應根據實際需要使P由高到低分布。(3)還有一些測驗,如篩選性測驗,其目的是要在一特定水平點上,把被試分成兩組,即高于這一水平的組和低于這一水平的組,這樣的測驗的難度分布應該是對處在劃界點(決斷點)上的被試來說,通過率為0.50。因此,此類篩選測驗,其項目就應針對劃界點(決斷點)水平來確定恰當難度和恰當難度分布。6.1.試述常模參照測驗與標準參照測驗的主要差異,及兩者的共同點?(1)主要有如下一些差異:①常模參照測驗通常是一種相對評分,采用相對等級分數(shù)、百分等級分數(shù)或標準分數(shù)體系,說明的是被試在某一被試團體中的相對地位;而標準參照測驗的成績通常是一種絕對評分,采用卷面分數(shù),或者參照既定標準下的等級評定分數(shù),或者答對題目的百分比(即掌握百分比),說明的是被試達成某一教學目標,或掌握某一范圍內的知識技能的實有程度。②常模參照測驗在設計意圖上比較強調對個體能力的區(qū)分鑒別,因而在題目的難度方面多為中等而不用偏難或偏易的題目,以增加測驗的區(qū)別功能和選拔功能;而標準參照測驗在設計意圖上考慮的是測驗內容抽樣是否良好地代表一組既定的能力標準或既定的教學目標,在此理念支配下,題目難度要與既定的學習任務相匹配,而不管題目是否偏易還是偏難。③常模參照測驗通常涉及更Jr“泛的、難以明確限定的學習內容與能力目標,對每一項能力或目標一般只用少量題目加以測量;而標準參照測驗相對來說,測驗內容集中在限定的學習任務上,對每一項學習任務或目標通常用較多數(shù)量的題目來測量,在許多情況下,測驗分數(shù)要針對各個具體的目標能力進行分項解釋。(2)常模參照測驗和標準參照測驗之間也有許多共同之處:①它們都以所學過的教學內容為命制題目的素材;②它們都使用大體相同的題目類型;③它們都需要講究題目的質量(如信度和效度等);④它們通常都有相同的答題方式和評分準則;⑤它們通常都以相同的方式來安排題目構成試卷等。6.2.選擇題在知識能力測驗中的優(yōu)點和局限性?(1)優(yōu)點。①選擇題不僅可以準確地測量簡單學習結果,而且可以測量理解、運用、分析及綜合等領域中更為復雜的高級學習成就。②選擇題兼具其他幾種客觀題型的優(yōu)點,同時還克服了其他客觀題型的缺點。如它避免了簡答題經常存在的題意不清的缺陷,克服了是非題的簡單判斷所帶來的過高的猜測概率。③選擇題答題方式簡便,在單位時間內可以考查更廣泛的學習內容范圍,提高測驗效率。④選擇題題型規(guī)范,答題方式可以采用專用答題卡和特殊型號的鉛筆,因而它適合于考試機器評分,提高了評分的效率與準確性,能有效控制閱卷者的評分誤差,確保了評分的客觀性。⑤選擇題采用大量似真的誘惑選項,這給教師分析學生的理解錯誤與學習困難提供易于診斷的線索,因而在診斷性學業(yè)成就測驗中廣泛采用精心編制的選擇題型。(2)局限性。①選擇題只要求學生識別與選擇正確答案,因而不太適合測量諸如數(shù)學和自然科學領域許多需要解題技巧,展示學生思維過程及特點方面的學習成就。②選擇題只要求學生識別與選擇正確答案,因而,減少了對學生自己回憶與自己提供正確答案方面的學習要求,這可能會削弱對低年級學生鞏固知識以及掌握各學科基本知識方面的要求。③選擇題的解題思路要求歸一與歸真,因此選擇題既不能考查學生組織與表達自己觀點的能力,也不能考查學生的思維發(fā)散力與創(chuàng)造力。④選擇題在編題時,要求技巧性較高,特別是要考查學生的分析綜合等方面的高級學業(yè)成就時,不僅在題目內容取材與表達方面需要精心思考,而且要編出若干個似是而非的、具有同樣強的迷惑作用的干擾項,確實需要花費更多的智慧與精力。因而,編制選擇題需要專門技能和創(chuàng)造性。6.3.請聯(lián)系實際談談心理測驗在學校教育領域的應用。人的心理發(fā)展存在著明顯的個別差異,青少年時期是人的心理形成與發(fā)展的關鍵時期,為了提高教育水平與質量,需要對學生個體間的差異進行了解,并結合實際引導學生朝健康方向發(fā)展,具體來說:(1)把心理學方法同傳統(tǒng)的德育工作方法相結合,可以更有效地收集學生的心理資料,建立學生心理檔案,了解學生心理特點和個別差異,發(fā)現(xiàn)與預測行為有問題者,進行及早預防。還可以了解學生群體在特定社會環(huán)境下的道德認識、學習態(tài)度和心理癥結等。(2)通過心理測驗,可以了解與評估學生的能力結構及發(fā)展水平,探測學生的職業(yè)傾向,為學生樹立自己的人生理想提供心理支持;同時,可以開發(fā)學生潛能天賦,在學生升學就業(yè)時,起到一定的指導作用;對一些學生針對某門學科所出現(xiàn)的學習困難或不適應,可以通過適當?shù)男睦頊y驗進行有效地分析、診斷和輔導幫助。(3)通過心理測驗方法,了解特殊學生個體在特定環(huán)境下的心理問題,包括人際關系緊張、神經官能癥、焦慮、認知障礙、情感障礙、人格障礙以及精神性疾病等。具體來說,例如新生開學的不適應、早戀、同學關系不融洽、考試恐懼等,這些心理問題,可以通過全面的健康教育和心理輔導,以及個別化心理咨詢與心理治療得到改善與解決,為學生正常的學習和健全的人格提供保障。6.4.如何編制和評價一個命題雙向細目表。(1)編制命題雙向細目表主要有如下步驟:①確定考試內容要目,并把它們排列在表中最左一欄上。有兩種方法:一是按教材章節(jié)名稱排列;二是根據教學內容知識塊排列。②界定該科目要考查的掌握目標層次,并把這些目標層次從低級到高級依次安排在表中頂端第一行格子上。③確定各項考試內容要目下的分數(shù)比重。④把每項考試內容的分數(shù)比重,逐一分配到若干必要的考查目標即掌握層次上去,形成網格的分數(shù)分配方案,即命題雙向細目表。(2)評價一個命題雙向細目表,從以下幾方面著手進行:①看該命題細目表是否以教學大綱或考試大綱為依據,是否能清晰地反映出考試大綱或教學大綱的要求。②考察該表是否易于命題操作,各考核項的分數(shù)比例是否合理。③看該命題雙向細目表的形式是否能確切地與考核內容相適應,即能否靈活地編制命題雙向細目表。7.1.分層抽樣方法和分階段抽樣方法有什么異同?(1)相同點:①兩種抽樣方法都是隨機抽樣方法;②兩種方法都含有簡單隨機抽樣的成分,在層內或階段內部的抽樣是簡單隨機抽樣;③它們的目的都是為了使所抽樣本更好的代表總體,而不致使樣本有所偏頗。(2)不同點:主要表現(xiàn)在適用的總體特征上的不同:分層抽樣方法適用的總體的特征是:總體分成若干個部分,各部分元素之間差異較大。如果按照簡單隨機抽樣,某些容量較小的部分將會沒有元素人樣,而這些元素與其他部分的元素在質上有較大差異,沒有這些元素將失去樣本對總體的代表性。分階段抽樣,適用的總體的特征是:總體之下雖有部分之別,其間卻無明顯差異,但是“部分”的個數(shù)卻很多。如果所抽樣本的容量較小,應采用分階段抽樣,第一階段,按簡單隨機抽樣方法對“部分”抽樣,抽出一些“部分”進入第二階段的抽樣,第二階段是對這些第一階段抽出的“部分”的元素做簡單隨機抽樣,最終形成所需樣本。7.2.試述你對t分布有哪些認識?t分布又叫學生氏分布,它與正態(tài)分布一樣,也是一個單峰對稱呈鐘形的分布,其對稱軸通過分布的平均數(shù),t分布曲線在正負兩個方向上以橫軸為它的漸近線,t分布曲線中間低而尖峭,兩頭高而平緩。t分布的最大特點是其實質是一族分布,每一個t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論