版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
教育統(tǒng)計(jì)與測(cè)量學(xué)原理第一頁(yè),共七十九頁(yè),編輯于2023年,星期日教育統(tǒng)計(jì)與測(cè)量學(xué)原理學(xué)習(xí)教育統(tǒng)計(jì)與教育測(cè)量的重要意義1、教育統(tǒng)計(jì)和測(cè)量是認(rèn)識(shí)教育本質(zhì)的有力武器;2、是分析處理教育工作中各種數(shù)據(jù)資料、進(jìn)行教育督導(dǎo)與評(píng)價(jià)的有效工具;3、對(duì)教育管理科學(xué)化具有重要意義;4、是教育科學(xué)研究中,發(fā)現(xiàn)探索教育教學(xué)規(guī)律、指導(dǎo)教育教學(xué)實(shí)踐、為教育行政部門(mén)決策提供依據(jù)的重要思想方法;5、是黨和政府制定教育方針、政策以及認(rèn)清教育事業(yè)和整個(gè)國(guó)民經(jīng)濟(jì)發(fā)展關(guān)系的重要工具。第二頁(yè),共七十九頁(yè),編輯于2023年,星期日
第一部分:教育統(tǒng)計(jì)學(xué)一、概述
1、什么是教育統(tǒng)計(jì)學(xué)
2、教育統(tǒng)計(jì)學(xué)的歷史
3、教育統(tǒng)計(jì)學(xué)的內(nèi)容二、描述統(tǒng)計(jì)
1、常用的統(tǒng)計(jì)表、圖與統(tǒng)計(jì)量
2、相關(guān)分析
3、正態(tài)分布三、推斷統(tǒng)計(jì)
1、相關(guān)概念
2、總體平均數(shù)估計(jì)
3、平均數(shù)差異的顯著性檢驗(yàn)四、實(shí)驗(yàn)設(shè)計(jì)簡(jiǎn)介第三頁(yè),共七十九頁(yè),編輯于2023年,星期日一、概述教育統(tǒng)計(jì)學(xué)概念、發(fā)展歷史、內(nèi)容
1、概念:教育統(tǒng)計(jì)學(xué)就是運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法研究教育問(wèn)題的一門(mén)應(yīng)用科學(xué)。它是研究如何收集、整理、分析和解釋教育方面的數(shù)據(jù),從而表明教育上某些現(xiàn)象的特征及規(guī)律的一門(mén)科學(xué),它是處理教育實(shí)際工作和進(jìn)行教育研究以及提高管理質(zhì)量的科學(xué)水平、提高教育質(zhì)量的重要工具。
教育統(tǒng)計(jì)學(xué)的主要任務(wù):對(duì)教育現(xiàn)象進(jìn)行調(diào)查和實(shí)驗(yàn),在占有充分?jǐn)?shù)據(jù)資料的基礎(chǔ)上,經(jīng)過(guò)對(duì)數(shù)據(jù)的整理計(jì)算、統(tǒng)計(jì)分析和統(tǒng)計(jì)檢驗(yàn)等方法,對(duì)研究結(jié)果予以科學(xué)說(shuō)明。即從數(shù)量方面的研究,來(lái)探索教育和心理現(xiàn)象的發(fā)展變化的特征和規(guī)律,或根據(jù)研究結(jié)果的數(shù)據(jù)處理、統(tǒng)計(jì)推斷,做出正確決策。
第四頁(yè),共七十九頁(yè),編輯于2023年,星期日教育統(tǒng)計(jì)學(xué)概念、發(fā)展歷史、內(nèi)容
2、教育統(tǒng)計(jì)學(xué)發(fā)展史:教育統(tǒng)計(jì)學(xué)產(chǎn)生于上個(gè)世紀(jì)初,發(fā)展于五、六十年代,廣泛應(yīng)用于八十年代以后。(1)國(guó)外:20世紀(jì)初統(tǒng)計(jì)學(xué)傳入美國(guó),桑代克(E.L.Thorndike)為了達(dá)到“極力以心理學(xué)與統(tǒng)計(jì)學(xué)為工具研究教育學(xué),使教育科學(xué)化”的目的,1904年出版世界上第一本有關(guān)教育統(tǒng)計(jì)學(xué)的專(zhuān)著《心理與社會(huì)測(cè)量導(dǎo)論》。(2)國(guó)內(nèi):我國(guó)的教育統(tǒng)計(jì)學(xué)是在辛亥革命以后,隨著西方科學(xué)技術(shù)成就一起被引入。當(dāng)時(shí)的大學(xué)教育系和中等師范學(xué)校,都把教育統(tǒng)計(jì)學(xué)作為必修課程,很多學(xué)者撰寫(xiě)專(zhuān)著,如薛鴻志《教育統(tǒng)計(jì)方法》(1925)、王書(shū)林《教育測(cè)驗(yàn)與統(tǒng)計(jì)》(1935)等。1979年隨著全國(guó)教育科學(xué)規(guī)劃會(huì)議的召開(kāi),教育統(tǒng)計(jì)學(xué)恢復(fù)了新生,各師范大學(xué)又都開(kāi)設(shè)了教育統(tǒng)計(jì)學(xué)課程。教育部組織葉佩華、萬(wàn)梅亭、郝德元、陳一百等教授編寫(xiě)《教育統(tǒng)計(jì)學(xué)》作為全國(guó)通用教材。
經(jīng)過(guò)100多年的發(fā)展,各種教育統(tǒng)計(jì)方法已相當(dāng)豐富。但每一種方法的運(yùn)用在我國(guó)還處于推廣和適用階段,因此不少人對(duì)它的作用缺乏足夠的認(rèn)識(shí),特別是對(duì)復(fù)雜的教育問(wèn)題,由于統(tǒng)計(jì)方法本身的限制,還有十分重要的實(shí)驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)推斷的問(wèn)題不能在理論上得到有力解決,還有待于教育學(xué)家親自動(dòng)手來(lái)推進(jìn)統(tǒng)計(jì)理論和改進(jìn)統(tǒng)計(jì)工具。第五頁(yè),共七十九頁(yè),編輯于2023年,星期日教育統(tǒng)計(jì)學(xué)概念、發(fā)展歷史、內(nèi)容
3、教育統(tǒng)計(jì)學(xué)的內(nèi)容:教育統(tǒng)計(jì)學(xué)按應(yīng)用分為描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)、實(shí)驗(yàn)設(shè)計(jì)(多元統(tǒng)計(jì))三部分內(nèi)容。
(1)描述統(tǒng)計(jì)的主要作用就在于就所關(guān)心的教育現(xiàn)象進(jìn)行全面調(diào)查和觀測(cè),然后將所得的大量數(shù)據(jù)加以整理、簡(jiǎn)縮、制成圖表;或就這些數(shù)據(jù)的分布特征(如集中趨勢(shì)、離散趨勢(shì)、相關(guān)度等等)計(jì)算出具有概括性的數(shù)字作為標(biāo)志。借助這些概括性的數(shù)字,我們就可以從雜亂無(wú)章的數(shù)據(jù)中取得有意義的信息。
(2)推斷統(tǒng)計(jì)也叫抽樣統(tǒng)計(jì),它是在描述統(tǒng)計(jì)的基礎(chǔ)上發(fā)展起來(lái)的。是用抽樣的方法,根據(jù)部分?jǐn)?shù)據(jù)來(lái)推斷一般情況,即通過(guò)局部對(duì)全局的情況加以推斷的一種方法。它可以幫我們透過(guò)現(xiàn)象看到本質(zhì),對(duì)客觀現(xiàn)象作出本質(zhì)性的判斷,它是從樣本的研究中得出統(tǒng)計(jì)量。來(lái)推斷總體的有關(guān)特征,以便作出具體的措施和決策。常用的方法有:u檢驗(yàn)、t檢驗(yàn)、卡方檢驗(yàn)和非參數(shù)檢驗(yàn),還有多元分析中的主成份分析和因素分析等。(3)實(shí)驗(yàn)設(shè)計(jì)通常指實(shí)驗(yàn)程序的計(jì)劃和安排。而實(shí)驗(yàn)程序的計(jì)劃和安排離不開(kāi)統(tǒng)計(jì)和檢驗(yàn)。
第六頁(yè),共七十九頁(yè),編輯于2023年,星期日二、描述統(tǒng)計(jì)
第一章常用統(tǒng)計(jì)表、統(tǒng)計(jì)圖及統(tǒng)計(jì)量(一)常用統(tǒng)計(jì)表
1、統(tǒng)計(jì)表的結(jié)構(gòu):由標(biāo)題、項(xiàng)目(標(biāo)目)、數(shù)據(jù)、線(xiàn)條、表注(數(shù)據(jù)來(lái)源)組成
1983年我國(guó)普通中學(xué)教師學(xué)歷統(tǒng)計(jì)表
學(xué)歷人數(shù)百分比(%)
大學(xué)本科以上30088711.6
大專(zhuān)畢業(yè)56686321.8
中專(zhuān)畢業(yè)以下172975066.6
合計(jì)2596900100.0
注:引自《中國(guó)教育成就統(tǒng)計(jì)資料》,1984年人民教育出版社標(biāo)題項(xiàng)目線(xiàn)條
數(shù)據(jù)表注第七頁(yè),共七十九頁(yè),編輯于2023年,星期日二、描述統(tǒng)計(jì)
第一章常用統(tǒng)計(jì)表、圖及統(tǒng)計(jì)量數(shù)2、制表的一般要求A、統(tǒng)計(jì)表的內(nèi)容要簡(jiǎn)要,最好一個(gè)表說(shuō)明一個(gè)中心內(nèi)容。標(biāo)題的措詞要簡(jiǎn)明扼要,正確說(shuō)明內(nèi)容,使人一望便知。B、分項(xiàng)要準(zhǔn)確,以能說(shuō)明問(wèn)題為主,分項(xiàng)的好壞是決定統(tǒng)計(jì)表質(zhì)量的關(guān)鍵,切忌分項(xiàng)太細(xì)。C、數(shù)據(jù)是統(tǒng)計(jì)表的語(yǔ)言,說(shuō)明內(nèi)容,要求準(zhǔn)確,書(shū)寫(xiě)整齊,一律用阿拉伯?dāng)?shù)字,單位要統(tǒng)一,位數(shù)對(duì)齊,有效數(shù)字要一致,表格內(nèi)不能有空白。D、線(xiàn)條不要太多,表的上下端有頂線(xiàn)與底線(xiàn),左右兩邊不要用線(xiàn)封死,縱項(xiàng)目用細(xì)線(xiàn)格開(kāi),橫項(xiàng)目一律不畫(huà)線(xiàn)條,合計(jì)項(xiàng)目用粗線(xiàn)條或雙線(xiàn)與其它項(xiàng)目分開(kāi)。第八頁(yè),共七十九頁(yè),編輯于2023年,星期日(二)常用統(tǒng)計(jì)圖1、統(tǒng)計(jì)圖結(jié)構(gòu):圖題、圖目、圖尺、圖例、圖形、圖注人數(shù)
706050403020101980年1985年1991年某校近十年教師人數(shù)及性別變化圖示男女年份圖例圖形第一章常用統(tǒng)計(jì)表、統(tǒng)計(jì)圖及統(tǒng)計(jì)量圖目圖尺(制圖的尺度線(xiàn)。點(diǎn)、單位的總稱(chēng))圖題第九頁(yè),共七十九頁(yè),編輯于2023年,星期日2、統(tǒng)計(jì)圖的類(lèi)型及繪制要求繪制統(tǒng)計(jì)圖的要求A、根據(jù)數(shù)據(jù)和目的選擇合適的圖形B、圖形所表示的面積或距離要比例適當(dāng)C、表示不同的事物要用不同的顏色與線(xiàn)條類(lèi)型:1直條圖2圓形圖3曲線(xiàn)圖4直方圖講師42.9%助教28.8%教授0.4%某大學(xué)教師職稱(chēng)圖副教授21.9%某市7至18歲男女生身高比較圖1.751.701.651.601.551.501.451.40歲789101112131415161718米某校某班50名學(xué)生家庭背景情況比較
2015105人數(shù)其他農(nóng)工商企業(yè)職員公務(wù)與科教人員141615
5
2015105人數(shù)其他農(nóng)工商企業(yè)職員公務(wù)與科教人員141615
5(二)常用統(tǒng)計(jì)圖第十頁(yè),共七十九頁(yè),編輯于2023年,星期日
3、次數(shù)分布表與直方圖
對(duì)一批數(shù)據(jù)按一定次序排列并加以分組、編成反映這群數(shù)據(jù)在各組上出現(xiàn)次數(shù)的統(tǒng)計(jì)表和圖,就是次數(shù)分布表和直方圖。例:一次考試之后,某班48名學(xué)生的成績(jī)?nèi)缦拢?/p>
86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68
將該組數(shù)據(jù)整理成次數(shù)分布表與直方圖(二)常用統(tǒng)計(jì)圖*第十一頁(yè),共七十九頁(yè),編輯于2023年,星期日
1求全距:R=max{xi}-min{xi}用該組數(shù)據(jù)最大數(shù)減最小數(shù)
2定組數(shù)和組距:數(shù)據(jù)劃分組數(shù)、每組上下限之間距離(全距除以組數(shù))
3列組限:從最高分至最低分以組距為單位依次分組
4歸組劃記:計(jì)算數(shù)據(jù)出現(xiàn)次數(shù),并計(jì)算累積次數(shù)及相對(duì)次數(shù)
步驟:例:一次考試之后,某班48名學(xué)生的成績(jī)?nèi)缦拢?6,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68組限組中值劃記次數(shù)f累積次數(shù)∑f相對(duì)次數(shù)Rf累積相對(duì)次數(shù)∑Rf95908580757065605550459994898479746964595449225912763101
2491830374346474748
0.040.040.100.190.250.150.130.060.0200.020.040.080.180.370.620.770.900.960.980.981.00正正正正正正合計(jì)48481.00次數(shù)分布表
9792878277726762575247K=1.87(n-1)2/5第十二頁(yè),共七十九頁(yè),編輯于2023年,星期日14121086424550556065707580859095100次數(shù)分?jǐn)?shù)
直方圖第十三頁(yè),共七十九頁(yè),編輯于2023年,星期日(三)常用統(tǒng)計(jì)量-集中量數(shù)1、集中量數(shù):代表一組數(shù)據(jù)的集中趨勢(shì)和典型特征常用的有:平均數(shù)中數(shù)眾數(shù)第一章常用統(tǒng)計(jì)表、統(tǒng)計(jì)圖及統(tǒng)計(jì)量
(1)
平均數(shù)(算數(shù)平均數(shù))X1、X=(X1+X2+---+Xn)/n=(1/n)∑Xi
(原始數(shù)據(jù)公式)2、X=∑fxc/n(分組數(shù)據(jù)公式)xc:組中值f:次數(shù)3、X=(n1x1+n2x2+---+nkxk)/(n1+n2+---nk)(加權(quán)平均數(shù)公式)第十四頁(yè),共七十九頁(yè),編輯于2023年,星期日(2)中數(shù)(中位數(shù)):用Md表示,是在一組按大小順序排列的數(shù)據(jù)中位置居中的那個(gè)數(shù)。數(shù)據(jù)是奇數(shù)個(gè)時(shí),正好是中間位置的數(shù),即第(N+1)/2個(gè)那個(gè)數(shù);數(shù)據(jù)是偶數(shù)個(gè)時(shí),求中間位置兩個(gè)數(shù)的平均數(shù)。如:13679
Md=6;36792021Md=(7+9)/2=8(3)眾數(shù):用M0表示,是一組數(shù)據(jù)中次數(shù)出現(xiàn)最多的那個(gè)數(shù)。在眾數(shù)不明顯的情況下,一般可看眾數(shù)段,即哪個(gè)分?jǐn)?shù)段的次數(shù)多,就以該段中點(diǎn)值作眾數(shù)。一般用觀察法求得。眾中平眾中平平中眾
正態(tài)分布正偏態(tài)分布負(fù)偏態(tài)分布平均數(shù)、中數(shù)、眾數(shù)在數(shù)據(jù)常態(tài)分布中的相對(duì)位置第十五頁(yè),共七十九頁(yè),編輯于2023年,星期日2、差異量數(shù):全距平均差標(biāo)準(zhǔn)差
差異量數(shù)是描述次數(shù)分布中“離中趨勢(shì)”這一特征的統(tǒng)計(jì)量,簡(jiǎn)稱(chēng)“差異量”。一組數(shù)據(jù),若離中趨勢(shì)小,則集中量的代表性就大;反之,若離中趨勢(shì)大,則集中量的代表性就小。但是,僅考慮集中量數(shù)是不夠的。要了解兩組學(xué)生成績(jī)分布的全貌,還必須研究?jī)蓚€(gè)組的差異量數(shù)。最常用的差異量有全距、平均差和標(biāo)準(zhǔn)差。
(1)全距(符號(hào)為“R”),指一組數(shù)據(jù)中由最大量數(shù)到最小量數(shù)的距離。R小說(shuō)明離散程度小,比較整齊。
(2)平均差,指一組數(shù)據(jù)內(nèi)的每個(gè)數(shù)與均數(shù)差的絕對(duì)值的算術(shù)平均數(shù),通常用AD表示。平均差的計(jì)算公式為:
常用統(tǒng)計(jì)量-差異量數(shù)AD=(1/n)∑Xi-X或AD=(1/n)∑Xi-Md第十六頁(yè),共七十九頁(yè),編輯于2023年,星期日差異量數(shù)-方差與標(biāo)準(zhǔn)差
(3)、標(biāo)準(zhǔn)差:指一組數(shù)據(jù)中每一個(gè)數(shù)值與它們的平均數(shù)之差的平方的算術(shù)平均數(shù)的平方根,其符號(hào)為S(樣本標(biāo)準(zhǔn)差)、總體標(biāo)準(zhǔn)差用σ表示。S的計(jì)算公式為:
S越大表明離散程度越大,數(shù)據(jù)不均勻,集中量的代表性小。
方差與標(biāo)準(zhǔn)差除具有平均差的優(yōu)點(diǎn)之外,還具有受抽樣影響小和適于代數(shù)運(yùn)算等優(yōu)點(diǎn),是最優(yōu)良的差異量數(shù)。()()()()nxxxxxxxxSn2232221-++-+-+-=…
X
X1X22S2σ表示樣本方差表示總體方差第十七頁(yè),共七十九頁(yè),編輯于2023年,星期日標(biāo)準(zhǔn)差的應(yīng)用:變異系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)差的應(yīng)用-變異系數(shù)變異系數(shù)計(jì)算公式:主要用于:①同一團(tuán)體不同觀測(cè)值離散程度的比較;②對(duì)于水平相差較大,但進(jìn)行的是同一種觀測(cè)的各種團(tuán)體離散程度的比較。例:已知某小學(xué)一年級(jí)學(xué)生的平均體重為25千克,標(biāo)準(zhǔn)差是3.7千克,平均身高110厘米,標(biāo)準(zhǔn)差為6.2厘米,問(wèn)體重與身高的離散程度那個(gè)大?解:CV體重=3.7/25=14.8%
CV身高=6.2/110=5.64%答:通過(guò)比較差異系數(shù)可知,體重的分散程度比身高的分散程度大(14.8>5.64)。變異系數(shù)是一種相對(duì)差異量,常用cv表示第十八頁(yè),共七十九頁(yè),編輯于2023年,星期日標(biāo)準(zhǔn)差的應(yīng)用-標(biāo)準(zhǔn)分
標(biāo)準(zhǔn)分?jǐn)?shù)(又稱(chēng)Z分?jǐn)?shù))。它是一種以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的,表示一個(gè)分?jǐn)?shù)在團(tuán)體分?jǐn)?shù)中所處位置的量數(shù),其計(jì)算方法為:由原始分?jǐn)?shù)與平均分?jǐn)?shù)的差除以標(biāo)準(zhǔn)差所得的量數(shù),其符號(hào)為“Z”,計(jì)算公式是:標(biāo)準(zhǔn)分是以標(biāo)準(zhǔn)差為單位的,故稱(chēng)為標(biāo)準(zhǔn)分。它是一種相對(duì)地位分。標(biāo)準(zhǔn)分有正負(fù)之分,一般在[-3,3]中(幾率為99.74%),平均值為零。標(biāo)準(zhǔn)分可比性根據(jù)在于標(biāo)準(zhǔn)正態(tài)分布。
T分?jǐn)?shù):T=10Z+50(一般20≤T≤80)
E分?jǐn)?shù):E=20Z+90(一般30≤E≤150)第十九頁(yè),共七十九頁(yè),編輯于2023年,星期日例:有某生三次數(shù)學(xué)考試的成績(jī)分別為70、57、45,三次考試的班平均分為70、55、42,標(biāo)準(zhǔn)差分別為8、4、5。如何看待該生的三次考試成績(jī)?
答:如果僅從原始分?jǐn)?shù)看,肯定認(rèn)為第一次最好,其實(shí)不然,要計(jì)算出各次的標(biāo)準(zhǔn)分?jǐn)?shù),才能說(shuō)明問(wèn)題。根據(jù)公式得出:Z1=(70-70)/8=0Z2=(57-55)/4=0.5Z3=(45-42)/5=0.6這說(shuō)明,原始分?jǐn)?shù)為70,其位置正在平均線(xiàn)上,而原始分?jǐn)?shù)為57的,其位置在平均線(xiàn)上0.5處,而原始分?jǐn)?shù)為45的,其位置在平均線(xiàn)上0.6處。很顯然第三次成績(jī)最好,第一次最差。標(biāo)準(zhǔn)差的應(yīng)用-標(biāo)準(zhǔn)分第二十頁(yè),共七十九頁(yè),編輯于2023年,星期日標(biāo)準(zhǔn)分?jǐn)?shù):
運(yùn)用標(biāo)準(zhǔn)分比較不同教育測(cè)驗(yàn)成績(jī)總分的優(yōu)劣,更為合理。例:甲乙兩學(xué)生五科考試成績(jī)?nèi)缦?,試分析哪名學(xué)生成績(jī)好些?語(yǔ)文數(shù)學(xué)地理歷史政治合計(jì)70.014.080850.711.0785.03.590881.430.8655.04.057510.50-1.0042.05.045400.60-0.4070.08.0709002.503423543.243.03兩考生總成績(jī)標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算表
甲生乙生甲生乙生
科目XSXZ
如果按原始分?jǐn)?shù)乙生總分是354分優(yōu)于甲生的342分總分,但按標(biāo)準(zhǔn)分?jǐn)?shù)則甲生的3.24分優(yōu)于乙生的3.03分。標(biāo)準(zhǔn)差的應(yīng)用-標(biāo)準(zhǔn)分第二十一頁(yè),共七十九頁(yè),編輯于2023年,星期日二、描述統(tǒng)計(jì)相關(guān)分析:研究?jī)勺宰兞恐g的關(guān)系緊密程度的過(guò)程,統(tǒng)計(jì)學(xué)上稱(chēng)為相關(guān)分析。事物的變化總是伴隨著一定的量的變化,有些是單變量,有些是雙變量或多變量,也有些是復(fù)變量。集中量數(shù)和差異量數(shù)反映的是單變量數(shù)據(jù)特征,相關(guān)分析主要研究雙變量數(shù)據(jù)特征。我們都知道事物現(xiàn)象間的相互關(guān)系,如果從數(shù)量關(guān)系的角度考察,可分為函數(shù)關(guān)系和相關(guān)關(guān)系兩種類(lèi)型。相關(guān)關(guān)系可分為正相關(guān)、負(fù)相關(guān)、直線(xiàn)相關(guān)、曲線(xiàn)相關(guān)、完全相關(guān)(函數(shù)關(guān)系)、高度相關(guān)、低相關(guān)和零相關(guān)。如:教育經(jīng)費(fèi)的投入與教育事業(yè)發(fā)展規(guī)模和速度之間的關(guān)系是正相關(guān);復(fù)習(xí)次數(shù)與遺忘量之間的關(guān)系是負(fù)相關(guān)。相關(guān)分析的方法有二:一是圖示法,一為計(jì)算法。第二章相關(guān)分析圖示法:將兩組觀測(cè)值標(biāo)在坐標(biāo)系中●●●●●●●●●●●●●●●●曲線(xiàn)相關(guān)●●●●●●●●●●●直線(xiàn)相關(guān)第二十二頁(yè),共七十九頁(yè),編輯于2023年,星期日二、描述統(tǒng)計(jì)相關(guān)系數(shù):是描述兩組數(shù)據(jù)之間相關(guān)程度的量數(shù)種類(lèi)有:積差相關(guān)系數(shù)、等級(jí)相關(guān)、點(diǎn)二列相關(guān)和φ相關(guān)積差相關(guān)系數(shù)(皮爾遜系數(shù)):是描述來(lái)自正態(tài)總體兩個(gè)連續(xù)變量之間線(xiàn)性相關(guān)程度的一種相關(guān)量數(shù)r=[n∑xy-(∑x)(∑y)]/√[n∑X2-(∑X)2][n∑y2-(∑y)2]
相關(guān)系數(shù)的范圍:-1≤r≤1
當(dāng)r是正值時(shí)為正相關(guān);當(dāng)r是負(fù)值時(shí)為負(fù)相關(guān);r=0為零相關(guān)。通常1r≥0.70為高度相關(guān);0.70r≥0.40為較顯著相關(guān)
0.40≥r0為低相關(guān)。當(dāng)然在下結(jié)論時(shí)還要進(jìn)行顯著性檢驗(yàn)第二章相關(guān)分析對(duì)相關(guān)系數(shù)的解釋注意以下問(wèn)題:
A在小樣本中要做顯著性檢驗(yàn);B相關(guān)系數(shù)大小差異不是絕對(duì)的;C相關(guān)系數(shù)不是等距的不能進(jìn)行大小比較;D相關(guān)關(guān)系不一定是因果關(guān)系第二十三頁(yè),共七十九頁(yè),編輯于2023年,星期日第二章相關(guān)分析數(shù)學(xué)物理英語(yǔ)物理70757675606360638275657544605660525570559097859780894889r=0.91r=0.26例:數(shù)學(xué)與物理、物理與英語(yǔ)相關(guān)性比較第二十四頁(yè),共七十九頁(yè),編輯于2023年,星期日第三章正態(tài)分布
在社會(huì)、教育現(xiàn)象中大多數(shù)隨機(jī)變量都呈現(xiàn)是或近似正態(tài)分布的情形。正態(tài)分布是統(tǒng)計(jì)理論與統(tǒng)計(jì)應(yīng)用中最重要應(yīng)用最廣泛的一種分布。正態(tài)曲線(xiàn)的特點(diǎn)11.52.534.56X
Y0.80.60.40.20σ=0.8,μ=1.5、2.5、4.5二、描述統(tǒng)計(jì)
一個(gè)正態(tài)分布是由總體的平均數(shù)和總體的方差所決定的。1、正態(tài)曲線(xiàn)及其特點(diǎn)正態(tài)分布x~(μ,σ)的密度函數(shù)曲線(xiàn)2①正態(tài)曲線(xiàn)位于x軸上方,以x=μ
為對(duì)稱(chēng)軸,以x軸為漸近線(xiàn)②曲線(xiàn)的位置和形狀取決于μ
值和σ值
,μ決定位置,σ決定形狀。σ越大曲線(xiàn)越矮胖,σ越小曲線(xiàn)越陡峭
③x=μ時(shí)曲線(xiàn)處于最高點(diǎn),即當(dāng)x=μ時(shí)f(μ)=1/
√2σ為最大值
,曲線(xiàn)呈中間高兩邊低的形態(tài)。p正態(tài)曲線(xiàn)方程:f(x)=【1/(√2
●σ)】e-(x-μ)/2σ22其中:是園周率;e是自然對(duì)數(shù)的底;x為隨機(jī)變量的取值;μ為正態(tài)分布的均值;
σ為正態(tài)分布的方差。2pp第二十五頁(yè),共七十九頁(yè),編輯于2023年,星期日第三章正態(tài)分布2、正態(tài)分布曲線(xiàn)的重要性質(zhì):
-3σ-2σ-σ0σ2σ3σ
68.26%95.46%99.73%
從概率的角度而言:觀測(cè)數(shù)據(jù)落在(μ+1σ)內(nèi)的概率為68.26%;落在(μ+2σ)內(nèi)的概率為95.46%;落在(μ+3σ)內(nèi)的概率為99.73%。z=(x-μ)/σ標(biāo)準(zhǔn)正態(tài)分布x~(0,1)z、P的意義如:z=1時(shí)P=0.3413
z=2時(shí)P=0.4772
z=2.5時(shí)P=0.4938
z=3時(shí)P=0.4987第二十六頁(yè),共七十九頁(yè),編輯于2023年,星期日3、正態(tài)曲線(xiàn)理論的應(yīng)用(1)推求學(xué)生成績(jī)中某些分?jǐn)?shù)的人數(shù)
例:假定500個(gè)學(xué)生某科成績(jī)近似正態(tài)分布,其X=70,σ=10,試問(wèn)(1)75分以下有多少人(2)85分以上有多少人(3)75-85分之間有多少人。解:(1)z=(75-70)/10=0.5,查正態(tài)分布表中值為0.6915,因此75分以下的學(xué)生占69.15%,75分以下的人數(shù)是500X69.15%=346(人)
(2)z=(85-70)/10=1.5,查正態(tài)分布表中值為0.93319,85分以下的學(xué)生占93.319%,因此85分以上的學(xué)生占100%-93.319%=6.681%,所以85分以上的人數(shù)是500X6.681%=33(人)(3)75分至85分之間,實(shí)際上是75分以上至85分以下的范圍,因此85分的百分率減去75分以下的百分率即為所求93.319%-69.15%=24.169%500x24.169%=121(人)
-3σ-2σ-σ0σ2σ3σ
第二十七頁(yè),共七十九頁(yè),編輯于2023年,星期日正態(tài)曲線(xiàn)理論的應(yīng)用(2)推求某一特定百分率的成績(jī)界限
例:某縣對(duì)初一年級(jí)學(xué)生1000名學(xué)生進(jìn)行能力測(cè)驗(yàn),其結(jié)果為X=75,σ=10,現(xiàn)擬根據(jù)此次結(jié)果選取25名學(xué)生作為“尖子班”培養(yǎng),假定測(cè)驗(yàn)成績(jī)近似正態(tài)分布,問(wèn)多少分以上才能被選到“尖子班”學(xué)習(xí)。97.5%2.5%X1.96σ7594.6在正態(tài)分布表中查表中值0.975所對(duì)應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù),z=1.96,既是說(shuō)1000名學(xué)生中有97.5%的人數(shù)在標(biāo)準(zhǔn)分?jǐn)?shù)1.96以下,因此有2.5%的人數(shù)在標(biāo)準(zhǔn)分1.96以上,再將標(biāo)準(zhǔn)分?jǐn)?shù)1.96化為原始分?jǐn)?shù)得:
1.96X10+75=94.6(分)答:分?jǐn)?shù)在94.6分以上才能進(jìn)“尖子班”。分析:“尖子班”的人數(shù)占全年級(jí)的百分比為:25/1000=2.5%用標(biāo)準(zhǔn)分計(jì)算更容易理解:σxxZ-=Z=1.96=(x-75)/10X=1.96X10+75=94.6(分)第二十八頁(yè),共七十九頁(yè),編輯于2023年,星期日正態(tài)曲線(xiàn)理論的應(yīng)用(3)分析測(cè)驗(yàn)試題的難度例:某校學(xué)生在一次測(cè)驗(yàn)中,第一題的答對(duì)率為15%,第二題的答對(duì)率為25%,第三題的答對(duì)率為35%,假設(shè)這三題所測(cè)量的能力近似正態(tài)分布,問(wèn)1、2、3題的難度值各為多少?各題之間的難度差異怎樣?解:試題難度值比較表題號(hào)答對(duì)率答錯(cuò)率難度值難度差異
115%85%1.04225%75%0.670.37335%65%0.390.28在正態(tài)分布中,通常是根據(jù)答錯(cuò)率找出所對(duì)應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)界限值,此值即為該題的難度比值。由左表可知雖然三題的答對(duì)率都相差10%,但第二題與第三題的難度差異卻比第一題與第二題的難度差異要小。x0
0.650.750.85
0.390.671.04第二十九頁(yè),共七十九頁(yè),編輯于2023年,星期日三、推斷統(tǒng)計(jì)
教育現(xiàn)象和一切客觀物質(zhì)世界中的現(xiàn)象一樣,不僅存在質(zhì)的方面,同時(shí)也存在量的方面,而且這兩方面是辯證統(tǒng)一的。教育統(tǒng)計(jì)學(xué)就是在教育現(xiàn)象的質(zhì)與量中,專(zhuān)門(mén)研究其數(shù)量方面特征的重要工具。在建立了以概率論和抽樣方法為主要依據(jù)后,教育統(tǒng)計(jì)學(xué)便具有了以局部推知全體,以樣本資料推知總體性質(zhì)的科學(xué)推斷功能。根據(jù)樣本信息對(duì)總體參數(shù)狀況的推斷有兩種不同形式,既總體參數(shù)估計(jì)和假設(shè)檢驗(yàn),二者既有區(qū)別也有聯(lián)系。第三十頁(yè),共七十九頁(yè),編輯于2023年,星期日三、推斷統(tǒng)計(jì)
1、總體和樣本
所要研究對(duì)象的全體叫做總體。其中每一個(gè)研究對(duì)象叫做個(gè)體。從總體中抽取的一部分叫做總體的一個(gè)樣本,樣本中個(gè)體的數(shù)目叫做樣本容量。
例1:對(duì)家用電器質(zhì)量抽查,確定次品率。不能采用全部檢測(cè)的方法。例2:全市要檢查初中學(xué)生體育鍛煉達(dá)標(biāo)情況,對(duì)每名學(xué)生一一測(cè)試工作量很大,不僅耗費(fèi)人力、物力和時(shí)間,而且沒(méi)有必要。有沒(méi)有一種科學(xué)的方法只抽測(cè)一少部分學(xué)生,然后根據(jù)這部分學(xué)生的測(cè)試成績(jī)?nèi)ネ浦兄袑W(xué)生的體育達(dá)標(biāo)情況?
2、參數(shù)與統(tǒng)計(jì)量
總體參數(shù)是指一切由觀察測(cè)定總體的全部個(gè)體而得到的統(tǒng)計(jì)量數(shù)(μ,σ);樣本統(tǒng)計(jì)量是指為估計(jì)總體參數(shù)從樣本所得的統(tǒng)計(jì)(,s)。第一章相關(guān)概念第三十一頁(yè),共七十九頁(yè),編輯于2023年,星期日推斷統(tǒng)計(jì)4、抽樣方法3、隨機(jī)誤差樣本統(tǒng)計(jì)量與總體參數(shù)之間的差距。從某市參加高考的1200名學(xué)生中抽取200名試卷組成一個(gè)樣本,計(jì)算這200份試卷的平均分和標(biāo)準(zhǔn)差,這200份試卷的平均分和標(biāo)準(zhǔn)差與1200名考生的平均分和標(biāo)準(zhǔn)差是有差距的,不同的抽取帶來(lái)不同的差距,這種差距稱(chēng)之為隨機(jī)誤差。A、隨機(jī)抽樣(抽簽法、隨機(jī)數(shù)字法)B、機(jī)械抽樣C、分層抽樣D、整群抽樣抽取樣本應(yīng)遵循的原則。第一總體中每一個(gè)個(gè)體被抽中的機(jī)會(huì)均等,即抽中與抽不中純屬偶然;第二任一個(gè)體與其它個(gè)體在抽取時(shí)無(wú)聯(lián)帶關(guān)系,即抽中的個(gè)體與抽不中的個(gè)體無(wú)關(guān);第三在條件允許的情況下,盡量使樣本容量大一些。
5.小概率事
在隨機(jī)事件中,概率很小的事件被稱(chēng)為小概率事件,習(xí)慣上約定在0.05以下,即當(dāng)P(A)<5%時(shí),則稱(chēng)A為小概率事件。在統(tǒng)計(jì)推斷中認(rèn)為,小概率事件在一次試驗(yàn)或觀察中是不可能發(fā)生的。第三十二頁(yè),共七十九頁(yè),編輯于2023年,星期日
第二章
總體平均數(shù)的區(qū)間估計(jì)
(總體平均數(shù)的置信區(qū)間)
推斷統(tǒng)計(jì)的基本理論之一就是抽樣理論,而推斷統(tǒng)計(jì)的任務(wù)則是根據(jù)樣本資料來(lái)推斷總體的特征,從而揭示總體的本質(zhì)和規(guī)律。抽樣分布的幾個(gè)重要定理(統(tǒng)計(jì)推斷的理論依據(jù))
1.從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)。E(x)=μ
2.容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n的方根。
σx=σn√
3、從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能的樣本平均數(shù)的分布也呈正態(tài)分布。
4、雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。多個(gè)樣本平均數(shù)呈正態(tài)分布~N(μ,)xσn√第三十三頁(yè),共七十九頁(yè),編輯于2023年,星期日
第二章
總體平均數(shù)的區(qū)間估計(jì)
(總體平均數(shù)的置信區(qū)間)(一)、原總體的方差已知
樣本平均數(shù)的總體分布,在樣本容量很大時(shí)其分布近似于正態(tài)分布,樣本平均數(shù)分布的標(biāo)準(zhǔn)差為σ/√n,根據(jù)正態(tài)分布的性質(zhì)U=(X-μ)/σX
服從正態(tài)分布。對(duì)于給定的α值(0<α<1),則稱(chēng)(1-α)為置信度,可求出滿(mǎn)足P(U>Uα)=1-α。一般取α=0.01或α=0.05,對(duì)應(yīng)的U0.05=1.96U0.01=2.58。置信區(qū)間:α=0.05(x-1.96σ/√n,x+1.96σ/√n)為總體平均數(shù)95%的置信區(qū)間
α=0.01(x-2.58σ/√n,x+2.58σ/√n)為總體平均數(shù)99%的置信區(qū)間根據(jù)樣本平均數(shù)估計(jì)總體平均數(shù)的所在區(qū)間,稱(chēng)為總體平均數(shù)的區(qū)間估計(jì)?;驹恚喊匆欢ǜ怕室螅鶕?jù)樣本平均數(shù)估計(jì)總體平均數(shù)的所在區(qū)間。01-αα/2
α/2區(qū)間估計(jì)示意圖x-1.96σ/√nx+1.96σ/√n
x+1.96σ/√n
01-αα/2
α/2區(qū)間估計(jì)示意圖x-1.96σ/√nx+1.96σ/√n
01-αα/2
α/2區(qū)間估計(jì)示意圖x-1.96σ/√nx+1.96σ/√n
第三十四頁(yè),共七十九頁(yè),編輯于2023年,星期日(二)、原總體的方差未知
對(duì)于總體方差未知且容量n﹥30,則用S代σ相應(yīng)的有置信區(qū)間為:α=0.05(x-1.96S/√n,x+1.96S/√n)為總體平均數(shù)95%的置信區(qū)間
α=0.01(x-2.58S/√n,x+2.58S/√n)為總體平均數(shù)99%的置信區(qū)間例:從某地區(qū)高考初試的數(shù)學(xué)試卷中,隨機(jī)抽取40份,分析后得到如下數(shù)據(jù),平均成績(jī)?yōu)?1.2,標(biāo)準(zhǔn)差為3.8,問(wèn)這一地區(qū)初試數(shù)學(xué)平均成績(jī)?cè)谠鯓拥姆秶鷥?nèi)?答:已知X=51.2S=3.8n=40,本題屬于總體方差未知且大樣本n>30,
因此:置信區(qū)間的下限=51.2-1.96x3.8/√40=50
置信區(qū)間的上限=51.2+1.96x3.8/√40=52
這一地區(qū)初試數(shù)學(xué)平均成績(jī)有95%的可能性在(50,52)范圍內(nèi)。同理也可以計(jì)算出有99%的可能性在(49.6,52.7)范圍內(nèi)。第三十五頁(yè),共七十九頁(yè),編輯于2023年,星期日
三、推斷統(tǒng)計(jì)第三章顯著性檢驗(yàn)
平均數(shù)差異的顯著性檢驗(yàn)(Z檢驗(yàn)與t檢驗(yàn))一、顯著性檢驗(yàn)的基本思想顯著性檢驗(yàn)是統(tǒng)計(jì)推斷的一種方法,它是確定一個(gè)具有已知統(tǒng)計(jì)量的樣本是不是從已知對(duì)應(yīng)參數(shù)的總體中抽出來(lái)的或是兩樣本的統(tǒng)計(jì)量是來(lái)自同一總體還是來(lái)自不同的總體。或從另外的角度說(shuō),樣本統(tǒng)計(jì)量與總體參數(shù)的差異或兩個(gè)樣本統(tǒng)計(jì)量的差異究竟是由于抽樣所引起的隨機(jī)誤差,還是本質(zhì)上的誤差,這需要檢驗(yàn)才能加以確定。判斷這種差異是否顯著,要用概率來(lái)回答。如果差異是由于抽樣誤差而引起的可能性大,那末兩者的差異就不顯著,反之兩者的差異就顯著。抽樣誤差的概率大小是由顯著性水平來(lái)衡量的。通常采用的顯著性水平為0.05或0.01,如果P>0.05為差異不顯著;如果0.05≥P>0.01差異顯著;如果P<0.01則特別顯著。需要注意的是,顯著性檢驗(yàn)是以隨機(jī)樣本為前提的,以概率論原理為基礎(chǔ)的,所以進(jìn)行檢驗(yàn)時(shí)應(yīng)注意樣本的隨機(jī)性,以及樣本的可比性,觀測(cè)指標(biāo)的所有條件應(yīng)盡可能相同或基本相同。0
0.0250.025接受假設(shè)區(qū)域
0.95拒絕假設(shè)區(qū)域拒絕假設(shè)區(qū)域第三十六頁(yè),共七十九頁(yè),編輯于2023年,星期日
二、顯著性檢驗(yàn)的一般方法一般來(lái)說(shuō),統(tǒng)計(jì)檢驗(yàn)先對(duì)總體的分布規(guī)律作出某種假說(shuō),然后,根據(jù)樣本提供的信息,對(duì)假說(shuō)作出肯定或否定的決策。具體步驟為:①提出假設(shè)。如“假設(shè)兩個(gè)群體平均數(shù)沒(méi)有差別”,其數(shù)學(xué)符號(hào)為:“H0:μ1=μ2”,這種對(duì)群體所作的“無(wú)差別”的假設(shè),稱(chēng)為“零假設(shè)”或稱(chēng)虛無(wú)假設(shè),用符號(hào)“H0”表示。與此同時(shí)實(shí)際上存在第二種假設(shè),“兩個(gè)總體平均數(shù)有差別”,其符號(hào)為:“H1:μ1≠μ2”,稱(chēng)為備擇假設(shè)。顯然,“零假設(shè)”與“備擇假設(shè)”是兩個(gè)對(duì)立的假設(shè),肯定是此否定彼。②根據(jù)不同條件和樣本提供的信息即數(shù)據(jù),從零假設(shè)出發(fā),代入相應(yīng)的公式,計(jì)算出零假設(shè)的概率。③作出統(tǒng)計(jì)決斷,根據(jù)“小概率事件實(shí)際上不可能性”原理,研究H0成立的概率。如果H0的概率P>
0.05,表示零假設(shè)不是一個(gè)小概率事件,則H0成立,便否定被擇假設(shè)H1從而確定“μ1=μ2”。如果H0的概率p≤0.05,表明是個(gè)小概率事件H0不成立,就肯定備擇假設(shè)H1的成立,從而確定“μ1≠μ2”。
④結(jié)論:當(dāng)P>0.05時(shí)差異不顯著;當(dāng)0.01≤p≤0.05時(shí)差異顯著;當(dāng)P≤0.01時(shí)差異特別顯著。
三、推斷統(tǒng)計(jì)第三章顯著性檢驗(yàn)第三十七頁(yè),共七十九頁(yè),編輯于2023年,星期日推斷統(tǒng)計(jì)(顯著性檢驗(yàn))三、顯著性檢驗(yàn)的一般步驟:1、建立檢驗(yàn)假設(shè)(H0:=μ或μ1=μ2)2、選擇和計(jì)算統(tǒng)計(jì)量(z值或t值)3、確定P值4、判斷結(jié)果:當(dāng)P>0.05為差異不顯著接受檢驗(yàn)假設(shè)當(dāng)0.05≥P>0.01差異顯著拒絕檢驗(yàn)假設(shè)當(dāng)P≤0.01差異特別顯著拒絕檢驗(yàn)假設(shè)第三十八頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(Z檢驗(yàn))1、兩個(gè)獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)
Z檢驗(yàn)是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗(yàn)的方法。它是用標(biāo)準(zhǔn)正態(tài)分布的理論來(lái)推斷差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。
Z檢驗(yàn)公式:例1987年上海市初中三年級(jí)語(yǔ)文教學(xué)調(diào)查中,對(duì)男女生語(yǔ)文測(cè)試成績(jī)作如下統(tǒng)計(jì),試檢驗(yàn)?zāi)信Z(yǔ)文成績(jī)是否存在顯著差異,性別人數(shù)總分閱讀寫(xiě)作平均分標(biāo)準(zhǔn)差平均分標(biāo)準(zhǔn)差平均分標(biāo)準(zhǔn)差男167113.7420.9571.6415.1142.129.73女159118.5219.0974.8714.0144.438.83差值|Z|2.152.002.27抽取的兩個(gè)樣本均大于30,屬兩個(gè)獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn),用Z檢驗(yàn)。差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗(yàn)pz第三十九頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(Z檢驗(yàn))檢驗(yàn)步驟:①提出零假設(shè)z:H0:μ1=μ2即假定男女寫(xiě)作、閱讀及讀寫(xiě)總分均無(wú)顯著差異,現(xiàn)在的差異是抽樣誤差所致。②計(jì)算統(tǒng)計(jì)量,代人Z值公式0
0.0250.025接受假設(shè)區(qū)域
0.95拒絕假設(shè)區(qū)域拒絕假設(shè)區(qū)域差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗(yàn)pz第四十頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(Z檢驗(yàn))③計(jì)算出的Z值與下表進(jìn)行對(duì)照,作出判斷:|Z|P差異顯著性>1.96<0.05差異顯著>1.96<0.05差異顯著>1.96<0.05差異顯著
因?yàn)閨Z寫(xiě)|=2.27,顯然,|Z寫(xiě)|>1.96,表明概率P≤0.05,男女生寫(xiě)作成績(jī)差異顯著。因?yàn)閨Z讀|=2.00,顯然,|Z讀|>1.96,表明概率P≤0.05,男女生閱讀成績(jī)差異顯著。因?yàn)閨Z總|=2.15,顯然,|Z總|>1.96,表明概率P≤0.05,男女生語(yǔ)文成績(jī)差異顯著。④結(jié)論:當(dāng)P≤0.05時(shí),拒斥H0,肯定H1,1987年調(diào)查說(shuō)明上海市初三語(yǔ)文成績(jī)男女生存在顯著差異,女生高于男生。0
0.0250.025接受假設(shè)區(qū)域
0.95拒絕假設(shè)區(qū)域拒絕假設(shè)區(qū)域-1.961.96第四十一頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(t檢驗(yàn))2、小樣本與總體均數(shù)的差異檢驗(yàn)
t檢驗(yàn)是用于小樣本(樣本容量小于30)時(shí)的平均值差異程度檢驗(yàn)方法。它是用t分布理論來(lái)推斷差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。例某校初一年級(jí)抽出一組20人,對(duì)數(shù)學(xué)自學(xué)輔導(dǎo)教材進(jìn)行試驗(yàn),期末全年級(jí)測(cè)試平均成績(jī)?yōu)?0分,而這20人的平均分為=77.7,標(biāo)準(zhǔn)差為15,試檢驗(yàn)實(shí)驗(yàn)效果。本例隨機(jī)抽樣樣本容量為20人,屬小樣本,因此適用t檢驗(yàn)。所謂檢驗(yàn)實(shí)驗(yàn)效果,就是以樣本(20人)的平均數(shù)與某已知總體平均數(shù)μ之間的差異程度的顯著性檢驗(yàn),既檢驗(yàn)樣本所取自(所代表)的總體的平均數(shù)μ與μ0,是否有差異。t檢驗(yàn)公式:第四十二頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(t檢驗(yàn))檢驗(yàn)步驟:①提出零假設(shè):H0:μ=μ0,即假定樣本所代表的總體平均數(shù)與已知平均數(shù)無(wú)顯著差異,如有差異僅是抽樣誤差所致。本題μ0=70分②計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值。用如下公式式中,=樣本平均數(shù)77.7;μ0=已知總體平均數(shù)70;
s=樣本標(biāo)準(zhǔn)差15;n=樣本容量20,代人公式得第四十三頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(t檢驗(yàn))
③作出判斷。與正態(tài)分布曲線(xiàn)不同,t分布的曲線(xiàn)形式隨自由度大小而不同?!白杂啥取庇涀鳌癲f”。作總體平均數(shù)的假設(shè)檢驗(yàn)時(shí),統(tǒng)計(jì)量t的自由度df=n-1。據(jù)此,本題的df=20-1=19。查t值表,得出理論t值為:
t(19)0.05=2.093再與計(jì)算所得t值比較可得:t=2.24>t(19)0.05=2.093依據(jù)《t值與差異顯著性關(guān)系》表,推斷H0發(fā)生的概率,作出結(jié)論。
t值與差異顯著性關(guān)系tP差異顯著性<t(df)0.05>0.05差異不顯著≥t(df)0.05≤0.05差異顯著≥t(df)0.01≤
0.01差異十分顯著因?yàn)閠=2.31>t(df)0.05,從上表可知,概率P≤0.05時(shí),μ和μ0之間的差異顯著。因此可下結(jié)論為:拒斥H0:μ=μ0,而肯定H1:μ≠μ0,又因μ>μ0,故結(jié)論表明新教材實(shí)驗(yàn)有成效。第四十四頁(yè),共七十九頁(yè),編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(yàn)(t檢驗(yàn))
3、其它檢驗(yàn)公式
如果是按同一組樣本不同情況的測(cè)試所得的平均值1和2來(lái)檢驗(yàn)平均值的差異程度,其計(jì)算公式為:式中,D為兩次測(cè)試中每對(duì)分?jǐn)?shù)之差即D=X2-X1。對(duì)于兩個(gè)獨(dú)立的正態(tài)總體,如果已知兩總體方差相等但未知總體方差具體數(shù)值,從中各抽取一隨機(jī)樣本,兩樣本平均數(shù)之差將服從自由度為
的t
分布。其檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式
第四十五頁(yè),共七十九頁(yè),編輯于2023年,星期日實(shí)驗(yàn)設(shè)計(jì)簡(jiǎn)述實(shí)驗(yàn)設(shè)計(jì):實(shí)驗(yàn)者為了揭示實(shí)驗(yàn)中的自變量與因變量的關(guān)系,在實(shí)驗(yàn)之前所作的實(shí)驗(yàn)計(jì)劃,通常指實(shí)驗(yàn)程序的計(jì)劃和安排。而實(shí)驗(yàn)程序的計(jì)劃和安排離不開(kāi)統(tǒng)計(jì)、檢驗(yàn)。實(shí)驗(yàn)設(shè)計(jì)的內(nèi)容:包括怎樣選擇被試(實(shí)驗(yàn)對(duì)象),控制那些因素,指出什么假設(shè),觀察那些內(nèi)容,如何安排實(shí)驗(yàn)步驟,采取何種統(tǒng)計(jì)方法來(lái)處理和分析實(shí)驗(yàn)結(jié)果等等。第四十六頁(yè),共七十九頁(yè),編輯于2023年,星期日例:控制變量指示語(yǔ)(一)目的:通過(guò)把指示語(yǔ)作為自變量,觀察被試對(duì)反應(yīng)變量的不同影響,從而了解到不是以指示語(yǔ)為自變量的實(shí)驗(yàn)中控制指示語(yǔ)的重要性。(二)材料:數(shù)學(xué)試卷一份,馬表。(三)程序:1按全班被試的數(shù)學(xué)程度,分為數(shù)學(xué)能力相同的甲、乙兩組。
2主試僅向甲組被試著重指出:你們?cè)谶\(yùn)算時(shí)必須注意試題中數(shù)字之間的關(guān)系,余內(nèi)容兩者相同。
3主試說(shuō)明實(shí)驗(yàn)要求,發(fā)給各被試試題一張,覆置桌上。主試發(fā)“預(yù)備”口令時(shí),被試把題紙翻轉(zhuǎn)正面,寫(xiě)好姓名等項(xiàng),主試發(fā)“開(kāi)始”口令時(shí),同時(shí)開(kāi)動(dòng)馬表,被試答題。
4被試做完題目,立即停筆并問(wèn)得答題時(shí)間,記錄在試題紙上。
5全組做完,主試宣布答案,被試加以核對(duì),并記錄成績(jī),以便整理全組結(jié)果。(四)結(jié)果:1統(tǒng)計(jì)甲乙兩組的平均成績(jī)(做對(duì)題數(shù)和做題的時(shí)間)
2檢驗(yàn)兩組時(shí)間(或成績(jī))差異的顯著性(五)討論:1在本實(shí)驗(yàn)中,你是怎樣發(fā)現(xiàn)題目的規(guī)律的
2指導(dǎo)語(yǔ)在解題中所起作用如何第四十七頁(yè),共七十九頁(yè),編輯于2023年,星期日實(shí)驗(yàn)設(shè)計(jì)簡(jiǎn)述附:數(shù)學(xué)試題如下姓名——組別——時(shí)間——在下列各數(shù)列后的橫線(xiàn)上,填寫(xiě)你認(rèn)為應(yīng)該填寫(xiě)的數(shù)字(1)26101418————(2)31248192768————(3)8421————(4)31/4833/4————(5)455667————(6)38131823————(7)134679————(8)72503-2————(9)1346101222————(10)1222428————第四十八頁(yè),共七十九頁(yè),編輯于2023年,星期日第二部分教育測(cè)量學(xué)原理簡(jiǎn)介第一章教育測(cè)量概述一教育測(cè)量的含義與特點(diǎn)二教育測(cè)量發(fā)展的歷史三教育測(cè)量的要素和種類(lèi)四教育測(cè)量的功能及對(duì)教育測(cè)量應(yīng)持的態(tài)度第二章測(cè)驗(yàn)的信度、效度、難度與區(qū)分度一、測(cè)驗(yàn)的信度二、測(cè)驗(yàn)的效度三、測(cè)驗(yàn)的難度四、測(cè)驗(yàn)的區(qū)分度第三章測(cè)驗(yàn)的編制與實(shí)施一、確定測(cè)驗(yàn)?zāi)康亩?、教育目?biāo)分類(lèi)
三、編制測(cè)驗(yàn)雙向細(xì)目表四、試題的編制五、試題評(píng)分六、試卷的編輯與測(cè)驗(yàn)實(shí)施七、試卷分析第四章題型編制的一般原理與方法第四十九頁(yè),共七十九頁(yè),編輯于2023年,星期日第一章教育測(cè)量概述
一、教育測(cè)量的含義與特點(diǎn)
1、教育測(cè)量的含義測(cè)量(Measurement):通常指人們對(duì)客觀事物進(jìn)行某種數(shù)量化的測(cè)定。測(cè)量是以數(shù)量來(lái)表述結(jié)果的,沒(méi)有數(shù)量來(lái)表述的結(jié)果不能稱(chēng)為測(cè)量。
教育測(cè)量(EducationalMcasufement):就是對(duì)學(xué)生的學(xué)習(xí)能力、學(xué)業(yè)成績(jī)、興趣愛(ài)好、思想品德以及教育措施上許多問(wèn)題的數(shù)量化測(cè)定。
教育測(cè)量主要對(duì)學(xué)生精神特性的測(cè)定。凡物之存在必有其數(shù)量,凡有數(shù)量的東西都可以測(cè)量,測(cè)不準(zhǔn)原理。第五十頁(yè),共七十九頁(yè),編輯于2023年,星期日一、教育測(cè)量的含義與特點(diǎn)測(cè)量、測(cè)驗(yàn)、考試、評(píng)價(jià)的聯(lián)系與區(qū)別
測(cè)量與測(cè)驗(yàn):測(cè)驗(yàn)(Test)是引起某種行為的工具,通常是指運(yùn)用某些儀器、試題來(lái)引起人們的某種行為,從而測(cè)定人們的某種特性。它是進(jìn)行數(shù)量化分析和科學(xué)推斷的前提和手段。測(cè)量比測(cè)驗(yàn)的含義要廣泛,測(cè)量不僅包括著運(yùn)用儀器、試題來(lái)進(jìn)行測(cè)定事物的質(zhì)量與特性,而且還包括著運(yùn)用調(diào)查、觀察等方法來(lái)測(cè)量事物的質(zhì)量與特性,測(cè)量既包括對(duì)事物的測(cè)驗(yàn),又包含對(duì)事物進(jìn)行數(shù)量化的分析,并對(duì)測(cè)驗(yàn)結(jié)果進(jìn)行一定的解釋和評(píng)價(jià)。
測(cè)驗(yàn)與考試(Examination)也不盡相同。我們平時(shí)所說(shuō)的考試,通常只憑教師自己的經(jīng)驗(yàn)去出試題和評(píng)分,帶有主觀隨意性。測(cè)驗(yàn)是經(jīng)過(guò)較細(xì)致的科學(xué)分析才編制出測(cè)驗(yàn)的題目,在測(cè)驗(yàn)的程序和評(píng)分方面也有較嚴(yán)格的要求??荚囈话阌糜诳己藢W(xué)生的學(xué)業(yè)成績(jī),測(cè)驗(yàn)不僅用于考核學(xué)生的學(xué)業(yè)成績(jī),還用于心理特性的測(cè)量。
測(cè)量與評(píng)價(jià)(Evalution)既有聯(lián)系,也有區(qū)別。測(cè)量強(qiáng)調(diào)的是數(shù)量化,評(píng)價(jià)則是突出價(jià)值觀,充分重視對(duì)問(wèn)題的分析與評(píng)斷。第五十一頁(yè),共七十九頁(yè),編輯于2023年,星期日一、教育測(cè)量的含義與特點(diǎn)2、教育測(cè)量的特點(diǎn)
(1)教育測(cè)量一般是間接測(cè)量我們只能通過(guò)學(xué)生對(duì)測(cè)驗(yàn)題目的反應(yīng)和一些行為表現(xiàn)運(yùn)用推理、判斷的方法,來(lái)間接的測(cè)量出他們的知識(shí)水平、智力高低和品德好壞。(2)教育測(cè)量的度量單位是相對(duì)的學(xué)生的學(xué)業(yè)成績(jī)好壞、智力高低和能力大小等,都是就其在所在團(tuán)體的整個(gè)分?jǐn)?shù)序列、行為序列中的地位來(lái)說(shuō)的,其測(cè)量的分?jǐn)?shù)單位,并非絕對(duì)的。
(3)教育測(cè)量是為實(shí)現(xiàn)教育目的服務(wù)的是為改進(jìn)教育工作,提高教育質(zhì)量,更好地實(shí)現(xiàn)教育目的服務(wù)的。不能脫離教育目的和教材的要求,隨意地制定測(cè)驗(yàn)量表,任意地進(jìn)行測(cè)量。對(duì)各種教育測(cè)量結(jié)果的評(píng)價(jià),也都應(yīng)依據(jù)教育目的的要求來(lái)進(jìn)行。第五十二頁(yè),共七十九頁(yè),編輯于2023年,星期日第一章教育測(cè)量概述
二、教育測(cè)量發(fā)展的歷史主觀經(jīng)驗(yàn)性考試階段(1864年以前)
教育測(cè)量起源于我國(guó)的科舉考試制度。
客觀標(biāo)準(zhǔn)化測(cè)驗(yàn)階段(1864一1940年)
法國(guó)的比納、西蒙,美國(guó)的推孟、桑戴克、麥柯?tīng)柋燃{被稱(chēng)為智力測(cè)量的鼻祖,桑戴克被稱(chēng)為教育測(cè)量學(xué)的鼻祖客觀測(cè)驗(yàn)的深入發(fā)展階段(1940年-)
過(guò)去教育測(cè)量多為對(duì)學(xué)生知識(shí)的測(cè)量,很少測(cè)量學(xué)生的心理和品德。現(xiàn)在的教育測(cè)量,不僅重視測(cè)量學(xué)生的知識(shí),而且重視學(xué)生的智力和思想品德的測(cè)量。過(guò)去教育測(cè)量的量表編制多為單一答案的求同式思維,缺乏多種答案的求異式思維,現(xiàn)在教育測(cè)量的量表中,也包括有多種答案的求異式思維題和論文題。過(guò)去教育測(cè)量多用于對(duì)學(xué)生的學(xué)習(xí)成績(jī)的測(cè)量,很少涉及課程設(shè)置、教材、教育改革方案等效益方面的測(cè)量,現(xiàn)在在教育工作的各個(gè)方面都運(yùn)用教育測(cè)量。過(guò)去教育工作中的客觀測(cè)驗(yàn),一般是常模參照測(cè)驗(yàn),現(xiàn)在教育工作中的客觀測(cè)驗(yàn),不僅有“常模參照性測(cè)驗(yàn)”,而且有“目標(biāo)參照性測(cè)驗(yàn)”。第五十三頁(yè),共七十九頁(yè),編輯于2023年,星期日
第一章教育測(cè)量概述
三、教育測(cè)量的要素和種類(lèi)單位
教育測(cè)量中的單位不是絕對(duì)等價(jià)值的
參照點(diǎn)
教育測(cè)量的參照點(diǎn)都屬于人為設(shè)定,從參照點(diǎn)起計(jì)算的分?jǐn)?shù)不能以“倍數(shù)”的方式解釋
量表
具有單位和參照點(diǎn)的連續(xù)體。
教育測(cè)量所使用的量表有四種:百分量表、年齡量表、等級(jí)量表、T量表
2、教育測(cè)量的種類(lèi)
以測(cè)量的對(duì)象來(lái)分:學(xué)業(yè)成績(jī)測(cè)驗(yàn)、智力測(cè)驗(yàn)、人格測(cè)驗(yàn)、特殊能力測(cè)驗(yàn)
以測(cè)量的目的來(lái)分:預(yù)測(cè)測(cè)驗(yàn)、形成性測(cè)驗(yàn)、總結(jié)性測(cè)驗(yàn)、診斷性測(cè)驗(yàn)、難度測(cè)驗(yàn)、速度測(cè)驗(yàn)
以測(cè)量的方式來(lái)分:個(gè)人測(cè)驗(yàn)、團(tuán)體測(cè)驗(yàn)以試題的形式來(lái)分:客觀性測(cè)驗(yàn)、論文式測(cè)驗(yàn)、投射測(cè)驗(yàn)、情景測(cè)驗(yàn)
1、教育測(cè)量的要素第五十四頁(yè),共七十九頁(yè),編輯于2023年,星期日第一章教育測(cè)量概述
四、教育測(cè)量的功能及對(duì)教育測(cè)量的認(rèn)識(shí)態(tài)度1、教育測(cè)量的功能教育測(cè)量是改進(jìn)教學(xué)的良好工具教育測(cè)量是教育管理的重要手段教育測(cè)量是教育研究的重要方法2、對(duì)教育測(cè)量應(yīng)有的認(rèn)識(shí)態(tài)度教育測(cè)量是一種工具教育測(cè)量尚需完善對(duì)教育測(cè)量應(yīng)持嚴(yán)肅的態(tài)度第五十五頁(yè),共七十九頁(yè),編輯于2023年,星期日教育測(cè)量學(xué)原理第二章測(cè)驗(yàn)的信度、效度、難度與區(qū)分度
測(cè)驗(yàn)的信度、效度、難度與區(qū)分度是衡量測(cè)量質(zhì)量的基本標(biāo)準(zhǔn)作為教育測(cè)量的工具——測(cè)驗(yàn),它的編制是一項(xiàng)十分復(fù)雜的工作,它需要懂得一些教育測(cè)量基本知識(shí)和基本方法的人來(lái)完成。一個(gè)連信度、效度、難度和區(qū)分度等教育測(cè)量基本概念都不甚了解的人是難以編出高質(zhì)量的測(cè)驗(yàn)的。從教育測(cè)量的理論上來(lái)講,一個(gè)良好的測(cè)驗(yàn)應(yīng)該具備以下條件:
測(cè)驗(yàn)的試題與測(cè)量的目標(biāo)吻合測(cè)驗(yàn)的試題應(yīng)具有代表性測(cè)驗(yàn)的試題有恰當(dāng)?shù)碾y度和區(qū)分度測(cè)驗(yàn)的試題的語(yǔ)言陳述簡(jiǎn)單、明確測(cè)驗(yàn)的結(jié)果有效和可靠(即效度、信度高)測(cè)驗(yàn)的實(shí)施符合經(jīng)濟(jì)性原則其中測(cè)驗(yàn)的信度、效度、難度和區(qū)分度是衡量測(cè)驗(yàn)質(zhì)量的基本指標(biāo)。第五十六頁(yè),共七十九頁(yè),編輯于2023年,星期日測(cè)驗(yàn)的信度、效度、難度與區(qū)分度
一、信度(reliability)
所謂測(cè)驗(yàn)的信度是指測(cè)驗(yàn)的可靠性或者可靠程度。具體地說(shuō),測(cè)驗(yàn)的信度是指同一組學(xué)生用同一測(cè)驗(yàn)實(shí)施兩次后所得分?jǐn)?shù)的一致性,或者同一組學(xué)生經(jīng)過(guò)一次測(cè)驗(yàn)后,用另一個(gè)同質(zhì)的測(cè)驗(yàn)再測(cè)一次,這兩次測(cè)驗(yàn)所得分?jǐn)?shù)的一致性。根據(jù)統(tǒng)計(jì)學(xué)的基本原理,刻劃測(cè)驗(yàn)的信度有三種方法:
①穩(wěn)定性系數(shù)穩(wěn)定性系數(shù)的求法是:先對(duì)某個(gè)測(cè)驗(yàn)實(shí)施一次,過(guò)了一段時(shí)間后。再用這個(gè)測(cè)驗(yàn)實(shí)施一次,然后計(jì)算學(xué)生在前后再次測(cè)驗(yàn)中所得分?jǐn)?shù)的相關(guān)系數(shù)。這個(gè)相關(guān)系數(shù)就是穩(wěn)定性系數(shù)。
②等值性系數(shù)等值性系數(shù)的求法是:等值性系數(shù)是以?xún)蓚€(gè)等值(題型、題數(shù)、難度、區(qū)分度相等)但具體內(nèi)容不同的量表,在最短時(shí)距內(nèi),對(duì)相同應(yīng)試者先后施測(cè)兩次的兩組對(duì)應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。
③內(nèi)部一致性系數(shù)
內(nèi)部一致性系數(shù)的求法是:將一個(gè)測(cè)驗(yàn)分?jǐn)?shù)分為兩個(gè)相等而獨(dú)立的部分(例如奇數(shù)題和偶數(shù)題),然后求兩者的相關(guān)系數(shù)。對(duì)于這個(gè)相關(guān)系數(shù),再用斯皮爾曼-布朗公式r信=2r/1+r來(lái)校正。其中r是相關(guān)系數(shù),r信就是內(nèi)部一致性系數(shù)。第五十七頁(yè),共七十九頁(yè),編輯于2023年,星期日測(cè)驗(yàn)的信度、效度、難度與區(qū)分度
在前述三種類(lèi)型的信度系數(shù)中,前兩個(gè)都要學(xué)生接受同一(或同質(zhì))內(nèi)容的兩次測(cè)驗(yàn),這在實(shí)際的中小學(xué)教育過(guò)程中是不現(xiàn)實(shí)的。因此,在中小學(xué)教育或從事教育科學(xué)研究的過(guò)程中,信度系數(shù)的計(jì)算一般以?xún)?nèi)部一致系數(shù)為主。測(cè)驗(yàn)的信度是十分重要的,不可靠的測(cè)驗(yàn)是沒(méi)有什么意義的,如用一桿秤去稱(chēng)肉,第一次稱(chēng)的的重量是1500克,第二次稱(chēng)得的重量是1000克,那么這種秤還有什么用呢?教育測(cè)量也是如此,如用一次去測(cè)量學(xué)生的數(shù)學(xué)學(xué)業(yè)水平,第一次測(cè)驗(yàn)的成績(jī)是92分,第二次測(cè)驗(yàn)的成績(jī)卻只有61分,這樣就無(wú)法確定這個(gè)學(xué)生的數(shù)學(xué)學(xué)業(yè)水平。當(dāng)然,這個(gè)測(cè)驗(yàn)是根本不可靠的。就測(cè)驗(yàn)的內(nèi)容而言,學(xué)業(yè)成績(jī)測(cè)驗(yàn)要求信度系數(shù)在0.9以上,常達(dá)到0.95;智力測(cè)驗(yàn)應(yīng)達(dá)到0.85以上;個(gè)性測(cè)驗(yàn)和興趣測(cè)驗(yàn)稍低,應(yīng)在0.7~0.8.第五十八頁(yè),共七十九頁(yè),編輯于2023年,星期日測(cè)驗(yàn)的信度、效度、難度與區(qū)分度
提高測(cè)驗(yàn)信度的方法:①延長(zhǎng)測(cè)驗(yàn)的長(zhǎng)度。量表題目越少,得分越容易受試題抽樣的偶然因素影響,當(dāng)然測(cè)驗(yàn)的信度也越低。新增加的試題必須與原試題同質(zhì)(平均難度一樣)且不使被試感到厭倦。②測(cè)驗(yàn)的難度要適中,同一測(cè)驗(yàn)中的試題難度水平接近。③施測(cè)內(nèi)容盡量單一。不要妄圖在一次測(cè)驗(yàn)中測(cè)量被試的所有能力,信度很低。④測(cè)驗(yàn)的時(shí)間要充分,使被試從容回答問(wèn)題。⑤測(cè)驗(yàn)的程序要統(tǒng)一。進(jìn)行多次測(cè)驗(yàn),開(kāi)始時(shí)的指導(dǎo)語(yǔ)、回答問(wèn)題方式、分發(fā)收回試卷的辦法、時(shí)間掌握都要盡量一致。⑥評(píng)分要客觀??陀^性測(cè)驗(yàn),評(píng)分標(biāo)準(zhǔn)明確有助于提高測(cè)驗(yàn)的信度。主觀性試題,受偶然因素影響大,往往評(píng)分者的“量尺”不統(tǒng)一,信度差。⑦加大應(yīng)試者之間的差異。因?yàn)樾哦认禂?shù)的大小與實(shí)得分?jǐn)?shù)成正比,加大被試能力的差異可提高信度。2σ第五十九頁(yè),共七十九頁(yè),編輯于2023年,星期日測(cè)驗(yàn)的信度、效度、難度與區(qū)分度
二、效度(Validity)
所謂測(cè)驗(yàn)的效度是指一個(gè)測(cè)驗(yàn)真正能確實(shí)測(cè)量到它所要測(cè)量的東西的程度。它是針對(duì)測(cè)量的目的和結(jié)果而言的。根據(jù)測(cè)量的目的,可以把測(cè)驗(yàn)的效度分為內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)關(guān)聯(lián)效度三種。
①內(nèi)容效度
內(nèi)容效度是指測(cè)驗(yàn)?zāi)康拇頊?zhǔn)備測(cè)驗(yàn)的內(nèi)容和引起的預(yù)期反應(yīng)所達(dá)到的程度。如在教育實(shí)驗(yàn)研究的測(cè)量中,“準(zhǔn)備測(cè)量的內(nèi)容”是指實(shí)驗(yàn)自變量的變化,“預(yù)期反應(yīng)”是指實(shí)驗(yàn)因變量的變化。目前,對(duì)測(cè)驗(yàn)的內(nèi)容效度沒(méi)有恰當(dāng)?shù)挠?jì)算方法,尚不能用一個(gè)簡(jiǎn)單數(shù)字來(lái)刻劃它?,F(xiàn)在判斷測(cè)驗(yàn)的內(nèi)容效度一般是用邏輯分析法或內(nèi)容分析法。
②結(jié)構(gòu)效度測(cè)驗(yàn)的結(jié)構(gòu)效度是指測(cè)驗(yàn)結(jié)果能夠說(shuō)明教育學(xué)和心理學(xué)理論的某種結(jié)構(gòu)或特征的程度。它可以理解為測(cè)驗(yàn)實(shí)際上測(cè)量了準(zhǔn)備測(cè)量的結(jié)構(gòu)特征所達(dá)到的程度。測(cè)驗(yàn)的結(jié)構(gòu)效度問(wèn)題比較復(fù)雜。一般在中小學(xué)教育和教育科學(xué)研究中所使用的自編測(cè)驗(yàn)是不考慮這個(gè)問(wèn)題的。
③效標(biāo)關(guān)聯(lián)效度
測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度是指測(cè)驗(yàn)結(jié)果與作為效標(biāo)的另一個(gè)獨(dú)立的測(cè)驗(yàn)結(jié)果之間的一致性程度。這種一致性程度一般是用本測(cè)驗(yàn)結(jié)果與另一個(gè)獨(dú)立的測(cè)驗(yàn)結(jié)果之間的相關(guān)系數(shù)來(lái)描述的。那個(gè)獨(dú)立的測(cè)驗(yàn)結(jié)果是用來(lái)估計(jì)本測(cè)驗(yàn)效度的標(biāo)準(zhǔn),所以叫做效標(biāo)。實(shí)際上,效標(biāo)在一定程度上用另一個(gè)獨(dú)立測(cè)驗(yàn)結(jié)果反映本測(cè)驗(yàn)準(zhǔn)備測(cè)量的某些特征。由于效標(biāo)是計(jì)算測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度的主要依據(jù)。因此,效標(biāo)必須確實(shí)能反映某個(gè)方面的特征。只有這樣才能成計(jì)算測(cè)驗(yàn)效標(biāo)關(guān)聯(lián)效度的依據(jù)。第六十頁(yè),共七十九頁(yè),編輯于2023年,星期日測(cè)驗(yàn)的信度、效度、難度與區(qū)分度效度的統(tǒng)計(jì)定義:提高效度的方法
①控制系統(tǒng)誤差。
②精心編制量表。
③妥善組織測(cè)驗(yàn)
④擴(kuò)充樣本的容量和代表性。
⑤合理處理信度和效度的關(guān)系。從某種意義上講效度比信度更重要第六十一頁(yè),共七十九頁(yè),編輯于2023年,星期日
三、難度:被試完成題目(item)任務(wù)時(shí)所遇到的困難程度。
在教育測(cè)量中,某測(cè)驗(yàn)的難度一般是用正確解答該測(cè)驗(yàn)題的人數(shù)與參與測(cè)驗(yàn)的學(xué)生數(shù)的比值來(lái)刻劃的。用公式表示即P=R/N其中,P表示某測(cè)驗(yàn)題的難度,R表示答對(duì)該測(cè)驗(yàn)題的人數(shù),N表示參加測(cè)驗(yàn)的人數(shù)。難度對(duì)測(cè)驗(yàn)有很大的影響。這種影響主要體現(xiàn)在影響測(cè)驗(yàn)成績(jī)的分布,影響測(cè)驗(yàn)成績(jī)的離散程度;影響測(cè)驗(yàn)的區(qū)分能力等三個(gè)方面。難度計(jì)算,常用的以下幾個(gè)公式:①P=X/W
其中P表示某測(cè)驗(yàn)題的難度,X表示接受測(cè)驗(yàn)的學(xué)生在該測(cè)驗(yàn)題上的平均分?jǐn)?shù),W表示該測(cè)驗(yàn)題的最高得分。②P=PH+PL/2
其中P表示某測(cè)驗(yàn)題的難度,PH表示接受測(cè)驗(yàn)的高分組學(xué)生(占總數(shù)的27%)在該測(cè)驗(yàn)題的通過(guò)率,PL表示接受測(cè)驗(yàn)的低分組學(xué)生(占總數(shù)的27%)在該測(cè)驗(yàn)題的通過(guò)率。③P=XH+XL-2NL/2N(H-L)該公式只適宜計(jì)算論文式測(cè)驗(yàn)題的難度。其中P表示某測(cè)驗(yàn)題的難度,XH表示接受測(cè)驗(yàn)的高分級(jí)學(xué)生的得分總數(shù),XL表示接受測(cè)驗(yàn)的低分級(jí)學(xué)生的得分總數(shù),N表示接受測(cè)驗(yàn)的學(xué)生總數(shù)。H表示該測(cè)驗(yàn)題的最高可能得分,L表示該測(cè)驗(yàn)題的最低可能得分。測(cè)驗(yàn)的信度、效度、難度與區(qū)分度第六十二頁(yè),共七十九頁(yè),編輯于2023年,星期日
四、區(qū)分度
區(qū)分度又叫鑒別力,它是測(cè)驗(yàn)對(duì)學(xué)生實(shí)際水平的區(qū)分程度的指標(biāo)。一個(gè)具有良好區(qū)分度的測(cè)驗(yàn)題,實(shí)際水平高的學(xué)生應(yīng)該得高分,實(shí)際水平低的學(xué)生應(yīng)該得低分。測(cè)驗(yàn)的區(qū)分度有積極區(qū)分度和消極區(qū)分度兩種。積極區(qū)分是指區(qū)分的方向與測(cè)驗(yàn)總分的方向一致的區(qū)分,區(qū)分的方向與測(cè)驗(yàn)部分的方向不一致的區(qū)分是消極區(qū)分。測(cè)驗(yàn)題的區(qū)分度的取值范圍在-100至100之間。如果區(qū)分度是負(fù)值,則表示該區(qū)分是消極區(qū)分;如果區(qū)分度為0,則表示
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 業(yè)務(wù)并購(gòu)合同范本
- 中外合資建設(shè)項(xiàng)目合同范本(環(huán)保設(shè)施)
- 個(gè)人物流配送合同范例
- 個(gè)人與朋友借款購(gòu)房合同模板
- 中藥原料采購(gòu)框架合同
- 產(chǎn)品銷(xiāo)售合同模板:標(biāo)準(zhǔn)合同文本
- 2025年車(chē)輛融資租賃協(xié)議范本
- 2025年標(biāo)準(zhǔn)土地及房產(chǎn)買(mǎi)賣(mài)協(xié)議
- 中外合作生產(chǎn)合同
- 臨時(shí)電工勞動(dòng)合同
- 體檢科運(yùn)營(yíng)可行性報(bào)告
- 廣東省廣州市黃埔區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末生物試卷+
- 北京市豐臺(tái)區(qū)市級(jí)名校2024屆數(shù)學(xué)高一第二學(xué)期期末檢測(cè)模擬試題含解析
- 設(shè)立項(xiàng)目管理公司組建方案
- 薪酬戰(zhàn)略與實(shí)踐
- 答案之書(shū)(解答之書(shū))-電子版精選答案
- 中國(guó)古代文學(xué)史 馬工程課件(上)01總緒論
- GB/T 22085.1-2008電子束及激光焊接接頭缺欠質(zhì)量分級(jí)指南第1部分:鋼
- 上海中心大廈-介紹 課件
- 非酒精性脂肪性肝病防治指南解讀課件
- 地理微格教學(xué)課件
評(píng)論
0/150
提交評(píng)論