




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一講心理與教育統(tǒng)計(jì)學(xué)緒論一、心理與教育統(tǒng)計(jì)學(xué)
及其研究對(duì)象1、統(tǒng)計(jì)學(xué)最初指的是對(duì)一個(gè)國(guó)家情況的描述?,F(xiàn)代意義上的統(tǒng)計(jì)指的是對(duì)與隨機(jī)現(xiàn)象有關(guān)的數(shù)據(jù)資料進(jìn)行收集、整理、計(jì)算和分析的過程。統(tǒng)計(jì)學(xué)大致分為理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)兩部分。理論統(tǒng)計(jì)學(xué)研究如何從局部的樣本觀測(cè)數(shù)據(jù)資料來推斷總體的特征,并得出合乎規(guī)律的科學(xué)結(jié)論的原理和方法。應(yīng)用統(tǒng)計(jì)學(xué)研究如何運(yùn)用經(jīng)理論統(tǒng)計(jì)學(xué)證明的各種原理和方法解決實(shí)際問題。2、心理與教育統(tǒng)計(jì)學(xué)心理與教育統(tǒng)計(jì)學(xué)屬于應(yīng)用統(tǒng)計(jì)學(xué)。心理與教育統(tǒng)計(jì)學(xué)就是用統(tǒng)計(jì)學(xué)的原理和方法來研究心理與教育現(xiàn)象,對(duì)有關(guān)的數(shù)字資料進(jìn)行收集、整理、計(jì)算、分析的一門基礎(chǔ)學(xué)科。心理與教育研究的發(fā)展不斷充實(shí)著統(tǒng)計(jì)學(xué)的方法。3、心理與教育研究數(shù)據(jù)的特點(diǎn)心理與教育科學(xué)研究數(shù)據(jù)與結(jié)果多用數(shù)字形式呈現(xiàn)。心理與教育科學(xué)研究數(shù)據(jù)具有隨機(jī)性和變異性。心理與教育科學(xué)研究數(shù)據(jù)具有規(guī)律性。心理與教育科學(xué)研究的目標(biāo)是通過部分?jǐn)?shù)據(jù)來推測(cè)總體特征。心理與教育統(tǒng)計(jì)使我們能以最少的樣本含量,達(dá)到我們所需要的精確度,對(duì)總體的有關(guān)參數(shù)等作出判斷,同時(shí)又給出發(fā)生錯(cuò)誤的可能性。它保證了科學(xué)研究的精確性、可靠性和經(jīng)濟(jì)性。
二、心理與教育統(tǒng)計(jì)學(xué)的歷史發(fā)展最初的統(tǒng)計(jì)是統(tǒng)治者用以治國(guó)的方法,對(duì)于人口、土地、物產(chǎn)、貢賦、士兵與戰(zhàn)車等都需要統(tǒng)計(jì)。這類統(tǒng)計(jì)是記錄或描述已經(jīng)發(fā)生的各種現(xiàn)象,可以稱為描述性統(tǒng)計(jì)。隨著科學(xué)進(jìn)步,近百年來,在概率論基礎(chǔ)上逐步形成了推測(cè)性的數(shù)理統(tǒng)計(jì)。19世紀(jì)中期奠定了概率論的理論基礎(chǔ)。1、理論統(tǒng)計(jì)學(xué)的發(fā)展歷史統(tǒng)計(jì)學(xué)的理論基礎(chǔ)是概率論與正態(tài)分布曲線方程的產(chǎn)生。一般認(rèn)為理論統(tǒng)計(jì)學(xué)的發(fā)展經(jīng)歷了兩個(gè)階段:描述統(tǒng)計(jì)階段和推論統(tǒng)計(jì)階段。描述統(tǒng)計(jì)階段描述統(tǒng)計(jì)學(xué)產(chǎn)生于20世紀(jì)年代之前,在描述統(tǒng)計(jì)方面做出重要貢獻(xiàn)的是英國(guó)的優(yōu)生學(xué)家高爾頓(F.Galton)和統(tǒng)計(jì)學(xué)家皮爾遜(K.pearson)。推論統(tǒng)計(jì)階段
推論統(tǒng)計(jì)的先驅(qū)是英國(guó)統(tǒng)計(jì)學(xué)家格賽特(W.Gosset
),對(duì)推斷統(tǒng)計(jì)做出重要貢獻(xiàn)的是英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)舍爾(R.A.Fisher)。二次世界大戰(zhàn)以后,各種非參數(shù)統(tǒng)計(jì)方法、小樣本理論都得到發(fā)展和完善,同時(shí)多元統(tǒng)計(jì)的理論和方法也得到了廣泛的應(yīng)用,統(tǒng)計(jì)學(xué)形成了許多分支應(yīng)用學(xué)科。2.心理與教育統(tǒng)計(jì)的產(chǎn)生和發(fā)展心理與教育統(tǒng)計(jì)作為數(shù)理統(tǒng)計(jì)的一門應(yīng)用學(xué)科,是隨著數(shù)理統(tǒng)計(jì)的發(fā)展而發(fā)展的。最初應(yīng)用統(tǒng)計(jì)方法于教育與心理方面研究的是高爾頓。對(duì)教育統(tǒng)計(jì)做出重要貢獻(xiàn)的是心理學(xué)家斯皮爾曼(Ch.E.Spearman)。
隨著科學(xué)研究中心的轉(zhuǎn)移,心理與教育統(tǒng)計(jì)的研究也移向美國(guó)。為心理與教育統(tǒng)計(jì)學(xué)做出較大貢獻(xiàn)的是美國(guó)教育與心理學(xué)家桑代克(Thorndikt)、瑟斯頓(Thurstone)和卡特爾(Cattell)。3.我國(guó)心理與教育統(tǒng)計(jì)學(xué)的發(fā)展概況
心理與教育統(tǒng)計(jì)學(xué)在辛亥革命以后傳到我國(guó)。當(dāng)時(shí)心理與教育統(tǒng)計(jì)、心理與教育測(cè)量都作為高等、中等師范院校的必修課程,有一大批專家、學(xué)者從事這方面的研究、講授工作,出版了不少關(guān)于教育統(tǒng)計(jì)方面的譯著、專著。20世紀(jì)年代以后,心理與教育統(tǒng)計(jì)學(xué)開始復(fù)蘇。在二十多年中,我國(guó)的心理與教育統(tǒng)計(jì)學(xué)科在教學(xué)、研究、培養(yǎng)人才等各方面取得了非常豐碩的成果。目前,心理與教育統(tǒng)計(jì)學(xué)的教學(xué)和研究進(jìn)入穩(wěn)步快速發(fā)展時(shí)期。三.學(xué)習(xí)心理與教育統(tǒng)計(jì)學(xué)的意義數(shù)學(xué)化是自然科學(xué)成熟的標(biāo)志。心理與教育科學(xué)也必然會(huì)向數(shù)學(xué)化的方向發(fā)展,而心理與教育統(tǒng)計(jì)就是用數(shù)學(xué)方法研究心理與教育現(xiàn)象的重要工具。學(xué)習(xí)心理與教育專業(yè)的諸課程需要統(tǒng)計(jì)學(xué)知識(shí)。從事心理與教育工作的實(shí)踐需要統(tǒng)計(jì)學(xué)知識(shí)。進(jìn)行心理教育科學(xué)研究需要統(tǒng)計(jì)學(xué)知識(shí)。科學(xué)的思維需要統(tǒng)計(jì)學(xué)知識(shí)。
四、學(xué)習(xí)心理與教育統(tǒng)計(jì)
應(yīng)注意的事項(xiàng)學(xué)習(xí)心理與教育統(tǒng)計(jì)學(xué)要克服畏難情緒,注重掌握各種方法的使用條件,多做練習(xí)。應(yīng)用心理與教育統(tǒng)計(jì)方法時(shí)要克服“統(tǒng)計(jì)無用”和“統(tǒng)計(jì)萬能”的思想,遵守科研道德。正確選擇和使用統(tǒng)計(jì)方法,防止誤用和亂用。五、心理與教育統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容描述統(tǒng)計(jì)推論統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì)心理與教育統(tǒng)計(jì)學(xué)1、描述統(tǒng)計(jì)對(duì)已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯現(xiàn)其分布特征的統(tǒng)計(jì)方法,稱為描述統(tǒng)計(jì)。描述統(tǒng)計(jì)的目的是將大量零散的、雜亂無序的數(shù)字資料進(jìn)行整理、歸納、簡(jiǎn)縮、概括,使事物的全貌及其分布特征清晰、明確地顯現(xiàn)出來。2、推論統(tǒng)計(jì)根據(jù)樣本所提供的信息,運(yùn)用概率的理論進(jìn)行分析、論證,在一定可靠程度上,對(duì)總體分布特征進(jìn)行估計(jì)、推測(cè),這種統(tǒng)計(jì)方法稱為推論統(tǒng)計(jì)。推論統(tǒng)計(jì)的內(nèi)容包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分。推論統(tǒng)計(jì)的目的在于根據(jù)已知的情況,在一定概率的意義上估計(jì)、推測(cè)未知的情況。3、實(shí)驗(yàn)設(shè)計(jì)實(shí)驗(yàn)者為了揭示實(shí)驗(yàn)中自變量與因變量之間的關(guān)系,在實(shí)驗(yàn)之前所制訂的實(shí)驗(yàn)計(jì)劃,稱為實(shí)驗(yàn)設(shè)計(jì)。包括選擇怎樣的抽樣方式;如何計(jì)算樣本容量;確定怎樣的實(shí)驗(yàn)對(duì)照形式;如何實(shí)現(xiàn)實(shí)驗(yàn)組和對(duì)照組的等組化;如何安排實(shí)驗(yàn)因素和如何控制無關(guān)因素;用什么統(tǒng)計(jì)方法處理及分析實(shí)驗(yàn)結(jié)果,等等。六、心理與教育統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)1、數(shù)據(jù)類型分類數(shù)據(jù)等級(jí)數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)計(jì)數(shù)數(shù)據(jù)離散型數(shù)據(jù)測(cè)量數(shù)據(jù)連續(xù)型數(shù)據(jù)2、變量、隨機(jī)變量、觀測(cè)值變量是可以取不同值的量。統(tǒng)計(jì)觀察的指標(biāo)都是具有變異的指標(biāo)。當(dāng)我們用一個(gè)量表示這個(gè)指標(biāo)的觀察結(jié)果時(shí),這個(gè)指標(biāo)是一個(gè)變量。用來表示隨機(jī)現(xiàn)象的變量,稱為隨機(jī)變量。一般用大寫的X或Y表示隨機(jī)變量。隨機(jī)變量所取得的值,稱為觀測(cè)值。一個(gè)隨機(jī)變量可以有許多個(gè)觀測(cè)值。3、總體、個(gè)體和樣本需要研究的同質(zhì)對(duì)象的全體,稱為總體。
每一個(gè)具體研究對(duì)象,稱為一個(gè)個(gè)體。從總體中抽出的用以推測(cè)總體的部分對(duì)象的集合稱為樣本。樣本中包含的個(gè)體數(shù),稱為樣本的容量n。一般把容量n≥30的樣本稱為大樣本;而n
<30的樣本稱為小樣本。4、統(tǒng)計(jì)量和參數(shù)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)量參數(shù)平均數(shù)μ標(biāo)準(zhǔn)差Sσ相關(guān)系數(shù)rρ回歸系數(shù)bβ5、統(tǒng)計(jì)誤差誤差是測(cè)得值與真值之間的差值。測(cè)得值=真值+誤差統(tǒng)計(jì)誤差歸納起來可分為兩類:測(cè)量誤差與抽樣誤差。由于使用的儀器、測(cè)量方法、讀數(shù)方法等問題造成的測(cè)得值與真值之間的誤差,稱為測(cè)量誤差。由于隨機(jī)抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別,稱為抽樣誤差。心理與教育的研究不可能避免誤差,只可能減少誤差。抽樣設(shè)計(jì)的目的,就是保證研究達(dá)到所需要的精確度,同時(shí)在兼顧投入的人力、物力和財(cái)力條件下盡量減小抽樣誤差。本學(xué)期學(xué)習(xí)要求形式:分組學(xué)習(xí)(全班分為十個(gè)專家組)專家組的任務(wù):運(yùn)用專題統(tǒng)計(jì)方法處理自己收集的數(shù)據(jù);組織同學(xué)之間的學(xué)習(xí)交流;解答和反饋同學(xué)的問題;建立本專題的資料站;對(duì)全班同學(xué)本專題的學(xué)習(xí)情況作出評(píng)估。成績(jī)考核:平時(shí)成績(jī)30+期中考試30+期末考試40其中平時(shí)成績(jī)?yōu)椋撼銮?0分+小組活動(dòng)貢獻(xiàn)10分+期末作業(yè)10分上課紀(jì)律要求:不遲到;不在上課時(shí)吃東西第二講數(shù)據(jù)整理與圖表呈現(xiàn)一、數(shù)據(jù)的整理1、數(shù)據(jù)的整理心理和教育研究中收集的各種原始資料雜亂無章,只有經(jīng)過整理分析才能從中提取出有用的信息。在對(duì)資料進(jìn)一步分析之前,需要進(jìn)行認(rèn)真的整理。1.審核資料審核資料的目的,是為了剔除不合格的資料,以確保資料的可靠性和可信性。審核是對(duì)原始資料進(jìn)行初步的審查和核實(shí)。不符合要求的數(shù)據(jù)主要有三種:缺失、可疑、失誤。缺失:指數(shù)據(jù)不全或缺項(xiàng)未填;例如一份資料中未回答的問題占10%以上,或者缺少關(guān)鍵性資料。
可疑:指難以辨認(rèn)或懷疑其真實(shí)性的數(shù)據(jù);例如,有的被試填答的問卷全部選同一個(gè)選項(xiàng)(如全選A或全選B);有的被試填答的結(jié)果可以看到是一種規(guī)則的排列方式(如ABCDEDBCABCDE……)。失誤:指存在明確差錯(cuò)的數(shù)據(jù)或答案。在剔除不合格問卷的過程中,注意不能把一些不符合自己主觀假設(shè)的數(shù)據(jù)隨意去掉。因此這項(xiàng)工作一定要非常慎重。對(duì)于個(gè)別極端數(shù)據(jù)是否該剔除,應(yīng)遵循三個(gè)標(biāo)準(zhǔn)差法則。
2.?dāng)?shù)據(jù)的分組分組要以被研究對(duì)象的本質(zhì)特性為基礎(chǔ)分類標(biāo)志要明確,要能包括所有的數(shù)據(jù)數(shù)據(jù)分組的標(biāo)志性質(zhì)類別:按事物的不同性質(zhì)進(jìn)行分類。數(shù)量類別:按數(shù)值大小進(jìn)行分類,并排序。
數(shù)據(jù)類型分類數(shù)據(jù)等級(jí)數(shù)據(jù)等距數(shù)據(jù)比率數(shù)據(jù)計(jì)數(shù)數(shù)據(jù)離散型數(shù)據(jù)測(cè)量數(shù)據(jù)連續(xù)型數(shù)據(jù)變量、隨機(jī)變量、觀測(cè)值變量是可以取不同值的量。統(tǒng)計(jì)觀察的指標(biāo)都是具有變異的指標(biāo)。當(dāng)我們用一個(gè)量表示這個(gè)指標(biāo)的觀察結(jié)果時(shí),這個(gè)指標(biāo)是一個(gè)變量。用來表示隨機(jī)現(xiàn)象的變量,稱為隨機(jī)變量。一般用大寫的X或Y表示隨機(jī)變量。隨機(jī)變量所取得的值,稱為觀測(cè)值。一個(gè)隨機(jī)變量可以有許多個(gè)觀測(cè)值??傮w、個(gè)體和樣本需要研究的同質(zhì)對(duì)象的全體,稱為總體。
每一個(gè)具體研究對(duì)象,稱為一個(gè)個(gè)體。從總體中抽出的用以推測(cè)總體的部分對(duì)象的集合稱為樣本。樣本中包含的個(gè)體數(shù),稱為樣本的容量n。一般把容量n≥30的樣本稱為大樣本;而n
<30的樣本稱為小樣本。統(tǒng)計(jì)量和參數(shù)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)量參數(shù)平均數(shù)μ標(biāo)準(zhǔn)差Sσ相關(guān)系數(shù)rρ回歸系數(shù)bβ二、統(tǒng)計(jì)表統(tǒng)計(jì)表是用來表達(dá)研究變量與被說明的事物之間數(shù)量關(guān)系的表格。它可以將大量數(shù)據(jù)的分類結(jié)果清晰、概括、一目了然地表達(dá)出來,便于分析、比較和計(jì)算。
1、統(tǒng)計(jì)表的構(gòu)成
橫標(biāo)目的總標(biāo)目縱標(biāo)目橫標(biāo)目數(shù)字表2-1統(tǒng)計(jì)表的格式頂線底線表線表號(hào)標(biāo)題標(biāo)目標(biāo)目表注注:例:表2-2北京市四街道智力落后患者分布街道檢查人數(shù)病人數(shù)患病率(‰)甲518411593.1乙760302633.5丙495081903.8丁517881703.3總計(jì)2291687823.4資料來源:見《心理學(xué)報(bào)》1979年第1期103頁(yè),選部分引用2.統(tǒng)計(jì)表的種類簡(jiǎn)單表:只按研究現(xiàn)象(或變量)的名稱、地點(diǎn)、時(shí)序等列出數(shù)據(jù)的統(tǒng)計(jì)表。分組表:只按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表稱為分組表。復(fù)合表:按兩個(gè)或兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表稱為復(fù)合表。
簡(jiǎn)單表表2-3各校學(xué)生數(shù)一覽表學(xué)校A校B校C校D校人數(shù)9857628931051分組表表2-4上海市區(qū)男幼兒20米跑步用時(shí)年齡組3歲~4歲~5歲~6歲~平均用時(shí)(秒)7.717.166.045.53資料來源:引自《華東師范大學(xué)學(xué)報(bào)》,1985年第2期第30頁(yè)復(fù)合表表2-5某年級(jí)操行評(píng)定結(jié)果班別甲乙丙丁合計(jì)男女男女男女男女一班6588642140二班55910331137三班7698430138合計(jì)18162626131033115例:表2-6中學(xué)生心理煩惱調(diào)查被試分布三、統(tǒng)計(jì)圖統(tǒng)計(jì)圖是整理和呈現(xiàn)數(shù)據(jù)的另一種方法,它把研究變量與被說明事物之間的數(shù)量關(guān)系用圖形表現(xiàn),直觀、形象地表達(dá)出事物的全貌及其數(shù)據(jù)的分布特征,使人一目了然,便于理解和記憶,印象深刻。1、統(tǒng)計(jì)圖的構(gòu)成統(tǒng)計(jì)圖一般由圖號(hào)、標(biāo)題、標(biāo)目、圖形、圖注等幾部分構(gòu)成。統(tǒng)計(jì)圖中的標(biāo)目由基線和尺度線構(gòu)成。對(duì)于有縱、橫軸的統(tǒng)計(jì)圖,一般以基線表示被觀察的現(xiàn)象,而尺度線則表示其數(shù)量。
2、統(tǒng)計(jì)圖的分類條形圖:用直條的長(zhǎng)短來表示統(tǒng)計(jì)項(xiàng)目數(shù)值大小的圖形,主要是用來比較性質(zhì)相似的間斷型資料。
圓形圖:是用于表示間斷型資料比例的圖形。圓形的面積表示一組數(shù)據(jù)的整體,圓中扇形的面積表示各組成部分所占的比例。各部分的比例一般用百分比表示。
單式條形圖圖2-1某年級(jí)操行評(píng)定結(jié)果條形圖
基線尺度線圖形復(fù)式條形圖圖2-2某年級(jí)操行評(píng)定結(jié)果條形圖例:圖2-3三項(xiàng)影響較大的SARS信息對(duì)不同文化程度民眾的影響
圓形圖圖2-4某年級(jí)操行評(píng)定結(jié)果圓形圖基線尺度線繪制圓形圖的步驟求出各組成部分所占的百分比求出各部分的中心角度以順時(shí)針方向畫出扇形標(biāo)出不同顏色及百分比線形圖
線形圖用來表示連續(xù)型資料。它能表示兩個(gè)變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢(shì)等。基于線形圖,既可對(duì)有關(guān)統(tǒng)計(jì)變量進(jìn)行數(shù)量比較,又可分析發(fā)展的趨勢(shì)。
例如:對(duì)有意義的詞匯,小學(xué)一年級(jí)至初中三年級(jí)學(xué)生視覺、聽覺記憶再現(xiàn)率的情況。
圖2-5有意義的材料再現(xiàn)率比較線形圖學(xué)習(xí)專題1.集中量和差異量2.概率及其分布(包括二項(xiàng)分布和正態(tài)分布)3.抽樣分布及參數(shù)估計(jì)4.假設(shè)檢驗(yàn)的基本原理5.平均數(shù)的顯著性檢驗(yàn)6.平均數(shù)差異的顯著性檢驗(yàn)
7.方差分析
8.χ2檢驗(yàn)及非參數(shù)檢驗(yàn)
9.相關(guān)分析
10.回歸分析
2005年9月再見!第三講統(tǒng)計(jì)圖表一、次數(shù)分布表次數(shù)分布表是對(duì)雜亂無序的數(shù)據(jù)進(jìn)行整理的重要手段,它能使我們對(duì)樣本情況有個(gè)初步的了解,為今后進(jìn)一步分析和研究問題提供很大方便。1、簡(jiǎn)單次數(shù)分布表員工對(duì)主管盡職情況的評(píng)定人數(shù)①非常不盡職②不盡職③不置可否④盡職⑤非常盡職93010256總計(jì)80表3-180名員工對(duì)部門主管盡職程度調(diào)查結(jié)果2、分組次數(shù)分布表成績(jī)組中值頻數(shù)累積頻數(shù)95~97.52290~92.52485~87.53780~52.551275~77.582070~72.5113165~67.594060~62.554555~57.544950~52.525145~17.5152合計(jì)5252表3-2某班學(xué)生數(shù)學(xué)成績(jī)次數(shù)分布表編制分組次數(shù)分布表的步驟求全距R=Xmax-Xmin決定組距i和組數(shù)k列出分組區(qū)間登記次數(shù)計(jì)算每組數(shù)據(jù)的次數(shù)f抄錄新表3.相對(duì)次數(shù)分布表將次數(shù)分布表中各組的實(shí)際次數(shù)轉(zhuǎn)化為相對(duì)次數(shù),即用頻數(shù)比率(f/N)或百分比()來表示次數(shù),就可以制成相對(duì)次數(shù)分布表。4、累加次數(shù)分布表
表3-3某班學(xué)生數(shù)學(xué)成績(jī)累加次數(shù)分布表
成績(jī)組中值頻數(shù)累加頻數(shù)累加百分比95~97.5223.8590~92.5247.6985~87.53713.4680~82.551254.0575~77.582038.4670~72.5113159.6265~67.594076.9260~62.554586.5455~57.544994.2350~52.525198.0845~47.5152100.0合計(jì)52525、雙列次數(shù)分布表雙列次數(shù)分布表又稱相關(guān)次數(shù)分布表,是對(duì)有聯(lián)系的兩列變量用同一個(gè)表表示其次數(shù)分布。所謂有聯(lián)系的兩列變量,一般是指同一組被試中每個(gè)被試兩種心理能力的分?jǐn)?shù)或兩種心理特點(diǎn)的指標(biāo),或同一組被試在兩種實(shí)驗(yàn)條件下獲得的結(jié)果。
表3-431名學(xué)生視、聽反應(yīng)時(shí)測(cè)驗(yàn)結(jié)果聽視100~120~140~160~180~200~220~Y230~210~190~170~150~130~110~1111211322331112111112478451X159843131二、次數(shù)分布圖在編制次數(shù)分布表的基礎(chǔ)上,可以繪制次數(shù)分布圖,使一組數(shù)據(jù)特征更加直觀和概括,而且還可以對(duì)數(shù)據(jù)的分布情況和變動(dòng)趨勢(shì)作粗略的分析。繪制次數(shù)分布圖可以用已有的計(jì)算機(jī)程序,如EXCEL,也可以用專門的統(tǒng)計(jì)程序。1、頻數(shù)分布直方圖直方圖(histogram)又稱為等距直方圖,是以矩形的面積表示連續(xù)性隨機(jī)變量次數(shù)分布的圖形。一般用縱軸表示數(shù)據(jù)的頻數(shù),用橫軸表示數(shù)據(jù)的等距分組點(diǎn),即各分組區(qū)間的上下限。直方圖是統(tǒng)計(jì)學(xué)中常用而且又有特殊意義的一種統(tǒng)計(jì)圖,有著重要的應(yīng)用價(jià)值。例:根據(jù)第二講中52個(gè)學(xué)生的數(shù)學(xué)成績(jī)所作直方圖圖3-152名學(xué)生數(shù)學(xué)成績(jī)分布的頻數(shù)直方圖4550556065707580859095100還可以做成下面這種形式圖3-252名學(xué)生數(shù)學(xué)成績(jī)次數(shù)分布直方圖2、次數(shù)分布多邊圖次數(shù)分布多邊形圖(frequencypolygon)是一種表示連續(xù)性隨機(jī)變量次數(shù)分布的線形圖,屬于次數(shù)分布圖。凡是等距分組的可以用直方圖表示的數(shù)據(jù),都可用次數(shù)多邊圖來表示。繪制方法:以各分組區(qū)間的組中值為橫坐標(biāo),以各組的頻數(shù)為縱坐標(biāo),描點(diǎn);將各點(diǎn)以直線連接即構(gòu)成多邊圖形。圖3-352名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)圖3-452名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)成績(jī)利用次數(shù)分布多邊圖還可以把幾組資料放在一起進(jìn)行比較。但需要注意的是,這時(shí)必須把數(shù)據(jù)的次數(shù)換算成百分比。圖3-545頁(yè)數(shù)據(jù)的次數(shù)分布圖圖3-6不正確的比較圖3、累積次數(shù)分布圖根據(jù)累積次數(shù),可以繪制累積次數(shù)分布圖。右圖是累積次數(shù)分布直方圖。累積次數(shù)分布曲線當(dāng)數(shù)據(jù)的總數(shù)較多時(shí),將累積次數(shù)分布圖中的橫坐標(biāo)以每一分組區(qū)間的精確上限或精確下限表示,縱坐標(biāo)以累積次數(shù)表示,則可繪制累積次數(shù)分布曲線,即累積曲線。圖3-8累積次數(shù)分布曲線累積曲線可用于判斷一組數(shù)據(jù)的大致分布形態(tài)。圖3-9正態(tài)分布數(shù)據(jù)的累積曲線圖3-10正偏態(tài)數(shù)據(jù)累積曲線圖3-11負(fù)偏態(tài)數(shù)據(jù)累積曲線二、計(jì)算機(jī)制作統(tǒng)計(jì)圖表在心理與教育研究中常用的基本統(tǒng)計(jì)程序主要有兩個(gè):SPSS和SAS。其中以SPSS應(yīng)用最多。SPSS是專門用于社會(huì)科學(xué)研究的統(tǒng)計(jì)分析工具:StatisticsPackageforSocialScienceSAS的開發(fā)主要是商業(yè)用途,因此功能更強(qiáng)大,但SPSS包含一些特殊的社會(huì)科學(xué)應(yīng)用程序。瀏覽網(wǎng)上資料,看看常用的有哪些統(tǒng)計(jì)圖。請(qǐng)利用書上的數(shù)據(jù)或自己收集數(shù)據(jù),試做幾個(gè)漂亮的統(tǒng)計(jì)圖。練習(xí)某大學(xué)四年級(jí)80名學(xué)生的畢業(yè)成績(jī)?nèi)缦拢?/p>
5683766880926981627857817170596666756148845093827270498469669374706956746885539761525850739352746581685354956872948269606685905767758255466847895767755183685550試編制一個(gè)完整的次數(shù)分布表。2005年9月再見!第三講集中量集中量用來表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢(shì)(centraltendency)。常用的集中量包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、中位數(shù)和眾數(shù)等等。一、算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticaverage
)一般簡(jiǎn)稱為平均數(shù)(average)或均數(shù)、均值(mean)。一般用M,或者用表示。算術(shù)平均數(shù)是最常用的集中量。1.算術(shù)平均數(shù)的計(jì)算公式原始數(shù)據(jù)計(jì)算公式(4.1)由上述公式可得算術(shù)平均數(shù)的幾個(gè)重要性質(zhì)連加和計(jì)算規(guī)則次數(shù)分布表計(jì)算公式(4.2)表4-152名學(xué)生數(shù)學(xué)成績(jī)平均數(shù)計(jì)算表成績(jī)組中值Xc頻數(shù)fF*Xc計(jì)算95-97.5219590-92.5218585-87.53262.580-52.55262.575-77.5862070-72.511797.565-67.59607.560-62.55312.555-57.5423050-52.5210545-17.5117.5合計(jì)523595.02、算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應(yīng)用最普遍的一種集中量。它是“真值”(truescore)的最佳估計(jì)值。真值是反映某種現(xiàn)象的真實(shí)水平的分?jǐn)?shù)。由于測(cè)量過程中的各種偶然因素的影響,真值往往很難得到。在實(shí)際測(cè)量中,往往采用“多次測(cè)量,取平均數(shù)”的方法,用平均數(shù)去估計(jì)真值。3、算術(shù)平均數(shù)的優(yōu)缺點(diǎn)
算術(shù)平均數(shù)具備一個(gè)良好的集中量所應(yīng)具備的一些特點(diǎn):反應(yīng)靈敏、有公式嚴(yán)密確定、簡(jiǎn)明易懂、適合代數(shù)運(yùn)算等等,因此是一個(gè)最常用的集中量。主要不足:容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時(shí)無法計(jì)算。4、計(jì)算和應(yīng)用算術(shù)平均數(shù)的原則同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢(shì)。平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則:在解釋個(gè)體特征時(shí),既要看平均數(shù),也要結(jié)合個(gè)體的數(shù)據(jù)。平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則:描述一組數(shù)據(jù)時(shí)既要分析其集中趨勢(shì),也要分析離散程度。二、中位數(shù)中位數(shù)(median)又稱為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。中位數(shù)是常用集中量的一種。一般用Md或Mdn表示。1、中位數(shù)的計(jì)算方法原始數(shù)據(jù)計(jì)算法首先將一組數(shù)據(jù)按順序排列次數(shù)分布表計(jì)算法由次數(shù)分布表計(jì)算中位數(shù)需要用到累積次數(shù)分布表。當(dāng)表中數(shù)據(jù)的累積方向不同時(shí),計(jì)算公式也不同。表4-252名學(xué)生數(shù)學(xué)成績(jī)次數(shù)分布表成績(jī)頻數(shù)f累積頻數(shù)95-25290-25085-34880-54575-84070-113265-92160-51255-4750-2345-11合計(jì)5274.457473.5573.172.6572.271.7571.370.8570.469.9569.51110987654321由下至上累積頻數(shù)計(jì)算公式公式中:Lb為中位數(shù)所在組的精確下限
fb為中位數(shù)所在組下限以下的累積頻數(shù)
n為數(shù)據(jù)總和
fMd為中位數(shù)所在組的頻數(shù)
i為組距(4.3a)由上至下累積頻數(shù)計(jì)算公式公式中:La為中位數(shù)所在組的精確上限
fa為中位數(shù)所在組上限以上的累積頻數(shù)
n為數(shù)據(jù)總和
fMd為中位數(shù)所在組的頻數(shù)
i為組距(4.3b)表4-352名學(xué)生數(shù)學(xué)成績(jī)中位數(shù)計(jì)算表成績(jī)頻數(shù)f累積頻數(shù)計(jì)算95252902508534880545758407011326592160512554750234511合計(jì)522.百分位數(shù)百分位數(shù)的概念
百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值,一般用表示。百分位數(shù)的計(jì)算方法公式中:Lb為百分位數(shù)所在組的精確下限
fb為百分位數(shù)所在組下限以下的累積頻數(shù)
p為百分?jǐn)?shù)
n為數(shù)據(jù)總和
fp為百分位數(shù)所在組的頻數(shù)
i為組距(4.4)3.中位數(shù)的特點(diǎn)及應(yīng)用中位數(shù)是根據(jù)全部數(shù)據(jù)的個(gè)數(shù)來確定其位置的,意義簡(jiǎn)明,對(duì)按順序排列的數(shù)據(jù)來講,計(jì)算中位數(shù)也比較容易。中位數(shù)不受兩端極端數(shù)據(jù)的影響,但反應(yīng)不靈敏,也不適合進(jìn)一步代數(shù)運(yùn)算的要求。一般用于下列情況:一組數(shù)據(jù)中有極端數(shù)據(jù)時(shí);一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切、不清楚時(shí);資料屬于等級(jí)性質(zhì)時(shí)。三.眾數(shù)眾數(shù)(mode)用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn);粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)也是一種集中量,也可用來表示一組數(shù)據(jù)的集中趨勢(shì)。1.眾數(shù)的計(jì)算方法
觀察法尋找粗略眾數(shù)未分組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。次數(shù)分布表中,頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。公式法計(jì)算理論眾數(shù)的近似值用公式計(jì)算的眾數(shù)稱為理論眾數(shù)。一般在心理與教育統(tǒng)計(jì)中常用的公式有皮爾遜的經(jīng)驗(yàn)公式和金氏插補(bǔ)法公式。皮爾遜經(jīng)驗(yàn)公式金氏插補(bǔ)法(4.5)(4.6)皮爾遜經(jīng)驗(yàn)公式只有當(dāng)數(shù)據(jù)分布呈正態(tài)或接近正態(tài)時(shí)才能使用。當(dāng)數(shù)據(jù)分布呈偏態(tài)時(shí),一般用金氏插補(bǔ)法計(jì)算眾數(shù)。2.眾數(shù)的優(yōu)缺點(diǎn)眾數(shù)的概念簡(jiǎn)單易懂,但比較粗略,不能靈敏地反映一組數(shù)據(jù)的變化,而且不適合進(jìn)一步代數(shù)運(yùn)算。一般用于類別變量或等級(jí)變量的資料。4.算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者的關(guān)系在正態(tài)分布中:在正偏態(tài)分布中:在負(fù)偏態(tài)分布中:四、其它集中量除了算術(shù)平均數(shù)、中位數(shù)和眾數(shù)以外,在應(yīng)用中還有一些其它集中量。這些統(tǒng)計(jì)指標(biāo)可以從其它角度描述一組數(shù)據(jù)的集中趨勢(shì)。1.加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù),一般用表示。其計(jì)算公式有兩種:
(4.7)(4.8)2.幾何平均數(shù)幾何平均數(shù)(geometricmean)是n個(gè)數(shù)值連乘積的n次方根,用或表示。計(jì)算公式為當(dāng)數(shù)據(jù)的分布呈偏態(tài)時(shí),可用幾何平均數(shù)表示該組數(shù)據(jù)的集中趨勢(shì)。(4.9)幾何平均數(shù)的變式兩邊取對(duì)數(shù),得注意:幾何平均數(shù)計(jì)算的是平均的變化情況,如果要計(jì)算平均增長(zhǎng)率,需要從幾何平均數(shù)中減去基數(shù)1。(4.10)練習(xí)與思考第86頁(yè)和87頁(yè)的各練習(xí)題。注意觀察和收集我們生活中的資料,分析在集中量的使用中,哪些是正確的,哪些是錯(cuò)誤的?2005年9月再見!第五講差異量描述數(shù)據(jù)離散程度的統(tǒng)計(jì)量稱為差異量。差異量越大,表明數(shù)據(jù)越分散、不集中;差異量越小,表明數(shù)據(jù)越集中,變動(dòng)范圍越小。一組數(shù)據(jù)的離散程度,常常通過數(shù)據(jù)的離中趨勢(shì)特點(diǎn)進(jìn)行分析。一、全距、四分位距和百分位距全距R(range)全距是一組數(shù)據(jù)中的最大值(maximum)與該組數(shù)據(jù)中最小值(minimum)之差,又稱極差。R=Xmax-Xmin百分位差(百分位距)
百分位差是指兩個(gè)百分位數(shù)(percentile)之差。常用的百分位距有兩種:
P90-P10和P93-P7。用幾個(gè)百分位距能較好地反映一組數(shù)據(jù)的差異程度。計(jì)算公式公式中:fbp為某一百分位數(shù)所在組下限以下的累積頻數(shù)
fp為某一百分位數(shù)所在組的頻數(shù)
Lbp為某一百分位數(shù)所在組的精確下限四分位距四分位距是第一個(gè)四分位數(shù)與第三個(gè)四分位數(shù)之差的一半,計(jì)算公式為(5.1)其中:(5.2a)(5.2b)用中位數(shù)作集中量時(shí),常用四分位距作差異量。二、平均差平均差(averagedeviation
或者meandeviation)是指一組數(shù)據(jù)中,每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)的平均數(shù)離差的絕對(duì)值的算術(shù)平均數(shù),通常用AD或MD表示。本書中均以AD表示。原始數(shù)據(jù)計(jì)算公式次數(shù)分布表計(jì)算公式(5.3)(5.4)平均差意義明確,計(jì)算容易,反應(yīng)靈敏。但計(jì)算時(shí)要用絕對(duì)值,不適合代數(shù)運(yùn)算,因此在進(jìn)一步統(tǒng)計(jì)分析中應(yīng)用較少。三、方差和標(biāo)準(zhǔn)差方差(又稱為變異數(shù)、均方)。是表示一組數(shù)據(jù)離散程度的統(tǒng)計(jì)指標(biāo)。一般樣本的方差用
表示,總體的方差用表示。標(biāo)準(zhǔn)差(standarddeviation)是方差的算術(shù)平方根。一般樣本的標(biāo)準(zhǔn)差用S表示,總體的標(biāo)準(zhǔn)差用表示。標(biāo)準(zhǔn)差和方差是描述數(shù)據(jù)離散程度的最常用的差異量。1.方差和標(biāo)準(zhǔn)差的定義
(5.5)(5.6)2.方差和標(biāo)準(zhǔn)差的計(jì)算公式原始數(shù)據(jù)計(jì)算公式(5.7)(5.8)公式(5-5)、(5-6)等價(jià)于(5-7)、(5-8),當(dāng)兩個(gè)公式計(jì)算結(jié)果有出入時(shí),應(yīng)以原始數(shù)據(jù)計(jì)算公式的結(jié)果更準(zhǔn)確。次數(shù)分布表計(jì)算公式(5.9)(5.10)表5-152名學(xué)生數(shù)學(xué)成績(jī)方差和標(biāo)準(zhǔn)差計(jì)算表成績(jī)組中值Xc頻數(shù)fF*XcF*XC2計(jì)算95-97.5219519012.590-92.5218517112.585-87.53262.522968.7580-82.55412.534031.2575-77.586204805070-72.511797.557818.7565-67.59607.541006.2560-62.55312.519531.2555-57.542301322550-52.521055512.545-47.5147.52256.25合計(jì)5237752805253.總標(biāo)準(zhǔn)差的合成
方差具有可加性的特點(diǎn)。當(dāng)已知幾個(gè)小組數(shù)據(jù)的方差或標(biāo)準(zhǔn)差時(shí),可以計(jì)算幾個(gè)小組聯(lián)合在一起的總的方差或標(biāo)準(zhǔn)差。需要注意的是,只有在應(yīng)用同一種觀測(cè)手段,測(cè)量的是同一種特質(zhì),只是樣本不同的數(shù)據(jù)時(shí),才能計(jì)算合成方差或標(biāo)準(zhǔn)差。計(jì)算公式公式中:為總方差,為總標(biāo)準(zhǔn)差
Si為各小組標(biāo)準(zhǔn)差
ni為各小組數(shù)據(jù)個(gè)數(shù)(5.11)(5.12)4.方差和標(biāo)準(zhǔn)差的性質(zhì)方差是對(duì)一組數(shù)據(jù)中各種變異的總和的測(cè)量,具有可加性和可分解性特點(diǎn)。標(biāo)準(zhǔn)差是一組數(shù)據(jù)方差的算術(shù)平方根,它不可以進(jìn)行代數(shù)計(jì)算,但有以下特性:如果則如果則5.方差和標(biāo)準(zhǔn)差的意義方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo),是統(tǒng)計(jì)分析中最常用的差異量。標(biāo)準(zhǔn)差具備一個(gè)良好的差異量應(yīng)具備的條件,如:反應(yīng)靈敏,有公式嚴(yán)密確定,簡(jiǎn)明易懂,適合代數(shù)運(yùn)算等等。應(yīng)用方差和標(biāo)準(zhǔn)差表示一組數(shù)據(jù)的離散程度,須注意必須是同一類數(shù)據(jù)(即同一種測(cè)量工具的測(cè)量結(jié)果),而且被比較樣本的水平比較接近。四.相對(duì)差異量1.差異系數(shù)的概念及計(jì)算公式差異系數(shù)(coefficientofvariation)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比,它是沒有單位的相對(duì)數(shù)。常以CV表示,其計(jì)算公式為(5.13)2.差異系數(shù)的作用比較不同單位資料的差異程度比較單位相同而平均數(shù)相差較大的兩組資料的差異程度可判斷特殊差異情況根據(jù)經(jīng)驗(yàn),一般CV值常在5%-35%之間。如果CV大于35%時(shí),可懷疑所求得的平均數(shù)是否失去了意義;如果CV小于5%時(shí),可懷疑平均數(shù)與標(biāo)準(zhǔn)差是否計(jì)算有誤。
例1:比較計(jì)量單位不同的數(shù)據(jù)資料的差異程度1975年上海市區(qū)6歲男童體重與身高數(shù)據(jù):平均數(shù)標(biāo)準(zhǔn)差差異系數(shù)體重19.39千克2.16千克11.14%身高115.87厘米4.86厘米4.19%例2:比較單位相同而平均數(shù)相關(guān)較大的兩組資料的差異程度。
1975年上海市區(qū)兩組女童體重的數(shù)據(jù):
平均數(shù)標(biāo)準(zhǔn)差差異系數(shù)2個(gè)月組5.45千克0.62千克11.38%6歲組19.02千克2.12千克11.15%3.差異系數(shù)的應(yīng)用條件差異系數(shù)主要應(yīng)用于平均數(shù)不等于零的連續(xù)數(shù)據(jù)。學(xué)科成績(jī)可以勉強(qiáng)計(jì)算差異系數(shù)。練習(xí)與思考107頁(yè)的有關(guān)練習(xí)題。對(duì)一組數(shù)據(jù)進(jìn)行描述時(shí),應(yīng)怎樣選擇合適的集中量和差異量?2005年9月再見!第六講概率及其二項(xiàng)分布一、概率的定義后驗(yàn)概率(或統(tǒng)計(jì)概率)
隨機(jī)事件的頻率當(dāng)n無限增大時(shí),隨機(jī)事件A的頻率會(huì)穩(wěn)定在一個(gè)常數(shù)P,這個(gè)常數(shù)就是隨機(jī)事件A的概率。(6.1)先驗(yàn)概率(古典概率)古典概率模型要求滿足兩個(gè)條件:⑴試驗(yàn)的所有可能結(jié)果是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。(6.2)二.概率的公理系統(tǒng)1.任何隨機(jī)事件A的概率都是在0與1之間的正數(shù),即0≤P(A)≤12.不可能事件的概率等于零,即P(A)=03.必然事件的概率等于1,即P(A)=1
三.概率的加法定理和乘法定理概率的加法定理若事件A發(fā)生,則事件B就一定不發(fā)生,這樣的兩個(gè)事件為互不相容事件。兩互不相容事件和的概率,等于這兩個(gè)事件概率之和,即(6.3)(6.4)概率的乘法定理若事件A發(fā)生不影響事件B是否發(fā)生,這樣的兩個(gè)事件為互相獨(dú)立事件。兩個(gè)互相獨(dú)立事件積的概率,等于這兩個(gè)事件概率的乘積,即(9.5)(9.6)例1:某一學(xué)生從5個(gè)試題中任意抽取一題,進(jìn)行口試。如果抽到每一題的概率為1/5,則抽到試題1或試題2的概率是多少?如果前一個(gè)學(xué)生把抽過的試題還回后,后一個(gè)學(xué)生再抽,則4個(gè)學(xué)生都抽到試題1的概率是多少?
計(jì)算抽到第一題或第二題的概率應(yīng)為抽到第一題的概率和抽到第二題的概率之和,即四個(gè)學(xué)生都抽到第一題即四個(gè)學(xué)生同時(shí)抽到第一題,其概率應(yīng)為抽到第一題的概率的乘積,即例2:從30個(gè)白球和20個(gè)黑球共50個(gè)球中隨機(jī)抽取兩次(放回抽樣),問抽出一個(gè)黑球和一個(gè)白球的概率是多少?抽出一個(gè)白球的概率為3/5,抽出一個(gè)黑球的概率為2/5。抽出一個(gè)黑球和一個(gè)白球的情況應(yīng)包括先抽出一個(gè)黑球、后抽出一個(gè)白球和先抽出一個(gè)白球、后抽出一個(gè)黑球兩種情況。因此:四、概率分布類型概率分布(probabilitydistribution)是指對(duì)隨機(jī)變量取不同值時(shí)的概率的描述,一般用概率分布函數(shù)進(jìn)行描述。依不同的標(biāo)準(zhǔn),對(duì)概率分布可作不同的分類。1、離散型分布與連續(xù)型分布依隨機(jī)變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。心理與教育統(tǒng)計(jì)學(xué)中最常用的離散型分布是二項(xiàng)分布,最常用的連續(xù)型分布是正態(tài)分布。
2、經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來源,可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布(empiricaldistribution)是指根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對(duì)頻率分布。理論分布(theoreticaldistribution)是按某種數(shù)學(xué)模型計(jì)算出的概率分布。3、基本隨機(jī)變量分布與抽樣分布依所描述的數(shù)據(jù)的樣本特性,可將概率分布分為基本隨機(jī)變量分布與抽樣分布(samplingdistribution)?;倦S機(jī)變量分布是隨機(jī)變量各種不同取值情況的概率分布,抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。五.二項(xiàng)分布二項(xiàng)分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機(jī)變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。1.二項(xiàng)試驗(yàn)滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):一次試驗(yàn)只有兩種可能的結(jié)果,即成功和失??;各次試驗(yàn)相互獨(dú)立,即各次試驗(yàn)之間互不影響;各次試驗(yàn)中成功的概率相等,失敗的概率也相等。2.二項(xiàng)分布函數(shù)二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。用n次方的二項(xiàng)展開式來表達(dá)在n次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)的不同次數(shù)(X=0,1…)的概率分布,叫做二項(xiàng)分布函數(shù)。二項(xiàng)展開式的通式(即二項(xiàng)分布函數(shù)):(6.7)二項(xiàng)展開式的要點(diǎn):項(xiàng)數(shù):二項(xiàng)展開式中共有n+1項(xiàng)。方次:p的方次,從n→0為降冪;q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù):各項(xiàng)系數(shù)是成功事件次數(shù)的組合數(shù)。例3:從男生占2/5的學(xué)校中隨機(jī)抽?。秱€(gè)學(xué)生,問正好抽到4個(gè)男生的概率是多少?最多抽到2個(gè)男生的概率是多少?解:將n=6,p=2/5,q=3/5,X=4代入(6.7)式,則恰好抽到4個(gè)男生的概率為最多抽到2個(gè)男生的概率,等于1個(gè)也沒有抽到、抽到1個(gè)和抽到兩個(gè)男生的概率之和,即3.二項(xiàng)分布圖以成功事件出現(xiàn)的次數(shù)為橫坐標(biāo),以成功事件出現(xiàn)不同次數(shù)的概率為縱坐標(biāo),繪制直方圖或多邊圖,即為二項(xiàng)分布圖。二項(xiàng)分布是離散型分布,其概率直方圖是躍階式。二項(xiàng)分布的性質(zhì)從概率直方圖可以看到,二項(xiàng)分布有如下性質(zhì):①.當(dāng)p=q時(shí),圖形是對(duì)稱的。②.當(dāng)p≠q時(shí),直方圖呈偏態(tài)。p>q與p<q時(shí)的偏斜方向相反。4.二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p>q且nq≥5(或者p<q且np≥5時(shí),二項(xiàng)分布接近于正態(tài)分布。可用下面的方法計(jì)算二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差。二項(xiàng)分布的平均數(shù)為二項(xiàng)分布的標(biāo)準(zhǔn)差為(6.8)(6.9)5.二項(xiàng)分布的應(yīng)用二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在教育中主要用來判斷試驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。例如,一個(gè)學(xué)生憑猜測(cè)做10個(gè)是非題,平均可以猜對(duì)5題。什么情況下可以說他是真會(huì)而不是猜測(cè)呢?這種問題需要用累積概率來算。當(dāng)做對(duì)8題或8題以上時(shí),累積概率為0.989,也就是說,猜對(duì)9題或10題的概率不足0.05。表6-1一個(gè)學(xué)生做10個(gè)正誤題做對(duì)不同題數(shù)的概率分布做對(duì)題目數(shù)出現(xiàn)方式數(shù)概率P(X)累積概率010.0010.0011100.0100.0112450.0440.05531200.1170.17242100.2050.37752520.2460.62362100.2050.82871200.1170.9458450.0440.9899100.0100.9991010.0011.000總和10241.000例題:一個(gè)教師對(duì)8個(gè)學(xué)生的作業(yè)成績(jī)進(jìn)行猜測(cè),如果教師猜對(duì)的可能性為1/3,問:⑴.平均能猜對(duì)幾個(gè)學(xué)生的成績(jī)?⑵.假如規(guī)定猜對(duì)95%,才算這個(gè)教師有一定的評(píng)判能力,那么這個(gè)教師至少要猜對(duì)幾個(gè)學(xué)生?解:⑴.⑵.練習(xí)與思考第194頁(yè)和196頁(yè)的有關(guān)習(xí)題。觀察我們的生活,看看哪些現(xiàn)象是服從二項(xiàng)分布規(guī)律的?2005年9月再見!第六講正態(tài)分布及其應(yīng)用一、標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore),又稱為基分?jǐn)?shù)或Z分?jǐn)?shù)(Z-score),是以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處位置的相對(duì)位置量數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù)從分?jǐn)?shù)對(duì)平均數(shù)的相對(duì)地位、該組分?jǐn)?shù)的離中趨勢(shì)兩個(gè)方面來表示原始分?jǐn)?shù)的地位。1.標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式為(7.1)
或Z分?jǐn)?shù)可以表明原始分?jǐn)?shù)在團(tuán)體中的相對(duì)位置,因此稱為相對(duì)位置量數(shù)。把原始分?jǐn)?shù)轉(zhuǎn)換成Z分?jǐn)?shù),就把單位不等距的和缺乏明確參照點(diǎn)的分?jǐn)?shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位、以平均數(shù)為參照點(diǎn)的分?jǐn)?shù)。2.標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)Z分?jǐn)?shù)無實(shí)際單位,是以平均數(shù)為參照點(diǎn)、以標(biāo)準(zhǔn)差為單位的相對(duì)量。一組原始分?jǐn)?shù)得到的Z分?jǐn)?shù)既有正值,也有負(fù)值,所有原始分?jǐn)?shù)的Z分?jǐn)?shù)之和為零。一組原始數(shù)據(jù)中,各個(gè)Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1。標(biāo)準(zhǔn)正態(tài)分布的平均值為0,標(biāo)準(zhǔn)差為1。3.標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)
可比性:標(biāo)準(zhǔn)分?jǐn)?shù)以團(tuán)體的平均數(shù)為基準(zhǔn),以標(biāo)準(zhǔn)差為單位,因而具有可比性??杉有裕簶?biāo)準(zhǔn)分?jǐn)?shù)使不同的原始分?jǐn)?shù)具有相同的參照點(diǎn),因而具有可加性。明確性:標(biāo)準(zhǔn)分?jǐn)?shù)較原始分?jǐn)?shù)的意義更為明確。合理性:標(biāo)準(zhǔn)分?jǐn)?shù)保證了不同性質(zhì)的分?jǐn)?shù)在總分?jǐn)?shù)中的權(quán)重相同,使分?jǐn)?shù)更合理地反映事實(shí)。4、標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用用于比較幾個(gè)分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低。計(jì)算不同質(zhì)的觀測(cè)值的總和或平均值,以表示在團(tuán)體中的相對(duì)位置。當(dāng)研究需要合成不同質(zhì)的數(shù)據(jù)時(shí),如果已知這些不同質(zhì)的觀測(cè)值的次數(shù)分布為正態(tài),這時(shí)可采用Z分?jǐn)?shù)來計(jì)算不同質(zhì)的觀測(cè)值的總和或平均值。表示標(biāo)準(zhǔn)測(cè)驗(yàn)分?jǐn)?shù)
經(jīng)過標(biāo)準(zhǔn)化的心理和教育測(cè)驗(yàn),常常用標(biāo)準(zhǔn)分?jǐn)?shù)表示測(cè)驗(yàn)結(jié)果。如果其常模分?jǐn)?shù)分布接近正態(tài)分布,為了克服標(biāo)準(zhǔn)分?jǐn)?shù)出現(xiàn)的小數(shù)、負(fù)數(shù)和不易為人們所接受等缺點(diǎn),常常是將其轉(zhuǎn)換成正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)。轉(zhuǎn)換公式為:
(7.2)
例如:早期智力測(cè)驗(yàn)中運(yùn)用智力商數(shù)表示智力測(cè)查的指標(biāo)這種表示智力的方法后來被離差智商取代:異常值的取舍
在一個(gè)正態(tài)分布中,平均數(shù)上下一定的標(biāo)準(zhǔn)差處,包含有確定百分?jǐn)?shù)的數(shù)據(jù)個(gè)數(shù)?!?σP=68.26%±2σP=95.45%±3σP=99.73%可以看到,在平均數(shù)上下各三個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),分布著全部數(shù)據(jù)的99.73%,反言之,在三個(gè)標(biāo)準(zhǔn)差之外的數(shù)據(jù)不足0.27%,因此常把“三個(gè)標(biāo)準(zhǔn)差”做為判斷可疑值取舍的依據(jù)。二.正態(tài)分布正態(tài)分布(normaldistribution)也稱為常態(tài)分布,是連續(xù)型隨機(jī)變量概率分布的一種,是在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。正態(tài)分布由棣.莫弗于1733年發(fā)現(xiàn)的。拉普拉斯、高斯對(duì)正態(tài)分布的研究也做出了貢獻(xiàn),故有時(shí)稱正態(tài)分布為高斯分布。1.正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般公式為公式所描述的正態(tài)曲線,由σ和μ兩個(gè)參數(shù)決定。2.標(biāo)準(zhǔn)正態(tài)分布曲線將標(biāo)準(zhǔn)分?jǐn)?shù)代入正態(tài)曲線函數(shù)并且,令σ=1則公式變換為標(biāo)準(zhǔn)正態(tài)分布函數(shù):以Z為橫坐標(biāo),以Y為縱坐標(biāo),可繪制標(biāo)準(zhǔn)正態(tài)分布曲線。標(biāo)準(zhǔn)正態(tài)分布曲線的縱線高度Y為概率密度,曲線下的面積為概率。3.標(biāo)準(zhǔn)正態(tài)分布曲線的特點(diǎn)⑴.曲線在Z=0處達(dá)到最高點(diǎn)⑵.曲線以Z=0處為中心,雙側(cè)對(duì)稱⑶.曲線從最高點(diǎn)向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。⑷.標(biāo)準(zhǔn)正態(tài)分布曲線的平均數(shù)為0,標(biāo)準(zhǔn)差為1。從Z=-3至Z=+3之間幾乎分布著全部數(shù)據(jù)。⑸.曲線的拐點(diǎn)為正負(fù)一個(gè)標(biāo)準(zhǔn)差處。三.標(biāo)準(zhǔn)正態(tài)分布表及使用1.標(biāo)準(zhǔn)正態(tài)分布表利用積分公式可求出正態(tài)曲線下任何區(qū)間的面積,但需要計(jì)算,非常麻煩。統(tǒng)計(jì)學(xué)家已編制好了標(biāo)準(zhǔn)正態(tài)分布表,使其使用非常方便。正態(tài)分布表的特點(diǎn):
表中僅列有標(biāo)準(zhǔn)正態(tài)曲線下的面積,因此,查表前應(yīng)先將原始變量X轉(zhuǎn)換為Z。表中列出的數(shù)據(jù),是從Z=0到右邊某一Z值之間的面積,查表時(shí)應(yīng)注意合理使用。2.已知Z值求概率⑴.求Z=0至某一Z值之間的概率:直接查表⑵.求兩個(gè)Z值之間的概率兩Z值符號(hào)相同:PZ1-Z2=PZ2-PZ1兩Z值符號(hào)相反:PZ1-Z2=PZ2+PZ1⑶.求某一Z值以上的概率Z>0時(shí),PZ-∞=0.5-PZZ<0時(shí),PZ-∞=0.5+PZ⑷.求某一Z值以下的概率Z>0時(shí),P-∞-Z=0.5+PZZ<0時(shí),P-∞-Z=0.5-PZ3.已知面積(概率)求Z值⑴.求Z=0以上或以下某一面積對(duì)應(yīng)的Z值:直接查表⑵.求與正態(tài)曲線上端或下端某一面積P相對(duì)應(yīng)的Z值:先用0.5-PZ,再查表⑶.求與正態(tài)曲線下中央部位某一面積相對(duì)應(yīng)的Z值:先計(jì)算P/2,再查表4.已知概率P或Z值,求概率密度Y直接查正態(tài)分布表就能得到相應(yīng)的概率密度Y值。如果由概率P求Y值,要注意區(qū)分已知概率是位于正態(tài)曲線的中間部分,還是兩尾端部分,才能通過查表求得正確的概率密度。四.正態(tài)分布
在測(cè)驗(yàn)記分方面的應(yīng)用1.以標(biāo)準(zhǔn)分?jǐn)?shù)表示考試成績(jī)
比較學(xué)生的考試成績(jī)時(shí),使用原始分?jǐn)?shù)有其不合理之處:⑴.原始分制度沒有提示考生成績(jī)?cè)诳忌鷪F(tuán)體成績(jī)中的位置。⑵.由于各科命題難度不同,導(dǎo)致各科原始分之間不能直接比較,造成分?jǐn)?shù)解釋上的困難。⑶.各科原始分相加不合理。采用標(biāo)準(zhǔn)分?jǐn)?shù),有如下特點(diǎn):⑴.標(biāo)準(zhǔn)分的大小,既表明考生水平的高低,也表明該生在考生團(tuán)體中的位置的高低。⑵.各科標(biāo)準(zhǔn)分都表示考生各科在同一團(tuán)體中的位置,可根據(jù)標(biāo)準(zhǔn)分大小直接比較考生的各科成績(jī)水平。⑶.各科標(biāo)準(zhǔn)分的參照點(diǎn)(平均分為500分)和單位(1個(gè)標(biāo)準(zhǔn)差為100分)都一樣,具有可加性,克服了原始分的缺陷。目前我國(guó)一些省在高考中采用標(biāo)準(zhǔn)分?jǐn)?shù)表示考生的成績(jī),為了使分?jǐn)?shù)更適合一般習(xí)慣,對(duì)標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)一步做轉(zhuǎn)換:2.確定等級(jí)評(píng)定的人數(shù)如要將某種能力的分?jǐn)?shù)分成等距的幾個(gè)等級(jí),在確定各等級(jí)人數(shù)時(shí),可將正態(tài)分布基線上Z=-3至Z=+3之間6個(gè)標(biāo)準(zhǔn)差的距離分成相等的幾份,然后查表求出各段Z值之間的面積,再乘以總?cè)藬?shù),即為各等級(jí)人數(shù)。3.品質(zhì)評(píng)定數(shù)量化在心理與教育研究中,常常遇到等級(jí)評(píng)定的結(jié)果。但是不同評(píng)定者的評(píng)定結(jié)果往往不一致,無法綜合他們的評(píng)定結(jié)果,而且等級(jí)分?jǐn)?shù)不是等距數(shù)據(jù),不同事物的評(píng)定結(jié)果不能直接比較。將品質(zhì)評(píng)定的結(jié)果轉(zhuǎn)化為數(shù)量結(jié)果,就可解決這些問題。具體方法根據(jù)各等級(jí)被評(píng)者的數(shù)目求各等級(jí)的人數(shù)比率;求各等級(jí)比率值的中間值;求各等級(jí)中點(diǎn)以上(或以下)的累積比率;用累積比率查正態(tài)分布表;求被評(píng)者所得評(píng)定等級(jí)的數(shù)量化值的平均值。練習(xí)與思考第195頁(yè)的有關(guān)習(xí)題。標(biāo)準(zhǔn)分?jǐn)?shù)的意義是什么?正態(tài)分布還有哪些應(yīng)用?2005年10月再見!第八講抽樣分布與參數(shù)估計(jì)復(fù)習(xí):正態(tài)分布
在測(cè)驗(yàn)記分方面的應(yīng)用1.以標(biāo)準(zhǔn)分?jǐn)?shù)表示考試成績(jī)
比較學(xué)生的考試成績(jī)時(shí),使用原始分?jǐn)?shù)有其不合理之處:⑴.原始分制度沒有提示考生成績(jī)?cè)诳忌鷪F(tuán)體成績(jī)中的位置。⑵.由于各科命題難度不同,導(dǎo)致各科原始分之間不能直接比較,造成分?jǐn)?shù)解釋上的困難。⑶.各科原始分相加不合理。采用標(biāo)準(zhǔn)分?jǐn)?shù),有如下特點(diǎn):⑴.標(biāo)準(zhǔn)分的大小,既表明考生水平的高低,也表明該生在考生團(tuán)體中的位置的高低。⑵.各科標(biāo)準(zhǔn)分都表示考生各科在同一團(tuán)體中的位置,可根據(jù)標(biāo)準(zhǔn)分大小直接比較考生的各科成績(jī)水平。⑶.各科標(biāo)準(zhǔn)分的參照點(diǎn)(平均分為500分)和單位(1個(gè)標(biāo)準(zhǔn)差為100分)都一樣,具有可加性,克服了原始分的缺陷。例題:下表是兩名高考學(xué)生的成績(jī),試分析哪一位考生的成績(jī)更好?科目原始成績(jī)?nèi)w考生Z分?jǐn)?shù)甲乙平均分標(biāo)準(zhǔn)差甲乙語(yǔ)文858970101.51.9政治70626551-0.6外語(yǔ)6872698-0.1250.375數(shù)學(xué)53405060.5-1.67理化7287758-0.3751.5Σ3483502.51.505目前我國(guó)一些省在高考中采用標(biāo)準(zhǔn)分?jǐn)?shù)表示考生的成績(jī),為了使分?jǐn)?shù)更適合一般習(xí)慣,對(duì)標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)一步做轉(zhuǎn)換:2.確定等級(jí)評(píng)定的人數(shù)如要將某種能力的分?jǐn)?shù)分成等距的幾個(gè)等級(jí),在確定各等級(jí)人數(shù)時(shí),可將正態(tài)分布基線上Z=-3至Z=+3之間6個(gè)標(biāo)準(zhǔn)差的距離分成相等的幾份,然后查表求出各段Z值之間的面積,再乘以總?cè)藬?shù),即為各等級(jí)人數(shù)。計(jì)算:今有1000人參加一項(xiàng)數(shù)學(xué)能力測(cè)驗(yàn),欲將測(cè)驗(yàn)結(jié)果評(píng)為六個(gè)等級(jí)。問各等級(jí)評(píng)定的人數(shù)應(yīng)是多少?3.品質(zhì)評(píng)定數(shù)量化在心理與教育研究中,常常遇到等級(jí)評(píng)定的結(jié)果。但是不同評(píng)定者的評(píng)定結(jié)果往往不一致,無法綜合他們的評(píng)定結(jié)果,而且等級(jí)分?jǐn)?shù)不是等距數(shù)據(jù),不同事物的評(píng)定結(jié)果不能直接比較。將品質(zhì)評(píng)定的結(jié)果轉(zhuǎn)化為數(shù)量結(jié)果,就可解決這些問題。具體方法根據(jù)各等級(jí)被評(píng)者的數(shù)目求各等級(jí)的人數(shù)比率;求各等級(jí)比率值的中間值;求各等級(jí)中點(diǎn)以上(或以下)的累積比率;用累積比率查正態(tài)分布表;求被評(píng)者所得評(píng)定等級(jí)的數(shù)量化值的平均值。P169例題3名教師對(duì)100名學(xué)生的評(píng)定結(jié)果等級(jí)評(píng)定結(jié)果(人數(shù))教師甲教師乙教師丙A51020B252025C404035D252015E5102總數(shù)1001001001.960.940-0.94-1.961.650.840-0.84-1.651.280.45-0.32-1.15-1.96一、抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計(jì)量的概率分布1.抽樣分布的概念抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。抽樣分布是一個(gè)理論的概率分布,是統(tǒng)計(jì)推斷的依據(jù)。2.平均數(shù)抽樣分布的幾個(gè)定理
⑴.從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。⑵.容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差(即平均數(shù)的標(biāo)準(zhǔn)誤),等于總體標(biāo)準(zhǔn)差除以n的平方根。(8.1)(8.2)⑶.從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。⑷.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。二.標(biāo)準(zhǔn)誤某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近,樣本對(duì)總體越有代表性,用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。因此,標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷可靠性的指標(biāo)。平均數(shù)標(biāo)準(zhǔn)誤的計(jì)算1.總體正態(tài),σ已知(不管樣本容量大?。蚩傮w非正態(tài),σ已知,大樣本平均數(shù)的標(biāo)準(zhǔn)誤為:平均數(shù)標(biāo)準(zhǔn)誤的計(jì)算2.總體正態(tài),σ未知(不管樣本容量大?。?,或總體非正態(tài),σ未知,大樣本平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為(8.3)三.平均數(shù)離差統(tǒng)計(jì)量的分布由樣本的平均數(shù)對(duì)總體平均數(shù)進(jìn)行估計(jì),首先要了解平均數(shù)離差統(tǒng)計(jì)量的分布,才能根據(jù)一定的概率,由樣本的平均數(shù)對(duì)總體的平均數(shù)做出估計(jì)。1.總體正態(tài),σ已知(不管樣本容量大小),
或總體非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài)分布(8.4)2.總體正態(tài),σ未知(不管樣本容量大?。?,
或總體非正態(tài),σ未知,大樣本平均數(shù)離差的的抽樣分布呈t分布(8.5)t分布的特點(diǎn)⑴.形狀與正態(tài)分布曲線相似⑵.t分布曲線隨自由度不同而有一簇曲線⑶.自由度的計(jì)算:自由度是指能夠獨(dú)立變化的數(shù)據(jù)個(gè)數(shù)。⑷.查t分布表時(shí),需根據(jù)自由度及相應(yīng)的顯著性水平,并要注意是單側(cè)數(shù)據(jù)還是雙側(cè)。3.總體σ未知,大樣本時(shí)的近似處理樣本容量增大后,平均數(shù)的抽樣分布接近于正態(tài)分布,可用正態(tài)分布近似處理:(8.6)四.總體參數(shù)估計(jì)的基本原理根據(jù)樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所作的估計(jì)叫作總體參數(shù)估計(jì)??傮w參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。由樣本的標(biāo)準(zhǔn)差估計(jì)總體的標(biāo)準(zhǔn)差即為點(diǎn)估計(jì);而由樣本的平均數(shù)估計(jì)總體平均數(shù)的取值范圍則為區(qū)間估計(jì)。1.良好的點(diǎn)估計(jì)量應(yīng)具備的條件無偏性
如果一切可能個(gè)樣本統(tǒng)計(jì)量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計(jì)量就是總體參數(shù)的無偏估計(jì)量。有效性
當(dāng)總體參數(shù)不止有一種無偏估計(jì)量時(shí),某一種估計(jì)量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。
良好的點(diǎn)估計(jì)量應(yīng)具備的條件一致性當(dāng)樣本容量無限增大時(shí),估計(jì)量的值能越來越接近它所估計(jì)的總體參數(shù)值,這種估計(jì)是總體參數(shù)一致性估計(jì)量。充分性一個(gè)容量為n的樣本統(tǒng)計(jì)量,應(yīng)能充分地反映全部n個(gè)數(shù)據(jù)所反映的總體的信息。2.區(qū)間估計(jì)以樣本統(tǒng)計(jì)量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。對(duì)總體參數(shù)值進(jìn)行區(qū)間估計(jì),就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。⑴要知道與所要估計(jì)的參數(shù)相對(duì)應(yīng)的樣本統(tǒng)計(jì)量的值,以及樣本統(tǒng)計(jì)量的理論分布;⑵要求出該種統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤;⑶要確定在多大的可靠度上對(duì)總體參數(shù)作估計(jì),再通過某種理論概率分布表,找出與某種可靠度相對(duì)應(yīng)的該分布橫軸上記分的臨界值,才能計(jì)算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時(shí)正確的可能性(概率)。置信區(qū)間,也稱置信間距(confidenceinterval,CI)是指在某一置信度時(shí),總體參數(shù)所在的區(qū)域距離或區(qū)域長(zhǎng)度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)時(shí),置信概率表示做出正確推斷的可能性,但這種估計(jì)還是會(huì)有犯錯(cuò)誤的可能。顯著性水平(significancelevel)就是指估計(jì)總體參數(shù)落在某一區(qū)間時(shí),可能犯錯(cuò)誤的概率,用符號(hào)α表示。
P=1-α3.平均數(shù)區(qū)間估計(jì)的基本原理通過樣本的平均數(shù)估計(jì)總體的平均數(shù),首先假定該樣本是隨機(jī)取自一個(gè)正態(tài)分布的母總體(或非正態(tài)總體中的n>30的樣本),而計(jì)算出來的實(shí)際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個(gè)。根據(jù)樣本平均數(shù)的分布理論,可以對(duì)總體平均數(shù)進(jìn)行估計(jì),并以概率說明其正確的可能性。練習(xí)與思考平均數(shù)的抽樣分布有哪些規(guī)律?什么是點(diǎn)估計(jì)?什么是區(qū)間估計(jì)?良好的點(diǎn)估計(jì)量應(yīng)具備什么條件?下次學(xué)習(xí)內(nèi)容:總體平均數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本原理2005年10月再見!第九講參數(shù)估計(jì)方法與假設(shè)檢驗(yàn)的基本原理一.總體參數(shù)估計(jì)的基本原理根據(jù)樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所作的估計(jì)叫作總體參數(shù)估計(jì)。總體參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。由樣本的標(biāo)準(zhǔn)差估計(jì)總體的標(biāo)準(zhǔn)差即為點(diǎn)估計(jì);而由樣本的平均數(shù)估計(jì)總體平均數(shù)的取值范圍則為區(qū)間估計(jì)。1.良好的點(diǎn)估計(jì)量應(yīng)具備的條件無偏性
如果一切可能個(gè)樣本統(tǒng)計(jì)量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計(jì)量就是總體參數(shù)的無偏估計(jì)量。有效性
當(dāng)總體參數(shù)不止有一種無偏估計(jì)量時(shí),某一種估計(jì)量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。
良好的點(diǎn)估計(jì)量應(yīng)具備的條件一致性當(dāng)樣本容量無限增大時(shí),估計(jì)量的值能越來越接近它所估計(jì)的總體參數(shù)值,這種估計(jì)是總體參數(shù)一致性估計(jì)量。充分性一個(gè)容量為n的樣本統(tǒng)計(jì)量,應(yīng)能充分地反映全部n個(gè)數(shù)據(jù)所反映的總體的信息。2.區(qū)間估計(jì)以樣本統(tǒng)計(jì)量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。對(duì)總體參數(shù)值進(jìn)行區(qū)間估計(jì),就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。⑴要知道與所要估計(jì)的參數(shù)相對(duì)應(yīng)的樣本統(tǒng)計(jì)量的值,以及樣本統(tǒng)計(jì)量的理論分布;⑵要求出該種統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤;⑶要確定在多大的可靠度上對(duì)總體參數(shù)作估計(jì),再通過某種理論概率分布表,找出與某種可靠度相對(duì)應(yīng)的該分布橫軸上記分的臨界值,才能計(jì)算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時(shí)正確的可能性(概率)。置信區(qū)間,也稱置信間距(confidenceinterval,CI)是指在某一置信度時(shí),總體參數(shù)所在的區(qū)域距離或區(qū)域長(zhǎng)度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)時(shí),置信概率表示做出正確推斷的可能性,但這種估計(jì)還是會(huì)有犯錯(cuò)誤的可能。顯著性水平(significancelevel)就是指估計(jì)總體參數(shù)落在某一區(qū)間時(shí),可能犯錯(cuò)誤的概率,用符號(hào)α表示。
P=1-α3.平均數(shù)區(qū)間估計(jì)的基本原理通過樣本的平均數(shù)估計(jì)總體的平均數(shù),首先假定該樣本是隨機(jī)取自一個(gè)正態(tài)分布的母總體(或非正態(tài)總體中的n>30的樣本),而計(jì)算出來的實(shí)際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個(gè)。根據(jù)樣本平均數(shù)的分布理論,可以對(duì)總體平均數(shù)進(jìn)行估計(jì),并以概率說明其正確的可能性。二.總體平均數(shù)的區(qū)間估計(jì)1.總體平均數(shù)區(qū)間估計(jì)的基本步驟①.根據(jù)樣本的數(shù)據(jù),計(jì)算樣本的平均數(shù)和標(biāo)準(zhǔn)差;②.計(jì)算平均數(shù)抽樣分布的標(biāo)準(zhǔn)誤;③.確定置信概率或顯著性水平;④.根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計(jì)表;⑤.計(jì)算置信區(qū)間;⑥.解釋總體平均數(shù)的置信區(qū)間。2.平均數(shù)區(qū)間估計(jì)的計(jì)算①總體正態(tài),σ已知(不管樣本容量大?。?,或總體非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài),平均數(shù)的置信區(qū)間為:(9.1)例題1:某小學(xué)10歲全體女童身高歷年來標(biāo)準(zhǔn)差為6.25厘米,現(xiàn)從該校隨機(jī)抽27名10歲女童,測(cè)得平均身高為134.2厘米,試估計(jì)該校10歲全體女童平均身高的95%和99%置信區(qū)間。解:10歲女童的身高假定是從正態(tài)總體中抽出的隨機(jī)樣本,并已知總體標(biāo)準(zhǔn)差為σ=6.25。無論樣本容量大小,一切樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù)呈正態(tài)分布。于是可用正態(tài)分布來估計(jì)該校10歲女童身高總體平均數(shù)95%和99%的置信區(qū)間。其標(biāo)準(zhǔn)誤為當(dāng)P=0.95時(shí),Z=±1.96因此,該校10歲女童平均身高95%的置信區(qū)間為:當(dāng)P=0.99時(shí),Z=±2.58因此,該校10歲女童平均身高99%的置信區(qū)間為:②總體正態(tài),σ未知(不管樣本容量大?。?,
或總體非正態(tài),σ未知,大樣本平均數(shù)離差的抽樣分布為t分布,平均數(shù)的置信區(qū)間為:(9.2)例題2:從某小學(xué)三年級(jí)隨機(jī)抽取12名學(xué)生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試估計(jì)該校三年級(jí)學(xué)生閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。解:12名學(xué)生閱讀能力的得分假定是從正態(tài)總體中抽出的隨機(jī)樣本,而總體標(biāo)準(zhǔn)差σ未知,樣本的容量較?。ǎ?12<30),在此條件下,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量服從呈t分布。于是需用t分布來估計(jì)該校三年級(jí)學(xué)生閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。由原始數(shù)據(jù)計(jì)算出樣本統(tǒng)計(jì)量為當(dāng)P=0.95時(shí),因此,該校三年級(jí)學(xué)生閱讀能力得分95%的置信區(qū)間為:當(dāng)P=0.99時(shí),因此,該校三年級(jí)學(xué)生閱讀能力得分99%的置信區(qū)間為:③總體正態(tài),σ未知,大樣本
平均數(shù)的抽樣分布接近于正態(tài)分布,用正態(tài)分布代替t分布近似處理:(9.3)例題3:從某年高考中隨機(jī)抽取102份作文試卷,算得平均分?jǐn)?shù)為26,標(biāo)準(zhǔn)差為1.5,試估計(jì)全部考生作文成績(jī)95%和99%的置信區(qū)間。解:學(xué)生高考分?jǐn)?shù)假定是從正態(tài)總體中抽出的隨機(jī)樣本,而總體的標(biāo)準(zhǔn)差σ未知,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量呈t分布。但是由于樣本容量較大(n=120>30),t分布接近于正態(tài)分布,因此可用正態(tài)分布近似處理。其標(biāo)準(zhǔn)誤為當(dāng)P=0.95時(shí),Z=±1.96因此,該年全部考生作文成績(jī)95%的置信區(qū)間為:當(dāng)P=0.99時(shí),Z=±2.58因此,該年全部考生作文成績(jī)99%的置信區(qū)間為:④總體非正態(tài),小樣本
不能進(jìn)行參數(shù)估計(jì),即不能根據(jù)樣本分布對(duì)總體平均數(shù)進(jìn)行估計(jì)。三、假設(shè)檢驗(yàn)的基本原理利用樣本信息,根據(jù)一定概率,對(duì)總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗(yàn)。1.假設(shè)假設(shè)檢驗(yàn)一般有兩互相對(duì)立的假設(shè)。H0:零假設(shè),或稱原假設(shè)、虛無假設(shè)(nullhypothesis)、解消假設(shè);是要檢驗(yàn)的對(duì)象之間沒有差異的假設(shè)。H1:備擇假設(shè)(alternativehypothesis),或稱研究假設(shè)、對(duì)立假設(shè);是與零假設(shè)相對(duì)立的假設(shè),即存在差異的假設(shè)。進(jìn)行假設(shè)檢驗(yàn)時(shí),一般是從零假設(shè)出發(fā),以樣本與總體無差異的條件計(jì)算統(tǒng)計(jì)量的值,并分析計(jì)算結(jié)果在抽樣分布上的概率,根據(jù)相應(yīng)的概率判斷應(yīng)接受零假設(shè)、拒絕研究假設(shè)還是拒絕零假設(shè)、接受研究假設(shè)。2.小概率事件樣本統(tǒng)計(jì)量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時(shí)就認(rèn)為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機(jī)事件稱為小概率事件。當(dāng)概率足夠小時(shí),可以作為從實(shí)際可能性上,把零假設(shè)加以否定的理由。因?yàn)楦鶕?jù)這個(gè)原理認(rèn)為:在隨機(jī)抽樣的條件下,一次實(shí)驗(yàn)竟然抽到與總體參數(shù)值有這么大差異的樣本,可能性是極小的,實(shí)際中是罕見的,幾乎是不可能的。3.顯著性水平統(tǒng)計(jì)學(xué)中把拒絕零假設(shè)的概率稱為顯著性水平,用α表示。顯著性水平也是進(jìn)行統(tǒng)計(jì)推斷時(shí),可能犯錯(cuò)誤的概率。常用的顯著性水平有兩個(gè):α=0.05和α=0.01。在抽樣分布曲線上,顯著性水平既可以放在曲線的一端(單側(cè)檢驗(yàn)),也可以分在曲線的兩端(雙側(cè)檢驗(yàn))。圖9-1正態(tài)抽樣分布上α=0.05的三種不同位置αα4.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤及其控制對(duì)于總體參數(shù)的假設(shè)檢驗(yàn),有可能犯兩種類型的錯(cuò)誤,即α錯(cuò)誤和β錯(cuò)誤。表9-1假設(shè)檢驗(yàn)中的兩類錯(cuò)誤H0為真H0為假拒絕H0α錯(cuò)誤正確接受H0正確β錯(cuò)誤為了將兩種錯(cuò)誤同時(shí)控制在相對(duì)最小的程度,研究者往往通過選擇適當(dāng)?shù)娘@著性水平而對(duì)α錯(cuò)誤進(jìn)行控制,如α=0.05或α=0.01。對(duì)β錯(cuò)誤,則一方面使樣本容量增大,另一方面采用合理的檢驗(yàn)形式(即單側(cè)檢驗(yàn)或雙側(cè)檢驗(yàn))來使β誤差得到控制。在確定檢驗(yàn)形式時(shí),凡是檢驗(yàn)是否與假設(shè)的總體一致的假設(shè)檢驗(yàn),α被分散在概率分布曲線的兩端,因此稱為雙側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ=μ0,H1:μ≠μ0凡是檢驗(yàn)大于或小于某一特定條件的假設(shè)檢驗(yàn),α是在概率分布曲線的一端,因此稱為單側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ≥μ0,H1:μ<μ0或者H0:μ≤μ0,H1:μ>μ05.假設(shè)檢驗(yàn)的基本步驟一個(gè)完整的假設(shè)檢驗(yàn)過程,一般經(jīng)過四個(gè)主要步驟:⑴.提出假設(shè)⑵.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算統(tǒng)計(jì)量的值⑶.確定顯著性水平⑷.做出統(tǒng)計(jì)結(jié)論練習(xí)與思考書222頁(yè)第1、3、5、6、7、8題。怎樣由樣本平均數(shù)對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)?假設(shè)檢驗(yàn)是怎樣解決問題的?下次學(xué)習(xí)內(nèi)容:平均數(shù)的顯著性檢驗(yàn)(第八章第二節(jié))2005年10月再見!第十講平均數(shù)的顯著性檢驗(yàn)一.總體平均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業(yè)管理系統(tǒng)開發(fā)合作協(xié)議
- 農(nóng)業(yè)科技推廣應(yīng)用案例分析
- 維修服務(wù)委托合同
- 金融產(chǎn)品開發(fā)合作協(xié)議
- 旅游行業(yè)游客安全與責(zé)任免除合同
- 學(xué)生自制動(dòng)漫電影小感悟
- 昆蟲記的讀后感
- 食品營(yíng)養(yǎng)與健康功能性食品知識(shí)點(diǎn)題集
- 寵物行業(yè)智能門店與健康管理方案
- 市場(chǎng)營(yíng)銷策略效果評(píng)估表格模板(行業(yè)A)
- 四川政采評(píng)審專家入庫(kù)考試基礎(chǔ)題復(fù)習(xí)測(cè)試卷附答案
- 2024解析:第十二章滑輪-基礎(chǔ)練(解析版)
- 《社會(huì)應(yīng)急力量建設(shè)基礎(chǔ)規(guī)范 第2部分:建筑物倒塌搜救》知識(shí)培訓(xùn)
- 國(guó)有企業(yè)管理人員處分條例培訓(xùn)2024
- 浙江省寧波市2025屆高三上學(xué)期一??荚嚁?shù)學(xué)試卷 含解析
- 代理記賬業(yè)務(wù)內(nèi)部規(guī)范(三篇)
- 腰椎間盤突出癥課件(共100張課件)
- 委托調(diào)解民事糾紛協(xié)議書合同
- 中醫(yī)四季養(yǎng)生之道課件
- 消防安全教育主題班會(huì)課件
- 7.1.2 直觀圖的畫法-【中職專用】高一數(shù)學(xué)教材配套課件(高教版2021·基礎(chǔ)模塊下冊(cè))
評(píng)論
0/150
提交評(píng)論