6第六章 抽樣分布及總體平均數(shù)的推斷_第1頁
6第六章 抽樣分布及總體平均數(shù)的推斷_第2頁
6第六章 抽樣分布及總體平均數(shù)的推斷_第3頁
6第六章 抽樣分布及總體平均數(shù)的推斷_第4頁
6第六章 抽樣分布及總體平均數(shù)的推斷_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 抽樣分布及總體平均數(shù)的推斷抽樣分布;總體平均數(shù)的參數(shù)估計假設檢驗總體平均數(shù)顯著性檢驗6.1 抽樣分布6.1.1抽樣分布的含義總體分布:總體內(nèi)個體數(shù)值的頻率分布;樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布;抽樣分布:某一種統(tǒng)計量的頻率分布。135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 127 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 1

2、31 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122 128 127 125 127 131師大附小二年級80個學生的身高師大附小二年級80個學生的身高總體分布:總體內(nèi)個體數(shù)值的頻率分布1351341291331311311311341241321221241271311371321341381241321281361271201311201211441281331281271261301221281271251

3、27131135127127133130132132129師大附小二年級中48個學生的身高容量=48 平均數(shù)=129.5625 標準差=4.8942師大附小二年級中48個學生的身高 樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布所抽取的各樣本的平均數(shù)如下:129.825 126.55 128.575 129.5 128.52 130.72 129.55 129.45 129.68 129.385 129.95 130.27 128.57 128.9 125.65 容量=50 平均數(shù)=129.00 標準差=1.34容量=50 平均數(shù)=129.00 標準差=1.34根據(jù)抽樣平均數(shù)頻率分布表制作的多邊圖 上海市

4、初中一年級末數(shù)學水平的調(diào)查研究,在該研究中假定上海市共有初中一年級學生為150000人( N 人),如果對上海所有初中一年級學生進行統(tǒng)一的標準化的數(shù)學成就測驗,其測驗的平均成績?yōu)?0分( ),測驗的標準差為9分( )。例1例2 某一調(diào)查研究者甲為了節(jié)省調(diào)查研究的成本,現(xiàn)從上海市初中一年級學生中隨機抽取500人(n人)進行統(tǒng)一的標準化的數(shù)學成就測驗,試圖通過這500人的測驗結果來推斷全上海初中一年級學生的數(shù)學水平,其測驗的平均成績?yōu)?2分( ),測驗的標準差為8分(x)。1 分析上述實例區(qū)分總體和樣本區(qū)分參數(shù)與統(tǒng)計量及不同的表達方式 如果我們用上海初一年級150000個學生的成績做圖,則構成一個

5、總體分布圖:概率密度或百分比成績 如果我們只用其中抽取的500個個學生的成績做圖,則構成一個樣本分布圖:概率密度或百分比成績2、抽樣分析 假定該研究者第一次抽取500人做完調(diào)查研究后,又重新從上海初中一年級學生中(150000人)抽取500人(n2)進行調(diào)查研究,其平均數(shù)為: 標準差為:x2 (抽取學生的過程中,前面抽到的學生在后面抽取中也可能抽到,但不重復測驗) 。 如果上述過程不斷重復操作,則可以得到更多的樣本平均數(shù)和標準差,如下表: 如果我們用k (k趨近于無窮大)個樣本平均數(shù)做頻數(shù)分布圖,則構成一個由樣本平均數(shù)組成的抽樣分布(平均數(shù)抽樣分布)圖:概率密度或百分比抽樣的平均成績由這些抽樣

6、的平均數(shù)構成的平均數(shù) 由這些抽樣平均數(shù)組成分布的標準差稱為平均數(shù)的標準誤用 來表示。 標準誤(STANDARD ERRORS):某種統(tǒng)計量的標準差稱為該統(tǒng)計量的標準誤。 抽樣分布是某一種統(tǒng)計量的概率分布。 6.1.2平均數(shù)抽樣分布的幾個定理3、正態(tài)總體中,平均數(shù)的抽樣分布呈正態(tài)1、2、4、偏態(tài)總體中,當抽樣容量較大時,平均數(shù)的抽樣分布也呈正態(tài)6.1.3 樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量平均數(shù)為:標準差為:離差統(tǒng)計量是以標準差為單位來來度量某一個個案值與平均數(shù)間的差異。Z分數(shù)就是一種離差統(tǒng)計量當總體標準差已知時,平均數(shù)的離差統(tǒng)計量的計算:當總體標準差未知時,平均數(shù)的離差統(tǒng)計量的計算: 首先根據(jù)

7、樣本標準差( x )來估計總體標準差() 其估計值用S來表示。因此,平均數(shù)的標準誤為:離差統(tǒng)計量的表達形式為:練習1: 某校二年級學生的英語平均成績?yōu)?8,從中隨機抽取50人,其平均成績?yōu)?2,標準差為12。試估計該校二年級學生英語成績的標準差,并計算50人平均成績的離差統(tǒng)計量。關于T分布:關于Z分布與T分布的區(qū)別:當總體方差已知時,Z只隨樣本平均數(shù)而變化;當總體方差未知時,T不僅隨樣本平均數(shù)而變化,而且還隨S而變化。T分布的特點:T分布的形態(tài)隨自由度的變化呈一簇分布形態(tài)(即自由度不同的T分布形態(tài)也不同);T分布的峰狹窄尖峭,尾長而翹得高;自由度越小,分布范圍越廣;自由度趨于無限大,T分布接近

8、正態(tài)分布;自由度df:指總體參數(shù)估計量中變量值自由變化的個數(shù)。6.2 總體平均數(shù)的參數(shù)估計 根據(jù)樣本統(tǒng)計量對相應總體參數(shù)所作的估計叫總體參數(shù)估計。總體參數(shù)估計分為點估計和區(qū)間估計。6.2.1 點估計(1)點估計的定義 用某一樣本統(tǒng)計量的值來估計相應總體參數(shù)的值叫總體參數(shù)的點估計。6.2 總體平均數(shù)的參數(shù)估計(2)點估計的評價標準:無偏性:用統(tǒng)計量估計總體參數(shù)一定會有誤差,不可能恰恰相同。因此,好的估計量應該是一個無偏估計量,即用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值,其偏差的的平均值為0。 有效性:當總體參數(shù)的無偏估計不止一個統(tǒng)計量時,無偏估計變異性小者有效性高,變異大者有效性低。6.2 總體平

9、均數(shù)的參數(shù)估計(2)點估計的評價標準:一致性:當樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,估計值越來越精確,逐漸趨近于真值。充分性:一個容量為的樣本統(tǒng)計量,是否充分地反映了全部個數(shù)據(jù)所反映總體的信息。 6.2.2 區(qū)間估計(1)區(qū)間估計的定義 區(qū)間估計是指以樣本統(tǒng)計量的樣本分布為理論依據(jù),按一定的概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍。6.2.2 區(qū)間估計(2)置信區(qū)間與顯著性水平 置信區(qū)間是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。 顯著性水平是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用表示。1為置信度或置信水平。6.2.2 區(qū)間估計(2)

10、區(qū)間估計的原理 區(qū)間估計的原理是樣本分布理論。在計算區(qū)間估計值、解釋估計的正確概率時,依據(jù)是該樣本統(tǒng)計量的分布規(guī)律及樣本分布的標準誤(SE)。 下面以平均數(shù)的區(qū)間估計為例,說明如何根據(jù)平均數(shù)的樣本分布及平均數(shù)分布的標準誤(SE),計算置信區(qū)間和解釋成功估計的概率。 。 6.2.2 區(qū)間估計(2)區(qū)間估計的原理 當總體方差2為已知時,樣本平均數(shù)的分布為正態(tài)分布或漸近正態(tài)分布,此時樣本平均數(shù)分布的平均數(shù) ,標準誤 。根據(jù)正態(tài)分布,可以說:有95% 的 落在 之間, 之間,或者說: 之間包含所有的 的95% ,即 6.2.2 區(qū)間估計(2)區(qū)間估計的原理 但是,在實際研究中,只能得到一個樣本平均數(shù),

11、我們可以將這個樣本平均數(shù)看做是無限多個樣本平均數(shù)之中的一個。于是將上式經(jīng)過移項寫成 這意味著有95%的落在 之間,或者說,估計 落在 之間的正確的概率為95% 。 6.2.2 區(qū)間估計練習2某一個正態(tài)總體,其平均數(shù)為130,標準差為10。以平均數(shù)為中心,95%學生的成績的分布范圍;其成績在128到132間的人數(shù)的比例;排名在班級前5%的學生成績的分布范圍。從總體中抽取25人,計算其平均成績,該平均成績在128到132間的概率有多大;從總體中抽取25人,計算其平均成績,該平均成績以總體平均數(shù)為中心,95%概率下的分布范圍從總體中抽取25人,計算其平均成績,該平均成績由高到低95%概率下的分布范圍

12、;從總體中抽取25人,計算其平均成績,最高5%的平均成績的范圍。從總體中抽取25人,計算其平均成績,該平均成績大于135的概率是多少。練習3 某小學10歲兒童身高的標準差為6.25厘米,現(xiàn)從該校隨機抽出27名10歲兒童,其平均身高為134.2厘米,試估計該校10歲兒童身高的95%和99%置信區(qū)間。6.2.3 總體平均數(shù)的估計(1)估計總體平均數(shù)的步驟1 根據(jù)實得樣本的數(shù)據(jù),計算樣本平均數(shù)與標準差。2 計算標準誤。 ( 已知)或 ( 未知)3 確定置信區(qū)間或顯著性水平。 6.2.3 總體平均數(shù)的估計4 根據(jù)樣本平均數(shù)的抽樣分布,確定查何種統(tǒng)計表。5 計算置信區(qū)間。 (正態(tài)分布)或 (分布)6 解

13、釋總體平均數(shù)的置信區(qū)間。 6.2.3 總體平均數(shù)的估計(2)總體方差2 已知時1 當總體分布為正態(tài)時 當總體分布為正態(tài),總體方差( )已知時,樣本平均數(shù) 的分布為正態(tài)分布,這時可用下式計算其置信區(qū)間: (其中 ) 6.2.3 總體平均數(shù)的估計(2)總體方差2 已知時2 當總體分布為非正態(tài)時 總體分布非正態(tài),總體方差( )已知,這時只有當樣本容量 時,其樣本平均數(shù) 的分布為漸近正態(tài)分布,這時可用下式計算其置信區(qū)間: ( 其中 ) 6.2.3 總體平均數(shù)的估計(2)總體方差2 未知時1 當總體分布為正態(tài)時 當總體分布為正態(tài),總體方差( )未知時,樣本平均數(shù) 的分布為分布,這時可用下式計算其置信區(qū)間

14、: (其中 ) 6.2.3 總體平均數(shù)的估計(2)總體方差2 未知時2 當總體分布為非正態(tài)時 總體分布非正態(tài),總體方差( )未知,這時只有當樣本容量 時,其樣本平均數(shù) 的分布為漸近分布,這時可用下式計算其置信區(qū)間: (其中 ) 練習5 從某次考試中隨機抽取102名學生的成績,其平均成績?yōu)?6,標準差為1.5。試估計總體平均成績95%和99%的置信區(qū)間。練習4 從某小學三年級學生中隨機抽取12名學生,其平均成績?yōu)?9.917,標準差為3.926。試估計該校三年級學生總體平均成績95%和99%的置信區(qū)間。6.3 假設檢驗6.3.1 假設檢驗的原理 假設是根據(jù)已知理論與事實對研究對象所做的假定性說明

15、,統(tǒng)計學中的假設一般專指用統(tǒng)計學術語對總體參數(shù)所做的假定性說明。 在進行任何一項研究時,都需要根據(jù)已有的理論和經(jīng)驗對研究結果作出一種預想的希望證實的假設,這種假設叫科學假設,用統(tǒng)計術語表示時叫研究假設(備擇假設),記作H1 。 6.3 假設檢驗6.3.1 假設檢驗的原理 在統(tǒng)計學中不能對H1 的真實性直接檢驗,需要建立與之對立的假設,稱做虛無假設(零假設,無差假設,原假設),記作H0 。 假設檢驗的問題,就是要判斷虛無假設H0是否正確,決定接受還是拒絕虛無假設H0 ,若拒絕虛無假設H0 ,則接受備擇假設H1 。 6.3 假設檢驗6.3.1 假設檢驗的原理 假設檢驗是從零假設出發(fā),視其被拒絕的機

16、會,如果根據(jù)樣本信息,不得不否定零假設的真實性時,就不得不承認備擇假設的真實性,這時,就要拒絕零假設而接受備擇假設;如果根據(jù)樣本的信息不能否定零假設的真實性時,就要保留零假設而拒絕備擇假設。 6.3 假設檢驗6.3.1 假設檢驗的原理 假設檢驗的基本思想是概率性質(zhì)的反證法。為了檢驗虛無假設,首先假定虛無假設為真。在虛無假設為真的前提下,如果導致違反邏輯或違反人們常識和經(jīng)驗的不合理現(xiàn)象出現(xiàn),則表明“虛無假設為真”的假定是不正確的,也就不難接受虛無假設。若沒有導致不合理的現(xiàn)象出現(xiàn),那就認為“虛無假設為真”的假定是正確的,也就是接受了虛無假設。 6.3 假設檢驗6.3.1 假設檢驗的原理 這種“反證

17、法”思想不同于數(shù)學中的反證法,后者是在假設某一條件下導致邏輯上的矛盾從而否定原來的假設。假設檢驗中“不合理現(xiàn)象”是指小概率事件在一次試驗中發(fā)生了,它是基于人們在實踐中廣泛采用的小概率事件原理。 (小概率事件原理是指“小概率事件在一次試驗中幾乎不可能發(fā)生”。通常情況下,將概率不超過0.05或0.01的事件當做“小概率事件”。) 6.3 假設檢驗6.3 假設檢驗6.3.2 單側檢驗與雙側檢驗 只強調(diào)差異而不強調(diào)方向性的檢驗叫雙側檢驗;強調(diào)某一方向的檢驗叫單側檢驗。 6.3 假設檢驗6.3.2 單側檢驗與雙側檢驗 某市全體7歲男童體重平均數(shù)為21.61千克,標準差為2.21千克,某小學70個7歲男童

18、體重的平均數(shù)為22.9,問該校7歲男童體重與該市是否一樣。 某區(qū)某年高考化學平均分數(shù)為72.4,標準差為12.6,該區(qū)實驗學校28名學生此次考試平均分數(shù)為74.7,問實驗學校此次考試成績是否高于全區(qū)平均水平? 6.3 假設檢驗6.3.2 單側檢驗與雙側檢驗雙側檢驗單側檢驗6.3 假設檢驗6.3.3 假設檢驗的步驟1 根據(jù)問題要求,提出虛無假設和備擇假設。 2 選擇適當?shù)臋z驗統(tǒng)計量并計算其值。3 規(guī)定顯著性水平。 4 選擇檢驗的方式(單側還是雙側)。5 做出統(tǒng)計決策。 假設檢驗這種反證法與一般的數(shù)學反證法有什么不同?思考題 (1)數(shù)學反證法最終推翻假設的依據(jù)一定是出現(xiàn)了百分之百的謬誤,因此推翻假

19、設的決策無論是決策邏輯還是從決策內(nèi)容看都是百分之百正確的。而假設檢驗的反證法最終推翻零假設的依據(jù)是一個小概率事件,從決策邏輯角度看是百分之百正確的,但其決策的內(nèi)容卻是有可能出錯的。 (2)數(shù)學中使用反證法,其最終結果一定是推翻原假設,而假設檢驗這種反證法的最終結果卻有可能無充分理由推翻零假設。答:6.3 假設檢驗6.3.4 假設檢驗中的兩類錯誤 統(tǒng)計學中將這類拒絕H0時所犯的錯誤稱做 錯誤,即假設是真而被拒絕所犯的錯誤,其大小與假設檢驗的顯著性水平相等。 接受H0時所犯的錯誤為錯誤,即假設是偽而被接受。 例A 韋氏智力測驗的總體平均數(shù)為100,標準差為15。現(xiàn)從某實驗學校抽取64人,其平均智商

20、為103,問該校的智力水平與總體水平是否有顯著差異(=.05)。=1001.961.60=103例A假設檢驗的示意圖 /2=.025 /2=.025例B 從現(xiàn)從某實驗學校抽取64人,其平均智商為103。問該校學生的智力水平是否是來自于平均智商為105,標準差為15的總體(=.05) 。=105-1.96-1.06=103例B假設檢驗的示意圖 /2=.025 /2=.0251 =1050 =1001.60=103例A假設檢驗中所犯錯誤1.96/2=.025/2=.025=.240 =1001 =105-1.06=103例B假設檢驗中所犯錯誤/2=.025/2=.025-1.96=.246.3 假

21、設檢驗6.3.4 假設檢驗中的兩類錯誤兩類錯誤的關系: (1) 不一定等于1; (2) 與 不可能同時減小或增大; (3)1 - 反映著正確辨認真實差異的能力。 6.3 假設檢驗6.3.4 假設檢驗中的兩類錯誤6.3 假設檢驗6.3.4 假設檢驗中的兩類錯誤 控制 錯誤:可以由研究者通過選擇適當?shù)娘@著性水平加以主動控制。 控制錯誤的概率有以下兩種方法: 利用已知的實際總體參數(shù)值與假設參數(shù)值之間大小關系,合理安排拒絕區(qū)域的位置; 增大樣本的容量。樣本容量的擴大引起的變化是什么? 檢驗功效 ( POWER )1、什么是檢驗功效Power=1-功效:正確拒絕虛無假設的概率2、影響功效的因素Power

22、=1- 檢驗的形式樣本的容量鑒別力(EFFECT SIZE , d值)d3、依據(jù)功效的要求,確定樣本的大小例A中,如果要求功效為.80,其樣本應為多少?1 =1050 =1001.96/2=.025/2=.025N=71.916.4 總體平均數(shù)顯著性檢驗6.4.1 平均數(shù)顯著性檢驗的概念 平均數(shù)的顯著性檢驗是指根據(jù)樣本平均數(shù)與假設總體平均數(shù)的差異檢驗樣本所在總體的平均數(shù)與假設總體的平均數(shù)的差異。 6.4 總體平均數(shù)顯著性檢驗6.4.1 平均數(shù)顯著性檢驗的概念例3 全區(qū)統(tǒng)一考試物理平均分為50分,標準差為10分。某校一個班41人的平均成績?yōu)?2.5,問該班成績與全區(qū)成績差異是否顯著? 6.4 總

23、體平均數(shù)顯著性檢驗6.4.1 平均數(shù)顯著性檢驗的方法1 總體正態(tài)分布、總體方差已知的條件下平均數(shù)的顯著性檢驗 2 總體正態(tài)分布、總體方差未知條件下平均數(shù)的顯著性檢驗 練習6 有人從受過良好教育早期兒童中隨機抽取70人是行韋氏智力測驗(該測驗的總體平均數(shù)為100,標準差為15),其結果為103.3。能否認為受過良好早期教育的兒童智力高于一般水平?練習7 某一種食品的標準重量為1000克,但在包裝過程中有誤差,其標準差為50克。工商部門為檢驗其重量是否合格,從該產(chǎn)品中抽出50袋樣品,平均重量為986克。問該產(chǎn)品在重量上是否合格?練習8 某心理學家變認為一般汽車司機的視反應平均時間是175毫秒,有人

24、隨機抽取36名汽車司機作為研究樣本進行了測定,結果平均值為180毫秒,標準差為25毫秒。能否根據(jù)測試結果否定該心理學家的結論。練習9 醫(yī)學上測定,正常人的血色素應該是每100毫升13克,某學校進行抽查,37名學生血色素平均值為12.1克,標準差為1.5,問該學校學生的血色素是否顯著低于正常值。6.4 總體平均數(shù)顯著性檢驗6.4.1 平均數(shù)顯著性檢驗的方法3 總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗 當 n30 時,盡管總體分布非正態(tài),對于平均數(shù)的顯著性檢驗仍可用Z 檢驗。 (0 已知) 或 ( 0 未知) 6.4 總體平均數(shù)顯著性檢驗6.4.2 平均數(shù)顯著性檢驗的方法3 總體非正態(tài)分布條件下平均數(shù)的顯著性檢驗 當 n30 時,若總體分布非正態(tài),對于平均數(shù)的顯著性檢驗不符合近似 Z 檢驗的條件,嚴格講此時也不符合t 檢驗的條件。 6.4.3 差異顯著性的判斷規(guī)則 有大于或等于99%的把握(即有很大把握)說兩個總體有差異。(拒絕 接受 )差異非常顯著P0.01有大于或等于95%的把握(即有把握)說兩個總體有差異。 ( 拒絕 接受 )差異顯著0.010.05判斷統(tǒng)計意義P值練習10某人做100個5選1的選題,假如規(guī)定做對95%的題目才算了解有關知識,則至少應該做對多少

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論