《統(tǒng)計學-基于SPSS》第5章-參數(shù)估計(S3)_第1頁
《統(tǒng)計學-基于SPSS》第5章-參數(shù)估計(S3)_第2頁
《統(tǒng)計學-基于SPSS》第5章-參數(shù)估計(S3)_第3頁
《統(tǒng)計學-基于SPSS》第5章-參數(shù)估計(S3)_第4頁
《統(tǒng)計學-基于SPSS》第5章-參數(shù)估計(S3)_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學—基于SPSS課程內(nèi)容描述統(tǒng)計、推斷統(tǒng)計、其他常用方法使用軟件SPSS學分與課時3學分,1~17周,每周3課時第5章參數(shù)估計5.1

參數(shù)估計的基本原理5.2

總體均值的區(qū)間估計5.3

總體比例的區(qū)間估計5.4總體方差的區(qū)間估計5.4樣本量的確定parameterestimation2019-5-5學習目標參數(shù)估計的基本原理點估計與區(qū)間估計評價估計量優(yōu)良性的標準總體均值的區(qū)間估計方法總體比例的區(qū)間估計方法總體方差的區(qū)間估計方法樣本量的確定方法2019-5-5問題與思考

科學家做出重大貢獻時的最佳年齡是多少科學家在哪個年齡段易取得重大突破?有研究表明:杰出科學家做出重大貢獻的最佳年齡區(qū)在25~45歲之間,其最佳峰值年齡和首次貢獻的最佳成名年齡隨著時代的變化而逐漸增大。偉大的科學發(fā)現(xiàn)很多是由富于創(chuàng)造力的年輕人所提出的。下表是16世紀中葉至20世紀的12個重大科學突破的資料5.1參數(shù)估計的基本原理

5.1.1點估計與區(qū)間估計

5.1.2評價估計量的標準第5章參數(shù)估計5.1.1點估計與區(qū)間估計5.1參數(shù)估計的基本原理2019-5-5參數(shù)估計(parameterestimation)就是用樣本統(tǒng)計量去估計總體的參數(shù)估計量:用于估計總體參數(shù)的統(tǒng)計量的名稱如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值

的一個估計量參數(shù)用

表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值

x=80,則80就是

的估計值估計量與估計值

(estimator&estimatedvalue)2019-5-5點估計

(pointestimate)用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量2019-5-5區(qū)間估計

(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分數(shù)在75~85之間,置信水平是95%

2019-5-5區(qū)間估計的圖示2019-5-5將構(gòu)造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度表示為(1-

為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應的為0.01,0.05,0.10置信水平

(confidencelevel)

2019-5-5由樣本估計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進行表述置信區(qū)間的表述

(confidenceinterval)2019-5-5總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實際估計時往往只抽取一個樣本,此時所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。我們只能希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間的表述

(confidenceinterval)2019-5-5當抽取了一個具體的樣本,用該樣本所構(gòu)造的區(qū)間是一個特定的常數(shù)區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,因為它可能是包含總體均值的區(qū)間中的一個,也可能是未包含總體均值的那一個一個特定的區(qū)間總是“包含”或“絕對不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問題置信水平只是告訴我們在多次估計得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取的這個樣本所構(gòu)建的區(qū)間而言的置信區(qū)間的表述

(confidenceinterval)2019-5-5置信區(qū)間的表述

(95%的置信區(qū)間)重復構(gòu)造出的的100個置信區(qū)間2019-5-5使用一個較大的置信水平會得到一個比較寬的置信區(qū)間,而使用一個較大的樣本則會得到一個較準確(較窄)的區(qū)間。直觀地說,較寬的區(qū)間會有更大的可能性包含參數(shù)但實際應用中,過寬的區(qū)間往往沒有實際意義比如,天氣預報說“在一年內(nèi)會下一場雨”,雖然這很有把握,但有什么意義呢?另一方面,要求過于準確(過窄)的區(qū)間同樣不一定有意義,因為過窄的區(qū)間雖然看上去很準確,但把握性就會降低,除非無限制增加樣本量,而現(xiàn)實中樣本量總是有限的區(qū)間估計總是要給結(jié)論留點兒余地置信區(qū)間的表述

(confidenceinterval)5.1.2評價估計量的標準5.1參數(shù)估計的基本原理2019-5-5無偏性

(unbiasedness)無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)2019-5-5有效性

(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效

2019-5-5一致性

(consistency)一致性:隨著樣本量的增大,估計量的值越來越接近被估計的總體參數(shù)5.2總體均值的區(qū)間估計

5.2.1一個總體均值的區(qū)間估計

5.2.2兩個總體均值之差的區(qū)間估計第5章參數(shù)估計5.2.1一個總體均值的區(qū)間估計5.2總體均值的區(qū)間估計2019-5-5一個總體均值區(qū)間的一般表達式總體均值的置信區(qū)間是由樣本均值加減估計誤差得到的估計誤差由兩部分組成:一是點估計量的標準誤差,它取決于樣本統(tǒng)計量的抽樣分布。二是估計時所要的求置信水平為時,統(tǒng)計量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達為樣本均值±分位數(shù)值×樣本均值的標準誤差2019-5-5總體均值的區(qū)間估計

(大樣本的估計)1. 假定條件總體服從正態(tài)分布,且方差(

2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計量z總體均值

在1-

置信水平下的置信區(qū)間為2019-5-5總體均值的區(qū)間估計

(大樣本的估計)【例5-1】一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間

36個投保人年齡的數(shù)據(jù)2335392736443642464331334253455447243428393644403949383448503439454845322019-5-5總體均值的區(qū)間估計

(大樣本的估計)解:已知n=36,1-

=90%,z

/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,

總體均值

在1-

置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.4歲~41.6歲2019-5-5總體均值的區(qū)間估計

(小樣本的估計)1. 假定條件總體服從正態(tài)分布,但方差(

2)

未知小樣本(n<30)使用t

分布統(tǒng)計量總體均值

在1-

置信水平下的置信區(qū)間為2019-5-5總體均值的區(qū)間估計

(小樣本的估計)【例5-2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.32019-5-5總體均值的區(qū)間估計

(小樣本的估計)解:已知X~N(

,102),n=25,1-

=95%,t

/2=2.0639。根據(jù)樣本數(shù)據(jù)計算得:。由于是正態(tài)總體,且方差已知??傮w均值

在1-

置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.375克~109.345克2019-5-5用SPSS求置信區(qū)間

(小樣本)

求置信區(qū)間SPSS5.2.2兩個總體均值之差的區(qū)間估計5.2總體均值的區(qū)間估計2019-5-5均值之差區(qū)間的一般表達式兩個總體均值的置信區(qū)間是由兩個樣本均值之差加減估計誤差得到的估計誤差由兩部分組成:一是點估計量的標準誤差,它取決于樣本統(tǒng)計量的抽樣分布。二是估計時所要的求置信水平為時,統(tǒng)計量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度兩個總體均值之差(

1-

2)在置信水平下的置信區(qū)間可一般性地表達為(

x1-

x2)±分位數(shù)值×(

x1-

x2)的標準誤差2019-5-5兩個總體均值之差的估計

(獨立大樣本)1. 假定條件兩個總體都服從正態(tài)分布,

12、

22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n1

30和n2

30)兩個樣本是獨立的隨機樣本使用正態(tài)分布統(tǒng)計量z2019-5-5兩個總體均值之差的估計

(獨立大樣本)1.

12,

22已知時,兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為

12、

22未知時,兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為2019-5-5兩個總體均值之差的估計

(獨立大樣本)【例5-3】某地區(qū)教育管理部門想估計兩所中學的學生高考時的英語平均分數(shù)之差,為此在兩所中學獨立地抽取兩個隨機樣本,有關(guān)數(shù)據(jù)如表5—4所示。建立兩所中學高考英語平均分數(shù)之差95%的置信區(qū)間2019-5-5兩個總體均值之差的估計

(獨立大樣本)解:兩個總體均值之差在1-

置信水平下的置信區(qū)間為兩所中學高考英語平均分數(shù)之差的置信區(qū)間為5.03分~10.97分2019-5-5兩個總體均值之差的估計

(獨立小樣本:

12=

22)1. 假定條件兩個總體都服從正態(tài)分布兩個總體方差未知但相等:

12=

22兩個獨立的小樣本(n1<30和n2<30)總體方差的合并估計量估計量

x1-x2的抽樣標準差2019-5-5兩個總體均值之差的估計

(獨立小樣本:

12=

22)兩個樣本均值之差的標準化兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為2019-5-5兩個總體均值之差的估計

(獨立小樣本:

12

22)1. 假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:

12

22兩個獨立的小樣本(n1<30和n2<30)使用統(tǒng)計量2019-5-5兩個總體均值之差的估計

(獨立小樣本:

12

22)

兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為自由度2019-5-5兩個總體均值之差的估計

(獨立小樣本:

12=

22)2019-5-5用SPSS求兩個總體均值之差置信區(qū)間

(獨立小樣本,

12=

22

;

12

22)求置信區(qū)間SPSS2019-5-5兩個總體均值之差的估計

(配對大樣本)假定條件兩個配對的大樣本(n1

30和n2

30)兩個總體各觀察值的配對差服從正態(tài)分布兩個總體均值之差

d=

1-

2在1-

置信水平下的置信區(qū)間為

d±分位數(shù)值×

d的標準誤差2019-5-5兩個總體均值之差的估計

(匹配小樣本)假定條件兩個匹配的小樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態(tài)分布

兩個總體均值之差

d=

1-

2在1-

置信水平下的置信區(qū)間為2019-5-5兩個總體均值之差的估計

(匹配小樣本)【例5-5】由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結(jié)果如表5—7所示。假定兩套試卷分數(shù)之差服從正態(tài)分布,試建立兩種試卷平均分數(shù)之差

d=

1-

2

95%的置信區(qū)間5.3總體比例的區(qū)間估計

5.3.1一個總體比例的區(qū)間估計

5.3.2兩個總體比例之差的區(qū)間估計第5章參數(shù)估計5.3.1一個總體比例的區(qū)間估計5.3總體比例的區(qū)間估計2019-5-5一個總體比例的區(qū)間估計

(傳統(tǒng)方法)1. 假定條件總體服從二項分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應該大于10使用正態(tài)分布統(tǒng)計量z3.總體比例

在1-

置信水平下的置信區(qū)間為樣本比例±分位數(shù)值×樣本比例的標準誤差2019-5-5總體比例的區(qū)間估計

(例題分析—傳統(tǒng)方法)【例5-6】某城市想要進行一項交通措施改革,為征求市民對該項改革措施的意見,在成年人中隨機調(diào)查了500個市民,其中325人贊成改革措施。用95%的置信水平估計該城市成年人口中贊成該項改革的人數(shù)比例的置信區(qū)間即(60.82%,69.18%),該城市人口中贊成該項改革的比例95%的置信區(qū)間為60.82%~69.18%2019-5-5一個總體比例的區(qū)間估計

(改進方法)按照傳統(tǒng)方法計算出來的置信水平為(1-

)的置信區(qū)間能夠覆蓋總體真實比例的概率小于(1-

),既是大樣本也是如此,更不可能應用于小樣本根據(jù)經(jīng)驗法則:傳統(tǒng)方法要求np(成功次數(shù))和n(1-p)(失敗次數(shù))均應該大于10(也有些書上說大于5)對于非常大的樣本,傳統(tǒng)方法和改進方法的結(jié)果幾乎相同,但對于小樣本或中等樣本改進方法更適用2019-5-5一個總體比例的區(qū)間估計

(改進方法)通過修正試驗次數(shù)n(樣本量)和試驗成功的比例P(樣本比例)改進置信區(qū)間將試驗次數(shù)n加上4,即用代替n;將試驗成功的次數(shù)x加上2,即用代替p對于任意大小的樣本都可以使用該方法計算置信區(qū)間只是在樣本較小時,偶爾會有區(qū)間下限小于0或區(qū)間上限大于1的情況發(fā)生。此時可用0代替小于0的下限,用1代替大于1的上限2019-5-5一個總體比例的區(qū)間估計

(改進方法)設(shè)總體服從二項分布,即X~(n,p),x為n次獨立伯努利試驗成功的次數(shù),P為成功的概率定義和總體比例在1-

置信水平下的置信區(qū)間該區(qū)間也稱為Agresti-Coull區(qū)間(由AlanAgresti和BrentCoull給出,以其姓氏命名)如果下限小于0則用0代替;如果上限大于1則用1代替2019-5-5總體比例的區(qū)間估計

(例題分析—改進方法)【例5-7】某城市想要進行一項交通措施改革,為征求市民對該項改革措施的意見,在成年人中隨機調(diào)查了500個市民,其中325人贊成改革措施。用95%的置信水平估計該城市成年人口中贊成該項改革的人數(shù)比例的置信區(qū)間即(60.71%,69.05%),該城市成年人口中贊成該項改革的人數(shù)比例95%的置信區(qū)間為60.71%~69.05%5.3.2兩個總體比例之差的區(qū)間估計5.3總體比例的區(qū)間估計2019-5-51. 假定條件兩個總體服從二項分布可以用正態(tài)分布來近似兩個樣本是獨立的n1p1和n1(1-p1),n2p2和n2(1-p2),均應該大于102. 兩個總體比例之差

1-

2在1-

置信水平下的置信區(qū)間為兩個總體比例之差的區(qū)間估計

(傳統(tǒng)方法)(p1-p2)±分位數(shù)值×(p1-p2)的標準誤差2019-5-5兩個總體比例之差的區(qū)間估計

(改進方法)通過修正試驗次數(shù)n1、n2(樣本量)和試驗成功的比例P1、P2(樣本比例)改進置信區(qū)間將試驗次數(shù)n1和n1各加上2,即用代n1,代替n2;將試驗成功的次數(shù)x1和x2各加上1,即用代替p1,用代替p2對于任意大小的樣本都可以使用該方法計算置信區(qū)間2019-5-5兩個總體比例之差的區(qū)間估計

(改進方法)設(shè)兩總體都服從二項分布,即X1~(n1,p1),X2~(n2,p2)。x1為n1次獨立伯努利試驗成功的次數(shù),P1為成功的概率,x2

為n2次獨立伯努利試驗成功的次數(shù),P2為成功的概率定義,;,

1-2在1-

置信水平下的置信區(qū)間該區(qū)間也稱為Agresti-Caffo區(qū)間(由AlanAgresti和BrianCaffo給出,以其姓氏命名)如果下限小于-1則用-1代替;如果上限大于1則用1代替2019-5-5兩個總體比例之差的估計

(例題分析—傳統(tǒng)方法)【例5—8、9】在某個電視節(jié)目的收視率調(diào)查中,女性觀眾隨機調(diào)查了500人,有225人收看了該節(jié)目;男性觀眾隨機調(diào)查了400人,有128人收看了該節(jié)目。用95%的置信水平估計女性與男性收視率差值的置信區(qū)間5.4總體方差的區(qū)間估計

5.4.1一個總體方差的區(qū)間估計

5.4.2兩個總體方差比的區(qū)間估計第5章參數(shù)估計5.4.1一個總體方差的區(qū)間估計5.4總體方差的區(qū)間估計2019-5-5一個總體方差的區(qū)間估計1. 估計一個總體的方差或標準差2. 假設(shè)總體服從正態(tài)分布總體方差

2

的點估計量為s2,且4.總體方差在1-

置信水平下的置信區(qū)間為

2019-5-5總體方差的區(qū)間估計

(圖示)2019-5-5總體方差的區(qū)間估計

(例題分析)【例5-10】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間

25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.32019-5-5總體方差的區(qū)間估計

(例題分析)解:已知n=25,1-

=95%,根據(jù)樣本數(shù)據(jù)計算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū)間為7.54g~13.43g5.4.2兩個總體方差比的區(qū)間估計5.4總體方差的區(qū)間估計2019-5-5兩個總體方差比的區(qū)間估計1. 比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/S22接近于1,說明兩個總體方差很接近如果S12/S22遠離1,說明兩個總體方差之間存在差異總體方差比在1-

置信水平下的置信區(qū)間為

2019-5-5兩個總體方差比的區(qū)間估計

(圖示)2019-5-5兩個總體方差比的區(qū)間估計

(例題分析)5.5樣本量的確定

5.5.1估計總體均值時樣本量的確定

5.5.2估計總體比例時樣本量的確定第5章參數(shù)估計6.5.1估計總體均值時樣本量的確定6.5樣本量的確定2019-5-5估計總體均值時樣本量n為樣本量n與總體方差

2、邊際誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與邊際誤差的平方成反比與可靠性系數(shù)成正比樣本量的圓整法則:當計算出的樣本量不是整數(shù)時,將小數(shù)點后面的數(shù)值一律進位成整數(shù),如24.68取25,24.32也取25等等估計一個總體均值時樣本量的確定其中:2019-5-5估計一個總體均值時樣本量的確定

(例題分析)【例5-12】擁有工商管理學士學位的大學畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應抽取多大的樣本量?2019-5-5估計一個總體均值時樣本量的確定

(例題分析)解:已知

=2000,E=400,1-

=95%,z/2=1.96

應抽取的樣本量為即應抽取97人作為樣本2019-5-5估計兩個總體均值之差時

樣本量的確定設(shè)n1和n2為來自兩個總體的樣本,并假定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論