第3章參數(shù)估計(jì)_第1頁(yè)
第3章參數(shù)估計(jì)_第2頁(yè)
第3章參數(shù)估計(jì)_第3頁(yè)
第3章參數(shù)估計(jì)_第4頁(yè)
第3章參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)Statistics第3章參數(shù)估計(jì)參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)大學(xué)生每周上網(wǎng)花多少時(shí)間?為了解學(xué)生每周上網(wǎng)花費(fèi)的時(shí)間,中國(guó)人民大學(xué)公共管理學(xué)院的4名本科生對(duì)全校部分本科生做了問(wèn)卷調(diào)查。調(diào)查的對(duì)象為中國(guó)人民大學(xué)在校本科生,調(diào)查內(nèi)容包括上網(wǎng)時(shí)間、途徑、支出、目的、關(guān)心的校園網(wǎng)內(nèi)容,以及學(xué)生對(duì)收費(fèi)的態(tài)度,包括收費(fèi)方式、價(jià)格等問(wèn)卷調(diào)查由調(diào)查員直接到宿舍發(fā)放并當(dāng)場(chǎng)回收。對(duì)四個(gè)年級(jí)中每年級(jí)各發(fā)60份問(wèn)卷,其中男、女生各30份。共收回有效問(wèn)卷共200份。其中有關(guān)上網(wǎng)時(shí)間方面的數(shù)據(jù)經(jīng)整理如下表所示大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類別人數(shù)(人)頻率(%)3小時(shí)以下32163~6小時(shí)3517.56~9小時(shí)3316.59~12小時(shí)2914.512小時(shí)以上7135.5合計(jì)200100平均上網(wǎng)時(shí)間為8.58小時(shí),標(biāo)準(zhǔn)差為0.69小時(shí)。全校學(xué)生每周的平均上網(wǎng)時(shí)間是多少?每周上網(wǎng)時(shí)間在12小時(shí)以上的學(xué)生比例是多少?參數(shù)估計(jì)大致判斷出總體分布的類型后,用樣本參數(shù)推斷總體分布的相應(yīng)參數(shù)。1.點(diǎn)估計(jì)不重復(fù)抽樣2.區(qū)間估計(jì)重復(fù)抽樣不同樣本算得的的估計(jì)值不同,因此還希望根據(jù)所給的樣本確定一個(gè)隨機(jī)區(qū)間,使其包含參數(shù)真值的概率達(dá)到指定的要求。均值方差區(qū)間估計(jì)

(IntervalEstimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)估計(jì)區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有

99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平

(ConfidenceLevel)

由樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。置信區(qū)間的表述

(ConfidenceInterval)置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出的20個(gè)置信區(qū)間我沒(méi)有抓住參數(shù)!點(diǎn)估計(jì)值使用一個(gè)較大的置信水平會(huì)得到一個(gè)比較寬的置信區(qū)間,而使用一個(gè)較大的樣本則會(huì)得到一個(gè)較準(zhǔn)確(較窄)的區(qū)間。直觀地說(shuō),較寬的區(qū)間會(huì)有更大的可能性包含參數(shù)但實(shí)際應(yīng)用中,過(guò)寬的區(qū)間往往沒(méi)有實(shí)際意義比如,天氣預(yù)報(bào)說(shuō)“在一年內(nèi)會(huì)下一場(chǎng)雨”,雖然這很有把握,但有什么意義呢?另一方面,要求過(guò)于準(zhǔn)確(過(guò)窄)的區(qū)間同樣不一定有意義,因?yàn)檫^(guò)窄的區(qū)間雖然看上去很準(zhǔn)確,但把握性就會(huì)降低,除非無(wú)限制增加樣本量,而現(xiàn)實(shí)中樣本量總是有限的區(qū)間估計(jì)總是要給結(jié)論留點(diǎn)兒余地置信區(qū)間的表述

(ConfidenceInterval)置信區(qū)間與置信水平的關(guān)系

均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1–aa/2a/2區(qū)間估計(jì)的種類區(qū)間估計(jì)均值均值差一個(gè)總體兩個(gè)總體方差方差比方差已知方差未知比率一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例方差

P(X﹥za)﹦a一個(gè)總體方差已知時(shí)均值的區(qū)間估計(jì)

P(X<-za)﹦a或的za或-za叫標(biāo)準(zhǔn)正態(tài)分布的單側(cè)上a分位點(diǎn)。若

X

服從標(biāo)準(zhǔn)正態(tài)分布,則滿足下式:需要的定義:

P(X﹥za/2)﹦a若

X

服從標(biāo)準(zhǔn)正態(tài)分布,則滿足下式:的za/2叫標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)上a分位點(diǎn)。不重復(fù)抽樣條件下:若隨機(jī)變量X則有如下定理成立:~~~重復(fù)抽樣條件下:需要的定理:

P(

﹥za/2)﹦a因?yàn)榉臉?biāo)準(zhǔn)正態(tài)分布,所以:

P(﹥za)﹦a或

P(﹤﹣za)﹦a重復(fù)抽樣條件下均值的單側(cè)區(qū)間估計(jì):重復(fù)抽樣條件下均值的雙側(cè)區(qū)間估計(jì):因?yàn)榉臉?biāo)準(zhǔn)正態(tài)分布,所以:?jiǎn)蝹?cè)置信區(qū)間雙側(cè)置信區(qū)間:重復(fù)抽樣條件下均值的置信區(qū)間:重復(fù)抽樣(放回)不重復(fù)抽樣均值的標(biāo)準(zhǔn)誤差(抽樣平均誤差)均值的標(biāo)準(zhǔn)誤差又稱為抽樣平均誤差或均值標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)誤差。若隨機(jī)變量則有如下定理成立:~~一個(gè)總體方差未知時(shí)均值的區(qū)間估計(jì)需要的定義:需要的定理:自由度小于45時(shí)重復(fù)抽樣條件下均值的兩個(gè)的單側(cè)置信區(qū)間為:

自由度大于45時(shí)重復(fù)抽樣條件下均值的兩個(gè)的單側(cè)置信區(qū)間為:

【例1】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3【例2】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(jì)【例3】一家保險(xiǎn)公司收集到由66個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間66個(gè)投保人年齡的數(shù)據(jù)23353927364436424643313342534554472434283936444039493834485034394548…32【例4】對(duì)某型號(hào)飛機(jī)的最大飛行速度進(jìn)行了16次試驗(yàn),測(cè)得其平均最大飛行速度為425米/秒,已知最大飛行速度方差為81,根據(jù)經(jīng)驗(yàn)知到最大飛行速度服從正態(tài)分布,以95%的置信度求平均最大飛行速度不低于多少?用SPSS求置信區(qū)間SPSS的輸出結(jié)果

區(qū)間估計(jì)AnalyzeDescriptiveStatisticsExploreSpreadvs.LevelwithLeveneTest:輸出散布——層次圖,包括回歸直線斜率及方差齊次性的Levene檢驗(yàn)。若無(wú)分組變量,此選項(xiàng)無(wú)效。Transformed:對(duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換,有:三次方(Cube)、平方(Square)、平方根(1/Square

root)取對(duì)數(shù)(Logarithm)。Powerestimation:轉(zhuǎn)換冪值估計(jì),表示對(duì)每一組數(shù)據(jù)產(chǎn)生一個(gè)中位數(shù)范圍的自然對(duì)數(shù)與四分位數(shù)范圍的自然對(duì)數(shù)的散點(diǎn)圖;None:不生成散布——層次圖;Statistics的界面解釋Descriptives:輸出均值的95%置信區(qū)間、中位數(shù)、眾數(shù)、均值標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)差、Min、Max、R、四分位距、峰度系數(shù)和斜度系數(shù)。M-estimators:做中心趨勢(shì)的粗略最大似然確定,輸出4個(gè)不同權(quán)重的最大似然確定數(shù)。當(dāng)數(shù)據(jù)分布均勻且兩尾巴較長(zhǎng)或數(shù)據(jù)中存在極端值時(shí),可以提供比較合理的估計(jì)。Outliers:輸出5個(gè)最大值和最小值。Percentiles:輸出第5%、10%、25%、50%、75%、90%和95%百分位數(shù)。大樣本:np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于15使用正態(tài)分布統(tǒng)計(jì)量z或t分布統(tǒng)計(jì)量

一個(gè)總體比例的區(qū)間估計(jì)3.總體比例在1-置信水平下的置信區(qū)間為自一大批產(chǎn)品中抽取100個(gè)樣品,其中有60個(gè)一級(jí)品,求這批產(chǎn)品的一級(jí)品率

p

的置信度為0.95的置信區(qū)間??傮w比例的區(qū)間估計(jì)【例5-4】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

練習(xí)某進(jìn)出口公司,出口一種名茶,規(guī)定每包規(guī)格重量不低于150克,現(xiàn)抽取1%進(jìn)行檢驗(yàn),結(jié)果如下:每包重量(克)包數(shù)

140——14910149——15020150——15150151——15220

合計(jì)100要求:以95%的概率推斷這批茶葉包裝合格率的置信區(qū)間。分位點(diǎn)定義分布單、雙側(cè)上

一個(gè)總體方差的區(qū)間估計(jì)需要的定義:需要的定理:若隨機(jī)變量則有如下定理成立:~~總體方差的區(qū)間估計(jì)

(圖示)221-2總體方差的1-的置信區(qū)間自由度為n-1的2

P(

)﹦a雙側(cè)置信區(qū)間為:

總體方差的區(qū)間估計(jì)

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3練習(xí)

某工廠生產(chǎn)一批滾珠,其直徑X服從正態(tài)分布N(

2),現(xiàn)從某天的產(chǎn)品中隨機(jī)

(1)若

2=0.06,求

的置信區(qū)間

(2)

2未知,求

的置信區(qū)間

(3)求方差

2的置信區(qū)間。抽取

6

件,

測(cè)得直徑為:15.1,14.8,15.2,14.9,14.9,15.1置信度均為0.95兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比例差方差比

兩個(gè)總體均值之差的區(qū)間估計(jì)兩獨(dú)立樣本兩配對(duì)樣本★兩獨(dú)立樣本已知總體方差,均值差的推算;~~若隨機(jī)變量則:★未知總體方差,但=,均值差推斷~~若隨機(jī)變量則:需要的定理:★未知總體方差,但≠,均值差推斷~~若隨機(jī)變量則:需要的定理:兩個(gè)總體方差比的置信區(qū)間(1,2未知)~~若隨機(jī)變量則:需要的定理:因此,方差比的置信區(qū)間為:兩個(gè)總體方差比的區(qū)間估計(jì)

(圖示)FF1-F總體方差比的1-的置信區(qū)間方差比置信區(qū)間示意圖【例】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)兩個(gè)總體方差比的區(qū)間估計(jì)

(例題分析)解:根據(jù)自由度

n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F(xiàn)1-/2(24)=1/1.98=0.50512/22置信度為90%的置信區(qū)間為男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間為0.47~1.84

兩個(gè)總體均值之差的估計(jì)

(獨(dú)立大樣本)【例5-6】某地區(qū)教育管理部門想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語(yǔ)平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表。建立兩所中學(xué)高考英語(yǔ)平均分?jǐn)?shù)之差95%的置信區(qū)間

兩個(gè)樣本的有關(guān)數(shù)據(jù)

中學(xué)1中學(xué)2n1=46n1=33S1=5.8S2=7.2English

反映了估計(jì)的可靠度,越小,越可靠.置信區(qū)間的長(zhǎng)度反映了估計(jì)精度越小,1-越大,估計(jì)的可靠度越高,但

確定后,置信區(qū)間的選取方法不唯一,

常選最小的一個(gè).幾點(diǎn)說(shuō)明越小,估計(jì)精度越高.這時(shí),往往增大,因而估計(jì)精度降低.★兩配對(duì)樣本大樣本小樣本兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)【例5-9】由10名學(xué)生組成一個(gè)隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試,結(jié)果如下表。試建立兩種試卷分?jǐn)?shù)之差d=1-2

95%的置信區(qū)間

10名學(xué)生兩套試卷的得分學(xué)生編號(hào)試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分兩個(gè)總體均值之差的區(qū)間估計(jì)

(用SPSS進(jìn)行估計(jì)—配對(duì)樣本)用求置信區(qū)間SPSS第1步:選擇【Analyze】下拉菜單,并選擇【CompareMeans—Paired-SamplesTTest】選項(xiàng),進(jìn)入主對(duì)話框第2步:將兩個(gè)樣本同時(shí)選入【PairedVariables】第3步:點(diǎn)擊【Options】,選擇所需的置信水平(隱含值為95%)。點(diǎn)擊【Continue】回到主對(duì)話框。點(diǎn)擊【OK】用SPSS求配對(duì)小樣本均值之差置信區(qū)間

(例題分析)SPSS的輸出結(jié)果

(只截取估計(jì)的部分)兩個(gè)總體比例之差的區(qū)間估計(jì)兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體比例之差的估計(jì)【例5-10】在某個(gè)電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論