1.參數(shù)估計(jì)解析_第1頁
1.參數(shù)估計(jì)解析_第2頁
1.參數(shù)估計(jì)解析_第3頁
1.參數(shù)估計(jì)解析_第4頁
1.參數(shù)估計(jì)解析_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一講

參數(shù)估計(jì)1.1、參數(shù)估計(jì)的基本概念1.2、區(qū)間估計(jì)公式1.3、必要樣本容量的確定1.1參數(shù)估計(jì)的基本概念一般情況下,對總體的每個(gè)個(gè)體都進(jìn)行觀察或試驗(yàn)是不可能的,這是因?yàn)榻?jīng)濟(jì)上時(shí)間上不允許(如個(gè)體的數(shù)量很大),或觀察試驗(yàn)是帶破壞性的(如燈泡的壽命、炮彈的射程).因此,必須對總體進(jìn)行抽樣觀察.總體樣本算術(shù)平均數(shù)統(tǒng)計(jì)量用來推斷總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量(estimator),其取值稱為估計(jì)值(estimate)。同一個(gè)參數(shù)可以有多個(gè)不同的估計(jì)量。參數(shù)是唯一的,但估計(jì)量(統(tǒng)計(jì)量)是隨機(jī)變量,取值是不確定的。

參數(shù)點(diǎn)估計(jì)點(diǎn)估計(jì):用估計(jì)量的數(shù)值作為總體參數(shù)的估計(jì)值。常用的點(diǎn)估計(jì)法有矩估計(jì)法和極大似然估計(jì)法。一個(gè)總體參數(shù)的估計(jì)量可以有多個(gè)。例如,在估計(jì)總體方差時(shí),和

都可以作為估計(jì)量。點(diǎn)估計(jì)量的常用評價(jià)準(zhǔn)則:無偏性無偏性:估計(jì)量的數(shù)學(xué)期望與總體待估參數(shù)的真值相等:P(

)BA無偏有偏點(diǎn)估計(jì)量的常用評價(jià)準(zhǔn)則:有效性在兩個(gè)無偏估計(jì)量中方差較小的估計(jì)量較為有效。AB

的抽樣分布

的抽樣分布P(

)估計(jì)量的常用評價(jià)準(zhǔn)則:一致性指隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)。AB較小的樣本容量較大的樣本容量

P(X)X

參數(shù)點(diǎn)估計(jì)是用一個(gè)確定的值去估計(jì)未知參數(shù),得到的是未知參數(shù)的近似值.但在很多實(shí)際問題中,我們不但需要求出未知參數(shù)的近似值,還需知道近似值的可靠程度和精確程度;數(shù)學(xué)上的處理方法是:確定一個(gè)范圍(區(qū)間),使我們能以比較高的可靠程度相信它包含參數(shù)真值.這就是參數(shù)的區(qū)間估計(jì).區(qū)間估計(jì)根據(jù)事先確定的置信度1-

給出總體參數(shù)的一個(gè)估計(jì)范圍。置信度1-

的含義是:在同樣的方法得到的所有置信區(qū)間中,有100(1-

)%的區(qū)間包含總體參數(shù)。抽樣分布是區(qū)間估計(jì)的理論基礎(chǔ)。估計(jì)值(點(diǎn)估計(jì))置信下限置信上限置信區(qū)間抽樣分布:幾個(gè)要點(diǎn)抽樣分布是統(tǒng)計(jì)量的分布而不是總體或樣本的分布。在統(tǒng)計(jì)推斷中總體的分布一般是未知的,不可觀測的(常常被假設(shè)為正態(tài)分布)。樣本數(shù)據(jù)的統(tǒng)計(jì)分布是可以直接觀測的,最直觀的方式是直方圖,可以用來對總體分布進(jìn)行檢驗(yàn)。抽樣分布一般利用概率統(tǒng)計(jì)的理論推導(dǎo)得出,在應(yīng)用中也是不能直接觀測的。其形狀和參數(shù)可能完全不同于總體或樣本數(shù)據(jù)的分布。樣本均值的抽樣分布_正態(tài)總體

=50

=10X總體分布n=4抽樣分布Xn=16

一般的,當(dāng)總體服從

N(μ,σ2)時(shí),來自該總體的容量為n的樣本的均值

X也服從正態(tài)分布,

X的期望為μ,方差為σ2/n。即

X~N(μ,σ2/n)。樣本均值的抽樣分布與總體分布的比較

=2.5σ2=1.25總體分布14230.1.2.3抽樣分布樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5樣本均值的抽樣分布_其他總體任意總體,隨n增大,樣本均值的分布趨于正態(tài)分布的過程。f(X)X小樣本中心極限定理從均值為

,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。大樣本(n

30)標(biāo)準(zhǔn)誤(StandardError)簡單隨機(jī)抽樣、重復(fù)抽樣時(shí),樣本均值抽樣分布的標(biāo)準(zhǔn)差等于,這個(gè)指標(biāo)在統(tǒng)計(jì)上稱為標(biāo)準(zhǔn)誤。統(tǒng)計(jì)軟件在對變量進(jìn)行描述統(tǒng)計(jì)時(shí)一般會(huì)輸出這一結(jié)果。有限總體校正系數(shù)

FinitePopulationCorrectionFactor簡單隨機(jī)抽樣、不重復(fù)抽樣時(shí),樣本均值抽樣分布的方差略小于重復(fù)抽樣的方差,等于這一系數(shù)稱為有限總體校正系數(shù)。當(dāng)抽樣比(n/N)<0.05時(shí)可以忽略有限總體校正系數(shù)。簡單隨機(jī)抽樣1.2、區(qū)間估計(jì)公式(一)一個(gè)總體均值的區(qū)間估計(jì)相關(guān)理論總體正態(tài)?n≥30?σ2已知?否是是否否是實(shí)際中總體方差總是未知的,因而這是應(yīng)用最多的公式。在大樣本時(shí)t值可以用z值來近似。根據(jù)中心極限定理得到的近似結(jié)果。

σ未知時(shí)用s來估計(jì)。增大n?數(shù)學(xué)變換?簡單隨機(jī)抽樣待估計(jì)參數(shù)已知條件置信區(qū)間正態(tài)總體,σ2已知正態(tài)總體,σ2未知n<30非正態(tài)總體,n≥30σ未知時(shí),用S有限總體,n≥30(不重復(fù))總體均值(μ)σ未知時(shí),用S關(guān)于置信區(qū)間的補(bǔ)充說明置信區(qū)間的推導(dǎo):有限總體不重復(fù)抽樣時(shí),樣本均值或比例的方差需要乘以“有限總體校正系數(shù)”(當(dāng)抽樣比f=n/N小于0.05時(shí)可以忽略不計(jì)),前面的公式需要進(jìn)行相應(yīng)的修改。關(guān)于置信度含義的說明在所有的置信區(qū)間中,有(1-

)*100%的區(qū)間包含總體真實(shí)值。對于計(jì)算得到的一個(gè)具體區(qū)間,這個(gè)區(qū)間要么包含總體真實(shí)值,要么不包含總體真值。說“總體均值有95%的概率落入某一區(qū)間”是不嚴(yán)格的,因?yàn)榭傮w均值是非隨機(jī)的。樣本均值的抽樣分布

=

1-

/2

/2X_σx_x實(shí)例演示:SPSS數(shù)據(jù)文件“男女性別身高.sav”可做如下基本統(tǒng)計(jì)分析:(1)頻數(shù)分析(包括頻數(shù)分布表以及統(tǒng)計(jì)圖)選擇分析——描述統(tǒng)計(jì)——頻率命令(2)描述統(tǒng)計(jì)分析(給出刻畫集中趨勢、離散程度和分布形態(tài)的描述統(tǒng)計(jì)量)選擇分析——描述統(tǒng)計(jì)——描述命令實(shí)例演示:SPSS數(shù)據(jù)文件“男女性別身高.sav”(3)探索性分析(給出基本描述統(tǒng)計(jì)量、置信區(qū)間、莖葉圖、箱圖、直方圖等結(jié)果)選擇分析——描述統(tǒng)計(jì)——探索命令練習(xí):SPSS文件“產(chǎn)品銷售數(shù)量”做頻數(shù)分析(輸出頻數(shù)分布表以及直方圖)SPSS文件“某公司男女員工年齡”做描述性分析(輸出描述性統(tǒng)計(jì)量)SPSS文件“兩城市平均氣溫”做探索性分析(輸出置信區(qū)間以及基本統(tǒng)計(jì)量和統(tǒng)計(jì)圖)(4)選擇分析——比較平均值——單樣本T檢驗(yàn)(也可以做區(qū)間估計(jì))案例1、學(xué)生對教學(xué)改革態(tài)度的分析(onesample)某校在對實(shí)行掛牌上課教學(xué)改革措施的效果評價(jià)中,隨機(jī)抽選了60位學(xué)生進(jìn)行態(tài)度調(diào)查,他們的10項(xiàng)態(tài)度量表的態(tài)度反映資料如下:掛牌上課態(tài)度反映得分(X)人數(shù)(f)10—2020—3030—4040—5050—6060—702610122010合計(jì)60(1分表示“很不同意”,7分表示“很同意”,將10項(xiàng)態(tài)度分累加后得一總態(tài)度分,這種量叫7級李克累加量表):試計(jì)算:(1)學(xué)生態(tài)度得分的平均值和標(biāo)準(zhǔn)差;(2)構(gòu)造學(xué)生態(tài)度得分平均值的98%置信區(qū)間。T-Test

結(jié)論:表1:學(xué)生態(tài)度得分的平均值為47分,標(biāo)準(zhǔn)差為13.6295分.表2:以98%的置信區(qū)間估計(jì)學(xué)生總體態(tài)度得分平均值的置信區(qū)間為(42.7925,51.2075)從中可以反映出學(xué)生對掛牌上課這一教改措施普遍贊成,但并不十分擁護(hù),可見還需進(jìn)一步改進(jìn)和完善.待估計(jì)參數(shù)已知條件置信區(qū)間兩個(gè)正態(tài)總體已知兩個(gè)正態(tài)總體未知但相等兩個(gè)非正態(tài)總體n1,n2≥30兩個(gè)總體均值之差μ1-μ2(二)兩個(gè)總體均值之差的區(qū)間估計(jì)案例___新舊電池使用壽命比較(Independent)某一個(gè)新的制造過程可以增加電池的使用壽命,假設(shè)電池使用壽命服從正態(tài)分布.在新電池中隨機(jī)抽取15個(gè),而在舊電中隨機(jī)抽取12個(gè)同時(shí)測試其使用壽命,資料如下:新舊兩種電池平均使用壽命之差95%的置信區(qū)間.新電池(日):

18.2\10.4\12.6\18.0\11.7\15.0\24.0\17.6\23.6\24.8\19.3\20.5\19.8\17.1\16.3舊電池(日):

12.1\17.5\8.6\13.9\7.8\15.1\17.9\10.6\13.8\14.2\15.3\11.6解:已知的原始數(shù)據(jù)是總體服從正態(tài)分布的兩個(gè)獨(dú)立樣本。設(shè)X代表電池使用壽命,g代表分組號操作步驟:(1)定義變量X和g,輸入數(shù)據(jù)資料,新舊電池壽命數(shù)據(jù)全部輸入X同一列中,g分別取1和2,新電池組號為1,舊電池組號為2(2)選擇AnalyzeCompareMeansIndependent-SamplesTTest,打開Independent-SamplesTTest對話框,(3)將變量X放入Test欄中(4)激活DefineGroups按鈕,打開該對話框Groups1中輸入1Groups2中輸入2,單擊Continue返回主對話框;(5)單擊OK按鈕執(zhí)行群組統(tǒng)計(jì)資料類型N平均數(shù)標(biāo)準(zhǔn)偏差標(biāo)準(zhǔn)錯(cuò)誤平均值壽命新電池1517.92674.344201.12167舊電池1113.30003.31632.99991獨(dú)立樣本檢定Levene的變異數(shù)相等測試針對平均值是否相等的t測試F顯著性Tdf顯著性(雙尾)平均差異標(biāo)準(zhǔn)誤差98%差異數(shù)的信賴區(qū)間下限上限壽命採用相等變異數(shù).485.4932.95224.0074.626671.56742.720418.53292不採用相等變異數(shù)3.07923.933.0054.626671.50265.881088.37226結(jié)論:表1:得出兩個(gè)獨(dú)立樣本各自的均值,標(biāo)準(zhǔn)差以及平均標(biāo)準(zhǔn)誤差.新電池的平均使用壽命明顯長于舊電池。表2:可以看出新舊電池平均使用壽命之差的95%的置信區(qū)間為:若兩個(gè)樣本方差相等則為(2.4454,8.6746);若兩個(gè)樣本方差不等則為(2.5437,8.5763)案例___吸煙有害廣告作用的分析(Paired)形形色色的廣告已深入到社會(huì)各個(gè)方面,與人民生活密不可分.成功的廣告將留給人們較深的印象,并帶給企業(yè)豐厚的回報(bào),如何鑒定廣告的效果,如何選擇最佳的廣告制作,對此西方國家更多地采用統(tǒng)計(jì)方法來判斷,舉例如下:為了研究吸煙有害廣告對吸煙者減少吸煙量甚至戒煙是否有作用,從某吸煙者中隨機(jī)抽取33位吸煙者,調(diào)查他們在觀看廣告前后的每天吸煙量(支)數(shù)據(jù)如下表.試問影片對他們的吸煙量有無產(chǎn)生作用?為了支持你的答案,請構(gòu)造一個(gè)99%的置信區(qū)間.吸煙者編號1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸煙者編號1213141516171819202122看前X1(支)看后X2(支)1710333425208441401910263016163120271862吸煙者編號2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821解:配對樣本的試驗(yàn),比較觀看前后平均數(shù)的大小可解決第一個(gè)問題,求出兩平均數(shù)之差的99%的雙側(cè)置信區(qū)間可解答第二個(gè)問題.操作步驟:(1)定義變量X1和X2,輸入數(shù)據(jù);(2)選擇AnalyzeComparemeansPaired-samplesTTest(3)將變量X1和X2放入Test欄中(4)激活Options…子對話框,置信度改為99%,單擊Continue按鈕,返回Paired-samplesTTest主對話框;(5)單擊OK按鈕執(zhí)行T-Test結(jié)論:表1:顯示觀看影片前的平均每日吸煙量約為21.5758支.觀看影片后的平均每日吸煙量約為17.5758支,說明該影片發(fā)生了作用.表2:反映了影片觀看前與后存在著顯著相關(guān)關(guān)系,相關(guān)系數(shù)為0.878.表3:顯示了前后兩個(gè)總體平均每日吸煙量之差的99%置信區(qū)間為(1.4888,6.5112),這意味著不管隨機(jī)抽到哪幾對樣本單位做調(diào)查,均有99%的把握保證,觀看影片前的平均每日吸煙量大于觀看影片后的平均每日吸煙量之差在(1.4888支至6.5112支之間,即大約在2—7支之間.待估計(jì)參數(shù)已知條件置信區(qū)間無限總體,np和nq都大于5總體比率(p)有限總體,np和nq都大于5(三)總體比率的區(qū)間估計(jì)當(dāng)時(shí)總體比例的置信區(qū)間可以使用正態(tài)分布來進(jìn)行區(qū)間估計(jì)。(樣本比例記為,總體比例記為π)總體比例的置信區(qū)間總體比例的置信區(qū)間:例子解:顯然有因此可以用正態(tài)分布進(jìn)行估計(jì)。Z

/2=1.645結(jié)論:我們有90%的把握認(rèn)為悉尼青少年中每天都抽煙的青少年比例在19.55%~23.85%之間。1986年對悉尼995名青少年的隨機(jī)調(diào)查發(fā)現(xiàn),有216人每天都抽煙。試估計(jì)悉尼青少年中每天都抽煙的青少年比例的90%的置信區(qū)間。

SPSS的計(jì)算結(jié)果在SPSS中將“是否吸煙”輸入為取值為1和0的屬性變量,權(quán)數(shù)分別為216和779。計(jì)算這一變量均值的置信區(qū)間即為比例的置信區(qū)間。

統(tǒng)計(jì)量標(biāo)準(zhǔn)誤均值.2171.01308均值的90%置信區(qū)間下限.1956

上限.2386

5%修整均值.1857

中值.0000

方差.170

標(biāo)準(zhǔn)差.41247

極小值.00

極大值1.00

范圍1.00

四分位距.00

1.3、必要樣本量的計(jì)算樣本量越大抽樣誤差越小。由于調(diào)查成本方面的原因,在調(diào)查中我們總是希望抽取滿足誤差要求的最小的樣本量。關(guān)于抽樣誤差的幾個(gè)概念實(shí)際抽樣誤差抽樣平均誤差最大允許誤差實(shí)際抽樣誤差樣本估計(jì)值與總體真實(shí)值之間的絕對離差稱為實(shí)際抽樣誤差。由于在實(shí)踐中總體參數(shù)的真實(shí)值是未知的,因此實(shí)際抽樣誤差是不可知的;由于樣本估計(jì)值隨樣本而變化,因此實(shí)際抽樣誤差是一個(gè)隨機(jī)變量。抽樣平均誤差抽樣平均誤差:樣本均值的標(biāo)準(zhǔn)差,也就是前面說的標(biāo)準(zhǔn)誤。它反映樣本均值(或比例)與總體均值(比例)的平均差異程度。例如對簡單隨機(jī)抽樣中的樣本均值有:或(不重復(fù)抽樣)我們通常說“抽樣調(diào)查中可以對抽樣誤差進(jìn)行控制”,就是指的抽樣平均誤差。由上面的公式可知影響抽樣誤差的因素包括:總體內(nèi)部的差異程度;樣本容量的大?。怀闃拥姆绞椒椒?。最大允許誤差最大允許誤差(allowableerror):在確定置信區(qū)間時(shí)樣本均值(或樣本比例)加減的量,一般用E來表示,等于置信區(qū)間長度的一半。在英文文獻(xiàn)中也稱為marginoferror。置信區(qū)間=最大允許誤差是人為確定的,是調(diào)查者在相應(yīng)的置信度下可以容忍的誤差水平。如何確定必要樣本量?必要樣本量受以下幾個(gè)因素的影響:1、總體標(biāo)準(zhǔn)差??傮w的變異程度越大,必要樣本量也就越大。2、最大允許誤差。最大允許誤差越大,需要的樣本量越小。3、置信度1-α

。要求的置信度越高,需要的樣本量越大。4、抽樣方式

。其它條件相同,在重復(fù)抽樣、不重復(fù)抽樣;簡單隨機(jī)抽樣與分層抽樣等不同抽樣方式下要求的必要樣本容量也不同。簡單隨機(jī)抽樣下估計(jì)總體均值時(shí)

樣本容量的確定式中的總體方差可以通過以下方式估計(jì):根據(jù)歷史資料確定通過試驗(yàn)性調(diào)查估計(jì)簡單隨機(jī)抽樣下估計(jì)總體比例時(shí)

樣本容量的確定式中的總體比例π可以通過以下方式估計(jì):根據(jù)歷史資料確定通過試驗(yàn)性調(diào)查估計(jì)取為0.5。不重復(fù)抽樣時(shí)的必要樣本量比重復(fù)抽樣時(shí)的必要樣本量要小。式中n0是重復(fù)抽樣時(shí)的必要樣本容量。樣本量的確定(實(shí)例1)需要多大規(guī)模的樣本才能在90%的置信水平上保證均值的誤差在±5之內(nèi)?前期研究表明總體標(biāo)準(zhǔn)差為45.nZE===≈222222(1645)(45)(5)219.2220

.向上取整樣本量的確定(實(shí)例2)一家市場調(diào)研公司想估計(jì)某地區(qū)有電腦的家庭所占的比例。該公司希望對比例p的估計(jì)誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計(jì)值)?解:已知E=0.05,=0.05,Z

/2=1.96,當(dāng)π未知時(shí)取為0.5。實(shí)例3你在美林證券公司的人力資源部工作。你計(jì)劃在員工中進(jìn)行調(diào)查以求出他們的平均醫(yī)療支出。你希望有95%置信度使得樣本均值的誤差在$50以內(nèi)。過去的研究表明醫(yī)療支出的總體標(biāo)準(zhǔn)差約為$400。需要多大的樣本容量?nZE===≈222222(196)(400)(50)24586246

..實(shí)踐中的統(tǒng)計(jì)一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對產(chǎn)量質(zhì)量進(jìn)行檢測,企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,下表1是對每袋食品重量的檢驗(yàn)結(jié)果。表125袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.010808101.6108.498.4100.5115.6102.2105.093.3根據(jù)表1的數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均重量在101.38~109.34克之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過4克。產(chǎn)品的合格率在96.07%~73.93%之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過16%。質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見:一是抽取的樣本大小是否合適?能不能用一個(gè)更大的樣本進(jìn)行估計(jì)?二是能否將估計(jì)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論