社會統(tǒng)計學(xué)-參數(shù)估計_第1頁
社會統(tǒng)計學(xué)-參數(shù)估計_第2頁
社會統(tǒng)計學(xué)-參數(shù)估計_第3頁
社會統(tǒng)計學(xué)-參數(shù)估計_第4頁
社會統(tǒng)計學(xué)-參數(shù)估計_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第6章參數(shù)估計統(tǒng)計推論基本概念抽樣分布點估計區(qū)間估計大樣本區(qū)間估計6.1統(tǒng)計推論統(tǒng)計推論是根據(jù)局部資料(樣本資料)對總體的特征進(jìn)行推斷。屬于歸納推理的范疇。統(tǒng)計推論的特點:(1)局部反映總體;(2)抽樣結(jié)果總是存在隨機(jī)性。統(tǒng)計推論的內(nèi)容:(1)參數(shù)估計(parameter’sestimation)(2)假設(shè)檢驗(Hypothesistest)6.2基本概念總體(Population):是研究對象的全體??梢钥醋魇且粋€研究對象的集合,又可以看作是所研究的變量的一個分布。例如家庭和家庭收入??傮w由個體(調(diào)查單位)構(gòu)成。樣本(Sample):從總體中按一定方式將要調(diào)查的個體抽出來,就組成一個樣本。其中包含的個體數(shù)目n稱為樣本大小或樣本容量。簡單隨機(jī)樣本:樣本中個體的抽取是獨立的,且和總體同分布,由此形成的樣本即簡單隨機(jī)樣本。要研究的總體的特征叫做參數(shù)值。要研究的樣本的特征叫做統(tǒng)計量。根據(jù)樣本觀測值得到的統(tǒng)計數(shù)字叫做統(tǒng)計量的觀測值。有時也把它們看作是統(tǒng)計量的本身。統(tǒng)計量的分布即抽樣分布。6.3抽樣分布總體分布(populationdistribution)是變量X的所有取值形成的分布。但我們在分析中往往不能知道總體分布的情況。1、樣本均值的分布(1)總體正態(tài)分布,方差已知

反映了統(tǒng)計量圍繞總體均值(μ)的分散程度,或者說反映了抽樣均值與μ的平均誤差水平。所以它又稱作抽樣均值的平均誤差或標(biāo)準(zhǔn)誤差。

是由抽樣引起的,其大小可以反映統(tǒng)計量的可靠性程度。其標(biāo)準(zhǔn)化后也得到標(biāo)準(zhǔn)正態(tài)分布。(2)總體正態(tài)分布,方差未知用樣本方差作為總體方差的估計值;統(tǒng)計量服從t分布。(3)任意總體,大樣本情況在社會現(xiàn)象的研究中,可以不考慮總體分布如何,只要n足夠大(≥50),樣本均值的分布將確定為一個近似的正態(tài)分布。2、樣本方差S2的分布樣本方差是隨機(jī)變量,當(dāng)總體為正態(tài)分布時,S2的分布與分布相聯(lián)系?!?/p>

2023/2/57

分布回顧該分布是指一些相互獨立、服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量平方和的分布。即從正態(tài)分布總體中抽取出來的樣本,經(jīng)過標(biāo)準(zhǔn)化后,它的平方和服從分布?!╪-1)常用于列聯(lián)表檢驗。2023/2/586.4點估計點估計:是以一個最適當(dāng)?shù)臉颖窘y(tǒng)計值來代表總體參數(shù)值。具體說,用樣本均值作為總體均值的點估計值。用樣本方差作為總體方式差的點估計值。估計量如果具有無偏性、一致性和有效性,就可以認(rèn)為這種統(tǒng)計量是總體參數(shù)的合理估計或最佳估計。6.4.1求點估計值的標(biāo)準(zhǔn)無偏性:要求統(tǒng)計量抽樣分布的均值恰好等于被估計的參數(shù)之值。比如,中心極限定理告訴我們,樣本均值抽樣分布的均值恰好等于總體均值,因此用樣本均值估計總體均值就滿足這個標(biāo)準(zhǔn)。但絕不是說任何的值將等于μ。一致性:當(dāng)樣本容量逐漸增加時,統(tǒng)計量越來越接近總體參數(shù)。要求統(tǒng)計量隨著樣本容量n的增大以更大的概率接近被估計參數(shù)。有效性:是指統(tǒng)計量的抽樣分布集中在真實參數(shù)周圍的程度。要求估計值的抽樣分布有較小的分散性,即選擇抽樣分布的標(biāo)準(zhǔn)差較小的統(tǒng)計量作為估計量。6.4.2點估計值的計算總體均值的點估計總體方差的點估計值在統(tǒng)計學(xué)中,常常用符號“”來表示無偏估計量。數(shù)學(xué)上可以證明,對于隨機(jī)樣本而言,才是總體方差的無偏估計量,它稱為修正樣本方差。當(dāng)Xi表示的是變量,其取值是0和1。如果A類(X=1)出現(xiàn)了m次,我們用樣本的成數(shù)P作為總體的估計值。[例]工會為了了解春游期間需用幾輛公共汽車,在全廠10000名職工中進(jìn)行了共100人的簡單隨機(jī)抽樣調(diào)查。統(tǒng)計結(jié)果,其中有20名愿意外出春游。假設(shè)每輛車可載乘客50名,問估計要預(yù)租多少輛公共汽車?用樣本成數(shù)來估計。[例]研究者要調(diào)查某社區(qū)居民家庭收入分布的差異情況,現(xiàn)隨機(jī)抽查了10戶,得到樣本方差為=200(元2)。試以此資料估計總體家庭收入分布的差異情況。

[解]因為樣本容量較小,宜用修正樣本方差作為總體方差點估計量。即

===222.26.5區(qū)間估計(Intervalestimation)區(qū)間估計的任務(wù)是,在點估計值的兩側(cè)設(shè)置一個區(qū)間,使得總體參數(shù)被估計到的概率大大增加??煽啃院途_性(即信度和效度)在區(qū)間估計中是相互矛盾的兩個方面。

6.5.1有關(guān)區(qū)間估計的幾個概念置信區(qū)間:區(qū)間估計是求所謂置信區(qū)間的方法。置信區(qū)間就是我們?yōu)榱嗽黾訁?shù)被估計到的信心而在點估計兩邊設(shè)置的估計區(qū)間。區(qū)分精確性與可靠性顯著性水平

α:表示用置信區(qū)間來估計的不可靠的概率。置信度(水平)1-α:表示置信區(qū)間估計的可靠性(把握度)。例如置信水平取0.90。抽樣平均誤差與概率度

Z抽樣平均誤差:樣本均值抽樣分布的標(biāo)準(zhǔn)差。反映在參數(shù)周圍抽樣平均值的平均變異程度。越大,樣本均值越分散。概率度:Z在參數(shù)估計中被稱為概率度,其大小由

α決定.

顯著性水平、置信水平、概率度之間的關(guān)系:

α

=0.10時,1-

α

=0.90,Zα/2=1.65

α=0.05時,1-

α

=0.95,Zα/2=1.96

α=0.01時,1-

α

=0.99,Zα/2=2.582023/2/5186.5.2區(qū)間估計的做法從點估計值開始,向兩側(cè)展開一定倍數(shù)的抽樣平均誤差,并估計總體參數(shù)很可能就包含在這個區(qū)間之內(nèi)。置信區(qū)間的大小主要由和Z這兩個量所決定,并且是2Z。所以參數(shù)μ的區(qū)間估計就歸結(jié)為計算這兩個量(即就各種抽樣分布計算概率度和就各種抽樣方式計算抽樣平均誤差)。

的大小對設(shè)置置信區(qū)間的范圍起著很重要的作用。在同等置信度的情況下,抽樣平均誤差小,估計區(qū)間就縮小了,從而獲得對參數(shù)較為有效的估計(決定效度的關(guān)鍵因素)。Z則與信度相聯(lián)系。對參數(shù)μ的區(qū)間估計的步驟:

1.首先從總體抽取一個樣本,根據(jù)收集的樣本資料求出它的均值。

2.根據(jù)合乎實際的置信水平查表求得概率度

3.根據(jù)總體標(biāo)準(zhǔn)差和樣本容量求出抽樣平均誤差

4.以均值為基準(zhǔn),向兩側(cè)展開Z倍抽樣平均誤差的區(qū)間。根據(jù)總體方差是否知道,估計分兩種情況。(1)已知(2)未知,用S代替6.5.3大樣本,總體均值的區(qū)間估計[例]設(shè)某工廠婦女從事家務(wù)勞動服從正態(tài)分布N

,0.662],根據(jù)36人的隨機(jī)抽樣調(diào)查,樣本每天平均從事家務(wù)勞動的時間為2.65小時,求μ的置信區(qū)間(置信度1-α

=0.95)。

[解]按題意,此為大樣本,且總體方差已知,又

n=36,=2.65,=0.66,1-α=0.95。查表得Z=1.96,代入公式有=2.65±1.96=2.65±0.22

因此,有95%的把握,該廠婦女平均從事家務(wù)勞動的時間在2.87~2.43小時之間。[例]從某校隨機(jī)地抽取100名男學(xué)生,測得平均身高為170厘米,標(biāo)準(zhǔn)差為7.5厘米,試求該校學(xué)生平均身高95%的置信區(qū)間。

[解]按題意,此為大樣本,且總體方差未知,又n=100,=170,S=7.5,1—α=0.95.查表得=1.96,代入公式有

=170±1.96=170±1.47因此,有95%的把握,該校學(xué)生的平均身高在168.5~171.5厘米之間。[習(xí)題]從來自“白領(lǐng)犯罪與罪犯生涯:一些初步研究結(jié)果”的一項研究報告的數(shù)據(jù)表明,白領(lǐng)犯罪可能是年紀(jì)較大者,并且顯示比街頭罪犯有較低的犯罪率。給出數(shù)據(jù)為:白領(lǐng)犯罪發(fā)作平均年齡為54歲,n

=100,標(biāo)準(zhǔn)差被估計為7.5歲。建立真實平均年齡的90%置信區(qū)間。采用t分布6.5.4小樣本,正態(tài)總體均值區(qū)間估計[例]在一個正態(tài)總體中抽取一個容量為25的樣本,其均值為52,標(biāo)準(zhǔn)差為12,求置信水平為95%的總體均值的置信區(qū)間。

[解]根據(jù)題意,總體方差未知,且為小樣本,故用t分布統(tǒng)計量。由95%置信水平查t分布表得概率度=(24)=2.064

代入公式得

=52±2.064=52±4.95因此,置信水平95%的總體均值的置信區(qū)間是從47.05到56.95。從總體的均值估計過渡到總體的成數(shù)估計,其方法和思路完全相同,只要用代替,用代替。6.5.5大樣本總體成數(shù)的估計[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本,發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開支上作決定的次數(shù)超過半數(shù)。試問家庭開支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)[例]假若從某社區(qū)抽取一個由200個家庭組成的樣本,發(fā)現(xiàn)其中有36%的家庭由丈夫在家庭開支上作決定的次數(shù)超過半數(shù)。試問家庭開支的半數(shù)以上由丈夫決定的家庭的置信區(qū)間是多少?(置信水平99%)

[解法一][解法二]2023/2/530n1≥50n2≥50現(xiàn)在從兩總體獨立地各抽取一個隨機(jī)樣本:只要樣本都大于或等于50,則兩個樣本均值的抽樣分布都服從正態(tài)分布,根據(jù)正態(tài)隨機(jī)變量線性組合的隨機(jī)變量仍然服從正態(tài)分布的原理,則均值差也服從正態(tài)分布。6.5.5大樣本二總體均值差的估計若總體方差未知,則用樣本方差代替總體方差。在大樣本的情況下置信度為1-a的(μ1-μ2)的區(qū)間估計為:2023/2/533

與單樣本成數(shù)的區(qū)間估計一樣,成數(shù)差區(qū)間估計可以被看作均值差的特例來處理(但它適用于各種量度層次)。即對給定的置信水平(1―α),得兩總體成數(shù)差(p1―p2)之估計區(qū)間為

6.5.5大樣本成數(shù)差的區(qū)間估計2023/2/534

[例]有一個大學(xué)生的隨機(jī)樣本,按照性格“外向”和“內(nèi)向”,把他們分成兩類。結(jié)果發(fā)現(xiàn),新生中有73%屬于“外向”類,四年級學(xué)生中有58%屬于“外向”類。樣本中新生有171名,四年級學(xué)生有117名。試在99%的置信水平上,求新生、老生性性格“外向”的成數(shù)差的置信區(qū)間。2023/2/535

[解]據(jù)題意,

新生組的抽樣結(jié)果為:=0.73,

=027,

n1=171(人)

四年級學(xué)生組的抽樣結(jié)果為:

=0.58,

=0.42,n2=117(人)

由(1―α)=0.99,得Zα/2=Z0.005=2.58,代入上式得

得在99%置信水平上,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論