社會(huì)統(tǒng)計(jì)學(xué)-6參數(shù)估計(jì)1大數(shù)定律、中心極限定理和抽樣分布_第1頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-6參數(shù)估計(jì)1大數(shù)定律、中心極限定理和抽樣分布_第2頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-6參數(shù)估計(jì)1大數(shù)定律、中心極限定理和抽樣分布_第3頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-6參數(shù)估計(jì)1大數(shù)定律、中心極限定理和抽樣分布_第4頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)-6參數(shù)估計(jì)1大數(shù)定律、中心極限定理和抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6講

參數(shù)估計(jì)本講概要大數(shù)定律、中心極限定理和抽樣分布參數(shù)估計(jì)樣本容量的確定1.大數(shù)定律、中心極限定理和抽樣分布要研究隨機(jī)現(xiàn)象的規(guī)律性,必須做大量的觀(guān)察或試驗(yàn)。對(duì)于隨機(jī)現(xiàn)象而言,的表現(xiàn)純屬偶然,但通過(guò)大量的觀(guān)察或試驗(yàn),可以發(fā)現(xiàn)隨機(jī)現(xiàn)象表現(xiàn)出一定的規(guī)律性。這種規(guī)律性的出現(xiàn)是由于在大量觀(guān)察或試驗(yàn)的過(guò)程中,隨機(jī)現(xiàn)象的各種偶然性在一定程度上相互抵消、相互補(bǔ)償。因此,大量觀(guān)察或試驗(yàn)的結(jié)果表現(xiàn)出來(lái)的規(guī)律性會(huì)非常穩(wěn)定。(1)大數(shù)定律大數(shù)定律:設(shè)m是在n次獨(dú)立觀(guān)察中事件A出現(xiàn)的次數(shù),p是事件A在一次觀(guān)察中出現(xiàn)的概率,則對(duì)于任意正數(shù)ε,有當(dāng)n足夠大

件A出現(xiàn)的頻率將無(wú)限接近于其發(fā)生的概率,即頻率的穩(wěn)定性。Law

of

Large

Numbers:

Comparing

Relative

versusAbsolute

Frequency

of

Coin

FlipsIf

you

wereto

flip

acoin

10,000

times,

you

would

expect

the

number

ofheads

tobeapproxima

y

equal

to

the

numberof

tailswhenusing

afair

coin.

Theabsolute

difference

plot

can

show

qui

arge

differences

in

absolute

terms,

,

asthe

number

of

tosses

increases.

In

comparison,

the

relative

difference

plot

showsthat

in

relative

terms,

,

the

differenceconverges

to

zero.This

Demonstration

showcases

the

law

of

large

numbers,

a

key

theorem

inprobability

theory,

that

describes

the

result

of

performing

the

same

experiment

alarge

number

of

times.

According

to

the

law,

the

average

of

the

results

obtainedfrom

a

large

number

of

trials

should

be

close

to

the

expected

value,

and

will

tendto e

closer

as

more

trials

are

performed.

For

this

Demonstration,

thinkaboutthe

simple

case

of

tossing

a

fair

coin.

If

each

flip

is

independent

of

the

next(so

that

the

result

of

one

flip

does

not

change

the

probabilities

of

seeing

heads

ortails

on

the

next

flip),

then

the

proportion

of

heads

in

tosses

should

get

close

to0.5

as

gets

large.(2)中心極限定理大數(shù)定律和切比雪夫大數(shù)定律說(shuō)明了在大量觀(guān)察的情況下,隨

量特征值的穩(wěn)定性,即頻率穩(wěn)定率,均值穩(wěn)定于數(shù)學(xué)期望。中心極限定理則說(shuō)明了在大量觀(guān)察的情況下,隨的特征值在分布上所表現(xiàn)的穩(wěn)定性。具體到抽樣量來(lái)說(shuō),只要樣本量足夠大,不管總體的分布如何,樣本均值的分布都將是已知的,即服從正態(tài)分布。這就為通過(guò)樣本來(lái)研究未知總體奠定了理論基礎(chǔ)。共有10名工作人員,他們的工作年限分別為:6789101112131415隨機(jī)抽取3人,則樣本均值的分布特征可以表示為右圖。(3)抽樣分布抽樣分布是所有樣本指標(biāo)(如均值、比例、方差等)形成的分布。它是根據(jù)概率原則而成立的理論性分布,顯示由同一總體中反復(fù)抽取樣本時(shí),各個(gè)可能出現(xiàn)的樣本統(tǒng)計(jì)量的分布情況。抽樣分布的概念要點(diǎn):①抽樣分布是一種理論概論分布;②

抽樣分布中的隨 量是樣本統(tǒng)計(jì)量,如樣本均值、樣本成數(shù)等;③結(jié)果來(lái)自容量相同的所有可能樣本。例:共有10名

,他們的工作年限分別為:6

7

8

9

10

11

1213

1415隨機(jī)抽取3人,計(jì)算均值的抽樣分布。2.參數(shù)估計(jì)推論統(tǒng)計(jì):根據(jù)局部資料(樣本資料)對(duì)總體的特征進(jìn)行推斷。統(tǒng)計(jì)推論具有兩方面的特點(diǎn):一方面由于局部資料來(lái)源于總體,因此局部資料的特性在某種程度上能反映總體的特性;但另-方面由于社會(huì)資料的隨機(jī)性,即抽樣的結(jié)果不是唯一的,又使得一次抽樣結(jié)果不能恰好就等于總體的結(jié)果。推論統(tǒng)計(jì)可分為兩大類(lèi)別:①參數(shù)估計(jì):根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)估計(jì)總體的參數(shù)值;②假設(shè)檢驗(yàn):首先對(duì)總體參數(shù)作出某種假設(shè),然后以一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)檢驗(yàn)這個(gè)假設(shè)是否成立。(1)點(diǎn)估計(jì)點(diǎn)估計(jì):也稱(chēng)點(diǎn)值估計(jì),是從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)。如果估計(jì)量具有無(wú)偏性、一致性和有效性,就可以認(rèn)為這種統(tǒng)計(jì)量是總體參數(shù)的合理估計(jì)或最佳估計(jì)。1)求點(diǎn)估計(jì)值的標(biāo)準(zhǔn)①無(wú)偏性:要求統(tǒng)計(jì)量抽樣分布的均值恰好等于被估計(jì)的參數(shù)值。換句話(huà)說(shuō),從最終的結(jié)果來(lái)看,估計(jì)量的數(shù)學(xué)期望就是參數(shù)本身。注意,這里所說(shuō)的并不是任何一個(gè)特定樣本結(jié)果的值。根據(jù)這一定義,隨機(jī)樣本的就是總體均值μ的無(wú)偏估計(jì)量,因?yàn)榈某闃臃植嫉木祷蚱谕稻褪铅?,?/p>

,然而這并不意味著,的任何一個(gè)特定值都等于μ。②有效性:要求估計(jì)值的抽樣分布有較小的分散性,即選擇抽樣分布的標(biāo)準(zhǔn)差較小的統(tǒng)計(jì)量作為估計(jì)量,因?yàn)?,才能保證一次抽樣的結(jié)果就能以較高的概率接近待估的總體參數(shù)。③一致性:要求統(tǒng)計(jì)量隨著樣本容量n的增大以更大的概率接近被估計(jì)參數(shù)。2)點(diǎn)估計(jì)值的計(jì)算①總體均值的點(diǎn)估計(jì)使用樣本均值:②總體方差的點(diǎn)估計(jì)使用樣本方差:(2)區(qū)間估計(jì)點(diǎn)估計(jì)是用一個(gè)數(shù)值估計(jì)總體參數(shù)的值,它沒(méi)有給出估計(jì)值接近總體未知參數(shù)程度的信息,所以無(wú)法判斷誤差的大小。區(qū)間估計(jì)則對(duì)此進(jìn)行了改進(jìn),它是根據(jù)樣本的觀(guān)察值給出總體參數(shù)的估計(jì)范圍,同時(shí)給出總體參數(shù)值落在這一區(qū)間的概率。有關(guān)區(qū)間估計(jì)的幾個(gè)概念:①置信水平:總體參數(shù)落在某區(qū)間內(nèi)的概率。②置信區(qū)間:為了增加參數(shù)被估計(jì)到的信心而在點(diǎn)估計(jì)兩邊設(shè)置的估計(jì)區(qū)間。③顯著性水平:總體參數(shù)未落在置信區(qū)間內(nèi)的概率,它是用置信區(qū)間來(lái)估計(jì)的不可靠程度,用α表示。置信區(qū)間與置信水平的關(guān)系:置信水平愈高,則相應(yīng)的置信區(qū)間也愈寬。④抽樣平均誤差(標(biāo)準(zhǔn)誤)抽樣平均誤差:樣本均值抽樣分布的標(biāo)準(zhǔn)差,它反映在參數(shù)周?chē)闃悠骄档钠骄儺惓潭?。它的值等于總體標(biāo)準(zhǔn)差除以樣本大小的平方根,即:1)

單個(gè)總體

的情況為總體設(shè)已給定置信水平為1-α,并設(shè)的樣本,

分別為樣本均值和樣本方差。①

已知,則在1-α的置信水平上,總體均值μ的置信區(qū)間為:例:想要了解某班學(xué)生的從中隨機(jī)抽取一個(gè)樣本,好友數(shù)量,假設(shè)滿(mǎn)足正態(tài)分布,,若已知總體方差為25的情況下,求顯著性水平為0.05時(shí)的置信區(qū)間。所求置信區(qū)間=② 未知,則無(wú)法使用①中的方法,因其中含有未知參數(shù)

??紤]到

的無(wú)偏估計(jì),且有可得:→置信水平為1-α?xí)r,μ的置信區(qū)間為:例:想要了解某班學(xué)生的從中隨機(jī)抽取一個(gè)樣本,好友數(shù)量,假設(shè)滿(mǎn)足正態(tài)分布,,求顯著性水平為0.05時(shí)的置信區(qū)間。所求置信區(qū)間=③方差

的置信區(qū)間(選學(xué))由,可得→置信水平為1-α?xí)r,方差的置信區(qū)間為:2)兩個(gè)總體

的情況①

均為已知時(shí),兩個(gè)總體均值差的置信區(qū)間由

可知,置信水平為1-

α?xí)r兩個(gè)總體均值差

的置信區(qū)間為:②但為未知時(shí),兩個(gè)總體均值差的置信區(qū)間由可知,置信水平為1-α?xí)r兩個(gè)總體均值差的置信區(qū)間為:例:為了比較兩所學(xué)校的學(xué)生身高,隨機(jī)抽取甲校10名學(xué)生,其均值為167cm,標(biāo)準(zhǔn)差為12cm;隨機(jī)抽取乙校15名學(xué)生,其均值為166cm,標(biāo)準(zhǔn)差為10cm。假設(shè)兩校學(xué)生的身高都近似服從正態(tài)分布,且方差相等。求置信水平為0.95時(shí)的兩校學(xué)生身高均值之差的置信區(qū)間。3)總體成數(shù)的估計(jì)①總體成數(shù)p的點(diǎn)估計(jì)如果在樣本容量為n的簡(jiǎn)單隨機(jī)抽樣中,對(duì)于所要研究的事件A共出現(xiàn)m次,則樣本成數(shù)

為總體中A的成數(shù)p的點(diǎn)估計(jì)值,且有:②大樣本總體成數(shù)p的區(qū)間估計(jì)區(qū)間估計(jì)公式:在1-α的置信水平下,大樣本總體成數(shù)p的置信區(qū)間為:在p未知時(shí),可用代替p。例:某高校100人抽樣,60人使用

,求該校學(xué)生中使用的成數(shù)p的置信區(qū)間(α

=

0.05)。所求置信區(qū)間=4.抽樣誤差樣本容量的確定1)抽樣誤差由于隨機(jī)抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對(duì)離差。我們平時(shí)想像的抽樣誤差可能是針對(duì)某個(gè)具體的樣本的檢測(cè)結(jié)果與總體真實(shí)結(jié)果的差異而言的,然后統(tǒng)計(jì)學(xué)上的抽樣誤差描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。影響抽樣誤差的因素:①抽樣單位的數(shù)目:數(shù)目越大,樣本越接近總體。②總體被研究標(biāo)志的變異程度:抽樣誤差和總體標(biāo)志的變異程度成正比變化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論