版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
應用多元統(tǒng)計抽樣方法與抽樣分布北京師范大學教育學部胡詠梅教育學部本科生課程抽樣方法-簡單隨機抽樣-等距抽樣-分層抽樣-整群抽樣抽樣分布t分布、X
分布和F分布樣本容量的確定contents□1.簡單隨機抽樣□
簡單隨機抽樣是指在抽樣過程中,每一個個體都有同等的、相互獨立
的被選機會的抽樣方法?!?/p>
常用的簡單隨機抽樣方法有隨機數(shù)字表法和抽簽法。一
、抽樣方法北京師范大學教育學部□
隨機數(shù)字表法□
隨機數(shù)字表是根據(jù)隨機化原則所制成的由隨機數(shù)排列起來的數(shù)字表
(見附表2)。表中0—9這10個數(shù)字在表上任一位置上出現(xiàn)的概率都是相等的。1.簡單隨機抽樣北京師范大學教育學部開始剪
切
復制▼粘貼格式刷剪貼板附表2
[兼容模式]-Excel頁面布局
公式
數(shù)據(jù)
審閱
視
圖
開發(fā)工具
Acrobat
百度網盤
告訴我您想要做什么
…京師范大學教育學自動換行合并后居中
對齊方式插入
刪除
單元格宋體常規(guī)B
I
U字體條件格式
套用單元格樣式表格格式▼樣式P11×
fxABCDEFGHIJKLMN0PQR附表2
萬
個
隨
機
數(shù)
字表00~0405~0910~1415~1920~2425~2930~3435~3940~4445~4900887586660533843436236277425517095604188085126607550135661428321624077410206862665659698862411315249187022633503771641153813340721067879596608419178886386036082674718565272950891975136952521572237063377343970495044998961376331764939706098714692710393416521297890583764476940614342741383389769469300998641964115083100627998425626540210056816684874408400831241989618805110782686323237462514510859272801780588147565493776379120818386138621098804197187707275771418811336950344037130921717131412270768165584401918708421238720303634208141510184468305231842086341188786070084642056574399365411611660277517747398664237016016232673433620550036594111712514209677954309874567896779638688694906202196551091813270456262673159911499650944024922372996949315118041914130941772514103000676884363565935782475610814151852021159238262518177525316363852448400259288572031079016922161625150809493267723290155699559389270445009065700223170934214528647277140384156340833561335670105490746824183814879001035097942439625733151881186230996823289625192368919997723821524780205580904880494548836932279926Sheet2
Sheet3
+部就緒00
0數(shù)字文件%9□
例6-1:某年級有學生150人,為了抽查該年級學生的體育達標情況.現(xiàn)需要抽取一個容量為15的樣本。問該樣本如何獲得?隨機數(shù)
字表法北京師范大學教育學部□
先將總體中的每一個個體都編上號碼,然后把號碼寫在簽上,將簽充分混合后,從中隨機抽取n個簽,則與簽上號碼相對應的n個個體就組成了
一個樣本容量為n
的樣本。抽
簽北京師范大學教育學部法□
網
站(
www.rand)
可以產生隨機數(shù)字(有放回的簡單隨機抽樣與不放回的簡單隨機抽樣)。利用抽
樣軟件北京師范大學教育學部Randomizer
Boxandgenerate
your
own
number
sets.To
generate
random
numbers,enter
your
choices
below(using
integer
valuesonly):How
many
sets
of
numbers
do
you
want
togenerate?How
do
you
wish
to
view
your
random
Place
Markers
Off
numbers?HelpRandomizeNow!SiteOverviewRandomize
Now三
Research
Randomizer
Form
v4.0-Windows
Internet
Explorerhttp://www.randomizer.org/form.htmBing文件(F)編輯(E)查看(V)收藏夾(A)工具(T)幫助(H)X
選擇Gmall:來自Google的
…
e
http-www.edujournal.c.建議網站▼網頁快訊庫▼How
many
numbers
per
set?10HelpNumber
range(e.g.,1-50):From:1To:100HelpDo
you
wish
each
number
in
a
set
toremainunique?YesHelpDo
you
wish
to
sort
the
numbers
that
No
are
generated?HelpUsethe
Randomizerformto
instantlQuickTutorialSeesomeexamplesofhow
ResearchRandomizercanbe
usedfor
randomRelated
LinksVisitlinkson
random
sampling,randomassignment,andresearch
methodsAbout
Research
RandomizerLean
moreabout
ResearchA
已完畢,但網頁上有錯誤。
Internet|保護模式:啟用
+100%Research
RandomizerFormv4.0命
▼5
▼
口▼頁面(P)▼
安全(S)▼工具(0)▼
②▼Randomizerandreadour
User
Policy.samplingandrandom
assignment.generaterandom
numbers.Addthis
tool
to
yourwebsite☆收藏來
咨2023-3-5Help2完成
Internet
保|護模式:啟用2023-3-5Research
RandomizerResults2
Sets
of
10
Unique
Numbers
Per
Set
Range:From1
to100
--UnsortedJobStatus:FinishedSet
#1:82,58,2,39,21,80,13,65,51,35Set
#2:61,50,83,58,79,71,16,5,98,18Results
-Research
Randomizer-Windows
Intermet
Explorer
0about:blank收藏夾建
議網站▼e網頁快訊庫▼口▼頁面(P)▼
安全(S)▼工具(0)▼②▼
k
能選擇Gmail:來自Google的….e
http--Www.edujournal.c
…EARCIDOMIZER文件(F)編輯(E)
查看(V)
收藏夾(A)
工具(T)
幫
助(H)Print
當
DownloadinExce
圖
Close區(qū)100%X
轉
換
選擇
★
收藏夾
☆Gmail:來自Google
的…e
http-www.edujournal.c
建
議
網站▼網頁快訊庫▼Research
Randomizer
Form
v4.0
合▼▼口▼頁面(P)▼安全(S)▼
工具(0)▼Howmanynumbersperset?10HelpNumberrange(e.g.,1-50):From:1To:100HelpQuick
TutorialRelated
LinksResearch
Randomizer
Form
v4.0-Windows
Internet
Explorerhttp://www.randomizer.org/form.htm文件(F)編輯(E)
查看(V)收藏夾(A)工具(T)幫助(H)Internet|
保護模式:啟用
+100%Togeneraterandom
numbers,enter
your
choicesinteger
values
only):Howmany
sets
of
numbers
do
you
want
to
generate?Do
you
wish
to
sort
the
numbers
that
Yes:Least
to
Greatest▼are
generated?HelpRandomizer
BoxAddthis
tool
to
yourwebsiteandgenerateyour
ownnumber
sets.Do
you
wish
each
number
in
a
set
to
remain
unique?No▼HelpHow
do
you
wish
to
view
your
random
Place
Markers
Off
numbers?HelpVisitlinksonrandom
sampling.randomassignment,andresearch
methods.About
Research
RandomizerSeesomeexamplesofhow
Research
Randomizercanbe
usedfor
random
samplingandrandom
assignment.Usethe
Randomizerformtoinstantly
generaterandom
numbers.Learnmore
about
ResearchRandomizerandreadour
User
Policy.Randomize
Now!
RandomizeNow
below
(using2023-3-52
Helpng=(T)
(H)選擇收藏夾
Gmail:
來自Google
的
…
journal.C--
建議網站一網頁快訊庫一▼頁面(P)▼
安全(S)▼工具(0)▼②▼k能術EAR(DPrint當Download
in
Excel圖
Close區(qū)MIZERResearch
RandomizerResults2
Sets
of
10
Non-unique
Numbers
Per
SetRange:From1to
100--Sortedfrom
LeasttoGreatestJobStatus:FinishedSet#1:5,11,26,43,68,69,90,90,94,94Set#2:15,21,28,32,40,48,54,64,68,91Results-Research
Randomizer
-Windows
Internet
Exploreraboutblank完成
Internet|
保護模式:啟用
+100%文件(F
編輯(E)
查看(V)
收藏夾(A)
工具
幫助可2023-3-5□
現(xiàn)有某校四年級某班50名學生的英語能力水平測驗成績,請利用SPSS
軟
件進行簡單隨機抽樣,隨機抽取10名學生的成績樣本。□
數(shù)據(jù)文件:6-1.savSPSS
軟
件應用北京師范大學教育學部學生編號數(shù)學英語Output--◎Eilter
out
unselected
casesOCopy
selectedcases
to
a
new
datasetDataset
name:ODelete
unselected
cases□
單擊Data-Selectc名——英語,選O
All
casesO
If
condition
is
satisfiedIf◎Random
sample
of
cases+TTnSelectCasesSelect-SPSS
軟件應用點擊欲抽樣的變量RangeOUse
fiter
variable:7
_
工
+XCurrent
Status:Do
notfiltercasesO旦ased
on
time
or
case
rangeResetasteOKSample.學教eCancelHelp讓-1SPSS軟件應用
北京師范大學教育學部□
點擊Sample,
出現(xiàn)Select
Cases:Random
Sample對話框。在抽取比例欄中
填上相應的值,此題抽取總體20%的樣本,則在Approximately%of
allcases
中填上20。當然,也可以選擇從前面n個案例中精確選擇m個被試,
需要在Exactly
m
cases
from
the
first
n
cases
中填上相應數(shù)據(jù)。tSelect
Cases:Random
SampleSampleSize◎
Approximately
po
%of
all
cases◎Exactly
cases
from
the
first
casesContinue
Cancel
Help□
先把總體所包含的個體(設共有N
個)編上號碼1—N,再根據(jù)樣本容量n求得抽樣間距k:k=N/n
。
然后,隨機確定一個起點a(1≤a≤k),
起點確
定后,從起點開始每隔k個個體抽選一個個體,這樣抽取的號碼序列也
就確定了。即由號碼a,a+k,a+2k,...,a+(n-1)k組成的容量為n的樣本。2.等距抽樣北京師范大學教育學部□例6-2:為了解某校初一年級學生數(shù)學學習情況,擬從200名學生中抽取
20人的成績來考察。問如何得到這樣的樣本?oN=200,n=20,k=200/20=10,先按學生入學時的登記號將學生成績編號,
假如這時隨機確定的起點為003,則抽選號碼依次是:003,013,023,.,183,1932.等距抽樣
北京師范大學教育學部□
等距抽樣對總體的代表性不如每種樣本組合都有相等的、相互獨立的被
選機會的簡單隨機樣本?!?/p>
在備有檔案記錄或登記表的條件下,使用等距抽樣比較方便。等距抽
樣VS
簡單隨機抽樣北京師范大學教育學部□
分層抽樣方法是按照總體已有的某些特征,將總體分成幾個不同的部分,
每一部分稱為一個層,在每一層中實行簡單隨機抽樣的方法。□分層總的原則:層內個體間的變異要小,而層與層之間的變異要盡可能
地大。北京師范大學教育學部3.分層抽樣□例6-3:要從某校2000名大學一年級學生中,抽出一個容量為100的樣
本,研究高考英語成績與升入大學后的英語成績的關系?!?/p>
先按高考英語分數(shù)把這2000名學生分為優(yōu)、良、中、差四層,然后在
各層中都隨機抽取100/2000=0.05即5%的學生,合起來就是一個容量為
100的樣本了。分層抽樣示例
北京師范大學教育學部分層抽樣示例
北京師范大學教育學部□例6-4:某中學有學生3000人,要通過抽查20%的學生來了解學生視力
情況。已知該校6個年級學生人數(shù)的分布情況是:初一年級600人,初
二年級580人,初三年級560人,高一年級440人,高二年級420人,高
三年級400人?!?/p>
首先按年級將總體分成6層,然后在各層(年級)內均按20%的比例隨
機抽樣。因此從各層中隨機抽取的人數(shù)依次為:120,116,112,88,
84,80?!?/p>
在樣本中各層人數(shù)的比例與總體中各層人數(shù)的比例是相同的,□
600:580:560:440:420:400=120:116:112:88:84:80。北京師范大學教育學部分層抽樣示例□分層抽樣使樣本與總體具有相同的整體結構,即各層所占的比例完全相同,從而控制了抽樣誤差,保證了樣本具有較高的代表性,所以分層抽
樣是最常用的一種抽樣方法。3.分層抽樣北京師范大學教育學部□
整群抽樣是從總體中按自然群體整個地隨機抽取若干群體,由這些群體的全部個體組成樣本的抽樣方法。2005年國民體質抽樣調查采用分層整群抽樣方法,采集了200多萬個人的數(shù)據(jù)。4.
整群
抽樣北京師范大學教育學部□整群抽樣的優(yōu)點在于實施便利,易于組織,省時省力,因而它適合于大
規(guī)模的調查研究。□
如果各群體之間的變異較小,而每一群體內個體的變異較大(最好能基
本上反映總體內部的變異情況)。此時,每一群體就可以看作總體的一
個縮影,適宜采用整群抽樣。4.整群抽樣北京師范大學教育學部□
簡單可行、節(jié)省人力物力而且所得樣本應對總體的代表抽樣方
法的選取原則北京師范大學教育學部□
為了全面研究我國各地公立中小學教育投入和產出關系,我們將分別構建東、中、西部的城市、農村的學校教育投入與產出關系模型。因
此,本課題的抽樣需要兼顧地區(qū)差別、城鄉(xiāng)差別和學段差別,同時根據(jù)分層抽樣方法需要考慮到各類學校抽樣比例應與其總體比例基本相同。調查單位為學校,樣本量的確定是考慮到擬采用的定量分析方法對最低樣本量的要求以及我們的人力和時間有限等因素后確定的。關于我國中小學教育投入與產出關系的研究—抽樣方案北京師范大學教育學部學校公立小學公立初中地點東部江
蘇城市3620農村2312廣東城市4025農村3021中部安
徽城市4016農村3822湖
北城市3423農村2015西部青
海城市4028農村4222四川城市4025農村3220關于我國中小學教育投入與產出關系的研究—抽樣方案從總體中抽取n個個體,得到n個隨機變量x,,x?,…,xn。我們所說的抽樣,一般是指隨機抽樣,即要求x,,x?,…,xn
相互獨立,并且與總體X
具有相同的分布。這樣的樣本稱為簡單隨機樣本,簡稱為隨機樣本。
x?,x?,…,x,被稱作來自總體X
的一個樣本容量為n的樣本。二、抽樣分布北京師范大學教育學部機變量。樣本函數(shù)f(x,,x?
,…,x
)中若不含有未知的參數(shù),則稱之為一個統(tǒng)計量。統(tǒng)計量的概率分布被稱為抽樣分布。北京師范大學教育學部n表示隨機變量時,它的函數(shù)f(x?,x?,
…
,
xn)也是一個隨二、抽樣分布當x?,x?,…,x設X~N(0,1),x?,X?,.,xn是來自總體X
的樣本,則為n的x2分布,記作
x2~x2(n)x2
分布臨界值表(見附表3)2X分布稱服從自由度北京師范大學教育學部2X分布北京師范大學教育學部例6-5:若α=0.05,自由度df=5,查分布的單側檢驗值表(附表3)可知:
p(x2>11.1)=0.05,即xoos(5)=11.1。例6-6:若取α=0.01,自由度df=5,則P(x2>15.1)=0.01,即xo.0(5)=15.1。x2分
布
表
黏
北京師范大學教育學部北京師范大學教育學部35
40
k(;n)in=1n=4n=10x2分布的特點0.200.150.100.055
10
15
20
25
30分布密度函數(shù)圖
1
:X
2n=20·x2分布是一個正偏態(tài)的分布。n越大,曲線越趨于對稱(由中心極限定理知,它趨于正態(tài)分布);n
越小,曲線越不對稱?!と鬤?,X?,...,Xm相互獨立,且X~x(n;),i=1,2,..,m,
則X=
X?+X?+...+Xm~x2(n),其中n=n?+n?+..+nm。·設X~x2(n),則E(X)=n,D(X)=2n。x2分布的特點
黏北京師范大學教育學部·X?,X?,.,Xm是從總體N(μ,σ2)中抽出的隨機樣本,易知(X-
μ
)/σ~
N(0,1),i=1,2,..,n
。
因此,服從自由度為n的x2
分布。服從自由度為n-1的x2分布其中
為樣本方差。
·X
和S2相互獨立。x2分布的特點
北京師范大學教育學部
北京師范大學教育學部設X~N(0,1),Y~x2(n),
且
X
與Y
相互獨立,則隨機變量
所服從的分布稱為自由度為n的t分布,記作t~t(n)?!分布臨界值表(附表4)P{|t>ta?2(n)}=α縣(m)t
分布北京師范大學教育學部口
29e0例6-7:已知α=0.05,自由度df=10,
試確定臨界值。解:查t值表就可以得到臨界值例6-8:已知隨機變量X~t(10),
問
P{|t|>0.879}
和
P{t<0.879}
的概率分別
為多少?北京師范大學教育學部t分布表解:根據(jù)df=10,查t分布表得與數(shù)值0.879對應的α=0.4,即P{|t>0.879}=0.4。由此,可得:P{t>0.879}+P{t<-0.879}=0.4,又因為t分布圖形具有對稱性,故P{t>0.879}=P{t<-0.879}=a/2=0.2,P{t<0.879}=1-P{t>0.879}=1-a/2=1-0.2=0.8t分布表
北京師范大學教育學部
北京師范大學教育學部是X的一個容量為n的隨機樣本。X有
關t分布的兩個重要結論(1)若總體X~N(μ,o2),x?,x?,.,x,和S2分別表示樣本平均值和樣本方差,則~t(n-1)(6.7)(2)設有兩個總體X
和Y,X~N(μ,o?2),Y~N(μ?,o?2),且X
和Y
相互獨立。已知X?,X?,..,
Xn是來自總體X
的隨機樣本,y,y?
,.,Vn?
是來自總體Y
的隨機樣本。兩個樣本的平均值和方差分別是X,S?及
Y
,S?,則+n?-2)
(6.8)有關t分布的兩個重要結論北京師范大學教育學部有關t分布的兩個重要結論特別地,當n?=n?=n時,北京師范大學教育學部(6.9)設有兩個總體X,Y,
已知X
并且X
與Y
相互獨立,則稱隨機變量
所服從的分布為第一自由度為n,
第二自由度為n,的F分布,并記作F~F(n?,n?)?!
分布臨界值表(附表5、6)北京師范大學教育學部F分布F分布P{F>F(n?,n?)}=a點
北京師范大學教育學部有關F分布的兩個重要結論·(1)設X~x2(n?),Y~x2(n?),
且
X與Y相互獨立,令
,
則北京師范大學教育學部有關F分布的兩個重要結論
北京師范大學教育學部(2)設有兩個總體X
和Y,
已
知X~N(μ,σ2),Y~N(μ?,o?2)
,且X
與Y
相互獨立。x?,x?,.,xn?是來自總體X
的隨機樣本,y?,y?,.,yn
2是來自總體Y的隨機樣本,兩個樣本的平均值和方差分別是X,S2及
γ,S2
。
令(6.11)則F~F(n?-1,n?-1)。有
關F分
布的兩個重要結論
北京師范大學教育學部特別地,如果確定樣本容量時應考慮的因素:1.決策的重要性2.估計的精確度(樣本均值的標準誤
與費用的關系
S
與
√n
成反比樣
本
容
量
的
確
定三
、北京師范大學教育學部n3.研究的性質(探索性的研究、結論性的研究,如升學率4.變量的個數(shù)5.數(shù)據(jù)分析的方法6.問卷的回收率7.數(shù)據(jù)的合格率三、樣
本容量的確定北京師范大學教育學部□
按統(tǒng)計方法定量地計算樣本容量按統(tǒng)計方法確定的是純樣本量,即去掉可能不合格的答
以后的純量。三、樣本容量的確定北京師范大學教育學部假
設
H
。:μ=X
成立,(6.13)□
按統(tǒng)計方法定量地計算樣本容量示例1:根據(jù)允許的樣本均值估計總體均值的精度來確定樣本量。三、樣本容量的確定北京師范大學教育學部例6-9:某校初一年級數(shù)學課進行了一年的教改試驗,我們需要調查數(shù)學教改的成效,因而對教改班的學生進行了一次考試。為減小工作量,我們
僅作抽樣分析。如果要使誤差不超過3分,且具有95%的置信程度,則至
少應抽取多少考生的試卷?(根據(jù)以往的經驗,估計該年級學生數(shù)學成績
的標準差σ=11)。計算樣
本容量北京師范大學教育學部由題意得,d=3,σ=11,a=0.05,
查正態(tài)分布表得,Ua?2=1.96,
所以,即至少應抽取52份考卷,才能有95%的把握說誤差不會超過3。計算樣本容量黏
北京師范大學教育學部示例2:根據(jù)估計總體比例的精度確定樣本量
北京師范大學教育學部□
依據(jù)對總體中某個比例的估計精度來確定樣本量,比如老宛民選草位
總統(tǒng)的比例p.o
Var(p)=p(1-p).□
如p=0.5,var(p)=0.25□
如p=0.9,var(p)=0.09□
其樣本量的確定可依據(jù)以下公式:(6.14)如抽樣絕對誤差d=0.03,α=0.05時,Ha12=1.96,p(1-p)最大取0.25(p=0.5),
則所需樣本量n?=1067.進行與前人相類似的研究時,可參考前人樣本量來抽取樣本。如果是地區(qū)性研究,平均樣本量通常在500—1000之間較為合適;如果是全國性的研究平均樣本量在1500—2500之間較為適宜。(臺灣學者)
>
對于大規(guī)模的調查,可按總體的1%來抽取。根據(jù)經驗確定樣本容量
北京師范大學教育學部描述性的研究,樣本量最少占總體的10%。如果總體較小,則樣本量最少為總體的20%。相關性研究的受試至少在30人以上。因果比較研究(causal-comparativestudies)與許多實驗研究,各組的人數(shù)
至少有30人。如果實驗研究設計得當,有嚴密的實驗控制,每組受試至少在15人以
上。(但是有些學者仍認為每組受試最少應有30人最為適宜。)Gay(1992)對于樣本量的看法北京師范大學教育學部□
試敘述幾種常用的抽樣方法,并說明它們在何種情況下使用?!?/p>
什么是抽樣分布?請分別大致繪出x2分布、t分布以及F分布的圖形,并
闡述其特征?!?/p>
確定樣本容量的影響因素有哪些?北京師范大學教育學部練習與思考參數(shù)估計:點估計與區(qū)間估計[北京師范大學教育學部胡詠梅]教育學部本科生課程教育統(tǒng)計學一
點估計二
區(qū)間估計三
利用Explore模塊獲得參數(shù)估計四
回歸模型中的區(qū)間估計目錄contentso
以樣本統(tǒng)計量來估計總體參數(shù),這種統(tǒng)計推斷的方法稱為參數(shù)估計。參
數(shù)估計可分為點估計和區(qū)間估計。o
用樣本統(tǒng)計量的值作為總體參數(shù)的估計值,稱為參數(shù)的點估計。例如,用樣本的算術平均值和樣本方差
分別作為總體的均值
E(X)和方差
D(X)
的估計量等。我們也可以用樣本的加權平均數(shù)
aix
i(其中
,0
<
ai
<
1,
a
i
=
1
)作為E
的一個估計量;用統(tǒng)
計量作為D(X)的一個估計量。一、點估計(一)判斷估計量優(yōu)劣的標準
無偏性Λ
Λo
定義7.1
設樣本x1,x2,
…,xn
的函數(shù)(不含未知參數(shù))θ
=
θ(x1,
x2,
…
,
xn
)
是總體的未知參數(shù)θ
的一個估計量。如果ΛEθ(x1,
x2,
…
,
xn
)=
θ(7.1)為θ的無偏估計量,否則稱為有偏的。一、點估計Λθ(x1,
x2,
…
,
xn
)成立,則稱樣本算術平均值X是總體均值EX
的一個無偏估計量。樣本k階原
點矩X
k
是總體原點矩E
Xk
的無偏估計量。樣本方差S
2
也是總體方差DX
的一個無偏估計量。但是,估計量S
不是總體方差DX
的無偏估計量。用無偏性的標準來衡量S
2
和S
,我們可以認為S
2
比S
好。不過,當
n
充分大時,這兩個估計量是近似相等的。而且,當n→∞時,ES
→
DX
,故我們稱S
為DX
的漸近無偏估計量。因此,對于大樣本,估計總體方差時,也可以用S。n2n2n2n2n2n2一、點估計
有效性ΛΛ設θ1
(x1,x2,
…,
x)
和θ2
(x1,x2,
…,
xn)
都是待估參數(shù)θ的無偏估計量,ΛΛΛΛΛ如果θ1
的方差不大于θ2
的方差,即D(
θ1
)≤D(
θ2
)
,則稱估計量θ1Λ比估計量θ2
有效。一、點估計
有效性例如,取
1=x1,
Xi
,
易知
1
和
都是參數(shù)E(X)的無偏估計量。但是,由于∧D(
θ
1)
=D(X1)
=
D(X)
∧∧∧因此,D(
θ
1)>D(
θ
2)
。可見,作為待估參數(shù)E(X)的無偏估計量,
θ
2∧比θ
1
更有效。即作為總體均值的估計量,比x1要好。X?一、點估計
一致性所謂一致性,是指當樣本量無限增大時,估計量依概率收斂到它所估計的
總體參數(shù)?!募僭Oθ
n(x1,x2,
…
,xn?是待估參數(shù)θ的一個估計量,n為樣本量。如果對任
何一個ε>0,∧n
P(|
θ
n-θ|>ε)=0
(7.2)∧成立,則稱θ
n為參數(shù)θ的一致估計。例如,
是總體均值E(X)的一個一致估計是總體方差D(X)的一致估計。X?一、點估計(二)
總體均值和總體方差的點估計例7-1:從某年級學生中隨機抽取30名,測得他們的期末各科成績的平
均分如下:82,90,78,69,65,73,77,88,80,67,58,89,75,60,76,74,93,73,89,66,95,82,83,59,64,91,87,83,63,92試對該年級學生的期末平均成績和成績的離散程度作出估計。一、點估計解:我們分別用樣本均值X和樣本方差S
2
來估計該年級學生的期末平均成績和成績的離散程度。
=1/30(82+90+…+92)=77.367
=124.861一、點估計區(qū)間估計方法既能告訴我們參數(shù)的真正數(shù)值在什么范圍內,又能告訴我們下此結論有多大把握。對參數(shù)θ
的區(qū)間估計,
就是要確定兩個統(tǒng)計量θ1
(x1,
x2,
…
,
xn
)
和θ2
(x1,
x2,
…
,
xn
)
,使得Λ
ΛP(θ1
≤
θ
≤
θ2
)
=1
-α
,
0<
α
<1
(7.3)我們稱區(qū)間[θ1,θ2
]為參數(shù)θ
的置信度(可靠性)為
1-α的置信區(qū)間,分別是下、上置信限。
下面我們將分幾種情況二、區(qū)間估計來討論區(qū)間估計問題。稱α為置信水平。Λ
Λθ1,θ2Λ
ΛΛ
Λ1.總體均值的區(qū)間估計(1)方差σ2
已知的情形
由抽樣分布理論知,如果X~N(μ,σ2
),則樣本均值X
~N(μ,σ2/n)。
若令
(7.4)則
u~N(0,1)
。
由正態(tài)分布的對稱性,可得,P(
-
uα/
2
≤
u≤uα/
2
)
=1
-α
,
即P(
X
-
uα/
2σ/sn
≤
μ
≤
X
+
uα/
2σ/vn
)
=
1
-α
(7.5)二、區(qū)間估計如圖7-1所示。所以,正態(tài)總體均值μ的置信度為1-α的置信區(qū)間為:[X
-
uα/
2σ/
·
n
,
X
+
uα/
2σ/
·
n](7.6)圖
7-1正態(tài)總體均值
μ
的區(qū)間估計示意圖二、區(qū)間估計uα/2-uα/2如果總體不服從正態(tài)分布,但是樣本量充分大(如樣本量n≥50),總體均值μ的置信度為1-α的置信區(qū)間仍然可以用式(7.6)估計。二、區(qū)間估計例7-2從某校某年級期中英語試卷中隨機抽取20份試卷,其成績分別為:80
,75
,72
,88
,65
,75
,90
,90
,61
,79,82
,78
,73
,82
,65
,70
,90
,90
,63
,77。已知該年級的期中英語成績服從正態(tài)分布,方差σ2=52
。試求出該班
期中英語成績均值μ的95%和99%的置信區(qū)間。二、區(qū)間估計二、區(qū)間估計o
置信區(qū)間的長短在樣本量n確定的情況下與置信度1-α有關。置信度越大,
則置信區(qū)間越寬;置信度越小,則置信區(qū)間也隨之縮短。o
因此,
當樣本量n一定時,要想提高置信度,置信區(qū)間勢必就要變寬。o
但是,置信區(qū)間過寬則會失去參數(shù)估計的實際意義。o
另外,
當置信度1-α一定時,置信區(qū)間的長短與樣本量n有關,隨著樣本量n
的增大,置信區(qū)間有縮短的趨勢。因此,在保證一定的置信度的前提下,應
適當?shù)卦龃髽颖玖恳钥s短置信區(qū)間。二、區(qū)間估計(2)方差
σ2
未知的情形二、區(qū)間估計(7.7)o
例7-3:某高校對大一新生進行健康體檢,在體重測試中隨機抽取100名學生,測得他們的平均體重為60公斤,標準差為5公斤。試用區(qū)間估計
方法求出該校學生的平均體重大約是多少?二、區(qū)間估計
(7.7)二、區(qū)間估計
(2)方差
σ2
未知的情形小樣本情形(樣本容量
n
<50)當正態(tài)總體方差未知,且為小樣本情形時,
由抽樣分布理論知,
此時
將服從自由度為
n-1
的
t
分布。因此,正態(tài)總體均值μ
的置信度為
1-α的置信區(qū)間為:[X
-
tα/
2
(n
-1)S
/
·
n
,
X
+
tα/
2
(n
-1)S
/
·
n]其中tα/
2
(n
-1)
是自由度為n
-1,顯著性水平為α所對應的
t
分布的雙側檢驗的臨界值(7.8)(7.9)例7-4
:從某高校參加大學四級英語統(tǒng)考的學生試卷中隨機抽取20份,其成績如下:71
,56
,67
,60
,80
,45
,73
,82
,65
,55,56
,72
,59
,63
,75
,88
,71
,64
,52
,70試對該次成績均值
μ
作區(qū)間估計。(α=0.01)二、區(qū)間估計先計算出樣本均值X和樣本方差S
2
。X
=
(71
+56+
…+
70)=66.2S
2
=
201一
1
[(71
一
66.2)2
+(56一
66.2)2
+…+(70
一
66.2)2
]=10.822置信度為
1-α=0.99,自由度為
df=n-1=19,查
t
分布臨界值表得,tα/
2
(n
一1)
=2.861,將之代入(5.2.6),可得X一
tα/
2
(n一1)S
/·
n
=66.2一
2.861×10.82
/
20
=59.28X+
tα/
2
(n一1)S
/
n
=66.2
+
2.861×10.82
/
20
=73.12所以,該次成績均值
μ
的置信度為
99%的置信區(qū)間為
[59.28,73.12]。二、區(qū)間估計
解:
設此次英語成績
X~N(μ,σ2
),其中
μ
,
σ2
均未知。
20份試
卷的成績?yōu)橐粋€小樣本,因此,我們采用
(7.9)
式來計算置信區(qū)間。2.總體方差的估計設總體
X~
N
(μ,
σ2
)
,
μ
,
σ2
都是未知的參數(shù),x1
,
x2
,
…,
xn
是來自正態(tài)總體
X
的隨機樣本。σ2
的置信度為
1-α的置信區(qū)間是:
二、區(qū)間估計圖7-2總體方差的區(qū)間估計的示意圖(7.11)例7-5:仍然以上題為例,試求出此次英語成績的方差在什么范圍?(α=0.05)解:由上題計算得:
1-α/2=0.975,查卡方分布表得,x12一α/
2
(19)
=8.91,
x/
2
(19)
=32.9
由((7.11))式得,
所以,
σ2
的置信度為
95%的置信區(qū)間為[67.61,
249.65]。α2二、區(qū)間估計二、區(qū)間估計
3.兩個正態(tài)總體均值差數(shù)的區(qū)間估計根據(jù)總體方差是否已知以及是否屬于大樣本情形分三種情況來討論兩
個相互獨立的正態(tài)總體均值差數(shù)的區(qū)間估計問題。(1)兩個正態(tài)總體方差已知的情形設X~N(μ1
,σ),Y~N(μ2
,σ),X與
Y相互獨立且σ
,σ為已知常數(shù)。x1
,
x2
,
…,
xn1
為來自總體
X
的隨機樣本;
y1,
y2,
…
,
yn2
為來自總體
Y
的隨
機樣本。
X和Y分別表示這兩個樣本的均值。我們需要計算兩總體均
值差數(shù)
μ1
-
μ2
的置信度為
1-α的置信區(qū)間。22122212由抽樣分布理論知
且X與Y相互獨立。因此,
令
則u~N(0,1)
。查正態(tài)分布表可得臨界值uα/
2
,故
P
(-
uα/
2
≤
u≤
uα/
2
)=
1
-α
,(7.12)即二、區(qū)間估計
所以,
μ1
-
μ2
的置信度為
1-α的置信區(qū)間是
(7.13)二、區(qū)間估計(2)兩個正態(tài)總體方差未知,但屬于大樣本的情形在這種情形下,由于是大樣本,所以,可以用樣本方差S
、S
來
代替總體方差σ、σ,并且令
(7.14)u將近似服從
N(0,1)。因此,
μ1
-
μ2
的置信度為
1-α的置信區(qū)間是
((7.15)
)
22122212二、區(qū)間估計二、區(qū)間估計
例7-6:從甲、乙兩校初三年級學生中分別隨機抽出
120
人,測得他們的身高的平均值分別為
160.5
公分、158.90
公分,標準差
分別為
4.30
公分、3.86
公分。試對甲、乙兩校初三年級學生的平均
身高的差數(shù)進行區(qū)間估計(置信度為
0.99)。解:由題意知,X=160.5,S=4.302
=18.49,Y=158.90,S=3.862=14.90,n1
=n2
=120,α=0.01,查正態(tài)分布表得,uα/
2
=
2.58。將這些
數(shù)據(jù)代入(5.2.12)式可算得甲、乙兩校初三年級學生的平均身高的
差數(shù)
μ1
-
μ2
的置信度為
99%的置信區(qū)間是[0.24,
2.96]。2212二、區(qū)間估計
(3)兩個正態(tài)總體的方差相等(
σ=
σ=
σ2
)
但σ2
未知,且屬于小樣本的情形2212總體方差,
所以,我們采用如下的統(tǒng)計量
來代替σ2
。可以證明統(tǒng)計量
服從自由度為n1
+n2
-2的
t
分布。由于n1
、
n2
均小于
50,屬于小樣本情形,不能再用樣本方差來代替(7.16)因此,
我們可得
μ1
-
μ2
的置信度為1-α的置信區(qū)間是L
(
n1
n2
,(
n1
n2
,」|其中tα/
2
(n1
+
n2
-
2)是臨界值,
可根據(jù)α的大小和自由度n1
+
n2
-
2查
t
分布表找到。
(X
-
Y)
-
tα/
2
(n1
+
n2
-
2)S
·|
+
|
,
(X
-
Y)
+
tα/
2
(n1
+
n2
-
2)SI|
+
|
|
(7.17)「
(
1
1
)
(
1
1
)
7二、區(qū)間估計o
點估計
數(shù)據(jù)文件7-1.sav,若我們采用點估計的方式估計該校所有參加閱讀能力
測試的五年級學生成績的均值和標準差。我們只需要單擊主菜單上Analyze→Descriptive
Statistics→Descriptives,將變量Score放入Variable欄。三、利用Explore模塊獲得參數(shù)估計o
單擊Options按鈕,選中Mean(樣本均值)、Std.deviation(樣本標準差)、variance(樣本方差)
等選項。o
區(qū)間估計
數(shù)據(jù)文件7-1.sav
,利用Explore過程來獲得均值的置信區(qū)間。
Analyze→Descriptive
Statistics→Explore…
,打開Explore的對話框,將變
量Score放入Dependent
List欄。三、利用Explore模塊獲得參數(shù)估計o
對于求兩個相互獨立的正態(tài)總體的均值差數(shù)的置信區(qū)間,
我們可以利用
獨立樣本的T檢驗模塊來進行。
先單擊Analyze-Compare
Means-Independent-Samples
T
test,在打開的Independent-Samples
T
test對話框中,在Test
Variables列表框中輸入變量
名,在Grouping
variable中輸入分組變量名,并單擊Define
Groups按鈕,
打開Define
Groups
對話框,在Group
1和Group2窗口中分別輸入分組
變量值,最后點擊Continue
和OK按鈕即可。三、利用Explore模塊獲得參數(shù)估計簡單回歸模型線性回歸分析:分析一個隨機變量(因變量)與若干個變量(自變量)之間線性關系的統(tǒng)計方法。假設因變量與自變量之間為線性關系,用線性回歸模型來擬合因變量與自變量的數(shù)據(jù),
并通過確定模型參數(shù)來得到回歸方程。PRF
:
Yi
=
β1
+
β2
Xi
+
ui
(i=
1,
2…,
n)SRF:
Yi
=+Xi
+
i
=+
i回歸分析的主要目的就是用SRF估計PRF.由于抽樣的隨機性,SRF很可能過高或過低地估計PRF。u?Yi?u?β2?β1?四、回歸模型中的區(qū)間估計比較兩條樣本回歸線SRF1和SRF2(假定PRF是直線),問哪條樣本線更好地代表“真實”的總體回歸線?樣本回歸線與總體回歸線SRF1PRFSRF2XYSRF是PRF的一個近似估計.問:怎樣構造SRF能使得
盡可能“逼近”真實的系數(shù)βi呢?βi?要解決的問題o
根據(jù)樣本回歸函數(shù)盡可能準確地估計總體回歸函數(shù)。o
常用的估計方法:
普通最小二乘法(Ordinary
Least
Square,OLS)
最大似然法(Maximum
Likelihood,ML)四、雙變量回歸模型:參數(shù)估計i
=Yi
-
=Yi
-
(
+
Xi
)OLS:
ordinaryleastsquare求解:minf(
,)
=
minΣ
=minΣ
[Yi
-
(
+
Xi
)]2β2?β1?i2u?β2?β1?β2?β1?Yi?u?PRF
:
Yi
=
β1
+
β2
Xi
+
ui
(i=
1,
2…,
n)SRF:
Yi
=+
Xi
+
i
=+
iu?Yi?u?β2?β1?普通最小二乘法
(OLS)
→得到的方程組稱為正規(guī)方程組整理得:Σ
Yi
=n+
Σ
Xi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年購車合同模板:私人轎車交易條款3篇
- 2024年通信基站建設合同
- 2025年度消防設施檢測及維修服務合同協(xié)議3篇
- 2025年度版權許可合同:音樂作品版權許可合同(2025版)
- 2025年度桉樹砍伐與木材倉儲物流一體化服務合同3篇
- 2024年金融聯(lián)盟:信貸合作框架協(xié)議
- 2025年度建筑拆除安全施工許可合同范本2篇
- 2024年起重機安裝與設備維護保養(yǎng)合同范本3篇
- 2025年度房屋裝修合同標的為甲方位于市中心的住宅乙方負責進行裝修設計及施工2篇
- 2025年度☆人工智能數(shù)據(jù)標注與審核服務合同3篇
- 支付平臺線上統(tǒng)一對賬接口說明V0.2.docx
- 《社區(qū)安全防范》課程教案
- 中石油度員工HSE培訓計劃
- (完整版)Adams課程設計
- 30課時羽毛球教案
- 客服部相關報表解
- 全踝關節(jié)置換術ppt課件
- 學術英語寫作范文17篇
- 任發(fā)改委副主任掛職鍛煉工作總結范文
- 中華任姓字輩源流
- 2021年人事部年度年終工作總結及明年工作計劃
評論
0/150
提交評論