版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第五章
統(tǒng)計(jì)量及其分布
§5.1
總體與樣本§5.2
樣本數(shù)據(jù)的整理與顯示§5.3
統(tǒng)計(jì)量及其分布§5.4
三大抽樣分布§5.5
充分統(tǒng)計(jì)量
*隨機(jī)變量及其的概率分布全面描述了隨機(jī)現(xiàn)象的統(tǒng)計(jì)性規(guī)律。*概率論的許多問題中,隨機(jī)變量的概率分布通常是已知的,或者假設(shè)是已知的,而一切計(jì)算與推理都是在這已知是基礎(chǔ)上得出來的。*但實(shí)際中,情況往往并非如此,一個(gè)隨機(jī)現(xiàn)象所服從的分布可能是完全不知道的(非參數(shù)統(tǒng)計(jì)學(xué)),或者知道其分布概型,但是其中的某些參數(shù)是未知的。例。某公司要采購一批產(chǎn)品,每件產(chǎn)品不是合格的就是不合格的。該批產(chǎn)品的不合格率是p,由此,若從該批產(chǎn)品中中隨機(jī)抽取一件,設(shè)X為其產(chǎn)品的不合格數(shù),顯然X的分布是兩點(diǎn)分布,但p是未知的,而p決定了該批產(chǎn)品的質(zhì)量,直接影響采購行為的經(jīng)濟(jì)效益,因此人們就會(huì)對p提出一些問題:1,p的大小如何?2,p大概落到什么范圍?3,能否認(rèn)為p滿足設(shè)定要求?(p≤0.05)
§5.1總體與個(gè)體總體的三層含義:
研究對象的全體;
數(shù)據(jù);
分布
例
我們研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)讓,每個(gè)學(xué)生有許多特征,性別,體重,年齡等,而該問題關(guān)心的是身高,這樣每個(gè)學(xué)生(個(gè)體)所具有的數(shù)量指標(biāo)值-----身高就是個(gè)體,而將所有身高全體看成總體,總體就是一堆數(shù)。這堆數(shù)中有大有小,各數(shù)出現(xiàn)的機(jī)會(huì)有多有少,所以用概率分布描述和歸納這堆數(shù)是合理的,于是總體就是一個(gè)分布。而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量,這堆數(shù)就是這個(gè)隨機(jī)變量可能的取值。所以“從總體抽樣”與“從某分布抽樣”是同一個(gè)意思。例5.1.1
考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則總體={該廠生產(chǎn)的全部合格品與不合格品}={由0或1組成的一堆數(shù)}若以
p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:X0
1P1
pp比如:兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體
分布:X01p0.9830.017X01p0.9150.0855.1.2
樣本樣本、樣本量樣本具有兩重性
一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫字母X1,X2,…,Xn
表示;
另一方面,樣本在抽取以后經(jīng)觀測就有確定的觀測值,因此,樣本又是一組數(shù)值。此時(shí)用小寫字母x1,x2,…,xn
表示是恰當(dāng)?shù)?。簡單起見,無論是樣本還是其觀測值,樣本一般均用
x1,x2,…xn
表示,應(yīng)能從上下文中加以區(qū)別。例5.1.4
設(shè)有一個(gè)有20個(gè)數(shù)組成的總體,先從該總體不放回抽取容量為5的樣本,記錄后,放回,再抽第二個(gè)樣本,這里一共抽4個(gè)樣本??傮w樣本1樣本2樣本3樣本411,8,12,9,11,10,9,11,10,11,10,,8,10,8,10,1211,8,9,11,10,131181312111311991011101011101089911樣本均值9.810.210.810.4例5.1.3
啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640
克。由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測定其凈含量,得到如下結(jié)果:641,635,640,637,642,638,645,643,639,640這是一個(gè)容量為10的樣本的觀測值,(體會(huì)抽樣作用)對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。這樣的樣本稱為完全樣本。例5.1.4
考察某廠生產(chǎn)的某種電子元件的壽命,選了100只進(jìn)行壽命試驗(yàn),得到如下數(shù)據(jù):表5.1.2
100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀測值沒有具體的數(shù)值,只有一個(gè)范圍,這樣的樣本稱為分組樣本。
壽命范圍
元件數(shù)
壽命范圍
元件數(shù)
壽命范圍
元件數(shù)
(024]4(192216]6(384408]4(2448]8(216240]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]3(504528]3(144168]5(336360]5(528552]1(168192]4(360184]1>55213
獨(dú)立性:
樣本中每一樣品的取值不影響其它樣品的取值--
x1,x2,…,xn
相互獨(dú)立。要使得推斷可靠,對樣本就有要求,使樣本能很好地代表總體。通常有如下兩個(gè)要求:
隨機(jī)性:總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本--
xi
與總體X有相同的分布。樣本的要求:簡單隨機(jī)樣本設(shè)總體X具有分布函數(shù)F(x),
x1,x2,…,xn
為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為用簡單隨機(jī)抽樣方法得到的樣本稱為簡單隨機(jī)樣本,也簡稱樣本。于是,樣本
x1,x2,…,xn
可以看成是獨(dú)立同分布(iid
)的隨機(jī)變量,其共同分布即為總體分布。5.2.1經(jīng)驗(yàn)分布函數(shù)§5.2
樣本數(shù)據(jù)的整理與顯示設(shè)
x1,x2,…,xn
是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測值由小到大進(jìn)行排列,為x(1),x(2),…,x(n),則稱
x(1),x(2),…,x(n)為有序樣本,用有序樣本定義如下函數(shù)
則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0和Fn()=1由此可見,F(xiàn)n(x)是一個(gè)分布函數(shù),并稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)。例5.2.1
某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱得其凈重(單位:克)
351347355344351x(1)=344,x(2)=347,x(3)=351,x(4)=351,x(5)=355這是一個(gè)容量為5的樣本,經(jīng)排序可得有序樣本:其經(jīng)驗(yàn)分布函數(shù)為由伯努里大數(shù)定律:只要n相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x)。
0,x
<344
0.2,344x
<347Fn(x)=0.4,347x
<3510.8,351x
<3551,x355160196164148170
175178166181162
161168166162172
156170157162154
5.2.2頻數(shù)--頻率分布表樣本數(shù)據(jù)的整理是統(tǒng)計(jì)研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表。例5.2.2
為研究某廠工人生產(chǎn)某種產(chǎn)品的能力,我們隨機(jī)調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品的數(shù)量,數(shù)據(jù)如下(1)對樣本進(jìn)行分組:作為一般性的原則,組數(shù)通常在5~20個(gè),對容量較小的樣本;(2)
確定每組組距:近似公式為組距d=(最大觀測值
最小觀測值)/組數(shù);(3)
確定每組組限:各組區(qū)間端點(diǎn)為a0,a1=a0+d,
a2=a0+2d,…,ak=a0+kd,
形成如下的分組區(qū)間(a0,a1],(a1,a2],…,(ak-1
,ak]對這20個(gè)數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:其中a0
略小于最小觀測值,ak
略大于最大觀測值.(4)
統(tǒng)計(jì)樣本數(shù)據(jù)落入每個(gè)區(qū)間的個(gè)數(shù)——頻數(shù),
并列出其頻數(shù)頻率分布表。表5.2.1
例5.2.2的頻數(shù)頻率分布表
組序分組區(qū)間組中值頻數(shù)頻率累計(jì)頻率(%)1(147,157]152
4
0.20
20
2
(157,167]162
8
0.4060
3(167,177]172
5
0.25
85
4
(177,187]18220.10955(187,197]19210.05100合計(jì)
2015.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無變化。5.3.1
統(tǒng)計(jì)量與抽樣分布§5.3統(tǒng)計(jì)量及其分布當(dāng)人們需要從樣本獲得對總體各種參數(shù)的認(rèn)識(shí)時(shí),最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義5.3.1
設(shè)x1,x2,…,xn
為取自某總體的樣本,若樣本函數(shù)T=T(x1,x2,…,xn)中不含有任何未知參數(shù)。則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。5.3.2
樣本均值及其抽樣分布
定義5.3.2
設(shè)x1,x2,…,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即思考:在分組樣本場合,樣本均值如何計(jì)算?二者結(jié)果相同嗎?
xx=
(x1+…+xn)/n定理5.3.2
數(shù)據(jù)觀測值與均值的偏差平方和最小,即在形如
(xic)2的函數(shù)中,樣本均值的基本性質(zhì):定理5.3.1
若把樣本中的數(shù)據(jù)與樣本均值之差稱為偏差,則樣本所有偏差之和為0,即
最小,其中c為任意給定常數(shù)。樣本均值的抽樣分布:定理5.3.3
設(shè)x1,x2,…,xn
是來自某個(gè)總體的樣本,x為樣本均值。(1)若總體分布為N(,2),則xx的精確分布為N(,2/n)
;
若總體分布未知或不是正態(tài)分布,但E(x)=,Var(x)=2,則n較大時(shí)
的漸近分布為N(,2/n)
,常記為。xAN(,2/n)這里漸近分布是指n較大時(shí)的近似分布.5.3.3樣本方差與樣本標(biāo)準(zhǔn)差稱為樣本標(biāo)準(zhǔn)差。s*=
s*2定義5.3.3稱為樣本方差,其算術(shù)平方根在n不大時(shí),常用作為樣本方差,其算術(shù)平方根也稱為樣本標(biāo)準(zhǔn)差。在這個(gè)定義中,
(
xix)2n1稱為偏差平方和的自由度。其含義是:x在確定后,
n個(gè)偏差x1x,x2x,…,xnx能自由取值,因?yàn)橹挥衝1個(gè)數(shù)據(jù)可以自由變動(dòng),而第n個(gè)則不
(xix)=0.稱為偏差平方和,中樣本偏差平方和有三個(gè)不同的表達(dá)式:(
xix
)2=xi2
–(xi)2/n=xi2–nx它們都可用來計(jì)算樣本方差。思考:分組樣本如何計(jì)算樣本方差?樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不依賴于總體的分布形式。定理5.3.4
設(shè)總體X具有二階矩,即
E(x)=
,Var(x)=2
,
x1,x2,…,xn
為從該總體得到的樣本,x和s2分別是樣本均值和樣本方差,則E(x)=,Var(x)=2/n,E(s2)=25.3.4
樣本矩及其函數(shù)
樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計(jì)量。定義5.3.4
ak
=(xik)/n
稱為樣本k階原點(diǎn)矩,
特別,樣本一階原點(diǎn)矩就是樣本均值。
稱為樣本k階中心矩。
特別,樣本二階中心矩就是樣本方差。
bk
=
(xi
x)k/n當(dāng)總體關(guān)于分布中心對稱時(shí),我們用x和s刻畫樣本特征很有代表性,而當(dāng)其不對稱時(shí),只用
就顯得很不夠。為此,需要一些刻畫分布形狀的統(tǒng)計(jì)量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。樣本偏度1反映了總體分布密度曲線的對稱性信息。樣本峰度2反映了總體分布密度曲線在其峰值附近的陡峭程度。定義:
1=b3/b23/2稱為樣本偏度,
2=b4/b22稱為樣本峰度。x和s5.3.6
樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)也是一個(gè)很常見的統(tǒng)計(jì)量,它也是次序統(tǒng)計(jì)量的函數(shù),通常如下定義:更一般地,樣本p分位數(shù)mp可如下定義:次序統(tǒng)計(jì)量設(shè)總體X的分布為取值0,1,2的離散的均勻分布,現(xiàn)從中抽取容量為3的樣本,其一切可能取值有3*3*3=27種,X1X2X3X(1)X(2)X(3)X1X2X3X(1)X(2)X(3)000000120012001001210012010001022022100001202022002002220022020002112112200002121112011011211112101011122122110011212122012012221122021012111111102012222222201012
X(1)012
P19/277/271/27**********************
X(2)012
P7/2713/277/27***********************X(3)012
P1/277/2719/27定理5.3.7
設(shè)總體密度函數(shù)為p(x),xp為其p分位數(shù),p(x)在xp處連續(xù)且p(xp)0,則特別,對樣本中位數(shù),當(dāng)n時(shí)近似地有當(dāng)n時(shí)樣本p分位數(shù)mp的漸近分布為§5.4三大抽樣分布大家很快會(huì)看到,有很多統(tǒng)計(jì)推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有廣泛的應(yīng)用,這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。5.4.12
分布(卡方分布)定義5.4.1
設(shè)X1,X2,…,Xn,獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則2=
X12+…
Xn2的分布稱為自由度為n的2分布,記為2
2(n)
。當(dāng)隨機(jī)變量
2
2(n)時(shí),對給定
(01),稱滿足P(2
12(n))的12(n)是自由度為n1的卡方分布的1
分位數(shù).分位數(shù)
12(n)可以從附表3中查到。該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布
5.4.2F分布定義5.4.2
設(shè)X1
2(m),X2
2(n),X1與X2獨(dú)立,則稱F=(X1/m)/(X2/n)的分布是自由度為
m與
n
的F分布,記為FF(m,n),其中m稱為分子自由度,n
稱為分母自由度。當(dāng)隨機(jī)變量FF(m,n)時(shí),對給定(01),稱滿足P(F
F1(m,n))=1的F1(m,n)是自由度為m與
n
的F
分布的1分位數(shù)。由
F
分布的構(gòu)造知F(n,m)=1/F1(m,n)。該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布
5.4.3t
分布
定義
5.4.3
設(shè)隨機(jī)變量X1
與X2
獨(dú)立,且X1N(0,1),X2
2(n),則稱t=X1/X2/n的分布為自由度為n
的t分布,記為tt(n)。
t分布的密度函數(shù)的圖象是一個(gè)關(guān)于縱軸對稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人創(chuàng)業(yè)投資延期借款合同
- 二零二五年度房地產(chǎn)項(xiàng)目開發(fā)合同合4篇
- 2025年度個(gè)人應(yīng)收賬款抵押債權(quán)轉(zhuǎn)讓合同4篇
- 2025年度美容院員工職業(yè)傷害賠償合同范本4篇
- 二零二五年度綠色建筑項(xiàng)目農(nóng)民工用工保障合同2篇
- 2025年度個(gè)人營運(yùn)汽車租賃車輛智能駕駛輔助系統(tǒng)安裝合同3篇
- 二零二五年度慈溪市生態(tài)環(huán)境編制與治理合同4篇
- 二零二五年度古董家具修復(fù)木工合同范本4篇
- 2025年度個(gè)人土地抵押貸款合同信用評估范本4篇
- 臨建設(shè)施轉(zhuǎn)讓合同范本(2024版)
- 《電力用直流電源系統(tǒng)蓄電池組遠(yuǎn)程充放電技術(shù)規(guī)范》
- 《哪吒之魔童降世》中的哪吒形象分析
- 信息化運(yùn)維服務(wù)信息化運(yùn)維方案
- 汽車修理廠員工守則
- 六年級上冊數(shù)學(xué)應(yīng)用題100題
- 個(gè)人代賣協(xié)議
- 公安交通管理行政處罰決定書式樣
- 10.《運(yùn)動(dòng)技能學(xué)習(xí)與控制》李強(qiáng)
- 冀教版數(shù)學(xué)七年級下冊綜合訓(xùn)練100題含答案
- 1神經(jīng)外科分級護(hù)理制度
- 場館惡劣天氣處置應(yīng)急預(yù)案
評論
0/150
提交評論