版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1
第七章樣本分布
數(shù)理統(tǒng)計是研究如何有效地收集、整理和分析帶有隨機影響的數(shù)據(jù),從而對所觀察的現(xiàn)象做出推斷或預(yù)測,為決策提供依據(jù)的一門學(xué)科。在近一個多世紀的發(fā)展中,數(shù)理統(tǒng)計不同程度地滲透到人類活動的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測量誤差、出生與死亡統(tǒng)計、保險業(yè)中賠款額和保險金的確定等,這些數(shù)理統(tǒng)計早期主要研究的問題,直到現(xiàn)在仍然值得認真研究。在近半個世紀以來,數(shù)理統(tǒng)計在理論、方法、應(yīng)用上都有較大的發(fā)展。抽樣調(diào)查、試驗設(shè)計、回歸分析與回歸診斷、多元分析、時間序列分析、非參數(shù)統(tǒng)計、統(tǒng)計決策函數(shù)、統(tǒng)計計算、隨機模擬、探索性數(shù)據(jù)分析等統(tǒng)計方法相繼產(chǎn)生并在實踐中普遍使用,把以描述為主的統(tǒng)計發(fā)展到以推斷為主的統(tǒng)計。數(shù)理統(tǒng)計的內(nèi)容已異常豐富,應(yīng)用廣泛,成為當(dāng)前最活躍的學(xué)科之一。2§7.1總體與樣本一、
總體與個體總體指研究對象的某項數(shù)量指標值的全體。組成總體的每個元素稱為個體。由于每個個體的出現(xiàn)帶有隨機性,即相應(yīng)的數(shù)量指標值的出現(xiàn)帶有隨機性。從而可把此種數(shù)量指標看作隨機變量,我們用一個隨機變量及其分布來描述總體。為此常用隨機變量的符號或分布的符號X,Y,Z…,F(x)…來表示總體。例7.1研究某燈泡的使用壽命時,總體可用隨機變量X來表示,或用其分布函數(shù)F(x)表示。3二、樣本為了推斷總體分布及其各種特征,就必須從總體中按一定法則抽取若干個體進行觀測或試驗,以獲得有關(guān)總體的信息.這一抽取過程稱為抽樣.所抽取的部分個體稱為樣本,樣本中個體的數(shù)目稱為樣本容量.例如容量為n的樣本可以看作是n維隨機變量(
),其觀察值為(
).例7.2研究某地區(qū)學(xué)齡前兒童發(fā)育情況,人們關(guān)心的是其體重X和身高Y這兩個數(shù)量指標,則此總體就可用二維隨機變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)表示.4簡單隨機抽樣它要求滿足兩點:(1)代表性.樣本中每個個體與所考慮的總體有相同的分布.即樣本中每個個體與總體X具有相同的分布.(2)獨立性.樣本中每個個體取什么值并不影響其它個體取什么值.即必須是相互獨立的隨機變量.由簡單隨機抽樣所得到的樣本稱為簡單隨機樣本.假如總體的分布函數(shù)為F(x),則其簡單隨機樣本的聯(lián)合分布函數(shù)為5三、分布族在概率論研究中,隨機變量的分布總是假設(shè)給定的,但在數(shù)理統(tǒng)計的研究中,總體的分布是未知的,但總可以假定總體的分布是某一個分布族的成員.例7.3在研究某批燈泡的質(zhì)量時,若關(guān)心的是其質(zhì)量是否合格,若合格記為0,不合格記為1,因此該總體就可用僅取0和1的隨機變量X來表示.顯然,這個總體的分布就是一個參數(shù)為p的二點分布b(1,p),由于p未知,故這個總體分布也是未知的,但可以假定該總體分布是二點分布族
F={b(1,p);0<p<1}6若人們關(guān)心的是燈泡的壽命。這是一個無限總體。假如人們根據(jù)過去的資料知道燈泡的壽命X服從指數(shù)分布,其密度函數(shù)為
所需確定的參數(shù)是λ>0.7四、從樣本去認識總體
⑴
頻數(shù)頻率分布表及其圖示例7.4我們通常飲用的礦泉水有19個指標.某市技術(shù)監(jiān)督局一次抽查了58批礦泉水,記錄每一批礦泉水的每個指標是否合格,從中可統(tǒng)計出每批礦泉水不合格指標的個數(shù)X.這里X是一個離散型隨機變量,其一切可能取值為0,1,…19。58批礦泉水的指標不合格數(shù)構(gòu)成了一個容量為58的樣本的觀察值,每個可取0,1,…,19中某個值,將它們整理后列成表1.1.18表158批礦泉水不合格指標數(shù)的頻率、頻數(shù)分布表910(2)
經(jīng)驗分布函數(shù)樣本直方圖可以形象地去描述總體概率密度函數(shù)大致形狀,經(jīng)驗分布函數(shù)將可以用來描述總體分布函數(shù)的大致形狀.定義1.1.1設(shè)總體X的分布函數(shù)為F(x),從中獲得的樣本觀察值為,將它們從小到大排列成,令
稱為該樣本的經(jīng)驗分布函數(shù).11例7.5寫出經(jīng)驗分布函數(shù)某食品廠用自動裝罐機生產(chǎn)凈重量為345克的午餐肉罐頭,由于隨機性,每個罐頭的凈重有差別,現(xiàn)從中隨機取10個罐頭,其凈重如下:344,336,345,342,340,338,344,343,344,343,求經(jīng)驗分布函數(shù).12
統(tǒng)計量及其分布
1.定義1.2.1設(shè)是取自某總體的一個容量為n的樣本,假如樣本函數(shù)
中不含任何未知參數(shù),則稱T為統(tǒng)計量.統(tǒng)計量的分布稱為抽樣分布.2.常用的幾個統(tǒng)計量設(shè)是來自總體X的樣本⑴樣本均值
樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一個統(tǒng)計量,是總體數(shù)學(xué)期望的一個很好的估計.13⑵樣本方差
樣本標準差
樣本方差與樣本標準差反映了數(shù)據(jù)取值分散與集中的程度,即反映了總體方差與標準差的信息.⑶樣本k階(原點)矩樣本k階中心矩
它們分別反映了總體k階(原點)矩與k階中心矩的信息.14⑷樣本偏度
SK反映了總體分布密度曲線的對稱性信息.當(dāng)SK>0時,分布的形狀是右尾長,稱為正偏的;當(dāng)SK<0時,分布的形狀是左尾長,稱為負偏的.⑸樣本峰度KU反映了總體分布密度曲線在其峰值附近的陡峭程度的信息,當(dāng)KU>0時,分布密度曲線在其峰比正態(tài)分布來得陡;當(dāng)KU<0時,比正態(tài)分布來得平坦.15⑹次序統(tǒng)計量
被稱為樣本的第i個次序統(tǒng)計量,它是樣本
的滿足如下條件的函數(shù):每當(dāng)樣本得到一組觀察值()時,將它們從小到大排列為
,第i個值便是
的觀察值,稱為該樣本的次序統(tǒng)計量.又稱為該樣本的最小次序統(tǒng)計量,稱為該樣本的最大次序統(tǒng)計量.16⑺樣本極差
若樣本容量為n,則樣本極差它反映了樣本取值范圍的大小,也反映了總體取值分散與集中的程度.極差常在小樣本(n≤30)場合使用,而在大樣本場合很少在實際中使用.這是因為極差僅使用了樣本中兩個極端點的信息,而把中間的信息都丟棄了,當(dāng)樣本容量越大時,丟棄的信息也就越多,從而留下的信息過少,其使用價值就不大了.17(8)樣本p分位數(shù)和中位數(shù)
定義
設(shè)是來自總體
F(x)
樣本,為該樣本的次序統(tǒng)計量.為該樣本的p分位數(shù)(或p分位點).
稱為樣本中位數(shù),
顯然有對于,稱18第一四分位數(shù)第三四分位數(shù)19例2設(shè)是F(x)
的樣本,此種統(tǒng)計量有個,加起來平均得:令有從中任選兩個分量和
分別為總體均值與方差,2021幾種常用的分布族⑴分布Ⅰ定義:1.2.2設(shè)為相互獨立的隨機變量,且均服從標準正態(tài)分布N(0,1),則稱隨機變量
服從自由度為n的分布,記作自由度可理解為平方和中獨立變量的個數(shù).Ⅱ分布性質(zhì)
(1)設(shè)
,則E(X)=n,D(X)=2n.(2)
可加性:設(shè)
,
,且X與Y獨立,則22下圖描繪了分布密度函數(shù)在n=5,10,20時的圖形.23(2)t分布①定義1.2.3:設(shè)X~N(0,1),,且X與Y獨立,則稱隨機變量
所服從的分布為t分布,記為T~t(n),稱n為自由度.24(3)F分布①定義1.2.4:設(shè)
,
,
且X與Y獨立,則稱隨機變量
服從自由度為(n,m)的F分布,記作.圖1.2.4描繪了的密度函數(shù)曲線25(4)Γ分布族定義1.2.5:定義在正實數(shù)上,且用密度函數(shù)表示的概率分布稱為Γ分布,記為Γ(α,λ).其中α>0是形狀參數(shù),λ>0是尺度參數(shù).而{Γ(α,λ);α>0,λ>0}就是Γ分布族當(dāng)α=1時的Γ分布為指數(shù)分布其密度曲線如下:2627Γ分布族性質(zhì)28(5)β分布族定義1.2.6:定義在[0,1]上,且密度函數(shù)表示的概率分布稱為β分布記為β(a,b),其中a>0,b>0.而{β(a,b):a>0,b>0}為β分布族. β分布有幾個重要的特例.當(dāng)a=1,b=1時,β分布就是U(0,1)29隨機變量的分布的分位點1、設(shè)隨機變量X~F(x),給定常數(shù):0<<1,若存在,滿足,則稱為分布F(x)的上(側(cè))分位點.2、設(shè)隨機變量X~N(0,1),給定常數(shù):0<<1,若存在,滿足,則稱為標準正態(tài)分布的上側(cè)分位點.30標準正態(tài)分布的分位點0.0010.0050.010.0250.050.10
3.0902.5762.3271.961.6451.28231設(shè)X
~2(n),若對于:0<<1,滿足則稱為分布的上分位點。分布分位點32t分布分位點設(shè)T~t(n),若對:0<<1,存在t(n),滿足P{T>t(n)}=,則稱t(n)為t(n)的上側(cè)分位點.33F—分布的分位點設(shè)F~F(n1,n2)對于:0<<1,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧建筑職業(yè)學(xué)院《有機化學(xué)Ⅰ》2023-2024學(xué)年第一學(xué)期期末試卷
- 科爾沁藝術(shù)職業(yè)學(xué)院《算法分析與設(shè)計實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 江蘇理工學(xué)院《視聽節(jié)目策劃》2023-2024學(xué)年第一學(xué)期期末試卷
- 吉林大學(xué)《汽車電工電子技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南農(nóng)業(yè)大學(xué)《烹調(diào)工藝學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北體育職業(yè)學(xué)院《消費者保護法》2023-2024學(xué)年第一學(xué)期期末試卷
- 【物理】《功》(教學(xué)設(shè)計)-2024-2025學(xué)年人教版(2024)初中物理八年級下冊
- 高考物理總復(fù)習(xí)《帶電粒子在交變場中的運動》專項測試卷含答案
- 重慶工程職業(yè)技術(shù)學(xué)院《分布式系統(tǒng)與云計算》2023-2024學(xué)年第一學(xué)期期末試卷
- 正德職業(yè)技術(shù)學(xué)院《學(xué)習(xí)科學(xué)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 代理記賬有限公司簡介(5個范本)
- 校園物業(yè)管理層培訓(xùn)課件
- 安全生產(chǎn)培訓(xùn)資料-20220703152820
- 3-U9C操作培訓(xùn)-MRP基礎(chǔ)
- 2024至2030年中國銅制裝飾材料行業(yè)投資前景及策略咨詢研究報告
- 中金公司在線測評真題
- 高中英語新課程標準解讀課件
- 2024供應(yīng)商大會策劃方案
- 2024小學(xué)語文六年級上冊第四單元:大單元整體教學(xué)課件
- 12S108-1 倒流防止器選用及安裝
- 人教版六年級下冊數(shù)學(xué)期末測試卷附答案【達標題】
評論
0/150
提交評論