基本概念與抽樣分布_第1頁(yè)
基本概念與抽樣分布_第2頁(yè)
基本概念與抽樣分布_第3頁(yè)
基本概念與抽樣分布_第4頁(yè)
基本概念與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、中南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院第1章 數(shù)理統(tǒng)計(jì)的基本概念與抽樣分布應(yīng)用統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)計(jì)的基本本概念與與抽樣分分布 例:某鋼筋廠廠每天可可以生產(chǎn)產(chǎn)某型號(hào)號(hào)鋼筋10000根,鋼筋筋廠每天天需要對(duì)對(duì)生產(chǎn)過過程進(jìn)行行控制,對(duì)產(chǎn)品品的質(zhì)量量進(jìn)行檢檢驗(yàn)。如如果把鋼鋼筋的強(qiáng)強(qiáng)度作為為鋼筋質(zhì)質(zhì)量的重重有指標(biāo)標(biāo),于是是質(zhì)量管管理人員員需要做做如下方方面的工工作第一,對(duì)對(duì)生產(chǎn)出出來(lái)的鋼鋼筋的強(qiáng)強(qiáng)度進(jìn)行行檢測(cè),獲得必必要的數(shù)數(shù)據(jù)。第二,對(duì)對(duì)通過抽抽樣獲取取的部分分?jǐn)?shù)據(jù)進(jìn)進(jìn)行整理理、分析析并推斷斷出這10000根鋼筋的的質(zhì)量是是否合乎乎要求。1.2總體、個(gè)個(gè)體、樣樣本1.2.1總體與個(gè)個(gè)體我們把所所研究對(duì)對(duì)象的全全體稱為為總體

2、或或母體。組成總總體的每每個(gè)單元元稱為個(gè)個(gè)體總體X可看作一一個(gè)隨機(jī)機(jī)變量,稱X的概率分分布為總總體分布布,稱X的數(shù)字特特征為總總體的數(shù)數(shù)字特征征,對(duì)總體進(jìn)進(jìn)行研究究就是對(duì)對(duì)總體的的分布或或?qū)傮w體的數(shù)字字特征進(jìn)進(jìn)行研究究.1.2.2樣本從總體中中抽取的的一部分分個(gè)體稱稱為樣本本或者子子樣,其其中所含含個(gè)體的的個(gè)數(shù)稱稱為樣本本容量.樣本具有有二重性性:隨機(jī)機(jī)性和確確定性定義1.1設(shè)總體X的樣本滿滿足 獨(dú)立立性:每每次觀測(cè)測(cè)結(jié)果既既不影響響其它結(jié)結(jié)果,也也不受其其它結(jié)果果的影響響;即相相互獨(dú)立立;代代表性:樣本中中每一個(gè)個(gè)個(gè)體都都與總體體X有相同分分布。則稱此樣樣本為簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本。進(jìn)行有放放回

3、抽樣樣就是簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,無(wú)放回抽抽樣就不不是簡(jiǎn)單單隨機(jī)樣樣本。但但N很大,n相對(duì)較小小時(shí)無(wú)放放回抽樣樣得到的的樣本可可以近似似看作簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本.稱樣本的的分布為為樣本分分布。如如果為為簡(jiǎn)單單隨機(jī)樣樣本,為為總體X的分布函函數(shù),則則樣本分分布有比比較簡(jiǎn)單單的形式式 。它完全由由總體X的分布函函數(shù)確定定兩種形式式例1.1設(shè)有一批批產(chǎn)品,其次品品率為p,如果記記“”表表示抽取取一件產(chǎn)產(chǎn)品是次次品;“”表表示抽抽取一件件產(chǎn)品是是正品;那么,產(chǎn)品的的質(zhì)量可可以用X的分布來(lái)來(lái)衡量。X服從0-1分布,參參數(shù)就是是次品率率p。如果為為簡(jiǎn)單隨隨機(jī)樣本,求樣樣本分布布.解:總體體X的概率分分布為例1.2設(shè)

4、總體X服從參數(shù)數(shù)為的的正態(tài)態(tài)分布,求樣本本的的分分布密度度。解:總體體X的分布密密度為所以的的概率率分布為為統(tǒng)計(jì)量統(tǒng)計(jì)量的的定義定義1.2設(shè)為為總總體X的一個(gè)樣樣本,為的的連續(xù)續(xù)函數(shù),且不含含有任何何未知參參數(shù),則則稱T為一個(gè)統(tǒng)統(tǒng)計(jì)量。注:1.統(tǒng)計(jì)量是是完全由由樣本確確定的一一個(gè)量,即樣本本有一個(gè)個(gè)觀測(cè)值值時(shí),統(tǒng)計(jì)量就就有一個(gè)個(gè)唯一確確定的值值;2.統(tǒng)計(jì)量是是一個(gè)隨隨機(jī)變量量,它將將高維隨隨機(jī)變量量問題轉(zhuǎn)轉(zhuǎn)化為一一維隨機(jī)機(jī)變量來(lái)來(lái)處理,但不會(huì)損損失所討討論問題題的信息息量.常見的統(tǒng)統(tǒng)計(jì)量1.樣本均值值2.樣本方差差3.k階原點(diǎn)矩矩4.k階中心矩矩5.順序統(tǒng)計(jì)計(jì)量6.樣本極差差 與中中位數(shù)例1.

5、3設(shè)總體X為連續(xù)型型的,求最大順順序統(tǒng)計(jì)計(jì)量與最最小順序序統(tǒng)計(jì)量量的分布布密度.解:最大順序序統(tǒng)計(jì)量量的的分分布函數(shù)數(shù)為最小順序序統(tǒng)計(jì)量量 的分分布函數(shù)數(shù)為如果總體體中服從從均勻分分布則其分布密密度為充分統(tǒng)計(jì)計(jì)量例:某廠廠要了解解其產(chǎn)品品的不合合格率p,檢驗(yàn)員員檢查了了10件產(chǎn)品,檢查結(jié)結(jié)果是,除前二二件是不不合格品品(記為為)外,其其它都是是合格品品(記為為)。當(dāng)廠長(zhǎng)長(zhǎng)問及檢檢查結(jié)果果時(shí)檢驗(yàn)驗(yàn)員可作作如下兩兩種回答答:(1)10件中有兩兩件不合合格;(2)前兩件不不合格。這兩種回回答反映映了檢驗(yàn)驗(yàn)員對(duì)樣樣本的兩兩種不同同的加工工方法。其所用用的統(tǒng)計(jì)計(jì)量分別別為顯然,第第二種回回答是不不能令人

6、人滿意的的,因?yàn)闉榻y(tǒng)計(jì)量量不包含含樣本中中有關(guān)p的全部信信息。而而第一種種回答是是綜合了了樣本中中有關(guān)p的全部信信息。因因?yàn)闃颖颈咎崽峁┝肆藘煞N信信息:(1)10次檢驗(yàn)中中不合格格品出現(xiàn)現(xiàn)了幾次次;(2)不合格品品出現(xiàn)在在哪幾次次試驗(yàn)上上。第二種信信息(試試驗(yàn)編號(hào)號(hào)信息)對(duì)了解解不合格格品率p是沒有什什么幫助助的.充分統(tǒng)計(jì)計(jì)量就是是能把含含在樣本本中有關(guān)關(guān)總體或或者參數(shù)數(shù)的信息息一點(diǎn)都都不損失失地提取取出來(lái)。或者說(shuō)說(shuō)充分統(tǒng)統(tǒng)計(jì)量包包含了有有關(guān)總體體或有關(guān)關(guān)參數(shù)的的全部信信息.考慮樣本本的分布 由于 且是是服服從二項(xiàng)項(xiàng)分布故它與無(wú)無(wú)關(guān)定義1.3設(shè)總體X的分布為為一個(gè)含含未知參參數(shù)的分分布族,是是

7、X的一個(gè)樣樣本。是一個(gè)統(tǒng)統(tǒng)計(jì)量,對(duì)給定的的t,樣本在在的的條件下下的條條件分布布與參數(shù)數(shù)無(wú)無(wú)關(guān),則則稱統(tǒng)計(jì)計(jì)量T是參數(shù)的的充分統(tǒng)統(tǒng)計(jì)量。上例的一一般情況況是設(shè)是是來(lái)自自0-1分布的一個(gè)簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,其中,則則是參參數(shù)的充充分統(tǒng)計(jì)計(jì)量。由定義可可得定理1.1設(shè)是是參數(shù)數(shù)的的充充分統(tǒng)計(jì)計(jì)量,是是單值值可逆函函數(shù),則則也也是是參數(shù)的的充分統(tǒng)統(tǒng)計(jì)量。當(dāng)總體為為連續(xù)型型總體時(shí)時(shí),充分分統(tǒng)計(jì)量量要用條條件分布布密度來(lái)來(lái)描述。奈曼(J.Neyman)和哈爾爾斯(P.R.Halmos)在20世紀(jì)40年代提出出并嚴(yán)格格證明了了一個(gè)判判別充分分統(tǒng)計(jì)量量的方法法:因子子分解定定理。定理1.2(因子分分解定理理)

8、設(shè)樣樣本的聯(lián)聯(lián)合分布布為一個(gè)個(gè)含未知知參數(shù)的的分布族族,則是是一個(gè)充充分統(tǒng)計(jì)計(jì)量當(dāng)且且僅當(dāng)存存在這樣樣的兩個(gè)個(gè)函數(shù):(1)與無(wú)無(wú)關(guān)的的非負(fù)函函數(shù);(2)與有有關(guān)關(guān),且僅僅與統(tǒng)計(jì)計(jì)量T的值有關(guān)關(guān)的非負(fù)負(fù)函數(shù)使使得得其中在在離散總總體的情情況下表表示樣本本的分布布列,在在連續(xù)總總體的情情況下表表示樣本本的分布布密度。例設(shè)設(shè)是是來(lái)自分分布布,即它的分分布密度度為的一個(gè)簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,其中則則分分別是參參數(shù)的充分統(tǒng)統(tǒng)計(jì)量解:樣本的的聯(lián)合分分布密度度為如果令由因子分分解定理理知是是的的充分統(tǒng)統(tǒng)計(jì)量。例 設(shè)總總體X的分布密密度為是X的一個(gè)簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,試證明明最小順順序統(tǒng)計(jì)計(jì)量的的充充分統(tǒng)計(jì)計(jì)量。證

9、:樣本的的聯(lián)合分分布密度度為如果令由因子分分解定理理知是是的的充充分統(tǒng)計(jì)計(jì)量。1.4抽樣分布布我們稱統(tǒng)統(tǒng)計(jì)量的的分布為為抽樣分分布,不同的統(tǒng)統(tǒng)計(jì)量其其分布不不一定相相同.常見的分分布類型型有:正態(tài)分布布伽瑪分布布卡方分布布t分布F分布伽瑪分布布定義1.4如果連續(xù)續(xù)型隨機(jī)機(jī)變量X的密度函函數(shù)為其中 為函函數(shù)數(shù),則稱稱X為服從參參數(shù)是的的伽伽瑪分布布,記為為伽瑪分布布的性質(zhì)質(zhì)(1)由此可得得(2)如果,并且且X和Y相互獨(dú)立立,容易易求得這個(gè)性質(zhì)質(zhì)稱為可可加性,即伽瑪分分布具有有可加性性.卡方分布布用構(gòu)造性性的方式式定義是是定義1.5設(shè)為為相相互獨(dú)立立的隨機(jī)機(jī)變量,且均服服從,則它們們的平方方和也是

10、一個(gè)個(gè)隨機(jī)變變量,它它所服從從的分布布稱為自自由度為為n的分分布,記記為它的密度度函數(shù)為為其密度函函數(shù)與參參數(shù)n有關(guān),它它的圖形形也有一一定差異異卡方分布布的性質(zhì)質(zhì)若,則即卡方分分布是一一種伽瑪瑪分布,因此具具有伽瑪瑪分布的的性質(zhì)()()如果,并且且X和Y相互獨(dú)立立,有 卡方分布布也具有有可加性性例是來(lái)自參參數(shù)為的的指數(shù)數(shù)分布總體,試證明明:總體的的密度為為當(dāng)時(shí)時(shí),我我們有密度為說(shuō)明假定子樣樣是簡(jiǎn)單單隨機(jī)子子樣,則且它們之之間相互互獨(dú)立,故有t分布構(gòu)造性的的方式定定義定義1.6設(shè),且X與Y相互獨(dú)立立,記則也是是一個(gè)隨隨機(jī)變量量,它所所服從的的分布稱稱為自由由度為n的t分布,記記為它的密度度函數(shù)

11、為為與參數(shù)n有關(guān),不不同的n其圖形也也有差異異性質(zhì)若則則()當(dāng)當(dāng)時(shí)時(shí),t分布是柯柯西分布布,柯西西分布不不存在數(shù)數(shù)學(xué)期望望和方差差參數(shù)數(shù)為2的t分布也不不存在數(shù)數(shù)學(xué)期望望和方差差()時(shí)時(shí),()可可以證明明這是標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布的分分布密度度,即當(dāng)當(dāng)n充分大時(shí)時(shí),T近似服從從標(biāo)準(zhǔn)正正態(tài)分布布分布構(gòu)造性的的方式定定義定義1.設(shè)設(shè),且X與Y相互獨(dú)立立,記則也是是一個(gè)隨隨機(jī)變量量,它所所服從的的分布稱稱為自由由度為(m,n)的F分布,記記為它的密度度函數(shù)為為它與m,n有關(guān),其其圖形也也有一定定差異容易得到到若,則例設(shè)試試證證明:證明:由由t分布的構(gòu)構(gòu)造性定定義知,存在相相互獨(dú)立立的變量量和,使得得于是,

12、仍相互獨(dú)獨(dú)立,由由分布布的定義義知結(jié)論論成立分位數(shù):定義1.6設(shè)X為連續(xù)型型隨機(jī)變變量,其其密度函函數(shù)為,對(duì),如果存存在數(shù)滿滿足足則稱為為此分分布的分分位位數(shù)分位數(shù)的的幾何意意義可可用圖形形表示,它的值值可查表表得到,不同的的分布有有不同的的分位數(shù)數(shù),有不不同的表表可查常見的分分位數(shù)有有它們的值值可以通通過附表表1、附表2、附表3、附表4查得分位數(shù)具具有性質(zhì)質(zhì)(1)(2)(3)當(dāng)n足夠大時(shí)時(shí)(一般般n 45)有近似似公式例:查表求下下列分位位數(shù)的值值抽樣分布布定理定理1.1設(shè)總體,為為X的一個(gè)簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,為為樣樣本均值值與樣本本方差,則有:(1) (2)(3)相互獨(dú)立立;(4)定理1.2設(shè)有兩個(gè)個(gè)總體與,從兩個(gè)個(gè)總體與中

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論