基本概念與抽樣分布課件_第1頁
基本概念與抽樣分布課件_第2頁
基本概念與抽樣分布課件_第3頁
基本概念與抽樣分布課件_第4頁
基本概念與抽樣分布課件_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

中南大學數(shù)學與統(tǒng)計學院第1章數(shù)理統(tǒng)計的基本概念與抽樣分布應用統(tǒng)計中南大學數(shù)學與統(tǒng)計學院第1章數(shù)理統(tǒng)計的基本概念與抽樣分布應數(shù)理統(tǒng)計的基本概念與抽樣分布

例:某鋼筋廠每天可以生產(chǎn)某型號鋼筋10000根,鋼筋廠每天需要對生產(chǎn)過程進行控制,對產(chǎn)品的質(zhì)量進行檢驗。如果把鋼筋的強度作為鋼筋質(zhì)量的重有指標,于是質(zhì)量管理人員需要做如下方面的工作第一,對生產(chǎn)出來的鋼筋的強度進行檢測,獲得必要的數(shù)據(jù)。第二,對通過抽樣獲取的部分數(shù)據(jù)進行整理、分析并推斷出這10000根鋼筋的質(zhì)量是否合乎要求。數(shù)理統(tǒng)計的基本概念與抽樣分布§1.2總體、個體、樣本

1.2.1總體與個體我們把所研究對象的全體稱為總體或母體。組成總體的每個單元稱為個體總體X可看作一個隨機變量,稱X的概率分布為總體分布,稱X的數(shù)字特征為總體的數(shù)字特征,對總體進行研究就是對總體的分布或?qū)傮w的數(shù)字特征進行研究.1.2.2樣本從總體中抽取的一部分個體稱為樣本或者子樣,其中所含個體的個數(shù)稱為樣本容量.

樣本具有二重性:隨機性和確定性§1.2總體、個體、樣本1.2.1總體與個體定義1.1

設總體X的樣本滿足⑴獨立性:每次觀測結(jié)果既不影響其它結(jié)果,也不受其它結(jié)果的影響;即相互獨立;⑵代表性:樣本中每一個個體都與總體X有相同分布。則稱此樣本為簡單隨機樣本。進行有放回抽樣就是簡單隨機樣本,無放回抽樣就不是簡單隨機樣本。但N很大,n相對較小時無放回抽樣得到的樣本可以近似看作簡單隨機樣本.

稱樣本的分布為樣本分布。如果為簡單隨機樣本,為總體X的分布函數(shù),則樣本分布有比較簡單的形式。定義1.1設總體X的樣本滿足

它完全由總體X的分布函數(shù)確定基本概念與抽樣分布課件兩種形式例1.1設有一批產(chǎn)品,其次品率為p,如果記“”表示抽取一件產(chǎn)品是次品;“”表示抽取一件產(chǎn)品是正品;那么,產(chǎn)品的質(zhì)量可以用X的分布來衡量。X服從0-1分布,參數(shù)就是次品率p。如果為簡單隨機樣本,求樣本分布.

解:總體X的概率分布為

兩種形式基本概念與抽樣分布課件

例1.2設總體X服從參數(shù)為的正態(tài)分布,求樣本的分布密度。解:總體X的分布密度為所以的概率分布為

例1.2設總體X服從參數(shù)為的正態(tài)

統(tǒng)計量

統(tǒng)計量的定義定義1.2設為總體X的一個樣本,為的連續(xù)函數(shù),且不含有任何未知參數(shù),則稱T為一個統(tǒng)計量。注:1.統(tǒng)計量是完全由樣本確定的一個量,即樣本有一個觀測值時,統(tǒng)計量就有一個唯一確定的值;2.統(tǒng)計量是一個隨機變量,它將高維隨機變量問題轉(zhuǎn)化為一維隨機變量來處理,但不會損失所討論問題的信息量.統(tǒng)計量常見的統(tǒng)計量1.樣本均值2.樣本方差3.k階原點矩4.k階中心矩5.順序統(tǒng)計量6.樣本極差與中位數(shù)常見的統(tǒng)計量

例1.3設總體X為連續(xù)型的,求最大順序統(tǒng)計量與最小順序統(tǒng)計量的分布密度.

解:最大順序統(tǒng)計量的分布函數(shù)為

例1.3設總體X為連續(xù)型的,求最大順序統(tǒng)計量與最小順

最小順序統(tǒng)計量的分布函數(shù)為最小順序統(tǒng)計量的分布函數(shù)為

如果總體中服從均勻分布則如果總體中服從均勻分布則

其分布密度為其分布密度為充分統(tǒng)計量例:某廠要了解其產(chǎn)品的不合格率p,檢驗員檢查了10件產(chǎn)品,檢查結(jié)果是,除前二件是不合格品(記為)外,其它都是合格品(記為)。當廠長問及檢查結(jié)果時檢驗員可作如下兩種回答:

(1)10件中有兩件不合格;

(2)前兩件不合格。這兩種回答反映了檢驗員對樣本的兩種不同的加工方法。其所用的統(tǒng)計量分別為充分統(tǒng)計量顯然,第二種回答是不能令人滿意的,因為統(tǒng)計量不包含樣本中有關p的全部信息。而第一種回答是綜合了樣本中有關p的全部信息。因為樣本提供了兩種信息:

(1)10次檢驗中不合格品出現(xiàn)了幾次;

(2)不合格品出現(xiàn)在哪幾次試驗上?;靖拍钆c抽樣分布課件

第二種信息(試驗編號信息)對了解不合格品率p是沒有什么幫助的.

充分統(tǒng)計量就是能把含在樣本中有關總體或者參數(shù)的信息一點都不損失地提取出來。或者說充分統(tǒng)計量包含了有關總體或有關參數(shù)的全部信息.

考慮樣本的分布

第二種信息(試驗編號信息)對了解不合格品率p是由于

且是服從二項分布故基本概念與抽樣分布課件

它與無關基本概念與抽樣分布課件定義1.3設總體X的分布為一個含未知參數(shù)的分布族,是X的一個樣本。是一個統(tǒng)計量,對給定的t,樣本在的條件下的條件分布與參數(shù)無關,則稱統(tǒng)計量T是參數(shù)的充分統(tǒng)計量。定義1.3設總體X的分布為一個含未知參數(shù)的分布族

上例的一般情況是設是來自0-1分布的一個簡單隨機樣本,其中,則是參數(shù)的充分統(tǒng)計量。上例的一般情況是由定義可得定理1.1設是參數(shù)的充分統(tǒng)計量,是單值可逆函數(shù),則也是參數(shù)的充分統(tǒng)計量。由定義可得當總體為連續(xù)型總體時,充分統(tǒng)計量要用條件分布密度來描述。奈曼(J.Neyman)和哈爾斯(P.R.Halmos)在20世紀40年代提出并嚴格證明了一個判別充分統(tǒng)計量的方法:因子分解定理。當總體為連續(xù)型總體時,充分統(tǒng)計量要用條件分布密度來描述。奈曼

定理1.2(因子分解定理)設樣本的聯(lián)合分布為一個含未知參數(shù)的分布族,則是一個充分統(tǒng)計量當且僅當存在這樣的兩個函數(shù):

(1)與無關的非負函數(shù);

(2)與有關,且僅與統(tǒng)計量T的值有關的非負函數(shù)使得

其中在離散總體的情況下表示樣本的分布列,在連續(xù)總體的情況下表示樣本的分布密度。定理1.2(因子分解定理)設樣本的聯(lián)合分布為一個含例設是來自分布,即它的分布密度為

的一個簡單隨機樣本,其中則分別是參數(shù)的充分統(tǒng)計量例設解:樣本的聯(lián)合分布密度為如果令由因子分解定理知是的充分統(tǒng)計量。解:樣本的例設總體X的分布密度為是X的一個簡單隨機樣本,試證明最小順序統(tǒng)計量的充分統(tǒng)計量。

例設總體X的分布密度為證:樣本的聯(lián)合分布密度為如果令由因子分解定理知是的充分統(tǒng)計量。證:樣本的§1.4抽樣分布我們稱統(tǒng)計量的分布為抽樣分布,不同的統(tǒng)計量其分布不一定相同.常見的分布類型有:

正態(tài)分布伽瑪分布卡方分布

t分布

F分布§1.4抽樣分布伽瑪分布定義1.4如果連續(xù)型隨機變量X的密度函數(shù)為其中

為函數(shù),則稱X為服從參數(shù)是的伽瑪分布,記為伽瑪分布伽瑪分布的性質(zhì)(1)由此可得伽瑪分布的性質(zhì)(2)

如果,并且X和Y相互獨立,容易求得

這個性質(zhì)稱為可加性,即伽瑪分布具有可加性.(2)卡方分布用構(gòu)造性的方式定義是定義1.5設為相互獨立的隨機變量,且均服從,則它們的平方和

也是一個隨機變量,它所服從的分布稱為自由度為n的分布,記為

卡方分布它的密度函數(shù)為其密度函數(shù)與參數(shù)n有關,它的圖形也有一定差異.它的密度函數(shù)為卡方分布的性質(zhì)若,則即卡方分布是一種伽瑪分布,因此具有伽瑪分布的性質(zhì)(1)(2)

如果,并且X和Y相互獨立,有

卡方分布也具有可加性卡方分布的性質(zhì)例是來自參數(shù)為的指數(shù)分布X總體,試證明:例總體X的密度為當時,我們有密度為說明總體X的密度為假定子樣是簡單隨機子樣,則且它們之間相互獨立,故有假定子樣是簡單隨機子樣,則t分布

構(gòu)造性的方式定義定義1.6設,,且X與Y相互獨立,記

則T也是一個隨機變量,它所服從的分布稱為自由度為n的t分布,記為t分布它的密度函數(shù)為與參數(shù)n有關,不同的n其圖形也有差異.它的密度函數(shù)為性質(zhì)若則(1)當時,t分布是柯西分布,柯西分布不存在數(shù)學期望和方差.參數(shù)為2的t分布也不存在數(shù)學期望和方差.(2)時,性質(zhì)(3)可以證明這是標準正態(tài)分布的分布密度,即當n充分大時,T近似服從標準正態(tài)分布(3)可以證明F分布

構(gòu)造性的方式定義定義1.7設,,且X與Y相互獨立,記

則F也是一個隨機變量,它所服從的分布稱為自由度為(m,n)的F分布,記為F分布它的密度函數(shù)為它與m,n有關,其圖形也有一定差異.它的密度函數(shù)為容易得到若,則

容易得到例設試證明:證明:由t分布的構(gòu)造性定義知,存在相互獨立的變量X和Y,使得于是,仍相互獨立,由F分布的定義知結(jié)論成立.例設試證明:

分位數(shù):定義1.6設X為連續(xù)型隨機變量,其密度函數(shù)為,對,如果存在數(shù)滿足

則稱為此分布的分位數(shù)分位數(shù)的幾何意義可用圖形表示,它的值可查表得到,不同的分布有不同的分位數(shù),有不同的表可查.分位數(shù):常見的分位數(shù)有它們的值可以通過附表1、附表2、附表3、附表4查得常見的分位數(shù)有分位數(shù)具有性質(zhì)(1)(2)(3)當n足夠大時(一般n>45)有近似公式分位數(shù)具有性質(zhì)例:查表求下列分位數(shù)的值例:查表求下列分位數(shù)的值抽樣分布定理定理1.1設總體,為X的一個簡單隨機樣本,為樣本均值與樣本方差,則有:

(1)

(2)抽樣分布定理(3)相互獨立;

(4)基本概念與抽樣分布課件定理1.2設有兩個總體X與Y,,從兩個總體X與Y中分別獨立抽取容量為m,n的簡單樣本,記為樣本的樣本均值與方差,為樣本的樣本均值與方差,則(1)定理1.2設有兩個總體X與Y,例1.8設總體,分別從X中抽取容量為10與15的兩個獨立樣本,求它們的均值之差的絕對值大于0.3的概率基本概念與抽樣分布課件例1.9設總體,是從總體中抽取的簡單隨機樣本,選取常數(shù)c,d使得并求出n.基本概念與抽樣分布課件中南大學數(shù)學與統(tǒng)計學院ThankYou!中南大學數(shù)學與統(tǒng)計學院ThankYou!中南大學數(shù)學與統(tǒng)計學院第1章數(shù)理統(tǒng)計的基本概念與抽樣分布應用統(tǒng)計中南大學數(shù)學與統(tǒng)計學院第1章數(shù)理統(tǒng)計的基本概念與抽樣分布應數(shù)理統(tǒng)計的基本概念與抽樣分布

例:某鋼筋廠每天可以生產(chǎn)某型號鋼筋10000根,鋼筋廠每天需要對生產(chǎn)過程進行控制,對產(chǎn)品的質(zhì)量進行檢驗。如果把鋼筋的強度作為鋼筋質(zhì)量的重有指標,于是質(zhì)量管理人員需要做如下方面的工作第一,對生產(chǎn)出來的鋼筋的強度進行檢測,獲得必要的數(shù)據(jù)。第二,對通過抽樣獲取的部分數(shù)據(jù)進行整理、分析并推斷出這10000根鋼筋的質(zhì)量是否合乎要求。數(shù)理統(tǒng)計的基本概念與抽樣分布§1.2總體、個體、樣本

1.2.1總體與個體我們把所研究對象的全體稱為總體或母體。組成總體的每個單元稱為個體總體X可看作一個隨機變量,稱X的概率分布為總體分布,稱X的數(shù)字特征為總體的數(shù)字特征,對總體進行研究就是對總體的分布或?qū)傮w的數(shù)字特征進行研究.1.2.2樣本從總體中抽取的一部分個體稱為樣本或者子樣,其中所含個體的個數(shù)稱為樣本容量.

樣本具有二重性:隨機性和確定性§1.2總體、個體、樣本1.2.1總體與個體定義1.1

設總體X的樣本滿足⑴獨立性:每次觀測結(jié)果既不影響其它結(jié)果,也不受其它結(jié)果的影響;即相互獨立;⑵代表性:樣本中每一個個體都與總體X有相同分布。則稱此樣本為簡單隨機樣本。進行有放回抽樣就是簡單隨機樣本,無放回抽樣就不是簡單隨機樣本。但N很大,n相對較小時無放回抽樣得到的樣本可以近似看作簡單隨機樣本.

稱樣本的分布為樣本分布。如果為簡單隨機樣本,為總體X的分布函數(shù),則樣本分布有比較簡單的形式。定義1.1設總體X的樣本滿足

它完全由總體X的分布函數(shù)確定基本概念與抽樣分布課件兩種形式例1.1設有一批產(chǎn)品,其次品率為p,如果記“”表示抽取一件產(chǎn)品是次品;“”表示抽取一件產(chǎn)品是正品;那么,產(chǎn)品的質(zhì)量可以用X的分布來衡量。X服從0-1分布,參數(shù)就是次品率p。如果為簡單隨機樣本,求樣本分布.

解:總體X的概率分布為

兩種形式基本概念與抽樣分布課件

例1.2設總體X服從參數(shù)為的正態(tài)分布,求樣本的分布密度。解:總體X的分布密度為所以的概率分布為

例1.2設總體X服從參數(shù)為的正態(tài)

統(tǒng)計量

統(tǒng)計量的定義定義1.2設為總體X的一個樣本,為的連續(xù)函數(shù),且不含有任何未知參數(shù),則稱T為一個統(tǒng)計量。注:1.統(tǒng)計量是完全由樣本確定的一個量,即樣本有一個觀測值時,統(tǒng)計量就有一個唯一確定的值;2.統(tǒng)計量是一個隨機變量,它將高維隨機變量問題轉(zhuǎn)化為一維隨機變量來處理,但不會損失所討論問題的信息量.統(tǒng)計量常見的統(tǒng)計量1.樣本均值2.樣本方差3.k階原點矩4.k階中心矩5.順序統(tǒng)計量6.樣本極差與中位數(shù)常見的統(tǒng)計量

例1.3設總體X為連續(xù)型的,求最大順序統(tǒng)計量與最小順序統(tǒng)計量的分布密度.

解:最大順序統(tǒng)計量的分布函數(shù)為

例1.3設總體X為連續(xù)型的,求最大順序統(tǒng)計量與最小順

最小順序統(tǒng)計量的分布函數(shù)為最小順序統(tǒng)計量的分布函數(shù)為

如果總體中服從均勻分布則如果總體中服從均勻分布則

其分布密度為其分布密度為充分統(tǒng)計量例:某廠要了解其產(chǎn)品的不合格率p,檢驗員檢查了10件產(chǎn)品,檢查結(jié)果是,除前二件是不合格品(記為)外,其它都是合格品(記為)。當廠長問及檢查結(jié)果時檢驗員可作如下兩種回答:

(1)10件中有兩件不合格;

(2)前兩件不合格。這兩種回答反映了檢驗員對樣本的兩種不同的加工方法。其所用的統(tǒng)計量分別為充分統(tǒng)計量顯然,第二種回答是不能令人滿意的,因為統(tǒng)計量不包含樣本中有關p的全部信息。而第一種回答是綜合了樣本中有關p的全部信息。因為樣本提供了兩種信息:

(1)10次檢驗中不合格品出現(xiàn)了幾次;

(2)不合格品出現(xiàn)在哪幾次試驗上。基本概念與抽樣分布課件

第二種信息(試驗編號信息)對了解不合格品率p是沒有什么幫助的.

充分統(tǒng)計量就是能把含在樣本中有關總體或者參數(shù)的信息一點都不損失地提取出來?;蛘哒f充分統(tǒng)計量包含了有關總體或有關參數(shù)的全部信息.

考慮樣本的分布

第二種信息(試驗編號信息)對了解不合格品率p是由于

且是服從二項分布故基本概念與抽樣分布課件

它與無關基本概念與抽樣分布課件定義1.3設總體X的分布為一個含未知參數(shù)的分布族,是X的一個樣本。是一個統(tǒng)計量,對給定的t,樣本在的條件下的條件分布與參數(shù)無關,則稱統(tǒng)計量T是參數(shù)的充分統(tǒng)計量。定義1.3設總體X的分布為一個含未知參數(shù)的分布族

上例的一般情況是設是來自0-1分布的一個簡單隨機樣本,其中,則是參數(shù)的充分統(tǒng)計量。上例的一般情況是由定義可得定理1.1設是參數(shù)的充分統(tǒng)計量,是單值可逆函數(shù),則也是參數(shù)的充分統(tǒng)計量。由定義可得當總體為連續(xù)型總體時,充分統(tǒng)計量要用條件分布密度來描述。奈曼(J.Neyman)和哈爾斯(P.R.Halmos)在20世紀40年代提出并嚴格證明了一個判別充分統(tǒng)計量的方法:因子分解定理。當總體為連續(xù)型總體時,充分統(tǒng)計量要用條件分布密度來描述。奈曼

定理1.2(因子分解定理)設樣本的聯(lián)合分布為一個含未知參數(shù)的分布族,則是一個充分統(tǒng)計量當且僅當存在這樣的兩個函數(shù):

(1)與無關的非負函數(shù);

(2)與有關,且僅與統(tǒng)計量T的值有關的非負函數(shù)使得

其中在離散總體的情況下表示樣本的分布列,在連續(xù)總體的情況下表示樣本的分布密度。定理1.2(因子分解定理)設樣本的聯(lián)合分布為一個含例設是來自分布,即它的分布密度為

的一個簡單隨機樣本,其中則分別是參數(shù)的充分統(tǒng)計量例設解:樣本的聯(lián)合分布密度為如果令由因子分解定理知是的充分統(tǒng)計量。解:樣本的例設總體X的分布密度為是X的一個簡單隨機樣本,試證明最小順序統(tǒng)計量的充分統(tǒng)計量。

例設總體X的分布密度為證:樣本的聯(lián)合分布密度為如果令由因子分解定理知是的充分統(tǒng)計量。證:樣本的§1.4抽樣分布我們稱統(tǒng)計量的分布為抽樣分布,不同的統(tǒng)計量其分布不一定相同.常見的分布類型有:

正態(tài)分布伽瑪分布卡方分布

t分布

F分布§1.4抽樣分布伽瑪分布定義1.4如果連續(xù)型隨機變量X的密度函數(shù)為其中

為函數(shù),則稱X為服從參數(shù)是的伽瑪分布,記為伽瑪分布伽瑪分布的性質(zhì)(1)由此可得伽瑪分布的性質(zhì)(2)

如果,并且X和Y相互獨立,容易求得

這個性質(zhì)稱為可加性,即伽瑪分布具有可加性.(2)卡方分布用構(gòu)造性的方式定義是定義1.5設為相互獨立的隨機變量,且均服從,則它們的平方和

也是一個隨機變量,它所服從的分布稱為自由度為n的分布,記為

卡方分布它的密度函數(shù)為其密度函數(shù)與參數(shù)n有關,它的圖形也有一定差異.它的密度函數(shù)為卡方分布的性質(zhì)若,則即卡方分布是一種伽瑪分布,因此具有伽瑪分布的性質(zhì)(1)(2)

如果,并且X和Y相互獨立,有

卡方分布也具有可加性卡方分布的性質(zhì)例是來自參數(shù)為的指數(shù)分布X總體,試證明:例總體X的密度為當時,我們有密度為說明總體X的密度為假定子樣是簡單隨機子樣,則且它們之間相互獨立,故有假定子樣是簡單隨機子樣,則t分布

構(gòu)造性的方式定義定義1.6設,,且X與Y相互獨立,記

則T也是一個隨機變量,它所服從的分布稱為自由度為n的t分布,記為t分布它的密度函數(shù)為與參數(shù)n有關,不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論