理論分布和抽樣分布_第1頁
理論分布和抽樣分布_第2頁
理論分布和抽樣分布_第3頁
理論分布和抽樣分布_第4頁
理論分布和抽樣分布_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章 理論分布和抽樣分布本章的二項(xiàng)式分布和正態(tài)分布在數(shù)學(xué)上已講過,在本書中不作為重點(diǎn)內(nèi)容。 自學(xué)內(nèi)容:1、 事件:事件的概念、事件間的關(guān)系、事件的運(yùn)算2、 概率:概率的概念、計(jì)算概率的法則3、 二項(xiàng)式分布:二項(xiàng)總體及二項(xiàng)式分布、二項(xiàng)式分布的概率計(jì)算方法、二項(xiàng)式分布的形狀和參數(shù)。4、 正態(tài)分布:正態(tài)分布的意義、正態(tài)分布曲線的特征、標(biāo)準(zhǔn)化正態(tài)分布、正態(tài)分布的概率計(jì)算。第一節(jié) 概率一、事件及其類型事物發(fā)生某種情況或?qū)嶒?yàn)中獲得的某種結(jié)果稱為某一事件必然事件(U)在一定條件下必然會(huì)出現(xiàn)的不可能事件(V)在一定條件下必然不會(huì)出現(xiàn)的隨機(jī)事件(A)在一定條件下必然可能出現(xiàn)也可能不出現(xiàn)事件關(guān)系:a 事件和:至

2、少發(fā)生一個(gè)事件。 b 事件積:同時(shí)發(fā)生事件。c 事件差:A發(fā)生而B不發(fā)生。d 互不相容事件: 不能同時(shí)發(fā)生的事件關(guān)系,如一胎生1只和生2只豬。e 對(duì)立事件: 嚴(yán)格的不相容事件,是一種非此即彼的事件關(guān)系。如男和女,生和死,A和非A。f 獨(dú)立事件: 互不影響發(fā)生的事件關(guān)系,如張三生男孩和李四生女孩。二、頻率與概率A正面向上aA出現(xiàn)的次數(shù)n總次數(shù)a/nA出現(xiàn)的頻率P(A)A的概率,若實(shí)驗(yàn)或觀察的次數(shù)n無限大,則A發(fā)生的頻率a/n必穩(wěn)定以某一定值p為中心上下做微小的擺動(dòng),那么這個(gè)p就稱為隨機(jī)事件A的概率 三、“小概率事件實(shí)際不可能”原理小概率事件如果一個(gè)事件的概率小于一個(gè)很小的數(shù)值,如5%或

3、者1%,則稱其為小概率事件。小概率事件不可能原理小概率事件在一次試驗(yàn)中,實(shí)際上可以認(rèn)為不可能發(fā)生。 四、概率的計(jì)算法則(一)加法定理P(A+B)=P(A)+P(B),A與B是互斥事件。(二)乘法定理P(AB)=P(A)P(B),A與B是相互獨(dú)立的。五、隨 機(jī) 變 量 隨機(jī)變量:是指從隨機(jī)變數(shù)中所取得的某一實(shí)數(shù)值。 隨機(jī)變量:可分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量離散型隨機(jī)變量:試驗(yàn)只有幾個(gè)確定的結(jié)果,并可一一列出,變量y的取值可用實(shí)數(shù)表示,且y取某一值時(shí),其概率是確定的,這種類型的變量稱為離散型隨機(jī)變量。將這種變量所有可能取值及其對(duì)應(yīng)概率一一列出所形成的分布稱離散型隨機(jī)變量的概率分布,

4、也可用函數(shù)f(y)表示,稱為概率函數(shù)。連續(xù)型隨機(jī)變量:變量y的取值僅是一個(gè)范圍,且y在該范圍內(nèi)取值時(shí),其概率是確定的。這時(shí)取y為一固定值是無意義的,因?yàn)樵谶B續(xù)尺度上一點(diǎn)的概率幾乎為0。這種類型的變量稱為連續(xù)型隨機(jī)變量。第二節(jié) 二項(xiàng)式分布一、二項(xiàng)總體及二項(xiàng)式分布1、 二項(xiàng)總體(binary population):由非此即彼的對(duì)立事件構(gòu)成的總體。例如:小麥種子發(fā)芽和不發(fā)芽,硬幣的正面與反面,調(diào)查棉田盲椿象為害分為受害株和不受害株等等。這類變數(shù)均屬間斷性隨機(jī)變數(shù)。為便于研究,通常將二項(xiàng)總體中的“此”事件以變量“1”表示,具概率p;將“彼”事件以變量“0”表示,具概率q。因而二項(xiàng)總體又稱為0、1總體

5、,其概率則顯然有:p+q=1或q=1-p2、 二項(xiàng)分布:從二項(xiàng)總體抽取n個(gè)個(gè)體,將有n+1種取值,這n+1種取值各有其概率,這些概率構(gòu)成的分布就是二項(xiàng)分布。例如觀察施用某種農(nóng)藥后供試5只蚜蟲的死亡數(shù)目,記“死”為0,記“活”為1,觀察結(jié)果將出現(xiàn)6種事件,它們是5只全死、4死1活、3死2活、2死2活、1死4活、5只全活、這6種事件構(gòu)成了一個(gè)完全事件系,但6個(gè)事件的概率不同,將完全事件系的總概率1分布到6個(gè)事件中去,就是所謂的概率分布。如果將活的蟲數(shù)y來代表相應(yīng)的事件,便得到了關(guān)于變量y的概率分布。下面將給出二項(xiàng)分布的概率計(jì)算方法。二、二項(xiàng)式分布的概率計(jì)算方法數(shù)學(xué)上的組合公式為:n相當(dāng)于抽樣單位數(shù)

6、,y相當(dāng)于某種事件發(fā)生的次數(shù)。因此y的概率函數(shù)為:p(y)變量y發(fā)生的概率,p為此事件發(fā)生的概率,q為彼事件發(fā)生概率例4.1棉田盲椿象為害的統(tǒng)計(jì)概率乃從調(diào)查2000株后獲得近似值p=0.35?,F(xiàn)受害株事件為A,其概率為p=0.35,未受害株事件為對(duì)立事件,其概率q=(1-0.35)=0.65。這一試驗(yàn)是可以重復(fù)的。假定做了n次試驗(yàn),即抽出n株為一個(gè)抽樣單位,那么,試問出現(xiàn)有y株是受害的,其概率應(yīng)有多少?假定n=1,即抽出一株為一個(gè)抽樣單位,那么,總體2000個(gè)單位中有多少株受害?多少株未受害?這里已知P(A)=0.35和P(A)=0.65,總體的理論次數(shù)分布則以n乘上述概率分布,即np和n(1

7、-p),所以有2000×0.35=700株受害和2000×0.65=1300株未受害。如調(diào)查5株為一個(gè)抽樣單位,即n=5,則受害株數(shù)y=0,1,2,3,4和5的概率可以計(jì)算出來,如表4.2。棉株受害數(shù)乃一隨機(jī)變數(shù)(y) ,可以計(jì)算變量y相應(yīng)的概率函數(shù)P(y=i)=Cinpiqn-i和累計(jì)函數(shù)如果每次抽5個(gè)單株,抽n=400次,則理論上我們能夠得到y(tǒng)=2的次數(shù)應(yīng)為:理論次數(shù)=400×P(2)=400×0.3364=134.56(次)對(duì)于任意y,其理論次數(shù)為:理論次數(shù)=Np(y)三、二項(xiàng)式分布的形狀和參數(shù)1、形狀:如果p=q,二項(xiàng)式分布呈對(duì)稱形狀,如果p&#

8、185;q,則表現(xiàn)為偏斜形狀,但當(dāng)n很大時(shí),即使p¹q,它也呈接近對(duì)稱形狀。2、參數(shù):凡描述一個(gè)總體分布,平均數(shù)和方差(或標(biāo)準(zhǔn)差)兩個(gè)參數(shù)是重要的。例如抽取5株中受害標(biāo)數(shù)的多少(y)作為統(tǒng)計(jì)指標(biāo)的話,從總體中可以抽取的所有樣本均有一個(gè)y, 這樣所有的y構(gòu)成了一個(gè)新總體,該總體也屬于二項(xiàng)式總體,其平均數(shù)、方差2和標(biāo)準(zhǔn)差如下式=np, 2=npq, 該總體的概率計(jì)算方法同于前述的二項(xiàng)式總體,只是由于統(tǒng)計(jì)指標(biāo)的變化,使平均數(shù)和標(biāo)準(zhǔn)差有所不同。第三節(jié) 正態(tài)分布(normal distribution)一、 正態(tài)分布的意義:正態(tài)分布是一種連續(xù)性隨機(jī)變量的理論分布,它的分布狀態(tài)是多數(shù)變量都圍繞在

9、平均值附近,從平均值到分布的兩側(cè),變量數(shù)減少。在理論和實(shí)踐問題上都具有非常重要意義??陀^世界中有許多現(xiàn)象的數(shù)據(jù)是服從正態(tài)分布的,因此我們可通過這些現(xiàn)象的樣本分布從而發(fā)現(xiàn)這些現(xiàn)象的理論分布。在適當(dāng)條件下,它可用來做二項(xiàng)分布及其它間斷性或連續(xù)性變數(shù)分布的近似分布,這樣就能用正態(tài)分布代替其它分布以計(jì)算概率和進(jìn)行統(tǒng)計(jì)推論。雖然有些總體并不做正態(tài)分布,但從總體中抽出的樣本平均數(shù)及其它一些統(tǒng)計(jì)數(shù)的分布,在樣本容量適當(dāng)大時(shí)仍然趨近正態(tài)分布,因此可用它來研究這些統(tǒng)計(jì)數(shù)的抽樣分布。二、正態(tài)分布正態(tài)分布是二項(xiàng)分布的極限分布,正態(tài)分布的概率密度函數(shù)為: y是所研究的變數(shù);fN(y)是某一定值y出現(xiàn)的函數(shù),一般稱概率

10、密度函數(shù);=3.1419;e=2.71828;為總體平均數(shù);為總體標(biāo)準(zhǔn)差。這里y是從負(fù)無窮大到正無窮大的數(shù)值區(qū)間中的一個(gè)點(diǎn),討論變量處在這個(gè)點(diǎn)的概率是沒有意義的,而且從正態(tài)總體抽取的變數(shù)資料的每一個(gè)觀察值均是從具有一定概率的數(shù)值區(qū)間中抽取的,所以討論正態(tài)變數(shù)在某一取值區(qū)間的概率才有意義。 因?yàn)椴煌傮w具不同的值和值,因此每個(gè)總體就對(duì)應(yīng)的一條正態(tài)曲線,這樣我們研究某一變量所處的概率區(qū)間時(shí)就很不方便,為簡化計(jì)算,一般以一個(gè)新變數(shù)u替代y變數(shù) 這里參數(shù)=0,2=1記作N(0,1)。各種不同平均數(shù)和標(biāo)準(zhǔn)差的正態(tài)分布均可以經(jīng)過適當(dāng)轉(zhuǎn)換用標(biāo)準(zhǔn)化分布表示出來。二、正態(tài)分布曲線的特性1、正態(tài)分布曲線是一個(gè)對(duì)稱

11、曲線,以為對(duì)稱軸,相左右兩側(cè)對(duì)稱分布。2、正態(tài)分布曲線以參數(shù)和的不同而表現(xiàn)為一系列曲線,所以它是一個(gè)曲線簇而不僅是一個(gè)曲線。3、正態(tài)分布在資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中于算術(shù)平均數(shù)附近,離相應(yīng)的次數(shù)越少;且在左右相等y-范圍內(nèi)具有相等次數(shù);在y-3以上其次數(shù)極少。4、正態(tài)曲線在y-=1處有“拐點(diǎn)”。曲線兩尾向左右伸展,永不接觸橫軸,所以當(dāng)y±,分布曲線以y 軸為漸近線,因之曲線全距從-到+。5、正態(tài)曲線與橫軸之間的總面積等于1任兩個(gè)變量u值之間概率結(jié)果均可通過查附表2計(jì)算得出,下面為幾對(duì)常見的區(qū)間與其相對(duì)應(yīng)的面積或概率的數(shù)字:區(qū)間±1 面積或概率=0.6827±

12、2 =0.9545±3 =0.9973±1.960 =0.9500±2.57 =0.9900 三、正態(tài)分布區(qū)間概率的計(jì)算方法1、 首先將變量y值轉(zhuǎn)化成u值2、 查附表即可得出相應(yīng)的區(qū)間概率下面我們以一個(gè)例題來說明求解方法假定y是一隨機(jī)變數(shù)具有正態(tài)分布,平均數(shù)=30,標(biāo)準(zhǔn)差=5,試計(jì)算小于26,小于40的概率。介乎26和40區(qū)間的概率以及大于40的概率。首先計(jì)算:P(y26)=FN(26)計(jì)算FN(26)必須先將y轉(zhuǎn)換為u值。查附表2,當(dāng)u=-0.8時(shí),F(xiàn)N(26)=0.2119,說明這一分布從-到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,y26概率為0

13、.2119.同樣計(jì)算:P(y40)=FN(40)查附表2,當(dāng)U=+0.2JF ,F(xiàn)N(40)=0.9773,這是指從-到40范圍內(nèi)的變量數(shù)占全部變量數(shù)的97.73%,或者說y40概率為 0.9773。計(jì)算:P(26y40=Fn(40)-FN(26)=0.9773-0.2119=0.7654,或者寫為(26y40=P(-0.8u2.0)=0.9773-0.2119-0.7654.計(jì)算:P(y40)=1-P(y40)=1-0.9773=0.0227第四節(jié) 抽樣分布(sampling distribution)生物統(tǒng)計(jì)學(xué)是研究樣本與總體之間關(guān)系的科學(xué)。其方法是從總體中抽取一個(gè)含有若干個(gè)個(gè)體的樣本加以

14、研究,這樣的樣本可以連續(xù)抽取幾次,抽取樣本的單位數(shù)就是試驗(yàn)的重復(fù)次數(shù)。本節(jié)重要內(nèi)容是討論衍生總體的參數(shù)與母總體參數(shù)之間的關(guān)系。 N() 體總樣 本3樣 本1樣 本2總體與樣本之間的關(guān)系可以從兩方面進(jìn)行研究統(tǒng)計(jì)推斷抽 樣總體 樣本從總體到樣本:即從一般到特殊的方向,目的是了解總體到樣本的變異特點(diǎn),研究樣本分布的形狀及其統(tǒng)計(jì)數(shù)。從樣本到總體:即從特殊到一般的方向,目的是用樣本的試驗(yàn)結(jié)果去推斷總體的特征數(shù),也就是統(tǒng)計(jì)推斷問題。一、統(tǒng)計(jì)數(shù)的抽樣及其分布參數(shù)抽樣分布:從總體中隨機(jī)抽樣得到樣本,獲得樣本觀察值后可以計(jì)算一些統(tǒng)計(jì)數(shù),統(tǒng)計(jì)數(shù)的分布稱為抽樣分布。抽樣分為復(fù)置抽樣和不復(fù)置抽樣,前者指將抽得的個(gè)體放

15、回總體后再繼續(xù)抽樣的方法,后者指將抽得的個(gè)體不放回總體而繼續(xù)進(jìn)行抽樣的方法。討論抽樣分布時(shí)考慮的是復(fù)置抽樣方法。一)樣本平均數(shù)的抽樣及其分布參數(shù)從一個(gè)總體里以一定的樣本容量進(jìn)行隨機(jī)抽樣,可以抽取許多個(gè)樣本,如果總體容量為N,樣本容量為n則能抽取Nn個(gè)樣本,求出所抽樣本的平均數(shù),那么所有樣本的平均數(shù)就組成了一個(gè)新的總體,這個(gè)新的總體稱為衍生總體,被抽總體稱為母總體。下面我們以一個(gè)實(shí)例講解衍生總體的參數(shù)與母總體的參數(shù)之間的關(guān)系。樣本平均數(shù)衍生總體的平均數(shù)用表示,方差用表示,標(biāo)準(zhǔn)差用表示。例:現(xiàn)有一總體,觀察值為2、4、6,分別以樣本容量n=1,n=2,n=3,從總體中進(jìn)行復(fù)置抽樣,試分析衍生總體參

16、數(shù)與母總體參數(shù)之間的關(guān)系。首先我們計(jì)算母總體的參數(shù)從母總體中以樣本容量n=1進(jìn)行抽樣: 從母總體中以樣本容量n=2進(jìn)行抽樣:得到樣本9個(gè):2,2 4,2 4,22,4 4,4 4,42,6 4,6 4,6 f2 13 24 35 26 1 從母總體中以樣本容量n=3進(jìn)行抽樣:得到樣本27個(gè):2: 2,2,2 8/3: 2,4,2 2,2,4 4,2,210/3: 2,6,2 2,2,6 6,2,2 4,4,2 4,2,4 2,4,44: 2,4,6 2,6,4 4,2,6 4,6,2 6,2,4 6,4,2 4,4,4 14/3: 6,4,4 4,6,4 4,4,6 6,6,2 6,2,6 2

17、,6,2 16/3: 6,4,6 6,6,4 4,6,6 6:6,6,6 從上我們可以看出,衍生總體的平均數(shù)和方差與母總體的平均數(shù)和方差有如下關(guān)系: 由于總體的平均數(shù)和方差往往是未知的,因此我們一般用樣本的平均數(shù)和方差來作為總體平均數(shù)和方差的估計(jì)值,因此可進(jìn)一步推出: (二)兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)如果從一個(gè)總體隨機(jī)地抽取一個(gè)樣本容量為n1,同時(shí)隨機(jī)獨(dú)立地從另一個(gè)總體抽取一個(gè)樣本容量為n2的樣本,那么可以得到分別屬于兩個(gè)總體的樣本,這兩個(gè)樣本的平均數(shù)作和表示。設(shè)這兩個(gè)樣本所來自的兩個(gè)總體的平均數(shù)分別為1和2,它們的方差分別為。和22。兩個(gè)獨(dú)立隨機(jī)抽取的樣本平均數(shù)間差數(shù)()的

18、抽樣分布參數(shù)與兩個(gè)母總體間存在如下關(guān)系:(1) 該抽樣分布的平均數(shù)y1-y2與母總體的平均數(shù)之差相等。 (2) 該抽樣分布的方差y12-y2與母總體方差的關(guān)系為 二、正態(tài)總體抽樣的分布規(guī)律 前面介紹了統(tǒng)計(jì)數(shù)抽樣分布的主要特征及其和母總體特征數(shù)間的關(guān)系,以下將討論統(tǒng)計(jì)數(shù)抽樣分布的規(guī)律。一)樣本平均數(shù)的分布定理1:若母總體呈正態(tài)分布,從母總體中抽出的樣本,不論其樣本容量大小,由樣本平均數(shù)構(gòu)成的衍生總體,也呈正態(tài)分布。定理2:中心極限定理:母總體的分布不呈正態(tài)分布,但只要樣本容量足夠大(n>30),樣本平均數(shù)的分布也趨近于正態(tài)分布。作用:這個(gè)定理很重要,因?yàn)槲覀兺磺宄闃涌傮w的性質(zhì),有了這個(gè)定理,就可通過增大樣本容量的方法,使衍生總體呈正態(tài)分布,從而可以利用以正態(tài)分布為前題的統(tǒng)計(jì)方法進(jìn)行抽樣估計(jì)或假設(shè)測(cè)驗(yàn),使問題簡化。如已知 求=10-16的概率?首先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論