抽樣分布與參數(shù)估計課件_第1頁
抽樣分布與參數(shù)估計課件_第2頁
抽樣分布與參數(shù)估計課件_第3頁
抽樣分布與參數(shù)估計課件_第4頁
抽樣分布與參數(shù)估計課件_第5頁
已閱讀5頁,還剩235頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第4章統(tǒng)計學(xué)抽樣分布與參數(shù)估計第4章統(tǒng)計學(xué)抽樣分布與參數(shù)估計1學(xué)習(xí)目標(biāo)掌握隨機(jī)試驗、事件和概率的概念及性質(zhì)理解隨機(jī)變量及其分布,計算各種分布的概率理解抽樣分布與總體分布的關(guān)系掌握總體均值、總體比例和總體方差的區(qū)間估計學(xué)習(xí)目標(biāo)掌握隨機(jī)試驗、事件和概率的概念及性質(zhì)2第一節(jié)概率與概率分布概率基礎(chǔ)隨機(jī)變量及其分布第一節(jié)概率與概率分布3隨機(jī)事件的基本概念1.隨即試驗:在相同條件下,對事物或現(xiàn)象所進(jìn)行的觀察2.事件:隨機(jī)試驗的每一個可能結(jié)果(任何樣本點集合)隨機(jī)事件的基本概念1.隨即試驗:4事件與樣本空間基本事件一個不可能再分的隨機(jī)事件例如:擲一枚骰子出現(xiàn)的點數(shù)樣本空間一個試驗中所有基本事件的集合,用表示例如:在擲枚骰子的試驗中,{1,2,3,4,5,6}在投擲硬幣的試驗中,{正面,反面}事件與樣本空間基本事件5事件的關(guān)系和運算事件的包含事件的并或和事件的交或積互斥事件事件的逆事件的差事件的關(guān)系和運算事件的包含6事件的關(guān)系和運算

(事件的性質(zhì))設(shè)A、B、C為三個事件,則有交換律:A∪B=B∪A

A∩B=B∩A結(jié)合律:A∪(B∪C)=(A∪B)∪CA(BC)

=(AB)C分配律:A∪(B∩C)=(A∪B)∩(A∪C)A∩(B∪C)=(A∩B)∪(A∩C)事件的關(guān)系和運算

(事件的性質(zhì))設(shè)A、B、C為三個事件,7事件的概率事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一種度量表示事件A出現(xiàn)可能性大小的數(shù)值事件A的概率表示為P(A)概率的定義有:古典定義、統(tǒng)計定義和主觀概率定義事件的概率事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一8事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右試驗的次數(shù)正面/試驗次數(shù)1.000.000.250.500.750255075100125事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,試驗的9概率的古典定義如果某一隨機(jī)試驗的結(jié)果有限,而且各個結(jié)果在每次試驗中出現(xiàn)的可能性相同,則事件A發(fā)生的概率為該事件所包含的基本事件個數(shù)m與樣本空間中所包含的基本事件個數(shù)n的比值,記為概率的古典定義如果某一隨機(jī)試驗的結(jié)果有限,而且各個結(jié)果10概率的古典定義

(實例)【例】某鋼鐵公司所屬三個工廠的職工人數(shù)如下表。從該公司中隨機(jī)抽取1人,問:(1)該職工為男性的概率(2)該職工為煉鋼廠職工的概率某鋼鐵公司所屬企業(yè)職工人數(shù)工廠男職工女職工合計煉鋼廠煉鐵廠軋鋼廠4000320090018001600600620048001500合計8500400012500概率的古典定義

(實例)【例】某鋼鐵公司所屬三個工廠的職工人11概率的古典定義

(計算結(jié)果)解:(1)用A表示“抽中的職工為男性”這一事件;A為全公司男職工的集合;基本空間為全公司職工的集合。則(2)用B表示“抽中的職工為煉鋼廠職工”;B為煉鋼廠全體職工的集合;基本空間為全體職工的集合。則概率的古典定義

(計算結(jié)果)解:(1)用A表示“抽中的職12概率的統(tǒng)計定義在相同條件下進(jìn)行n次隨機(jī)試驗,事件A出現(xiàn)m次,則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)P上下擺動,且波動的幅度逐漸減小,取向于穩(wěn)定,這個頻率的穩(wěn)定值即為事件A的概率,記為概率的統(tǒng)計定義在相同條件下進(jìn)行n次隨機(jī)試驗,事件A出現(xiàn)13概率的統(tǒng)計定義

(實例)【例】:某工廠為節(jié)約用電,規(guī)定每天的用電量指標(biāo)為1000度。按照上個月的用電記錄,30天中有12天的用電量超過規(guī)定指標(biāo),若第二個月仍沒有具體的節(jié)電措施,試問該廠第一天用電量超過指標(biāo)的概率。解:上個月30天的記錄可以看作是重復(fù)進(jìn)行了30次試驗,試驗A表示用電超過指標(biāo)出現(xiàn)了12次。根據(jù)概率的統(tǒng)計定義有概率的統(tǒng)計定義

(實例)【例】:某工廠為節(jié)約用電,規(guī)定每天14主觀概率定義對一些無法重復(fù)的試驗,確定其結(jié)果的概率只能根據(jù)以往的經(jīng)驗人為確定概率是一個決策者對某事件是否發(fā)生,根據(jù)個人掌握的信息對該事件發(fā)生可能性的判斷例如,我認(rèn)為2001年的中國股市是一個盤整年主觀概率定義對一些無法重復(fù)的試驗,確定其結(jié)果的概率只能根據(jù)以15概率的性質(zhì)非負(fù)性對任意事件A,有0P1規(guī)范性必然事件的概率為1;不可能事件的概率為0。即P()=1;P()=0可加性若A與B互斥,則P(A∪B)=P(A)+P(B)推廣到多個兩兩互斥事件A1,A2,…,An,有P

(A1∪A2

∪…∪An)=P(A1

)+P(A2

)+…+P(An

)概率的性質(zhì)非負(fù)性16隨機(jī)變量及其分布一.隨機(jī)變量的概念離散型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布隨機(jī)變量及其分布一.隨機(jī)變量的概念17隨機(jī)變量的概念一次試驗的結(jié)果的數(shù)值性描述一般用X、Y、Z來表示例如:投擲兩枚硬幣出現(xiàn)正面的數(shù)量根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量隨機(jī)變量的概念一次試驗的結(jié)果的數(shù)值性描述18離散型隨機(jī)變量隨機(jī)變量X取有限個值或所有取值都可以逐個列舉出來X1,X2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗隨機(jī)變量可能的取值抽查100個產(chǎn)品一家餐館營業(yè)一天電腦公司一個月的銷售銷售一輛汽車取到次品的個數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1離散型隨機(jī)變量隨機(jī)變量X取有限個值或所有取值都可以逐個列19連續(xù)型隨機(jī)變量隨機(jī)變量X取無限個值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點連續(xù)型隨機(jī)變量的一些例子試驗隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個產(chǎn)品的長度使用壽命(小時)半年后工程完成的百分比測量誤差(cm)X00

X100X0連續(xù)型隨機(jī)變量隨機(jī)變量X取無限個值試驗隨機(jī)變量可能的取值20離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布21離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率通常用下面的表格來表示X=xix1,x2

,…,xnP(X=xi)=pip1,p2

,…,pn

P(X=xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)pi00離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值X22離散型隨機(jī)變量的概率分布

(實例)【例】如規(guī)定打靶中域Ⅰ得3分,中域Ⅱ得2分,中域Ⅲ得1分,中域外得0分。今某射手每100次射擊,平均有30次中域Ⅰ,55次中域Ⅱ,10次中Ⅲ,5次中域外。則考察每次射擊得分為0,1,2,3這一離散型隨機(jī)變量,其概率分布為X=xi0123P(X=xi)pi0.050.100.550.30離散型隨機(jī)變量的概率分布

(實例)【例】如規(guī)定打靶中域Ⅰ得323離散型隨機(jī)變量的概率分布

(0—1分布)一個離散型隨機(jī)變量X只取兩個可能的值例如,男性用1表示,女性用0表示;合格品用1表示,不合格品用0表示列出隨機(jī)變量取這兩個值的概率離散型隨機(jī)變量的概率分布

(0—1分布)一個離散型隨機(jī)變量X24離散型隨機(jī)變量的概率分布

(0—1分布實例)【例】已知一批產(chǎn)品的次品率為p=0.05,合格率為q=1-p=1-0.5=0.95。并指定廢品用1表示,合格品用0表示。則任取一件為廢品或合格品這一離散型隨機(jī)變量,其概率分布為X=xi01P(X=xi)=pi0.050.950.5011xP(x)離散型隨機(jī)變量的概率分布

(0—1分布實例)【例】已知一批產(chǎn)25離散型隨機(jī)變量的概率分布

(均勻分布)一個離散型隨機(jī)變量取各個值的概率相同列出隨機(jī)變量取值及其取值的概率例如,投擲一枚骰子,出現(xiàn)的點數(shù)及其出現(xiàn)各點的概率離散型隨機(jī)變量的概率分布

(均勻分布)一個離散型隨機(jī)變量取各26離散型隨機(jī)變量的概率分布

(均勻分布實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)是個離散型隨機(jī)變量,其概率分布為X=xi123456P(X=xi)=pi1/61/61/61/61/61/601/6P(x)1x23456離散型隨機(jī)變量的概率分布

(均勻分布實例)【例】投擲一枚骰子27離散型隨機(jī)變量的數(shù)學(xué)期望在離散型隨機(jī)變量X的一切可能取值的完備組中,各可能取值xi與其取相對應(yīng)的概率pi乘積之和描述離散型隨機(jī)變量取值的集中程度計算公式為離散型隨機(jī)變量的數(shù)學(xué)期望在離散型隨機(jī)變量X的一切可能取值的完28離散型隨機(jī)變量的方差隨機(jī)變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為D(X)描述離散型隨機(jī)變量取值的分散程度計算公式為離散型隨機(jī)變量的方差隨機(jī)變量X的每一個取值與期望值的離差平方29離散型隨機(jī)變量的方差

(實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)是個離散型隨機(jī)變量,其概率分布為如下。計算數(shù)學(xué)期望和方差X=xi123456P(X=xi)=pi1/61/61/61/61/61/6解:數(shù)學(xué)期望為:方差為:離散型隨機(jī)變量的方差

(實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)30常見的離散型概率分布超幾何分布離散型隨機(jī)變量的概率分布泊松分布二項分布常見的離散型概率分布超幾何分布離散型隨機(jī)變量的概率分布泊松分31連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布32連續(xù)型隨機(jī)變量的概率分布指數(shù)分布連續(xù)型隨機(jī)變量的概率分布正態(tài)分布均勻分布其他分布連續(xù)型隨機(jī)變量的概率分布指數(shù)分布連續(xù)型隨機(jī)變量的概率分布正態(tài)33連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用數(shù)學(xué)函數(shù)的形式和分布函數(shù)的形式來描述連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實34概率密度函數(shù)設(shè)X為一連續(xù)型隨機(jī)變量,x為任意實數(shù),X的概率密度函數(shù)記為f(x),它滿足條件

f(x)不是概率概率密度函數(shù)設(shè)X為一連續(xù)型隨機(jī)變量,x為任意實數(shù),X的概率35概率密度函數(shù)密度函數(shù)f(x)表示X的所有取值x及其頻數(shù)f(x)值(值,頻數(shù))頻數(shù)f(x)abx概率密度函數(shù)密度函數(shù)f(x)表示X的所有取值x及36概率密度函數(shù)在平面直角坐標(biāo)系中畫出f(x)的圖形,則對于任何實數(shù)x1

<x2,P(x1<Xx2)是該曲線下從x1

到x2的面積f(x)xab概率是曲線下的面積概率密度函數(shù)在平面直角坐標(biāo)系中畫出f(x)的圖形,則對37分布函數(shù)連續(xù)型隨機(jī)變量的概率也可以用分布函數(shù)F(x)來表示分布函數(shù)定義為根據(jù)分布函數(shù),P(a<X<b)可以寫為分布函數(shù)連續(xù)型隨機(jī)變量的概率也可以用分布函數(shù)F(x)來表示根38分布函數(shù)與密度函數(shù)的圖示密度函數(shù)曲線下的面積等于1分布函數(shù)是曲線下小于x0的面積f(x)xx0F(x0

)分布函數(shù)與密度函數(shù)的圖示密度函數(shù)曲線下的面積等于1f(x)x39連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的數(shù)學(xué)期望為方差為連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的數(shù)學(xué)期望為40正態(tài)分布正態(tài)分布41正態(tài)分布的重要性1. 描述連續(xù)型隨機(jī)變量的最重要的分布2. 可用于近似離散型隨機(jī)變量的分布例如:二項分布3. 經(jīng)典統(tǒng)計推斷的基礎(chǔ)xf(x)正態(tài)分布的重要性1. 描述連續(xù)型隨機(jī)變量的最重要的分布xf42概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)=總體方差

=3.14159;e=2.71828x=隨機(jī)變量的取值(-<x<)

=總體均值概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)43正態(tài)分布函數(shù)的性質(zhì)概率密度函數(shù)在x的上方,即f(x)>0正態(tài)曲線的最高點在均值,它也是分布的中位數(shù)和眾數(shù)正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值的標(biāo)準(zhǔn)差來區(qū)分。決定曲線的高度,決定曲線的平緩程度,即寬度曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠(yuǎn)不會與橫軸相交正態(tài)曲線下的總面積等于1隨機(jī)變量的概率由曲線下的面積給出正態(tài)分布函數(shù)的性質(zhì)概率密度函數(shù)在x的上方,即f(x)>044

和對正態(tài)曲線的影響xf(x)CAB和對正態(tài)曲線的影響xf(x)CAB45正態(tài)分布的概率概率是曲線下的面積!abxf(x)正態(tài)分布的概率概率是曲線下的面積!abxf(x)46標(biāo)準(zhǔn)正態(tài)分布的重要性一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差計算概率時,每一個正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的若能將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計算概率時只需要查一張表標(biāo)準(zhǔn)正態(tài)分布的重要性一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差47標(biāo)準(zhǔn)正態(tài)分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)任何一個一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)任何一個一般的正48標(biāo)準(zhǔn)正態(tài)分布xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布49標(biāo)準(zhǔn)正態(tài)分布表的使用將一個一般的轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布計算概率時,查標(biāo)準(zhǔn)正態(tài)概率分布表對于負(fù)的x,可由(-x)x得到對于標(biāo)準(zhǔn)正態(tài)分布,即X~N(0,1),有P(aXb)baP(|X|a)2a1對于一般正態(tài)分布,即X~N(,),有標(biāo)準(zhǔn)正態(tài)分布表的使用將一個一般的轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布50標(biāo)準(zhǔn)化的例子

P(5X6.2)

x=5=10一般正態(tài)分布6.2=1Z標(biāo)準(zhǔn)正態(tài)分布00.12.0478標(biāo)準(zhǔn)化的例子

P(5X6.2)x=551標(biāo)準(zhǔn)化的例子

P(2.9X7.1)

一般正態(tài)分布.1664.0832.0832標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)化的例子

P(2.9X7.1)一般正態(tài)分52正態(tài)分布

(實例)【例】設(shè)X~N(5,32),求以下概率(1)P(X

10);(2)P(2<X

<10)解:(1)(2)正態(tài)分布

(實例)【例】設(shè)X~N(5,32),求以下概率(253為什么概率是近似的.0.1.2.30246810xP(x)正態(tài)曲線增加的概率正態(tài)曲線減少的概率二項概率:矩形的面積正態(tài)概率:曲線下從3.5到4.5的面積增加的部分與減少的部分不一定相等為什么概率是近似的.0.1.2.30246810xP(x)正54總體、個體和樣本

(概念要點)總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個體(Itemunit):組成總體的每個元素樣本(Sample):從總體中所抽取的部分個體樣本容量(Samplesize):樣本中所含個體的數(shù)量總體、個體和樣本

(概念要點)總體(Population)55抽樣方法

(概念要點)概率抽樣:根據(jù)已知的概率選取樣本

簡單隨機(jī)抽樣:完全隨機(jī)地抽選樣本

分層抽樣:總體分成不同的“層”,然后在每一層內(nèi)進(jìn)行抽樣

整群抽樣:將一組被調(diào)查者(群)作為一個抽樣單位

等距抽樣:在樣本框中每隔一定距離抽選一個被調(diào)查者非概率抽樣:不是完全按隨機(jī)原則選取樣本

非隨機(jī)抽樣:由調(diào)查人員自由選取被調(diào)查者

判斷抽樣:通過某些條件過濾來選擇被調(diào)查者配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者抽樣方法

(概念要點)概率抽樣:根據(jù)已知的概率選取樣本56所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計量樣本均值,樣本比例等結(jié)果來自容量相同的所有可能樣本 抽樣分布

(概念要點)所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布57樣本均值的抽樣分布

(一個例子)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3樣本均值的抽樣分布

(一個例子)【例】設(shè)一個總體,含有4個元58樣本均值的抽樣分布

(一個例子)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布

(一個例子)現(xiàn)從總體中抽取n=2的59樣本均值的抽樣分布

(一個例子)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x樣本均值的抽樣分布

(一個例子)計算出各樣本的均值,如60所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n所有樣本均值的均值和方差式中:M為樣本數(shù)目61樣本均值的分布與總體分布的比較抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較抽樣分布=2.5總62樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)樣本均值的抽樣分布

與中心極限定理=50=10X總63中心極限定理

(圖示)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X中心極限定理

(圖示)當(dāng)樣本容量足夠大時(n30),64樣本方差的抽樣分布樣本方差的抽樣分布65樣本方差的分布設(shè)總體服從正態(tài)分布N~(μ,σ2),X1,X2,…,Xn為來自該正態(tài)總體的樣本,則樣本方差s2

的分布為將2(n–1)稱為自由度為(n-1)的卡方分布樣本方差的分布設(shè)總體服從正態(tài)分布N~(μ,σ2),66卡方(c2)分布

選擇容量為n的簡單隨機(jī)樣本計算樣本方差S2計算卡方值2=(n-1)S2/σ2計算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體卡方(c2)分布選擇容量為n的計算卡方值計算出所有的67均值的標(biāo)準(zhǔn)誤所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所有樣本均值的離散程度小于總體標(biāo)準(zhǔn)差計算公式為均值的標(biāo)準(zhǔn)誤所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所有樣本均值的離68第二節(jié)參數(shù)估計基本方法一.點估計二.點估計的優(yōu)良性準(zhǔn)則區(qū)間估計第二節(jié)參數(shù)估計基本方法一.點估計69參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計70被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體均值比例方差兩個總體均值之差比例之差方差比被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體71點估計點估計72點估計

(概念要點)從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如:用樣本均值作為總體未知均值的估計值就是一個點估計2. 點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等點估計

(概念要點)從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量731. 用于估計總體某一參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本中位數(shù)等例如:樣本均值就是總體均值的一個估計量如果樣本均值x

=3,則3就是的估計值理論基礎(chǔ)是抽樣分布估計量

(概念要點)二戰(zhàn)中的點估計1. 用于估計總體某一參數(shù)的隨機(jī)變量估計量

(概念要點)二74估計量的優(yōu)良性準(zhǔn)則

(無偏性)無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)P(X)XCA無偏有偏估計量的優(yōu)良性準(zhǔn)則

(無偏性)無偏性:估計量的數(shù)學(xué)期望等于被75估計量的優(yōu)良性準(zhǔn)則

(有效性)AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量相比,樣本均值是一個更有效的估計量估計量的優(yōu)良性準(zhǔn)則

(有效性)AB中位數(shù)的抽樣分布均值的抽76估計量的優(yōu)良性準(zhǔn)則

(一致性)一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X估計量的優(yōu)良性準(zhǔn)則

(一致性)一致性:隨著樣本容量的增大,估77區(qū)間估計區(qū)間估計78區(qū)間估計

(概念要點)1. 根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在50~70之間,置信度為95%樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限區(qū)間估計

(概念要點)1. 根據(jù)一個樣本的觀察值給出總體參數(shù)79置信區(qū)間估計

(內(nèi)容)2已知2未知均值方差比例置信區(qū)間置信區(qū)間估計

(內(nèi)容)2已知2未知均值方差比80落在總體均值某一區(qū)間內(nèi)的樣本x_XX=Zx95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x落在總體均值某一區(qū)間內(nèi)的樣本x_XX=Zx81總體未知參數(shù)落在區(qū)間內(nèi)的概率表示為(1-為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的顯著性水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平總體未知參數(shù)落在區(qū)間內(nèi)的概率置信水平82區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了%的區(qū)間未包含1-aa/2a/2區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了83影響區(qū)間寬度的因素1. 數(shù)據(jù)的離散程度,用來測度樣本容量,3. 置信水平(1-),影響Z的大小影響區(qū)間寬度的因素1. 數(shù)據(jù)的離散程度,用來測度84第三節(jié)總體均值和總體比例

的區(qū)間估計一.總體均值的區(qū)間估計二.總體比例的區(qū)間估計樣本容量的確定第三節(jié)總體均值和總體比例

85總體均值的區(qū)間估計

(2已知)總體均值的區(qū)間估計

(2已知)86總體均值的置信區(qū)間

(2已知)1. 假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計量Z總體均值在1-置信水平下的置信區(qū)間為總體均值的置信區(qū)間

(2已知)1. 假定條件總體均值87總體均值的區(qū)間估計

(正態(tài)總體:實例)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長度在21.302~21.498mm之間【例】某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽?。辜?,測得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差

=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95??傮w均值的區(qū)間估計

(正態(tài)總體:實例)解:已知X~N(,088總體均值的區(qū)間估計

(非正態(tài)總體:實例)解:已知x=26,=6,n=100,1-=0.95,Z/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時間在24.824~27.176分鐘之間【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36小時)??傮w均值的區(qū)間估計

(非正態(tài)總體:實例)解:已知x=2689總體均值的區(qū)間估計

(2未知)總體均值的區(qū)間估計

(2未知)90總體均值的置信區(qū)間

(2未知)1. 假定條件總體方差(2)未知總體必須服從正態(tài)分布使用t分布統(tǒng)計量3.總體均值在1-置信水平下的置信區(qū)間為總體均值的置信區(qū)間

(2未知)1. 假定條件3.總91總體均值的區(qū)間估計

(實例)解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我們可以95%的概率保證總體均值在46.69~53.30之間【例】從一個正態(tài)總體中抽取一個隨機(jī)樣本,n=25,其均值`x=

50,標(biāo)準(zhǔn)差s=8。建立總體均值m的95%的置信區(qū)間??傮w均值的區(qū)間估計

(實例)解:已知X~N(,2),x92總體比例的區(qū)間估計總體比例的區(qū)間估計93總體比例的置信區(qū)間1. 假定條件兩類結(jié)果總體服從二項分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量Z3.總體比例P

的置信區(qū)間為總體比例的置信區(qū)間1. 假定條件3.總體比例P的置信94總體比例的置信區(qū)間

(實例)解:已知n=200,=0.7,n=140>5,n(1-)=60>5,=0.95,Z/2=1.96p

p

p

我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了200人組成一個樣本。在對其進(jìn)行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間??傮w比例的置信區(qū)間

(實例)解:已知n=200,=0.95樣本容量的確定樣本容量的確定96根據(jù)均值區(qū)間估計公式可得樣本容量n為估計總體均值時樣本容量的確定樣本容量n與總體方差2、允許誤差、可靠性系數(shù)Z之間的關(guān)系為與總體方差成正比與允許誤差成反比與可靠性系數(shù)成正比其中:根據(jù)均值區(qū)間估計公式可得樣本容量n為估計總體均值時樣本容量的97樣本容量的確定

(實例)解:已知2=1800000,=0.05,Z/2=1.96,=500

應(yīng)抽取的樣本容量為【例】一家廣告公想估計某類商店去年所花的平均廣告費用有多少。經(jīng)驗表明,總體方差約為1800000元。如置信度取95%,并要使估計處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?樣本容量的確定

(實例)解:已知2=1800000,=098根據(jù)比例區(qū)間估計公式可得樣本容量n為估計總體比例時樣本容量的確定若總體比例P未知時,可用樣本比例來代替

p^其中:根據(jù)比例區(qū)間估計公式可得樣本容量n為估計總體比例時樣本容量的99樣本容量的確定

(實例)【例】一家市場調(diào)研公司想估計某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對比例p的估計誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計值)。解:

已知=0.05,=0.05,Z/2=1.96,當(dāng)p未知時用最大方差0.25代替^應(yīng)抽取的樣本容量為樣本容量的確定

(實例)【例】一家市場調(diào)研公司想估計某地區(qū)有100抽樣設(shè)計抽樣設(shè)計101類型抽樣(分類抽樣)

先對總體各單位按一定標(biāo)志加以分類(層),然后再從各類(層)中按隨機(jī)原則抽取樣本,組成一個總的樣本。

類型抽樣(分類抽樣)先對總體各單位按一定標(biāo)志加以分類(102類型的劃分:一是必須有清楚的劃類界限;二是必須知道各類中的單位數(shù)目和比例;三是分類型的數(shù)目不宜太多。類型抽樣(分類抽樣)類型的劃分:一是必須有清楚的劃類界限;類型抽樣(分類抽樣)103類型抽樣的優(yōu)點是:

樣本代表性高、抽樣誤差小、抽樣調(diào)查成本較低。如果抽樣誤差的要求相同的話則抽樣數(shù)目可以減少。類型抽樣(分類抽樣)類型抽樣的優(yōu)點是:樣本代表性高、抽樣誤差小、抽樣調(diào)查成本104兩種類型:1.等比例類型抽樣(類型比例抽樣);2.不等比例類型抽樣(類型適宜抽樣)。類型抽樣(分類抽樣)兩種類型:1.等比例類型抽樣(類型比例抽樣);2.不等比例類105類型抽樣重復(fù)抽樣:不重復(fù)抽樣:類型抽樣(分類抽樣)類型抽樣重復(fù)抽樣:不重復(fù)抽樣:類型抽樣(分類抽樣)106整群抽樣

整群抽樣即從全及總體中成群地抽取樣本單位,對抽中的群內(nèi)的所有單位都進(jìn)行觀察。

整群抽樣的好處:組織工作比較簡單方便,適用于一些特殊的研究對象。其不足之處是,一般比其它抽樣方式的抽樣誤差大。整群抽樣 整群抽樣即從全及總體中成群地抽取樣本單位,對1071.若按無關(guān)標(biāo)志排隊公式用以上純隨機(jī)抽樣的公式,一般采用不重復(fù)抽樣公式:整群抽樣

1.若按無關(guān)標(biāo)志排隊公式用以上純隨機(jī)抽樣的公式,一般采用整群1082.若按有關(guān)標(biāo)志排隊公式用類型抽樣的公式:整群抽樣

2.若按有關(guān)標(biāo)志排隊公式用類型抽樣的公式:整群抽樣109六、整群抽樣的抽樣平均誤差

整群抽樣的抽樣平均誤差受三個因素影響:(1)抽出的群數(shù)(r)多少(反比關(guān)系)(2)群間方差()(正比關(guān)系)整群抽樣

六、整群抽樣的抽樣平均誤差整群抽樣的抽樣平均誤差受三個因素110計算方法如下:整群抽樣

計算方法如下:整群抽樣111(3)抽樣方法

整群抽樣

(3)抽樣方法整群抽樣112假如某一機(jī)器大量生產(chǎn)某一種零件,現(xiàn)每隔一小時抽取5分鐘產(chǎn)品進(jìn)行檢驗,用以檢查產(chǎn)品的合格率,檢查結(jié)果如下:合格率群數(shù)rpipir80%20.801.6-0.09960.0198485%40.853.4-0.04960.0098490%120.9010.80.0004…(太小不計)95%30.952.850.05040.0076298%30.982.940.08040.01939合計24-21.59-0.05669例整群抽樣

假如某一機(jī)器大量生產(chǎn)某一種零件,現(xiàn)每隔一小時抽取5分鐘產(chǎn)113多階段抽樣

即把抽樣本單位的過程分為兩個或幾個階段來進(jìn)行。(如果一次就直接抽選出具體樣本單位,這叫單階段抽樣)具體講:①先抽大單位(可以用類型抽樣或機(jī)械抽樣),②再在大單位中抽小單位(可用整群抽樣或簡單隨機(jī)抽),③小單位中再抽更小的單位;而不是一次就直接抽取基層的調(diào)查單位。多階段抽樣即把抽樣本單位的過程分為兩個或幾個階段來進(jìn)行114多階段抽樣的抽樣平均誤差

以兩階段抽樣為例設(shè)總體分R組,每組包含個單位,若各組相等,則在抽樣第一階段,從R組中抽出r組;在抽樣第二階段,在中選的r組中隨機(jī)抽選個單位,若各組m相等,則n=rm多階段抽樣

多階段抽樣的抽樣平均誤差以兩階段抽樣為例設(shè)總體分R組,每組115則:在重復(fù)抽樣下在不重復(fù)抽樣下多階段抽樣

則:在重復(fù)抽樣下在不重復(fù)抽樣下多階段抽樣116設(shè)某大學(xué)在學(xué)期初對學(xué)生進(jìn)行體重抽樣調(diào)查,先從全校80個班以不重復(fù)抽樣方法隨機(jī)抽取8個班,然后再從抽取的班中再分別抽取10個人作為第二階段抽樣單位。計算所得的抽樣平均體重為60.5千克,抽樣各班內(nèi)方差平均數(shù)為50,各班之間體重方差為22。

假設(shè)全校各班均為40人。試以94.45%(t=2)的概率,推斷該校學(xué)生平均體重的范圍。多階段抽樣

例:設(shè)某大學(xué)在學(xué)期初對學(xué)生進(jìn)行體重抽樣調(diào)查,先從全校80117已知:解:多階段抽樣

已知:解:多階段抽樣118以上抽樣平均誤差的公式歸納如下:多階段抽樣

以上抽樣平均誤差的公式歸納如下:多階段抽樣119結(jié)束結(jié)束120第4章統(tǒng)計學(xué)抽樣分布與參數(shù)估計第4章統(tǒng)計學(xué)抽樣分布與參數(shù)估計121學(xué)習(xí)目標(biāo)掌握隨機(jī)試驗、事件和概率的概念及性質(zhì)理解隨機(jī)變量及其分布,計算各種分布的概率理解抽樣分布與總體分布的關(guān)系掌握總體均值、總體比例和總體方差的區(qū)間估計學(xué)習(xí)目標(biāo)掌握隨機(jī)試驗、事件和概率的概念及性質(zhì)122第一節(jié)概率與概率分布概率基礎(chǔ)隨機(jī)變量及其分布第一節(jié)概率與概率分布123隨機(jī)事件的基本概念1.隨即試驗:在相同條件下,對事物或現(xiàn)象所進(jìn)行的觀察2.事件:隨機(jī)試驗的每一個可能結(jié)果(任何樣本點集合)隨機(jī)事件的基本概念1.隨即試驗:124事件與樣本空間基本事件一個不可能再分的隨機(jī)事件例如:擲一枚骰子出現(xiàn)的點數(shù)樣本空間一個試驗中所有基本事件的集合,用表示例如:在擲枚骰子的試驗中,{1,2,3,4,5,6}在投擲硬幣的試驗中,{正面,反面}事件與樣本空間基本事件125事件的關(guān)系和運算事件的包含事件的并或和事件的交或積互斥事件事件的逆事件的差事件的關(guān)系和運算事件的包含126事件的關(guān)系和運算

(事件的性質(zhì))設(shè)A、B、C為三個事件,則有交換律:A∪B=B∪A

A∩B=B∩A結(jié)合律:A∪(B∪C)=(A∪B)∪CA(BC)

=(AB)C分配律:A∪(B∩C)=(A∪B)∩(A∪C)A∩(B∪C)=(A∩B)∪(A∩C)事件的關(guān)系和運算

(事件的性質(zhì))設(shè)A、B、C為三個事件,127事件的概率事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一種度量表示事件A出現(xiàn)可能性大小的數(shù)值事件A的概率表示為P(A)概率的定義有:古典定義、統(tǒng)計定義和主觀概率定義事件的概率事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一128事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右試驗的次數(shù)正面/試驗次數(shù)1.000.000.250.500.750255075100125事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,試驗的129概率的古典定義如果某一隨機(jī)試驗的結(jié)果有限,而且各個結(jié)果在每次試驗中出現(xiàn)的可能性相同,則事件A發(fā)生的概率為該事件所包含的基本事件個數(shù)m與樣本空間中所包含的基本事件個數(shù)n的比值,記為概率的古典定義如果某一隨機(jī)試驗的結(jié)果有限,而且各個結(jié)果130概率的古典定義

(實例)【例】某鋼鐵公司所屬三個工廠的職工人數(shù)如下表。從該公司中隨機(jī)抽取1人,問:(1)該職工為男性的概率(2)該職工為煉鋼廠職工的概率某鋼鐵公司所屬企業(yè)職工人數(shù)工廠男職工女職工合計煉鋼廠煉鐵廠軋鋼廠4000320090018001600600620048001500合計8500400012500概率的古典定義

(實例)【例】某鋼鐵公司所屬三個工廠的職工人131概率的古典定義

(計算結(jié)果)解:(1)用A表示“抽中的職工為男性”這一事件;A為全公司男職工的集合;基本空間為全公司職工的集合。則(2)用B表示“抽中的職工為煉鋼廠職工”;B為煉鋼廠全體職工的集合;基本空間為全體職工的集合。則概率的古典定義

(計算結(jié)果)解:(1)用A表示“抽中的職132概率的統(tǒng)計定義在相同條件下進(jìn)行n次隨機(jī)試驗,事件A出現(xiàn)m次,則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)P上下擺動,且波動的幅度逐漸減小,取向于穩(wěn)定,這個頻率的穩(wěn)定值即為事件A的概率,記為概率的統(tǒng)計定義在相同條件下進(jìn)行n次隨機(jī)試驗,事件A出現(xiàn)133概率的統(tǒng)計定義

(實例)【例】:某工廠為節(jié)約用電,規(guī)定每天的用電量指標(biāo)為1000度。按照上個月的用電記錄,30天中有12天的用電量超過規(guī)定指標(biāo),若第二個月仍沒有具體的節(jié)電措施,試問該廠第一天用電量超過指標(biāo)的概率。解:上個月30天的記錄可以看作是重復(fù)進(jìn)行了30次試驗,試驗A表示用電超過指標(biāo)出現(xiàn)了12次。根據(jù)概率的統(tǒng)計定義有概率的統(tǒng)計定義

(實例)【例】:某工廠為節(jié)約用電,規(guī)定每天134主觀概率定義對一些無法重復(fù)的試驗,確定其結(jié)果的概率只能根據(jù)以往的經(jīng)驗人為確定概率是一個決策者對某事件是否發(fā)生,根據(jù)個人掌握的信息對該事件發(fā)生可能性的判斷例如,我認(rèn)為2001年的中國股市是一個盤整年主觀概率定義對一些無法重復(fù)的試驗,確定其結(jié)果的概率只能根據(jù)以135概率的性質(zhì)非負(fù)性對任意事件A,有0P1規(guī)范性必然事件的概率為1;不可能事件的概率為0。即P()=1;P()=0可加性若A與B互斥,則P(A∪B)=P(A)+P(B)推廣到多個兩兩互斥事件A1,A2,…,An,有P

(A1∪A2

∪…∪An)=P(A1

)+P(A2

)+…+P(An

)概率的性質(zhì)非負(fù)性136隨機(jī)變量及其分布一.隨機(jī)變量的概念離散型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布隨機(jī)變量及其分布一.隨機(jī)變量的概念137隨機(jī)變量的概念一次試驗的結(jié)果的數(shù)值性描述一般用X、Y、Z來表示例如:投擲兩枚硬幣出現(xiàn)正面的數(shù)量根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量隨機(jī)變量的概念一次試驗的結(jié)果的數(shù)值性描述138離散型隨機(jī)變量隨機(jī)變量X取有限個值或所有取值都可以逐個列舉出來X1,X2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗隨機(jī)變量可能的取值抽查100個產(chǎn)品一家餐館營業(yè)一天電腦公司一個月的銷售銷售一輛汽車取到次品的個數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1離散型隨機(jī)變量隨機(jī)變量X取有限個值或所有取值都可以逐個列139連續(xù)型隨機(jī)變量隨機(jī)變量X取無限個值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點連續(xù)型隨機(jī)變量的一些例子試驗隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個產(chǎn)品的長度使用壽命(小時)半年后工程完成的百分比測量誤差(cm)X00

X100X0連續(xù)型隨機(jī)變量隨機(jī)變量X取無限個值試驗隨機(jī)變量可能的取值140離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布141離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率通常用下面的表格來表示X=xix1,x2

,…,xnP(X=xi)=pip1,p2

,…,pn

P(X=xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)pi00離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值X142離散型隨機(jī)變量的概率分布

(實例)【例】如規(guī)定打靶中域Ⅰ得3分,中域Ⅱ得2分,中域Ⅲ得1分,中域外得0分。今某射手每100次射擊,平均有30次中域Ⅰ,55次中域Ⅱ,10次中Ⅲ,5次中域外。則考察每次射擊得分為0,1,2,3這一離散型隨機(jī)變量,其概率分布為X=xi0123P(X=xi)pi0.050.100.550.30離散型隨機(jī)變量的概率分布

(實例)【例】如規(guī)定打靶中域Ⅰ得3143離散型隨機(jī)變量的概率分布

(0—1分布)一個離散型隨機(jī)變量X只取兩個可能的值例如,男性用1表示,女性用0表示;合格品用1表示,不合格品用0表示列出隨機(jī)變量取這兩個值的概率離散型隨機(jī)變量的概率分布

(0—1分布)一個離散型隨機(jī)變量X144離散型隨機(jī)變量的概率分布

(0—1分布實例)【例】已知一批產(chǎn)品的次品率為p=0.05,合格率為q=1-p=1-0.5=0.95。并指定廢品用1表示,合格品用0表示。則任取一件為廢品或合格品這一離散型隨機(jī)變量,其概率分布為X=xi01P(X=xi)=pi0.050.950.5011xP(x)離散型隨機(jī)變量的概率分布

(0—1分布實例)【例】已知一批產(chǎn)145離散型隨機(jī)變量的概率分布

(均勻分布)一個離散型隨機(jī)變量取各個值的概率相同列出隨機(jī)變量取值及其取值的概率例如,投擲一枚骰子,出現(xiàn)的點數(shù)及其出現(xiàn)各點的概率離散型隨機(jī)變量的概率分布

(均勻分布)一個離散型隨機(jī)變量取各146離散型隨機(jī)變量的概率分布

(均勻分布實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)是個離散型隨機(jī)變量,其概率分布為X=xi123456P(X=xi)=pi1/61/61/61/61/61/601/6P(x)1x23456離散型隨機(jī)變量的概率分布

(均勻分布實例)【例】投擲一枚骰子147離散型隨機(jī)變量的數(shù)學(xué)期望在離散型隨機(jī)變量X的一切可能取值的完備組中,各可能取值xi與其取相對應(yīng)的概率pi乘積之和描述離散型隨機(jī)變量取值的集中程度計算公式為離散型隨機(jī)變量的數(shù)學(xué)期望在離散型隨機(jī)變量X的一切可能取值的完148離散型隨機(jī)變量的方差隨機(jī)變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為D(X)描述離散型隨機(jī)變量取值的分散程度計算公式為離散型隨機(jī)變量的方差隨機(jī)變量X的每一個取值與期望值的離差平方149離散型隨機(jī)變量的方差

(實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)是個離散型隨機(jī)變量,其概率分布為如下。計算數(shù)學(xué)期望和方差X=xi123456P(X=xi)=pi1/61/61/61/61/61/6解:數(shù)學(xué)期望為:方差為:離散型隨機(jī)變量的方差

(實例)【例】投擲一枚骰子,出現(xiàn)的點數(shù)150常見的離散型概率分布超幾何分布離散型隨機(jī)變量的概率分布泊松分布二項分布常見的離散型概率分布超幾何分布離散型隨機(jī)變量的概率分布泊松分151連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布152連續(xù)型隨機(jī)變量的概率分布指數(shù)分布連續(xù)型隨機(jī)變量的概率分布正態(tài)分布均勻分布其他分布連續(xù)型隨機(jī)變量的概率分布指數(shù)分布連續(xù)型隨機(jī)變量的概率分布正態(tài)153連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用數(shù)學(xué)函數(shù)的形式和分布函數(shù)的形式來描述連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實154概率密度函數(shù)設(shè)X為一連續(xù)型隨機(jī)變量,x為任意實數(shù),X的概率密度函數(shù)記為f(x),它滿足條件

f(x)不是概率概率密度函數(shù)設(shè)X為一連續(xù)型隨機(jī)變量,x為任意實數(shù),X的概率155概率密度函數(shù)密度函數(shù)f(x)表示X的所有取值x及其頻數(shù)f(x)值(值,頻數(shù))頻數(shù)f(x)abx概率密度函數(shù)密度函數(shù)f(x)表示X的所有取值x及156概率密度函數(shù)在平面直角坐標(biāo)系中畫出f(x)的圖形,則對于任何實數(shù)x1

<x2,P(x1<Xx2)是該曲線下從x1

到x2的面積f(x)xab概率是曲線下的面積概率密度函數(shù)在平面直角坐標(biāo)系中畫出f(x)的圖形,則對157分布函數(shù)連續(xù)型隨機(jī)變量的概率也可以用分布函數(shù)F(x)來表示分布函數(shù)定義為根據(jù)分布函數(shù),P(a<X<b)可以寫為分布函數(shù)連續(xù)型隨機(jī)變量的概率也可以用分布函數(shù)F(x)來表示根158分布函數(shù)與密度函數(shù)的圖示密度函數(shù)曲線下的面積等于1分布函數(shù)是曲線下小于x0的面積f(x)xx0F(x0

)分布函數(shù)與密度函數(shù)的圖示密度函數(shù)曲線下的面積等于1f(x)x159連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的數(shù)學(xué)期望為方差為連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的數(shù)學(xué)期望為160正態(tài)分布正態(tài)分布161正態(tài)分布的重要性1. 描述連續(xù)型隨機(jī)變量的最重要的分布2. 可用于近似離散型隨機(jī)變量的分布例如:二項分布3. 經(jīng)典統(tǒng)計推斷的基礎(chǔ)xf(x)正態(tài)分布的重要性1. 描述連續(xù)型隨機(jī)變量的最重要的分布xf162概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)=總體方差

=3.14159;e=2.71828x=隨機(jī)變量的取值(-<x<)

=總體均值概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)163正態(tài)分布函數(shù)的性質(zhì)概率密度函數(shù)在x的上方,即f(x)>0正態(tài)曲線的最高點在均值,它也是分布的中位數(shù)和眾數(shù)正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值的標(biāo)準(zhǔn)差來區(qū)分。決定曲線的高度,決定曲線的平緩程度,即寬度曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠(yuǎn)不會與橫軸相交正態(tài)曲線下的總面積等于1隨機(jī)變量的概率由曲線下的面積給出正態(tài)分布函數(shù)的性質(zhì)概率密度函數(shù)在x的上方,即f(x)>0164

和對正態(tài)曲線的影響xf(x)CAB和對正態(tài)曲線的影響xf(x)CAB165正態(tài)分布的概率概率是曲線下的面積!abxf(x)正態(tài)分布的概率概率是曲線下的面積!abxf(x)166標(biāo)準(zhǔn)正態(tài)分布的重要性一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差計算概率時,每一個正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的若能將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計算概率時只需要查一張表標(biāo)準(zhǔn)正態(tài)分布的重要性一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差167標(biāo)準(zhǔn)正態(tài)分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)任何一個一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)任何一個一般的正168標(biāo)準(zhǔn)正態(tài)分布xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布169標(biāo)準(zhǔn)正態(tài)分布表的使用將一個一般的轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布計算概率時,查標(biāo)準(zhǔn)正態(tài)概率分布表對于負(fù)的x,可由(-x)x得到對于標(biāo)準(zhǔn)正態(tài)分布,即X~N(0,1),有P(aXb)baP(|X|a)2a1對于一般正態(tài)分布,即X~N(,),有標(biāo)準(zhǔn)正態(tài)分布表的使用將一個一般的轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布170標(biāo)準(zhǔn)化的例子

P(5X6.2)

x=5=10一般正態(tài)分布6.2=1Z標(biāo)準(zhǔn)正態(tài)分布00.12.0478標(biāo)準(zhǔn)化的例子

P(5X6.2)x=5171標(biāo)準(zhǔn)化的例子

P(2.9X7.1)

一般正態(tài)分布.1664.0832.0832標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)化的例子

P(2.9X7.1)一般正態(tài)分172正態(tài)分布

(實例)【例】設(shè)X~N(5,32),求以下概率(1)P(X

10);(2)P(2<X

<10)解:(1)(2)正態(tài)分布

(實例)【例】設(shè)X~N(5,32),求以下概率(2173為什么概率是近似的.0.1.2.30246810xP(x)正態(tài)曲線增加的概率正態(tài)曲線減少的概率二項概率:矩形的面積正態(tài)概率:曲線下從3.5到4.5的面積增加的部分與減少的部分不一定相等為什么概率是近似的.0.1.2.30246810xP(x)正174總體、個體和樣本

(概念要點)總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個體(Itemunit):組成總體的每個元素樣本(Sample):從總體中所抽取的部分個體樣本容量(Samplesize):樣本中所含個體的數(shù)量總體、個體和樣本

(概念要點)總體(Population)175抽樣方法

(概念要點)概率抽樣:根據(jù)已知的概率選取樣本

簡單隨機(jī)抽樣:完全隨機(jī)地抽選樣本

分層抽樣:總體分成不同的“層”,然后在每一層內(nèi)進(jìn)行抽樣

整群抽樣:將一組被調(diào)查者(群)作為一個抽樣單位

等距抽樣:在樣本框中每隔一定距離抽選一個被調(diào)查者非概率抽樣:不是完全按隨機(jī)原則選取樣本

非隨機(jī)抽樣:由調(diào)查人員自由選取被調(diào)查者

判斷抽樣:通過某些條件過濾來選擇被調(diào)查者配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者抽樣方法

(概念要點)概率抽樣:根據(jù)已知的概率選取樣本176所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計量樣本均值,樣本比例等結(jié)果來自容量相同的所有可能樣本 抽樣分布

(概念要點)所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布177樣本均值的抽樣分布

(一個例子)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為X1=1、X2=2、X3=3、X4=4。總體的均值、方差及分布如下均值和方差總體分布14230.1.2.3樣本均值的抽樣分布

(一個例子)【例】設(shè)一個總體,含有4個元178樣本均值的抽樣分布

(一個例子)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布

(一個例子)現(xiàn)從總體中抽取n=2的179樣本均值的抽樣分布

(一個例子)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x樣本均值的抽樣分布

(一個例子)計算出各樣本的均值,如180所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n所有樣本均值的均值和方差式中:M為樣本數(shù)目181樣本均值的分布與總體分布的比較抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的分布與總體分布的比較抽樣分布=2.5總182樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)樣本均值的抽樣分布

與中心極限定理=50=10X總183中心極限定理

(圖示)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X中心極限定理

(圖示)當(dāng)樣本容量足夠大時(n30),184樣本方差的抽樣分布樣本方差的抽樣分布185樣本方差的分布設(shè)總體服從正態(tài)分布N~(μ,σ2),X1,X2,…,Xn為來自該正態(tài)總體的樣本,則樣本方差s2

的分布為將2(n–1)稱為自由度為(n-1)的卡方分布樣本方差的分布設(shè)總體服從正態(tài)分布N~(μ,σ2),186卡方(c2)分布

選擇容量為n的簡單隨機(jī)樣本計算樣本方差S2計算卡方值2=(n-1)S2/σ2計算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體卡方(c2)分布選擇容量為n的計算卡方值計算出所有的187均值的標(biāo)準(zhǔn)誤所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所有樣本均值的離散程度小于總體標(biāo)準(zhǔn)差計算公式為均值的標(biāo)準(zhǔn)誤所有可能的樣本均值的標(biāo)準(zhǔn)差,測度所有樣本均值的離188第二節(jié)參數(shù)估計基本方法一.點估計二.點估計的優(yōu)良性準(zhǔn)則區(qū)間估計第二節(jié)參數(shù)估計基本方法一.點估計189參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計190被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體均值比例方差兩個總體均值之差比例之差方差比被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體191點估計點估計192點估計

(概念要點)從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如:用樣本均值作為總體未知均值的估計值就是一個點估計2. 點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等點估計

(概念要點)從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量1931. 用于估計總體某一參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本中位數(shù)等例如:樣本均值就是總體均值的一個估計量如果樣本均值x

=3,則3就是的估計值理論基礎(chǔ)是抽樣分布估計量

(概念要點)二戰(zhàn)中的點估計1. 用于估計總體某一參數(shù)的隨機(jī)變量估計量

(概念要點)二194估計量的優(yōu)良性準(zhǔn)則

(無偏性)無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)P(X)XCA無偏有偏估計量的優(yōu)良性準(zhǔn)則

(無偏性)無偏性:估計量的數(shù)學(xué)期望等于被195估計量的優(yōu)良性準(zhǔn)則

(有效性)AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量相比,樣本均值是一個更有效的估計量估計量的優(yōu)良性準(zhǔn)則

(有效性)AB中位數(shù)的抽樣分布均值的抽196估計量的優(yōu)良性準(zhǔn)則

(一致性)一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X估計量的優(yōu)良性準(zhǔn)則

(一致性)一致性:隨著樣本容量的增大,估197區(qū)間估計區(qū)間估計198區(qū)間估計

(概念要點)1. 根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍給出總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論