版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
商務(wù)統(tǒng)計(jì)學(xué)5隨機(jī)變量及其分布5.1隨機(jī)變量對(duì)一項(xiàng)試驗(yàn)的結(jié)果進(jìn)行數(shù)值描述,稱為隨機(jī)變量(randomvariable)。隨機(jī)變量通常用大寫字母X、Y、Z表示,它們的取值用小寫字母x,y,z等表示。2隨機(jī)變量的特點(diǎn):一是取值的隨機(jī)性,事先不能確定X的取值;二是取值的統(tǒng)計(jì)規(guī)律,能夠確定X取某個(gè)值或在某區(qū)間的概率。根據(jù)隨機(jī)變量所取數(shù)值的不同,可以分為兩種類型:離散型隨機(jī)變量(discreterandomvariables)和連續(xù)型隨機(jī)變量(continuousrandomvariables)。3離散型隨機(jī)變量是指取值為可數(shù)個(gè)值的隨機(jī)變量,其取值不需要都是正數(shù),只需要從一個(gè)可能的值“跳躍”到另一個(gè)值。連續(xù)型隨機(jī)變量是指隨機(jī)變量可以取區(qū)間上的任一值,即可能的取值有不可數(shù)個(gè)。其取值連續(xù)地從一個(gè)轉(zhuǎn)移到另一個(gè),任意兩個(gè)值之間沒有任何間斷。45.2概率分布概率分布是指由隨機(jī)變量的取值和相應(yīng)概率所構(gòu)成的分布,能夠具體描述一個(gè)隨機(jī)變量的所有取值和相應(yīng)概率之間的關(guān)系。55.2.1離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布(probabilitydistribution)由離散型隨機(jī)變量X的取值和相應(yīng)的概率P組成。常用表5-1來反映。6離散型隨機(jī)變量的概率分布滿足以下兩個(gè)條件:(1),對(duì)所有的取值成立(2)7把離散型隨機(jī)變量取小于等于某一值的概率稱為累積概率分布(cumulativedistributionfunction),記為,即
8例5-1投資者擬從創(chuàng)業(yè)板新上市的10只股票中選4只。但他并不知道這10只股票中有3只股票將使購買者盈利,其余的將使購買者虧損。試求:(1)購買者選中的獲利股票數(shù)目X的概率分布和累積概率分布;(2)至少選中1只獲利股票的概率;(3)至多選中2只獲利股票的概率。9解:(1)
所以X的概率分布為10(2)(3)
115.2.2連續(xù)型隨機(jī)變量的概率分布設(shè)X為連續(xù)型隨機(jī)變量,且函數(shù)滿足下列條件:(1)(2)(3)則稱為概率密度函數(shù)(probabilitydensityfunction)12連續(xù)型隨機(jī)變量的累積概率分布稱為分布函數(shù)(distributionfunction)。設(shè)X是一個(gè)連續(xù)型隨機(jī)變量,對(duì)任意實(shí)數(shù)x,事件的概率稱為隨機(jī)變量X的分布函數(shù),記為,即有:
易見,對(duì)任意實(shí)數(shù),有13分布函數(shù)具有如下性質(zhì):(1)(2)(3)(4)是非降函數(shù),即若
則145.2.3隨機(jī)變量的期望和方差(1)離散型隨機(jī)變量的期望和方差離散型隨機(jī)變量X表示出現(xiàn)不同的可能結(jié)果,其均值一般稱為期望(expectation),用表示(有時(shí)也用表示):15我們常常需要計(jì)算隨機(jī)變量的離散性或變異性,而方差就可以解釋隨機(jī)變量的變異性。離散型隨機(jī)變量方差(variance)的數(shù)學(xué)表達(dá)式如下:標(biāo)準(zhǔn)差16例5-2某野生動(dòng)物保護(hù)區(qū)每個(gè)季度發(fā)生少數(shù)違反保護(hù)條例的事件,其次數(shù)的概率分布如表5-2所示:請(qǐng)計(jì)算野生動(dòng)物保護(hù)區(qū)每季度違反保護(hù)條例的事件次數(shù)的期望值。17解:根據(jù)期望公式可得:即野生動(dòng)物保護(hù)區(qū)每季度違反保護(hù)條例的事件次數(shù)的期望值為1.4。18(2)連續(xù)型隨機(jī)變量的期望和方差設(shè)X是連續(xù)型隨機(jī)變量,為概率密度函數(shù),其數(shù)學(xué)期望(expectation)定義為:連續(xù)型隨機(jī)變量的方差(variance)為:19(3)期望和方差的性質(zhì)期望的性質(zhì):?設(shè)C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨(dú)立的隨機(jī)變量,則
?若X和Y為任意的兩個(gè)隨機(jī)變量,則20方差的性質(zhì):?設(shè)C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨(dú)立的隨機(jī)變量,則
?215.3幾種常見的離散型隨機(jī)變量的概率分布5.3.10-1分布0-1分布又稱兩點(diǎn)分布,或伯努利分布(Bernoullidistribution)。服從0-1分布的隨機(jī)變量X的取值有這樣的特征:試驗(yàn)產(chǎn)生的結(jié)果只有兩種可能,“是”或“不是”。22在統(tǒng)計(jì)學(xué)中經(jīng)常把我們感興趣的表現(xiàn)稱為“成功”,則另一種稱為“失敗”,每次試驗(yàn)結(jié)果不是“成功”就是“失敗”。我們可以規(guī)定用“0”表示失敗,“1”表示成功,因此稱為0-1分布。23設(shè)隨機(jī)變量X只能取0或1兩個(gè)值,其概率分布為:或者整理成表5-3的形式:240-1分布的期望和方差分別為:25例5-3檢查一批產(chǎn)品的合格情況,從中任意抽取一件產(chǎn)品,記為“不合格品”,為“合格品”,則隨機(jī)變量服從0-1分布:試求隨機(jī)變量X的期望和方差。26解:期望方差275.3.2二項(xiàng)分布在0-1分布的條件下,進(jìn)行一系列結(jié)果為“成功”或“失敗”的獨(dú)立試驗(yàn),也就是n重伯努利試驗(yàn)(n-Bernoullitrials)。因此出現(xiàn)“成功”的次數(shù)不再是1,而是一個(gè)不能確定的隨機(jī)變量28試驗(yàn)成功的次數(shù)的概率分布就是二項(xiàng)分布(binomialdistribution),記作
。其中,n表示試驗(yàn)次數(shù),p表示試驗(yàn)成功的概率。每次試驗(yàn)相互獨(dú)立,任一次試驗(yàn)結(jié)果都對(duì)其他試驗(yàn)結(jié)果沒有影響。29二項(xiàng)分布中“成功”次數(shù)k的概率表達(dá)式為:式中,n為試驗(yàn)次數(shù);k為試驗(yàn)成功的次數(shù);p為一次試驗(yàn)成功的概率;q為一次試驗(yàn)失敗的概率,則。二項(xiàng)分布的期望和方差分別為:30例5-4某課程測(cè)驗(yàn)由20道選擇題構(gòu)成,每題有5個(gè)選項(xiàng),但只有一個(gè)正確選項(xiàng)。一個(gè)同學(xué)參加該測(cè)驗(yàn)打算全憑猜測(cè)來答題,則:(1)該同學(xué)全部答錯(cuò)的概率是多少?(2)該同學(xué)全部答對(duì)的概率是多少?31解:設(shè)=“答對(duì)的題數(shù)”根據(jù)二項(xiàng)分布計(jì)算概率的公式得:全部答錯(cuò)的概率為全部答對(duì)的概率為325.3.3超幾何分布從一個(gè)有限總體中進(jìn)行不放回抽樣得到超幾何分布(hypergeometricdistribution)。超幾何隨機(jī)變量X的特征為:從N個(gè)總體中隨機(jī)且無放回地抽取n個(gè)單元,總體中有M個(gè)單元被標(biāo)記為“成功”,其余都標(biāo)記為“失敗”。。33X表示在抽取的n個(gè)單元中被標(biāo)記為“成功”的個(gè)數(shù),則。超幾何分布的試驗(yàn)不具有獨(dú)立性,本次試驗(yàn)抽中“成功”或“失敗”的概率與上次試驗(yàn)結(jié)果有關(guān)。34通常情況下,在已知n,N,M時(shí),得到k個(gè)成功數(shù)的超幾何分布的概率為:式中,;。超幾何分布的期望和方差分別為:35當(dāng)時(shí),即抽取的個(gè)數(shù)遠(yuǎn)遠(yuǎn)小于總數(shù)N,每次抽取后,總體中的“成功”概率改變不明顯,因此不放回抽樣可以看成是放回抽樣,這時(shí)可以用二項(xiàng)分布近似:
式中,。36例5-5假設(shè)一位教授打算從10位申請(qǐng)人(6男4女)中隨機(jī)挑選3人為助教。令X是3位申請(qǐng)人中女性的人數(shù),求:(1)X的均值以及標(biāo)準(zhǔn)差;(2)受聘者中沒有女性的概率。37解:(1)X服從超幾何分布,其中均值方差標(biāo)準(zhǔn)差
38(2)受聘者中沒有女性,則,其概率為:
395.3.4泊松分布泊松分布主要應(yīng)用于某一段時(shí)間,或某一距離,或某一空間范圍內(nèi),某個(gè)事件的發(fā)生次數(shù)。例如,我們感興趣的是某一段時(shí)間進(jìn)入麥當(dāng)勞餐廳的人數(shù),某一長(zhǎng)度管材的瑕疵點(diǎn)數(shù),某段生產(chǎn)時(shí)間內(nèi)的工傷人數(shù),以及某一時(shí)期的結(jié)婚率等。40如果在一段時(shí)間或空間內(nèi),事件出現(xiàn)的次數(shù)X同時(shí)滿足以下條件,則稱此隨機(jī)變量服從泊松分布(Poissondistribution),記為:(1)在某一間隔內(nèi)事件發(fā)生與否和其他任何一個(gè)間隔內(nèi)該事件發(fā)生與否相互獨(dú)立;41(2)任意兩個(gè)相等的間隔內(nèi)事件發(fā)生的概率相等;(3)事件發(fā)生的概率僅與間隔長(zhǎng)度有關(guān);(4)如果把事件區(qū)間或空間區(qū)間分成許多很小的區(qū)間,兩個(gè)或兩個(gè)以上某事件發(fā)生的概率小到可以視為0。42泊松分布的概率分布為:我們稱隨機(jī)變量X服從參數(shù)為(為某事件發(fā)生的概率)的泊松分布。泊松分布的期望和方差為:43因?yàn)槭浅?shù),若很大時(shí),就很小,因此有:即二項(xiàng)分布近似為泊松分布(通常在
)時(shí)。44例5-6已知某種產(chǎn)品的不合格率為0.02,現(xiàn)從一批產(chǎn)品中隨機(jī)抽取100件進(jìn)行檢查,問:(1)至多有3件不合格的概率是多少?(2)恰好有4件不合格的概率是多少?45解:設(shè)X為不合格品數(shù),p為不合格品率,則X服從二項(xiàng)分布,由于n很大,p很小,可以近似認(rèn)為X服從參數(shù)為的泊松分布,從而得到:(1)至多有3件不合格的概率為:(2)恰好有4件不合格的概率為:465.4幾種常見的連續(xù)型隨機(jī)變量的概率分布5.4.1均勻分布如果連續(xù)型隨機(jī)變量所能取到的每個(gè)值的概率都相等,那么隨機(jī)變量服從均勻分布(uniformdistribution)。47若連續(xù)型隨機(jī)變量X在有限區(qū)間內(nèi)取值,且其概率密度函數(shù)為:則稱X在區(qū)間上服從均勻分布,記為。48均勻分布的分布函數(shù)為:49均勻分布的概率密度圖和分布函數(shù)圖,如圖5-1和圖5-2所示。50均勻分布的期望和方差分別為:51例5-7假設(shè)鋼鐵廠的一臺(tái)軋鋼機(jī)可以生產(chǎn)不同厚度的鋼板,其厚度為取值在150200毫米的均勻隨機(jī)變量。厚度小于160毫米的鋼板被認(rèn)為是廢品,請(qǐng)計(jì)算:(1)該機(jī)器生產(chǎn)的鋼板厚度X的均值和標(biāo)準(zhǔn)差;(2)該機(jī)器生產(chǎn)的鋼板被認(rèn)為是廢品的概率有多大?52解:(1)(2)求機(jī)器生產(chǎn)的鋼板是廢品的概率,即求鋼板厚度小于160毫米的概率,運(yùn)用均勻分布的公式,得:因此,20%的鋼板被認(rèn)為是廢品。535.4.2指數(shù)分布在描述各種“壽命”,比如電子元件的壽命、人或動(dòng)物的壽命、電話的通話時(shí)間,給一輛卡車裝貨所需要的時(shí)間等,都可以假定隨機(jī)變量服從指數(shù)分布(exponentialdistribution)。54若隨機(jī)變量服從指數(shù)分布,記為,其概率密度函數(shù)為:55指數(shù)分布的形狀和位置取決于參數(shù),如圖5-3。56指數(shù)分布的分布函數(shù)為:指數(shù)分布的期望和方差分別為:57指數(shù)分布的無記憶性:如果隨機(jī)變量
,則對(duì)任意的和,有我們稱指數(shù)分布具有無記憶性。58指數(shù)分布與泊松分布有著密切的聯(lián)系。泊松分布描述的是在某一給定區(qū)間(時(shí)間、距離)內(nèi),事件發(fā)生的次數(shù);而指數(shù)分布描述的是兩次事件發(fā)生之間的間隔長(zhǎng)度。如果說某事件發(fā)生的次數(shù)服從泊松分布,那么兩次發(fā)生的時(shí)間間隔一定服從指數(shù)分布。59例5-8為描述在一小時(shí)內(nèi)到達(dá)洗車店的汽車數(shù),假定該隨機(jī)變量服從均值為10的泊松分布。請(qǐng)寫出:(1)每小時(shí)到達(dá)洗車點(diǎn)的汽車數(shù)X的概率分布;(2)兩輛車到達(dá)的時(shí)間間隔Y的概率密度函數(shù)。60解:(1)因?yàn)殡S機(jī)變量X服從均值為10的泊松分布,所以泊松分布的參數(shù),其概率分布為:
61(2)因?yàn)槊啃r(shí)有10輛車到達(dá)洗車點(diǎn),所以兩輛車到達(dá)的時(shí)間間隔是,從而兩輛車到達(dá)的時(shí)間間隔Y的指數(shù)分布的均值為,相應(yīng)的概率密度函數(shù)為:
62例5-9為確定某燈泡的使用壽命,根據(jù)初步測(cè)試證明燈泡的壽命X服從指數(shù)分布,參數(shù)為,求:(1)X的均值和標(biāo)準(zhǔn)差;(2)設(shè)保修期為5年,當(dāng)
時(shí),必須更換燈泡的概率是多少?
63解:(1)(2)求必須更換燈泡的概率,即求即廠商必須更換燈泡的概率為55%。
645.4.3正態(tài)分布(1)一般正態(tài)分布德國(guó)10馬克的鈔票上印有德國(guó)著名數(shù)學(xué)家高斯的頭像,鈔票上同時(shí)印有正態(tài)分布的密度曲線??梢娫诟咚沟囊磺锌茖W(xué)貢獻(xiàn)中,對(duì)人類文明影響最大的,就是正態(tài)分布。因此正態(tài)分布(normaldistribution)也稱為高斯分布(Gaussiandistribution)。65如果隨機(jī)變量X的概率密度函數(shù)為:則稱X服從參數(shù)為和的正態(tài)分布,記為。式中,為正態(tài)隨機(jī)變量的均值;為標(biāo)準(zhǔn)差。66正態(tài)分布的分布函數(shù)為:正態(tài)分布的概率密度圖和分布函數(shù)圖,如圖5-5和圖5-6所示。6768根據(jù)正態(tài)分布的概率密度圖,可以看出正態(tài)曲線的特點(diǎn):?關(guān)于中心位置對(duì)稱,在處取得最大值。?可以用目測(cè)的方法找出它的標(biāo)準(zhǔn)差:想象你從山頂開始滑雪,山的形狀和正態(tài)曲線一樣。69起先當(dāng)你開始下滑時(shí),往下的角度非常陡,當(dāng)你還沒有直墜下去以前,陡度變得緩和起來,你越往下滑越平坦。這個(gè)陡度開始發(fā)生改變的點(diǎn)就代表了標(biāo)準(zhǔn)差的位置。圖5-7給出了當(dāng)和發(fā)生變化時(shí),相應(yīng)的正態(tài)密度曲線的變化情況:7071從圖中可以看出,如果固定,改變,則圖形的形狀不發(fā)生變化,只是沿著x軸平移,因此稱為位置參數(shù)(locationparameter)。如果固定,改變,則圖形的位置不發(fā)生改變。越小,圖形越尖峭,分布較為集中;越大,圖形越平坦,分布較為分散。因此稱為尺度參數(shù)(scaleparameter)。72(2)標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)當(dāng),時(shí),稱為標(biāo)準(zhǔn)正態(tài)分布,記為。其概率密度函數(shù)和分布函數(shù)分別為:73標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)和分布函數(shù)具有如下性質(zhì):??,和為常數(shù);?,且為常數(shù);?;?概率密度函數(shù)關(guān)于y軸對(duì)稱,在處取得最大值74一般正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系為:如果隨機(jī)變量X服從參數(shù)為和的正態(tài)分布,即,則隨機(jī)變量
服從標(biāo)準(zhǔn)正態(tài)分布,即
,這一變換稱為標(biāo)準(zhǔn)化變換。75的分布函數(shù)可以寫成:
則對(duì)于任意的,有:76通過標(biāo)準(zhǔn)化變換,可以計(jì)算出隨機(jī)變量取值落在任何區(qū)間內(nèi)的概率,如圖5-8所示。77例5-10學(xué)生《商務(wù)統(tǒng)計(jì)學(xué)》課程的考試成績(jī)服從均值為70分,標(biāo)準(zhǔn)差為12分的正態(tài)分布,請(qǐng)問某個(gè)學(xué)生的成績(jī)?cè)?0分到80分之間的概率有多大?78解:設(shè)是學(xué)生的成績(jī),則有
查附表1的標(biāo)準(zhǔn)正態(tài)分布表,得到因此也就是說學(xué)生的成績(jī)?cè)?0分到80分之間的概率為29.67%。79例5-11超市里每天的牛奶銷售量服從均值為500千克,標(biāo)準(zhǔn)差為50千克的正態(tài)分布,若早上營(yíng)業(yè)前超市有牛奶庫存600千克,當(dāng)天牛奶脫銷的概率是多大?80解:設(shè)是每天的牛奶銷售量,則有
查標(biāo)準(zhǔn)正態(tài)分布表,得到因此也就是說牛奶脫銷的概率為2.28%。81(3)正態(tài)分布的原則對(duì)于任何正態(tài)分布,大約有68.27%的觀測(cè)值落在距離均值1個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),95.45%的觀測(cè)值落在距離均值2個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),99.73%的觀測(cè)值落在距離均值3個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)。8283例5-12根據(jù)近期數(shù)據(jù)資料,某地18歲男青年的身高服從平均數(shù)為172.7cm,標(biāo)準(zhǔn)差為4.01cm的正態(tài)分布。請(qǐng)根據(jù)原則,分析該地男青年身高的分布規(guī)律。84解:根據(jù)原則,該地:
大約有68.27%的男青年身高介于168.69-176.71之間,大約有95.45%的男青年身高介于164.68-180.72之間,大約有99.73%的男青年身高介于160.67-184.73之間。85(4)管理原則管理原則是一種以數(shù)據(jù)為基礎(chǔ),追求幾乎完美無瑕的現(xiàn)代企業(yè)質(zhì)量管理策略。一般企業(yè)的瑕疵率大約是3到4個(gè)。以
為例,假設(shè)一個(gè)機(jī)場(chǎng),每天起降100架飛機(jī)。86若每架起飛的飛機(jī)安全質(zhì)量以標(biāo)準(zhǔn)管理,那么這100架飛機(jī)都安全的概率是
,說明至少有一架飛機(jī)不安全的概率為0.2369。若采用管理原則,則這100架飛機(jī)都安全的概率是。875.5由正態(tài)分布導(dǎo)出的三個(gè)重要分布5.5.1卡方分布設(shè)隨機(jī)變量互相獨(dú)立,并且都服從標(biāo)準(zhǔn)正態(tài)分布,則稱
的分布是自由度為的
分布,記為
。
88卡方分布(Chi-squaredistribution)的概率密度函數(shù)為:其中,是伽馬函數(shù)。通常我們稱為伽馬函數(shù),參數(shù)。89伽馬函數(shù)具有以下性質(zhì):(1)(2),若為自然數(shù),則
。90卡方分布的概率密度圖是一個(gè)取值為非負(fù)的偏態(tài)分布,如圖5-10所示,從左到右依次為自由度為2,4,10,20的概率密度圖。其期望和方差分別為:91卡方分布具有下面的重要性質(zhì):若來自正態(tài)總體,其樣本均值和方差分別為:則有:(1)與相互獨(dú)立(2)(3)925.5.2F分布設(shè)隨機(jī)變量,,且與
相互獨(dú)立,則稱的分布是自由度為和的F分布,記為。設(shè)F的取值為,對(duì),其密度函數(shù)為:
93F分布(Fdistribution)的概率密度圖如圖5-11。圖中,1、2、3、4、5、6分別表示、
、、、的概率密度圖。94F分布一般為正偏分布。若,則
,對(duì)于給定的,有
F分布一般可用于兩個(gè)正態(tài)總體方差的比較檢驗(yàn),方差分析和線性回歸模型的檢驗(yàn)。955.5.3t分布設(shè)隨機(jī)變量,,則稱
的分布是自由度為的t分布,記為。其密度函數(shù)為
96t分布(tdistribution)的概率密度圖關(guān)于Y軸對(duì)稱(如圖5-12),與標(biāo)準(zhǔn)正態(tài)分布的圖形類似,都是均值為0的鐘形曲線,但t分布的峰比標(biāo)準(zhǔn)正態(tài)分布的峰低,且兩尾較高。97圖中,1、2、3、4分別表示、、和的概率密度圖形。t分布的期望和方差分別為:t分布具有下面的重要性質(zhì):若都是來自正態(tài)總體的樣本,和分別是樣本均值和方差,則有98t分布多用于小樣本()情況下的區(qū)間估計(jì)和假設(shè)檢驗(yàn),或是在總體方差未知時(shí)正態(tài)總體均值的區(qū)間估計(jì)和假設(shè)檢驗(yàn),以及線性回歸模型中回歸系數(shù)的顯著性檢驗(yàn)等。995.6大數(shù)定理和中心極限定理5.6.1大數(shù)定理(1)伯努利大數(shù)定理(Bernoulli'sLawofLargeNumbers)設(shè)是重伯努利試驗(yàn)中事件發(fā)生的次數(shù),是每次試驗(yàn)中事件出現(xiàn)的概率,則對(duì)于任意的正數(shù),有
100伯努利大數(shù)定理說明:隨著試驗(yàn)次數(shù)
的增大,事件發(fā)生的頻率與其概率無限接近,它們的偏差要多小有多小。這就說明了頻率的穩(wěn)定性。而在許多實(shí)際應(yīng)用中,當(dāng)試驗(yàn)次數(shù)很大時(shí),可以用事件發(fā)生的頻率代替事件發(fā)生的概率。
101(2)切比雪夫大數(shù)定理(Chebyshev’sLawofLargeNumbers)設(shè)為一列兩兩不相關(guān)的隨機(jī)變量序列,若每個(gè)的方差存在,且有共同的上界,即(),則對(duì)于任意的正數(shù),有:
102切比雪夫大數(shù)定理說明:隨著試驗(yàn)次數(shù)趨于無窮大,隨機(jī)變量變化的均值依概率收斂到這個(gè)隨機(jī)變量的期望的均值
103切比雪夫大數(shù)定理只要求兩兩不相關(guān),并未對(duì)其分布做出說明。因此可以得到:若是獨(dú)立同分布的隨機(jī)變量,方差有界,則一定服從大數(shù)定理。伯努利大數(shù)定理是切比雪夫大數(shù)定理的特例。
104(3)辛欽大數(shù)定理(Khinchin’sLawofLargeNumbers)設(shè)為一獨(dú)立同分布的隨機(jī)變量序列,若每個(gè)的期望存在且有相同的期望值,則對(duì)于任意的正數(shù),有:
105辛欽大數(shù)定理提供了求隨機(jī)變量數(shù)學(xué)期望
的近似方法。假設(shè)現(xiàn)在對(duì)隨機(jī)變量重復(fù)觀察次,每次的觀察值相互獨(dú)立且與同分布。在期望存在時(shí),按照辛欽大數(shù)定理,若足夠大,可以把平均觀察值,作為期望的近似。
1065.6.2中心極限定理中心極限定理(CentralLimitTheorem)是研究隨機(jī)變量和的極限分布在什么條件下為正態(tài)分布的問題。(1)樣本平均數(shù)的中心極限定理
107考慮從均值為,標(biāo)準(zhǔn)差為,服從任意概率分布的總體中抽取容量為的樣本,當(dāng)趨于無窮大時(shí),樣本平均數(shù)的分布近似服從均值,標(biāo)準(zhǔn)差的正態(tài)分布。108由中心極限定理我們可以知道,無論總體服從何種概率分布,只要知道它的均值和標(biāo)準(zhǔn)差,對(duì)于足夠大的樣本,樣本平均數(shù)
的分布近似為正態(tài)。一般認(rèn)為樣本量的是大樣本,大樣本的平均數(shù)近似服從正態(tài)分布。
109例5-13某公司1000名員工的人均年獎(jiǎng)金為2000元,標(biāo)準(zhǔn)差500元,從中隨機(jī)抽取36人進(jìn)行調(diào)查,問該樣本中人均年獎(jiǎng)金在1900-2200元之間的概率是多少?
110解:,根據(jù)樣本平均數(shù)的中心極限定理可知111查標(biāo)準(zhǔn)正態(tài)分布表,得到因此即樣本中人均年獎(jiǎng)金在1900-2200元之間的概率是0.8767。112(2)樣本成數(shù)的中心極限定理從任一總體成數(shù)為,方差為的0-1分布總體中,抽取容量為的樣本,隨著樣本容量的增大,當(dāng)且時(shí),樣本成數(shù)的分布近似服從均值為,標(biāo)準(zhǔn)差的正態(tài)分布。
113例5-14某股民判斷股票漲跌正確的概率為0.6,且每次判斷相互獨(dú)立,假設(shè)該股民作了100次判斷,至少有50次判斷正確的概率有多大?114解:設(shè)為第次判斷正確,判斷正確取值為1,否則為0。記的和為,則至少有50次判斷正確的概率為:
查標(biāo)準(zhǔn)正態(tài)分布表,得到1155.7抽樣和抽樣分布5.7.1統(tǒng)計(jì)推斷在很多實(shí)際統(tǒng)計(jì)問題中,由于人力物力等諸多條件的限制,我們不能獲取全部數(shù)據(jù),只能從中抽取一部分?jǐn)?shù)據(jù),依據(jù)這部分觀測(cè)數(shù)據(jù)對(duì)全部研究對(duì)象的數(shù)量特征或數(shù)量規(guī)律進(jìn)行推斷,稱為統(tǒng)計(jì)推斷(statisticalinference)。
116統(tǒng)計(jì)推斷包括兩方面的內(nèi)容:一是參數(shù)估計(jì),即通過樣本數(shù)據(jù)對(duì)總體的數(shù)量特征進(jìn)行估計(jì);二是假設(shè)檢驗(yàn),由樣本數(shù)據(jù)對(duì)總體的數(shù)量規(guī)律性是否具有某種指定特征進(jìn)行檢驗(yàn)。
1175.7.2抽樣的基本概念抽樣(sampling),也叫抽樣調(diào)查(samplingsurvey),是按照隨機(jī)原則,以一定的概率從總體中抽取部分樣本進(jìn)行調(diào)查,根據(jù)樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的數(shù)量特征做出可靠的估計(jì)和推斷。抽取樣本時(shí),個(gè)體可以按照相等的概率被抽到,也可以按照不等的概率被抽到,前者稱為等概率抽樣,后者稱為不等概率抽樣。
118為什么要進(jìn)行抽樣調(diào)查呢?因?yàn)樵诤芏嗲闆r下抽樣比研究總體更切實(shí)可行。一方面有些試驗(yàn)具有破壞性,不適合全面調(diào)查,如調(diào)查燈泡壽命。也有一些總體在理論上可以進(jìn)行全面調(diào)查,但在實(shí)際中不具有可行性,如調(diào)查森林中有多少棵樹。
119(1)樣本容量和樣本可能個(gè)數(shù)樣本中包含的個(gè)體數(shù)稱為樣本容量。樣本可能個(gè)數(shù)是指從一個(gè)總體中可能抽取多少組樣本,即容量相同的所有可能樣本有多少組。樣本可能個(gè)數(shù)的多少與抽樣方法有關(guān)。
120(2)總體參數(shù)和樣本統(tǒng)計(jì)量總體分布的數(shù)量特征就是總體參數(shù),其數(shù)值是唯一的,確定的。即總體參數(shù)為常數(shù),但多為未知的。常見的總體參數(shù)有:總體平均數(shù)、總體比例(成數(shù))、總體方差或總體標(biāo)準(zhǔn)差等,它們都能反映總體的分布特征。
121以未加權(quán)的情況為例,總體平均數(shù)、總體方差和總體標(biāo)準(zhǔn)差分別為:122與總體參數(shù)對(duì)應(yīng)的是樣本統(tǒng)計(jì)量,即根據(jù)樣本數(shù)據(jù)計(jì)算出的指標(biāo)。由于樣本是從總體中抽取出來的,是隨機(jī)的,因此樣本統(tǒng)計(jì)量是隨機(jī)變量。常見的樣本統(tǒng)計(jì)量有:樣本平均數(shù)、樣本比例(成數(shù))、樣本方差或樣本標(biāo)準(zhǔn)差等。
123以未加權(quán)的情況為例,總體平均數(shù)、總體方差和總體標(biāo)準(zhǔn)差分別為:124(3)重復(fù)抽樣和不重復(fù)抽樣重復(fù)抽樣(或重置抽樣)是指從總體中抽出一個(gè)樣本單位,記錄其標(biāo)志值后,放回總體中繼續(xù)參加下一輪樣本單位的抽取。重復(fù)抽樣的特點(diǎn)是:第一,個(gè)單位的樣本是由次試驗(yàn)的結(jié)果構(gòu)成的。
125第二,每次試驗(yàn)是獨(dú)立的,即試驗(yàn)的結(jié)果與前次、后次的結(jié)果都無關(guān)。第三,每次試驗(yàn)都是在相同條件下進(jìn)行的,每個(gè)單位在多次試驗(yàn)中中選的機(jī)會(huì)(概率)是相同的。重復(fù)抽樣時(shí),樣本可能個(gè)數(shù)為,為總體單位數(shù),為樣本容量。
126不重復(fù)抽樣(或不重置抽樣)是指每次從總體中抽出一個(gè)樣本單位,記錄其標(biāo)志值后,不放回原總體,不繼續(xù)參加下一輪抽樣。下一次從余下的單位中抽取樣本。不重復(fù)抽樣的特點(diǎn)是:第一,個(gè)單位的樣本由次試驗(yàn)結(jié)果構(gòu)成,但由于每次抽樣不重復(fù),實(shí)質(zhì)上相當(dāng)于從總體中同時(shí)抽取
個(gè)樣本單位。
127第二,每次試驗(yàn)結(jié)果是不獨(dú)立的,上次中選的情況影響下次抽選的結(jié)果。第三,每個(gè)單位在多次試驗(yàn)中中選的機(jī)會(huì)是不相等的。對(duì)于考慮順序的不重復(fù)抽樣,樣本可能個(gè)數(shù)為;對(duì)于不考慮順序的不重復(fù)抽樣,樣本可能個(gè)數(shù)為。
1285.7.3抽樣組織方式(1)簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling)也稱純隨機(jī)抽樣,是指按照隨機(jī)原則從總體的所有單位中抽取樣本的方式,要保證全部可能的樣本被抽到的概率都相等。
129簡(jiǎn)單隨機(jī)抽樣是其他抽樣方法的基礎(chǔ),因?yàn)樗诶碚撋献钊菀滋幚?,并且?dāng)總體包含的抽樣單元數(shù)N不太大時(shí)實(shí)施并不困難,但是當(dāng)N很大時(shí)實(shí)施起來就相當(dāng)困難,此時(shí)可以采用隨機(jī)數(shù)表的方法。
130當(dāng)N很大時(shí)所抽到的樣本單元往往很分散,不能保證樣本在總體中較為均勻地分布,使調(diào)查極不方便且樣本缺乏代表性。因此在大規(guī)模抽樣調(diào)查中很少單獨(dú)采用簡(jiǎn)單隨機(jī)抽樣。
131(2)分層抽樣分層抽樣(stratifiedsampling)也稱類型抽樣或分類抽樣,是將總體中的抽樣單元按某種原則劃分成若干個(gè)組,然后在每個(gè)組內(nèi)獨(dú)立地進(jìn)行抽樣以獲得樣本的抽樣方式。其優(yōu)點(diǎn)是通過劃類分組,增大了各類中單位間的共同性,容易抽出具有代表性的樣本。
132分層抽樣的實(shí)施和組織都比較方便,樣本單元分布比較均勻。當(dāng)組內(nèi)差異較小而組間差異較大時(shí),采用分層抽樣可以大大提高估計(jì)的精度。
133(3)等距抽樣等距抽樣也稱機(jī)械抽樣或系統(tǒng)抽樣(systematicsampling),首先將總體單元按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)抽取一個(gè)單元作為初始單元,然后按照一定的規(guī)則確定其他樣本單元。
134在等距抽樣中,初始單元是隨機(jī)抽取的,其他樣本單元都隨著初始單元的確定而確定。在進(jìn)行等距抽樣時(shí),應(yīng)提前觀察總體的實(shí)物順序。若實(shí)物順序與總體的特征相關(guān),就不應(yīng)該使用等距抽樣。
135(4)整群抽樣整群抽樣(Clustersampling)也稱集團(tuán)抽樣,是指將總體單元按照一定的標(biāo)準(zhǔn)分成若干部分,每個(gè)部分稱為一個(gè)群,然后以群為單位,隨機(jī)抽取一個(gè)或幾個(gè)群,對(duì)被抽中的群進(jìn)行全面調(diào)查。整群抽樣的效率與群的劃分密切相關(guān),其劃分原則是盡量使每個(gè)群都有較好的代表性,群間差異小,而群內(nèi)差異大。
136(5)二階段抽樣和多階段抽樣在調(diào)查對(duì)象的總體范圍大、分布又廣的情況下,只進(jìn)行一次抽樣很難選出所需的樣本。我們可以把整個(gè)抽樣過程分成兩個(gè)或多個(gè)階段。如在企業(yè)職工收入調(diào)查中,先對(duì)企業(yè)進(jìn)行抽樣,再在被抽中的企業(yè)內(nèi)對(duì)職工進(jìn)行抽樣,然后對(duì)被抽中的職工進(jìn)行調(diào)查,這就是二階段抽樣(two-stagesampling)
137如果總體可以劃分成多個(gè)級(jí)別的抽樣單元,每一級(jí)別的抽樣單元由若干下一級(jí)別的抽樣單元組成,相應(yīng)地存在多個(gè)級(jí)別的抽樣框,抽樣時(shí)先在一級(jí)抽樣框中對(duì)一級(jí)單元抽樣,再在中選的一級(jí)單元中對(duì)二級(jí)單元抽樣。
138如果每個(gè)二級(jí)單元又由更小的三級(jí)單元組成,那么在二階段抽樣后,在中選的二級(jí)單元中對(duì)三級(jí)單元抽樣,稱為三階段抽樣(three-stagesampling)。以此類推,還可以定義更高階段的抽樣。對(duì)于二階段以上的抽樣統(tǒng)稱為多階段抽樣(multi-stagesampling)。
1395.7.4抽樣誤差隨機(jī)樣本的樣本值和總體值之間的差異稱為抽樣誤差(samplingerror),抽樣誤差是在選取樣本時(shí)一些偶然因素影響的結(jié)果。通常,抽樣誤差的大小由樣本均值的標(biāo)準(zhǔn)差來衡量。
140(1)樣本均值的標(biāo)準(zhǔn)差重復(fù)抽樣時(shí),有式中,為樣本均值的標(biāo)準(zhǔn)差,又稱為抽樣平均誤差;為總體的標(biāo)準(zhǔn)差;為樣本容量。141不重復(fù)抽樣時(shí),有式中,為樣本均值的標(biāo)準(zhǔn)差;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度車輛質(zhì)押貸款合同模板5篇
- 二零二五版白酒市場(chǎng)調(diào)研與分析服務(wù)合同2篇
- 二零二五版便利店區(qū)域代理合作合同范本2篇
- 二零二五年度花卉市場(chǎng)花卉供貨與品牌孵化服務(wù)合同3篇
- 二零二五年環(huán)境監(jiān)測(cè)地形圖測(cè)繪與污染防控合同3篇
- 二零二五版電影影視基地建設(shè)贊助合同3篇
- 2025版金融機(jī)構(gòu)出納人員現(xiàn)金擔(dān)保責(zé)任合同范本3篇
- 二零二五年建材城商鋪?zhàn)赓U合同環(huán)保及安全責(zé)任承諾書3篇
- 二零二五年度民間借貸合同管轄權(quán)變更協(xié)議3篇
- 二零二五年度房地產(chǎn)買賣居間合同模板(含稅費(fèi)繳納)下載3篇
- 餐飲行業(yè)智慧餐廳管理系統(tǒng)方案
- EGD殺生劑劑化學(xué)品安全技術(shù)說明(MSDS)zj
- GB/T 12229-2005通用閥門碳素鋼鑄件技術(shù)條件
- 超分子化學(xué)-第三章 陰離子的絡(luò)合主體
- 控制變量法教學(xué)課件
- 血壓計(jì)保養(yǎng)記錄表
- 食品的售后服務(wù)承諾書范本范文(通用3篇)
- 新外研版九年級(jí)上冊(cè)(初三)英語全冊(cè)教學(xué)課件PPT
- 初中中考英語總復(fù)習(xí)《代詞動(dòng)詞連詞數(shù)詞》思維導(dǎo)圖
- 植物和五行關(guān)系解說
- 因式分解法提公因式法公式法
評(píng)論
0/150
提交評(píng)論