版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于總體分布樣本分布第1頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月提示如何依據(jù)樣本的信息推斷總體的特征——參數(shù)估計(jì)問(wèn)題樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差總體均值、比例、方差等第2頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月有關(guān)概率概念的回顧通俗地說(shuō):概率是衡量某一特定事件的機(jī)會(huì)或可能性的數(shù)值度量。它可以用來(lái)度量如下一些問(wèn)題中的可能性如果提高產(chǎn)品的價(jià)格,則銷(xiāo)售下降的“機(jī)會(huì)”有多少?某種新的裝配作業(yè)方法會(huì)在多大“可能性”上提高生產(chǎn)率?某項(xiàng)工程按期完成的“可能性”有多大?新投資贏利的“機(jī)會(huì)”有多大?概率在決策過(guò)程中起著重要作用,它提供了一種機(jī)制來(lái)衡量、表達(dá)和分析與未來(lái)事件相聯(lián)系的不確定性。第3頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月一些相關(guān)概念隨機(jī)實(shí)驗(yàn)至少有兩個(gè)或兩個(gè)以上的結(jié)果但事先不知道會(huì)發(fā)生哪個(gè)結(jié)果的過(guò)程。隨機(jī)事件(簡(jiǎn)稱(chēng)為事件)一個(gè)隨機(jī)實(shí)驗(yàn)的可能結(jié)果稱(chēng)為基本事件。所有基本事件的集合稱(chēng)為總體(樣本空間)??傮w的子集稱(chēng)為隨機(jī)事件。概率的定義(見(jiàn)教材p2)。任何滿(mǎn)足定義中三個(gè)條件的函數(shù)P(A)都可以作為一種合適的概率分配方式。常用的概率分配方式有:古典法(拋擲硬幣)、相對(duì)頻數(shù)法(產(chǎn)品銷(xiāo)路調(diào)查)和主觀法(體育比賽結(jié)果預(yù)測(cè))。第4頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1總體分布與樣本分布本章的總體(PopulationorUniverse)是指研究對(duì)象的全體。并且先研究只有一個(gè)特征(指標(biāo)或變量)的總體。這樣表述總體特征的變量可以看成一個(gè)一維隨機(jī)變量。例如我們?cè)谀硞€(gè)研究中關(guān)注廣州市的某區(qū)居民的某年經(jīng)濟(jì)收入情況,我們?cè)谶@個(gè)問(wèn)題中的總體就是廣州市某區(qū)居民的全體,但我們實(shí)際上關(guān)注的是該區(qū)居民該年的經(jīng)濟(jì)收入這樣一個(gè)特征,我們可以用一個(gè)變量X來(lái)表征我們?nèi)我膺x取的一個(gè)該區(qū)居民該年的收入。則X是一個(gè)一維隨機(jī)變量,而我們研究的總體實(shí)際上是這一隨機(jī)變量取值的全體。因此,總體也可理解為一個(gè)隨機(jī)變量取的值全體。第5頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.1總體與總體分布更準(zhǔn)確地說(shuō),一維隨機(jī)變量是指反映某總體特征取值,且具有如下特點(diǎn)的變量X:(1)在同一條件下可以無(wú)限次重復(fù)取值;(2)取值的結(jié)果可能有多個(gè),但不確定;(3)事先不知道取值結(jié)果(Outcome)。由此可知,隨機(jī)變量可以理解為“隨機(jī)實(shí)驗(yàn)(隨機(jī)地抽取一個(gè)個(gè)體)”結(jié)果的數(shù)值性描述。第6頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月隨機(jī)變量取值的概率分布,就稱(chēng)為總體分布。一個(gè)隨機(jī)變量取給定值或?qū)儆谝唤o定值集合的概率所確定的函數(shù)稱(chēng)為該隨機(jī)變量的概率分布。概率分布反映的是隨機(jī)變量所有可能取值的概率的分配方式。一旦與所有可能結(jié)果相聯(lián)系的概率被確定,則概率分布完全確定。X
x1
x2…
xn
…P(X)p1
p2…
pn
…無(wú)論是理論研究還是解決實(shí)際問(wèn)題,知道一個(gè)隨機(jī)變量取各種可能值的概率情況(概率分布)都是十分重要的。第7頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月離散隨機(jī)變量的概率分布。設(shè)X為取相異值x1,
x2,
…
xn,…的離散隨機(jī)變量,則函數(shù)稱(chēng)為X的概率分布或概率分布函數(shù)(probabilitydistributionfunction,PDF),其中P(X=xi)為離散隨機(jī)變量X取xi值的概率。(1)離散隨機(jī)變量的概率分布第8頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月(2)連續(xù)隨機(jī)變量的概率密度函數(shù)設(shè)X是連續(xù)隨機(jī)變量,x是X取的值,若函數(shù)f(x)滿(mǎn)足下列條件:則稱(chēng)f(x)為X的概率密度函數(shù)(probabilitydensityfunction,PDF),其中P(a<xb)表示X在區(qū)間(a,b]取值的概率。第9頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月有時(shí)也稱(chēng)下式定義的函數(shù)為X的概率分布函數(shù):連續(xù)型隨機(jī)變量取給定值的概率為零。f(x)xab第10頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.2隨機(jī)樣本與樣本觀察值從重復(fù)抽樣的角度看“每次從總體中隨機(jī)抽取個(gè)體”可理解為一個(gè)隨機(jī)實(shí)驗(yàn)。隨機(jī)樣本:表征n次抽取個(gè)體的隨機(jī)抽樣的一組隨機(jī)變量X1,X2,…,Xn.樣本觀察值(樣本數(shù)據(jù)):n次隨機(jī)抽樣的結(jié)果:x1,x2,…,xn(稱(chēng)為隨機(jī)變量X1,X2,…,Xn的樣本觀察值)。n稱(chēng)為樣本容量。注:x1,x2,…,xn也可以看成隨機(jī)變量X的n次重復(fù)抽樣的結(jié)果。第11頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月大寫(xiě)的英文字母:隨機(jī)變量小寫(xiě)的英文字母:隨機(jī)變量的觀察值例拋擲一個(gè)均勻的骰子,假設(shè)骰子的六個(gè)面分別標(biāo)有數(shù)字1,2,3,4,5,6。用X標(biāo)識(shí)骰子落地后朝上一面的數(shù)字。則X是離散隨機(jī)變量。對(duì)該隨機(jī)變量進(jìn)行一次抽樣,其實(shí)就是擲該骰子一次。第i次抽樣,就是第i次擲骰子,其結(jié)果的表示:事前事后Xixi易見(jiàn),Xi其實(shí)就是X第12頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.3樣本分布函數(shù)設(shè)x1,x2,…,xn是隨機(jī)變量X的樣本觀察值,將它們按大小順序排列,排序后為x1x2…
xn,ki為小于xi+1的樣本值出現(xiàn)的累積頻次,n仍為樣本容量,則可得到樣本累積頻率分布函數(shù)如下樣本累積頻率分布函數(shù)又簡(jiǎn)稱(chēng)為樣本(累積)分布函數(shù),它是總體(累積)分布函數(shù)的近似,n越大,就越接近總體分布,如圖。第13頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月對(duì)于有限總體,其累積概率分布函數(shù)不連續(xù),是階躍式的。樣本的累積分布函數(shù)也是階躍式的。如圖所示。樣本(累積)分布函數(shù)是總體(累積)分布函數(shù)的近似,n越大,就越接近總體分布第14頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月1991年美國(guó)一般社會(huì)調(diào)查(1991U.S.GeneralSocialSurvey)數(shù)據(jù)中被調(diào)查對(duì)象”接受學(xué)校教育的最高年限”的樣本累積分布圖第15頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.4格利文科(Glivenko)定理(樣本分布與總體分布的關(guān)系)格利文科定理:當(dāng)n趨于無(wú)窮大時(shí),F(xiàn)n(x)依概率1(關(guān)于x)均勻地收斂于總體分布F(x).格利文科定理的數(shù)學(xué)表達(dá)如下:格利文科定理是用樣本特征推斷總體特征的依據(jù)。這表明當(dāng)n充分大時(shí),樣本分布Fn(x)是總體分布F(x)的一個(gè)良好近似。第16頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例如,利用格利文科定理可以證明:即樣本均值依概率收斂于總體均值。即樣本方差依概率收斂于總體方差。第17頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.5隨機(jī)樣本的均值函數(shù)對(duì)于隨機(jī)樣本X1,X2,…,Xn,定義樣本的均值函數(shù)(簡(jiǎn)稱(chēng)為樣本均值)為由于式中Xi是隨機(jī)樣本(隨機(jī)變量),因此作為隨機(jī)樣本函數(shù)的是隨機(jī)變量比較樣本數(shù)據(jù)的均值它可以看成是的觀察值第18頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.1.6隨機(jī)樣本的方差函數(shù)對(duì)于隨機(jī)樣本X1,X2,…,Xn,定義樣本的方差函數(shù)(簡(jiǎn)稱(chēng)為樣本方差)為由于式中Xi是隨機(jī)樣本(隨機(jī)變量),因此作為隨機(jī)樣本函數(shù)的S2是隨機(jī)變量比較樣本數(shù)據(jù)的方差它是S2的觀察值第19頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.2統(tǒng)計(jì)量與統(tǒng)計(jì)量的分布5.2.1統(tǒng)計(jì)量的定義統(tǒng)計(jì)量是不含未知參數(shù)的、隨機(jī)樣本X1,X2,…,Xn的函數(shù)注意統(tǒng)計(jì)量是隨機(jī)樣本X1,X2,…,Xn的函數(shù),因而也是隨機(jī)變量在上面定義的函數(shù)中將每個(gè)隨機(jī)樣本Xi用其觀察值xi代替,計(jì)算的結(jié)果f(x1,x2,…,xn)稱(chēng)為統(tǒng)計(jì)量的值。也可以直接將f(x1,x2,…,xn)看成統(tǒng)計(jì)量的觀察值。第20頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例子例如一項(xiàng)關(guān)于浙江省白領(lǐng)(收入為4000元-10000元)的職員的調(diào)查認(rèn)為有60%白領(lǐng)患失眠癥。樣本1樣本2樣本3如果在這個(gè)調(diào)查中樣本容量為100,則
=(樣本中失眠的人數(shù))/(樣本容量)是一個(gè)統(tǒng)計(jì)量。第21頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月是某一樣本統(tǒng)計(jì)量的全部可能取值的概率分布?,F(xiàn)實(shí)中不可能抽出所有樣本,因此統(tǒng)計(jì)量的抽樣分布實(shí)際是一種理論概率分布。統(tǒng)計(jì)推斷中,常用的理論概率分布:正態(tài)分布、2分布、t分布和F分布。提供了樣本統(tǒng)計(jì)量穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。樣本分布(samplingdistribution)第22頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.2.2由標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)樣本所引出的幾個(gè)重要統(tǒng)計(jì)量的分布1.正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布設(shè)X服從均值為μ,方差為σ2正態(tài)分布,即X~N(μ,σ2),則其分布密度函數(shù)為特別地,當(dāng)μ=0,σ2=1
時(shí)正態(tài)分布稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布。第23頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月任何一個(gè)正態(tài)分布X~N(μ,σ2),作變換就可化成標(biāo)準(zhǔn)正態(tài)分布,即Z~N(0,1)。正態(tài)分布有許多特點(diǎn):例如它是對(duì)稱(chēng)的。正態(tài)變量大約有68%的可能性在離均值一個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)取值;大約有95%的可能性在離均值1.96倍標(biāo)準(zhǔn)差的范圍內(nèi)取值。幾乎不在離均值3倍標(biāo)準(zhǔn)差以外的地方取值。68%95%99.7%第24頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例如設(shè)X~N(54,0.852),要計(jì)算P(X≤52)。則可以這樣計(jì)算:
第25頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月x0.000.010.020.030.040.050.060.070.080.090.00.10.20.30.4
0.50.60.70.80.9
1.01.11.21.31.4
1.51.61.71.81.9
2.02.12.22.32.4
2.52.62.72.82.90.50000.53980.57930.61790.6554
0.69150.72570.75800.78810.8159
0.84130.86430.88490.90320.9192
0.93320.94520.95540.96410.9713
0.97720.98210.98610.98930.9918
0.99380.99530.99650.99740.99810.50400.54380.58320.62170.6591
0.69500.72910.76110.79100.8186
0.84380.86650.88690.90490.9207
0.93450.94630.95640.96480.9719
0.97780.98260.98640.98960.9920
0.99400.99550.99660.99750.99820.50800.54780.58710.62550.6628
0.69850.73240.76420.79390.8212
0.84610.86860.88880.90660.9222
0.93570.94740.95730.96560.9726
0.97830.98300.98680.98980.9922
0.99410.99560.99670.99760.99820.51200.55170.59100.62930.6664
0.70190.73570.76730.79670.8238
0.84850.87080.89070.90820.9236
0.93700.94840.95820.96640.9732
0.97880.98340.98710.99010.9925
0.99430.99570.99680.99770.99830.51600.55570.59480.63310.6700
0.70540.73890.77030.79950.8264
0.85080.87290.89250.90990.9251
0.93820.94950.95910.96710.9738
0.97930.98380.98740.99040.9927
0.99450.99590.99690.99770.99840.51990.55960.59870.63680.6736
0.70880.74220.77340.80230.8289
0.85310.87490.89440.91150.9265
0.93940.95050.95990.96780.9744
0.97980.98420.98780.99060.9929
0.99460.99600.99700.99780.99840.52390.56360.60260.64060.6772
0.71230.74540.77640.80510.8315
0.85540.87700.89620.91310.9278
0.94060.95150.96080.96860.9750
0.98030.98460.98810.99090.9931
0.99480.99610.99710.99790.99850.52790.56750.60640.64430.6808
0.71570.74860.77940.80780.8340
0.85770.87900.89800.91470.9292
0.94180.95250.96160.96930.9756
0.98080.98500.98840.99110.9932
0.99490.99620.99720.99790.99850.53190.57140.61030.64800.6844
0.71900.75170.78230.81060.8365
0.85990.88100.89970.91620.9306
0.94300.95350.96250.97000.9762
0.98120.98540.98870.99130.9934
0.99510.99630.99730.99800.99860.53590.57530.61410.65170.6879
0.72240.75490.78520.81330.8389
0.86210.88300.90150.91770.9319
0.94410.95450.96330.97060.9767
0.98170.98570.98900.99160.9936
0.99520.99640.99740.99810.9986第26頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月2.
2(n)分布的構(gòu)成設(shè)X~N(0,1),X1,X2,…,Xn是X的隨機(jī)樣本,則這些隨機(jī)樣本的平方和服從自由度為n的
2分布,即
2~
2(n)這是一種常用的分布。例如對(duì)服從正態(tài)分布的變量的隨機(jī)樣本,其方差函數(shù)S2就滿(mǎn)足:第27頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月2(n)一個(gè)非對(duì)稱(chēng)分布,其均值為n,方差為2n,其中n為自由度(df)。第28頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月3.t分布自由度為n的t分布,記為t(n),
是由標(biāo)準(zhǔn)正態(tài)分布N(0,1)和2(n)分布組成,其表達(dá)式為其中X~N(0,1),Y~2(n),且X與Y相互獨(dú)立。第29頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月t分布的均值為0,方差為n/(n-2)。并且當(dāng)n充分大時(shí),它就近似于標(biāo)準(zhǔn)正態(tài)分布。第30頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月4.F分布F分布是由兩個(gè)2之比組成的:記為F~F(n,m),其中U~2(n),V~2(m).對(duì)于F(n,m),n稱(chēng)為第一自由度(分子自由度),m稱(chēng)為第二自由度(分母自由度)。第31頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月第32頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.2.3由一般正態(tài)分布的隨機(jī)樣本所構(gòu)成的若干重要統(tǒng)計(jì)量的分布
抽樣分布:樣本統(tǒng)計(jì)量所有可能值的概率分布。樣本統(tǒng)計(jì)量總體未知參數(shù)樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量分布的形狀及接近總體參數(shù)的程度第33頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月樣本統(tǒng)計(jì)量:平均數(shù)比率(成數(shù))方差第34頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月設(shè)隨機(jī)變量X~N(μ,σ2),X1,X2,…,Xn是X的隨機(jī)樣本,則(1)(2)(3)常使用的幾個(gè)樣本統(tǒng)計(jì)量及其分布第35頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月(4)(5)其中是容量為n1的隨機(jī)變量的樣本方差;是容量為n2的隨機(jī)變量的樣本方差。第36頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.2.4任意分布的隨機(jī)樣本均值函數(shù)的均值和方差設(shè)隨機(jī)變量X的均值為μ,方差為σ2,而分布形式任意,X1,X2,…,Xn是X的隨機(jī)樣本,則(1)(2)也就是任意隨機(jī)變量的樣本均值就等于總體均值;樣本方差等于總體方差與樣本容量的商第37頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.2.5大樣本均值的分布:中心極限定理設(shè)隨機(jī)變量X服從均值為μ,方差為σ2
的分布,X1,X2,…,Xn是X的隨機(jī)樣本,則有如下的中心極限定理。中心極限定理(CentralLimitTheorem):當(dāng)n充分大時(shí),近似地有一般地,當(dāng)n30時(shí),就可應(yīng)用中心極限定理了?;蛘呓频赜谢蛘呓频赜械?8頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月樣本容量樣本容量:一個(gè)樣本中包含的樣本單位數(shù)。通常用n來(lái)表示。大樣本:n≥30小樣本:n<30第39頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月學(xué)生ABCDEFG成績(jī)30405060708090按隨機(jī)原則抽選出4名學(xué)生,并計(jì)算平均分?jǐn)?shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等第40頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月第41頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月則容易得到利用上述結(jié)果與5.2.2的結(jié)果只要能夠證明第42頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例一汽車(chē)蓄電池商聲稱(chēng)其生產(chǎn)的電池具有均值為54個(gè)月、標(biāo)準(zhǔn)差為6個(gè)月的壽命分布?,F(xiàn)假設(shè)某消費(fèi)者團(tuán)體決定檢驗(yàn)該廠的說(shuō)法是否準(zhǔn)確,為此購(gòu)買(mǎi)了50個(gè)該廠的電池進(jìn)行檢驗(yàn)。1)假定廠商的聲稱(chēng)是正確的,試描述這50個(gè)電池平均壽命的抽樣分布。2)假定廠商聲稱(chēng)正確,則50個(gè)樣品組成的樣本的平均壽命不超過(guò)52個(gè)月的壽命的概率是多少?解1)由中心極限定理,樣本均值近似服從正態(tài)分布而并且故第43頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月2)按照上面得到的結(jié)果來(lái)計(jì)算這50個(gè)電池平均壽命不超過(guò)52個(gè)月的概率這表明這50個(gè)電池平均壽命不超過(guò)52個(gè)月的概率非常小。因此這種情況應(yīng)該不太可能出現(xiàn)。如果出現(xiàn)該情況意味著什么?第44頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.3點(diǎn)估計(jì)在解決實(shí)際問(wèn)題時(shí),常常需要用樣本來(lái)推斷總體分布的某些參數(shù)值,這就是所謂的參數(shù)估計(jì)。參數(shù)估計(jì)又分為點(diǎn)估計(jì)與區(qū)間估計(jì)??傮w參數(shù)(parameter)為描述一個(gè)總體的數(shù)字,它往往刻畫(huà)了總體某一方面的特征??傮w參數(shù)是一個(gè)特定值(fixednumber常數(shù)),但在現(xiàn)實(shí)中常常無(wú)法知道其確切的數(shù)值,例如總體的均值、方差,總體中某一類(lèi)特定對(duì)象占的比例等。第45頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月一般地,估計(jì)量(統(tǒng)計(jì)量)是指的隨機(jī)樣本的一個(gè)函數(shù)。所以粗略地講,點(diǎn)估計(jì)就是用樣本的某一函數(shù)值,來(lái)估計(jì)總體分布中的未知參數(shù)。而區(qū)間估計(jì)就是(以一定概率)把總體分布的參數(shù)確定在由樣本決定的某個(gè)區(qū)間內(nèi)。一個(gè)樣本統(tǒng)計(jì)量(如樣本均值)是樣本的函數(shù)Population
總體參數(shù)x4x49x103x354x41x4x42909x1005x31x411第46頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.3.1點(diǎn)估計(jì)的概念設(shè)θ是總體分布中一個(gè)需要估計(jì)的參數(shù)?,F(xiàn)在從總體中得到一個(gè)隨機(jī)樣本X1,X2,…,Xn
,我們的目的是通過(guò)這一隨機(jī)樣本來(lái)估計(jì)參數(shù)θ
。θ的估計(jì)量通常是隨機(jī)樣本X1,X2,…,Xn的一個(gè)函數(shù),記為簡(jiǎn)記為若能夠得到一組樣本觀察值x1,x2,…,xn,則將它們代入上述函數(shù),可以計(jì)算出θ的估計(jì)值θ的估計(jì)值也簡(jiǎn)記為。θ的點(diǎn)估計(jì)就是求θ的估計(jì)值第47頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.3.2矩估計(jì)法對(duì)總體而言,矩是指:——k階原點(diǎn)矩——k階中心矩(中心為μ)對(duì)樣本而言——一階原點(diǎn)矩——二階中心矩矩估計(jì)法就是用樣本矩來(lái)估計(jì)相應(yīng)的總體矩。第48頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例如通常用來(lái)估計(jì)用來(lái)估計(jì)并且稱(chēng)這樣得到的估計(jì)量為矩估計(jì)量。第49頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.3.3極大似然估計(jì)法引例設(shè)甲乙兩個(gè)盒子外形完全相同,甲盒中裝有90個(gè)白球10個(gè)黑球,乙盒中裝有90個(gè)黑球10個(gè)白球。今隨機(jī)地抽取一個(gè)盒子并從中抽取一球,結(jié)果抽到白球,問(wèn)這球是從哪個(gè)盒子中抽取的?從甲盒中抽取一球是白球的概率p1=9/10從乙盒中抽取一球是白球的概率p2=1/10p1遠(yuǎn)大于p2,因此我們推斷這球是從甲盒中取出。這個(gè)推斷我們依據(jù)的是所謂極大似然原理:如果進(jìn)行一次隨機(jī)實(shí)驗(yàn),結(jié)果是若干個(gè)可能后果中的某一個(gè)出現(xiàn)了,則可以認(rèn)為實(shí)驗(yàn)的條件有利于該后果的出現(xiàn),即該后果出現(xiàn)的概率最大。第50頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月更一般地,如果用一個(gè)參數(shù)θ來(lái)表示不同的盒子,即現(xiàn)在隨機(jī)抽取一個(gè)盒子,然后隨機(jī)獨(dú)立有放回地抽取5次,每次抽取一個(gè)球。如果結(jié)果是黑、白、白、白、黑。問(wèn)θ等于0還是等于1?對(duì)于甲盒,得到這樣結(jié)果的概率對(duì)于乙盒,得到這樣結(jié)果的概率由于p1大于p2,因此我們推斷θ=0。也就是,θ是使聯(lián)合概率達(dá)到最大的數(shù)。第51頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月將上述問(wèn)題抽象化。設(shè)X是一個(gè)隨機(jī)變量,其概率密度函數(shù)為。又設(shè)X1,X2,…,Xn是X的隨機(jī)樣本,則記聯(lián)合密度函數(shù)為稱(chēng)為θ的極大似然函數(shù)。若得到一組樣本觀察值x1,x2,…,xn
,則代入L后得到一個(gè)關(guān)于θ的函數(shù)。如果存在
使函數(shù)L取最大值。則稱(chēng)該為θ的極大似然估計(jì)值。而稱(chēng)為θ的極大似然估計(jì)量。第52頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.3.4示例例5.3.1設(shè)隨機(jī)變量X服從均值為μ,方差為σ2
的正態(tài)分布,X1,X2,…,Xn是X的隨機(jī)樣本,求μ和σ2的極大似然估計(jì)量。首先由前面的討論可知極大似然函數(shù)為第53頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月對(duì)L取極大值等價(jià)于對(duì)L的對(duì)數(shù)取極大值。因此在L取對(duì)數(shù)后,再分別計(jì)算關(guān)于μ和σ2的偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為零,解得μ和σ2的估計(jì)量分別為σ2的極大似然估計(jì)量要小于其矩估計(jì)量第54頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月例:英語(yǔ)六級(jí)未通過(guò)率假設(shè)某財(cái)經(jīng)大學(xué)的學(xué)生在畢業(yè)時(shí)尚未通過(guò)六級(jí)的比率為p,現(xiàn)從中隨機(jī)抽取100人調(diào)查其檔案,發(fā)現(xiàn)其中有10人六級(jí)沒(méi)過(guò),試用極大似然法估計(jì)總體參數(shù)——未通過(guò)六級(jí)的比例p。解用X表示任意抽取的一個(gè)畢業(yè)生六級(jí)通過(guò)的情況:X=1,若該生通過(guò)了六級(jí)0,若該生未通過(guò)六級(jí)則X~B(1,p).于是對(duì)于x=0,1,有P(X=x)=px(1–p)1–x
第55頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月英語(yǔ)六級(jí)未通過(guò)率<續(xù)>
對(duì)于來(lái)自于總體X的100個(gè)樣本觀測(cè)值x1,x2,…,x100,其中恰好有10個(gè)取值為1,其他為零。樣本觀察值的聯(lián)合分布密度(似然函數(shù))為兩邊取對(duì)數(shù)得對(duì)數(shù)似然函數(shù)為:上式關(guān)于p求導(dǎo)數(shù)并令導(dǎo)數(shù)為0,解得:其中q=1–p.注:用矩估計(jì)法可得到同樣結(jié)果第56頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4判斷點(diǎn)估計(jì)量的優(yōu)劣標(biāo)準(zhǔn)問(wèn)題:第一,我們?yōu)槭裁匆赃@一個(gè)而不是那一個(gè)統(tǒng)計(jì)量來(lái)估計(jì)某個(gè)總體參數(shù)?第二,如果有兩個(gè)以上的統(tǒng)計(jì)量可以用來(lái)估計(jì)某個(gè)總體參數(shù),其估計(jì)結(jié)果是否一致?是否一個(gè)統(tǒng)計(jì)量要優(yōu)于另一個(gè)?估計(jì)值的優(yōu)良標(biāo)準(zhǔn):無(wú)偏性、有效性、一致性第57頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4.1無(wú)偏估計(jì)量設(shè)為θ的估計(jì)量。如果則稱(chēng)為θ的無(wú)偏估計(jì)量。第58頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月對(duì)于正態(tài)總體,可以證明總體均值的樣本矩估計(jì)量(同時(shí)也是極大似然估計(jì)量)是無(wú)偏的??傮w方差的樣本矩估計(jì)量S2是無(wú)偏的,但是極大似然估計(jì)量是有偏的。第59頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4.2最小方差性在一個(gè)參數(shù)的眾多估計(jì)量中,人們偏好于那些具有較小方差的估計(jì)量。因?yàn)橛伤o出的估計(jì)值可能與真實(shí)值有更小的誤差。
的分布函數(shù)的分布函數(shù)第60頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月若總體參數(shù)為θ
,θ的估計(jì)量的方差小于等于其他所有對(duì)θ估計(jì)量的方差,也就是總是成立,那么稱(chēng)θ的估計(jì)量具有最小方差性。第61頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4.3有效估計(jì)量在用估計(jì)量來(lái)估計(jì)總體的某個(gè)參數(shù)時(shí),如果(1)估計(jì)量無(wú)偏的;(2)在的所有估計(jì)量中估計(jì)量的方差最小。那么,這個(gè)估計(jì)量就是總體參數(shù)的有效估計(jì)量。
第62頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4.4漸近無(wú)偏估計(jì)量漸近無(wú)偏估計(jì)量是指滿(mǎn)足如下條件的估計(jì)量:其中n為樣本容量。第63頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.4.5一致估計(jì)量第64頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月一致估計(jì)量的另一種等價(jià)的定義是:(1)是漸近無(wú)偏的;(2)其中(2)中的極限為所謂的漸近方差而普通方差為第65頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月通常判別點(diǎn)估計(jì)量?jī)?yōu)劣的準(zhǔn)則小樣本準(zhǔn)則無(wú)偏性有效性大樣本準(zhǔn)則一致性第66頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月可以證明下列估計(jì)量是具有較好統(tǒng)計(jì)性質(zhì)的估計(jì)量總體均值的矩估計(jì)量總體方差的矩估計(jì)量總體方差的極大似然估計(jì)量總體比例p的估計(jì)量樣本比例第67頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月總體構(gòu)成比例的估計(jì)常??赡軙?huì)關(guān)注總體中某一類(lèi)特定對(duì)象占的比例p。對(duì)于這樣的問(wèn)題,可以采用如下的方式處理。在總體中任取一個(gè)個(gè)體,用一個(gè)變量X來(lái)描述所抽取的對(duì)象是否屬于所關(guān)注的對(duì)象這一事件,即X=1,若抽得的是所關(guān)注的對(duì)象0,若抽得的不是所關(guān)注的對(duì)象于是,該總體可以用服從0-1分布的隨機(jī)變量X~B(1,p)描述,其中p表示所關(guān)注的對(duì)象在總體中占的比例。對(duì)于0-1分布B(1,p),其數(shù)學(xué)期望值與方差分別為:p,p(1–p)第68頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月設(shè)X1,X2,…,Xn是來(lái)自于總體X的一個(gè)隨機(jī)樣本,并且在這一樣本中我們所關(guān)注的對(duì)象恰好出現(xiàn)了n1次。那么即樣本的均值恰好等于樣本的比例。由此可見(jiàn),可用樣本比例π來(lái)估計(jì)總體比例p。此外,由中心極限定理,當(dāng)樣本容量充分大時(shí),樣本的均值函數(shù)近似地服從正態(tài)分布,也就是近似地有:第69頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月點(diǎn)估計(jì)的最大好處:給出確定的估計(jì)值點(diǎn)估計(jì)的最大問(wèn)題:無(wú)法控制誤差及判斷可靠程度在實(shí)際應(yīng)用中,我們通常只取一個(gè)樣本,因此我們無(wú)法知道通過(guò)這個(gè)樣本對(duì)總體參數(shù)的估計(jì)是否精確。但樣本容量大的隨機(jī)樣本通??偸墙o出更接近總體參數(shù)的估計(jì)值。第70頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.5區(qū)間估計(jì)在用樣本均值估計(jì)總體均值時(shí),總有人會(huì)問(wèn):“這一估計(jì)有多好?”這意味著人們不但關(guān)注你給出的估計(jì)值是多少,還關(guān)注你給出的估計(jì)有多大的誤差和可靠程度。例如一家商店調(diào)查顧客的滿(mǎn)意度,隨機(jī)抽取了由100個(gè)顧客組成的樣本,然后請(qǐng)這些顧客回答對(duì)商店服務(wù)的滿(mǎn)意度得分,最低(最不滿(mǎn)意)0分,最高100分。調(diào)查結(jié)果,這100個(gè)顧客給出的滿(mǎn)意度平均分80分。問(wèn)題“這一估計(jì)有多好?”具體來(lái)說(shuō)就是,這是否體現(xiàn)了所有顧客對(duì)商店滿(mǎn)意的平均程度,有多大誤差,樣本數(shù)量是否足夠等。第71頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.5.1置信區(qū)間若總體分布含一個(gè)未知參數(shù)β,如果找出了2個(gè)依賴(lài)樣本X1,X2,…,Xn的估計(jì)量:使得其中0<α<1,則稱(chēng)隨機(jī)區(qū)間為β的(1–α)(或100(1–α)%)的置信區(qū)間;(1–α)(或百分?jǐn)?shù)100(1–α)%)稱(chēng)為置信度或置信水平;α
稱(chēng)為顯著性水平,通常取為0.05,0.10或0.01。參數(shù)的區(qū)間估計(jì)就是求參數(shù)的置信區(qū)間。第72頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.5.2已知總體方差求總體均值的置信區(qū)間
設(shè)總體X服從N(μ,0.09),抽取了4個(gè)樣本觀察值x1,x2,x3,x4,求總體均值μ的95%的置信區(qū)間。首先因此注意到N(0,1)是一個(gè)對(duì)稱(chēng)分布。給定概率值0.95,現(xiàn)在來(lái)確定常數(shù)k,使得2.5%的面積95%的面積k第73頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月利用書(shū)末的附表一,可以查得k=z0.025=1.96。于是下面的不等式成立的概率為0.95這等價(jià)于將z0.025=1.96代入上式,即得到所需要的置信區(qū)間極限誤差平均誤差記作一般地,已知總體方差時(shí)均值置信區(qū)間的表達(dá)式第74頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月計(jì)算樣本統(tǒng)計(jì)量計(jì)算抽樣平均誤差計(jì)算抽樣極限誤差確定置信區(qū)間區(qū)間估計(jì)步驟(以估計(jì)為例):第75頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時(shí)間為6.7小時(shí)。如果總體標(biāo)準(zhǔn)差為5.8小時(shí),求該周刊訂閱者總體每周平均花費(fèi)在因特網(wǎng)上時(shí)間的95%置信區(qū)間。均值的區(qū)間估計(jì)則:該置信區(qū)間為:第76頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月5.5.3未知總體方差求總體均值的置信區(qū)間設(shè),抽取了一組樣本觀察值x1,x2,…xn,求總體均值μ的1-α置信區(qū)間。這里總體的方差σ2是未知的。首先由5.2.4有記是t分布對(duì)應(yīng)著顯著性水平α的臨界值。則α/2的面積1-α的面積tc第77頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月從而可得置信區(qū)間為其中常稱(chēng)為標(biāo)準(zhǔn)誤差(standarderror)。第78頁(yè),課件共91頁(yè),創(chuàng)作于2023年2月均值的區(qū)間估計(jì)某證券市場(chǎng)由10只股票組成的一個(gè)樣本其市盈率分別為:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 零酒駕宣傳標(biāo)語(yǔ)(130句)
- 水的溶解中班教案5篇
- 平面設(shè)計(jì)個(gè)人工作計(jì)劃(10篇)
- 網(wǎng)絡(luò)銷(xiāo)售開(kāi)場(chǎng)白(3篇)
- 安徽省馬鞍山市2023-2024學(xué)年高一上學(xué)期11月階段檢測(cè) 數(shù)學(xué)試題含答案
- DB12-T 1113-2021 河湖長(zhǎng)制工作規(guī)范
- 山東省青島市(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版隨堂測(cè)試((上下)學(xué)期)試卷及答案
- 2024年P(guān)CM脈碼調(diào)制終端設(shè)備項(xiàng)目資金需求報(bào)告代可行性研究報(bào)告
- 2024-2025學(xué)年重慶烏江新高考協(xié)作體高三上學(xué)期二調(diào)化學(xué)試題及答案
- 幼兒園教師信息化培訓(xùn)
- 國(guó)家開(kāi)放大學(xué)-機(jī)電控制與可編程控制器課程專(zhuān)題報(bào)告
- 鍋爐汽包水位串級(jí)三沖量給水控制系統(tǒng)設(shè)計(jì)
- 監(jiān)理檢測(cè)方案
- 驗(yàn)收測(cè)試大綱
- 卷管道施工方案
- 動(dòng)物感覺(jué)系統(tǒng)-眼(動(dòng)物解剖生理課件)
- 系統(tǒng)運(yùn)維年終總結(jié)模板
- 腦梗死靜脈溶栓流程優(yōu)化-課件
- 刑事撤案申請(qǐng)書(shū)
- 普外科科室醫(yī)療質(zhì)量持續(xù)改進(jìn)記錄
- 群文閱讀:童話(huà)中的不可思議 (教學(xué)實(shí)錄)
評(píng)論
0/150
提交評(píng)論