




免費(fèi)預(yù)覽已結(jié)束,剩余70頁(yè)可下載查看
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
定義:數(shù)理統(tǒng)計(jì)是以概率論為基礎(chǔ),研究社會(huì)和自然界中大量隨機(jī)現(xiàn)象數(shù)量變化基本規(guī)律的一種方法。其主要內(nèi)容有:參數(shù)估計(jì)、假設(shè)檢驗(yàn)、相關(guān)分析、試驗(yàn)設(shè)計(jì)、非參數(shù)統(tǒng)計(jì)、過(guò)程統(tǒng)計(jì)等。,特點(diǎn):,它以隨機(jī)現(xiàn)象的觀(guān)察試驗(yàn)取得資料作為出發(fā)點(diǎn),以概率論為理論基礎(chǔ)來(lái)研究隨機(jī)現(xiàn)象.根據(jù)資料為隨機(jī)現(xiàn)象選擇數(shù)學(xué)模型,且利用數(shù)學(xué)資料來(lái)驗(yàn)證數(shù)學(xué)模型是否合適,在合適的基礎(chǔ)上再研究它的特點(diǎn),性質(zhì)和規(guī)律性.,起源與發(fā)展:,古典時(shí)期(19世紀(jì)以前):這是描述性的統(tǒng)計(jì)學(xué)形成和發(fā)展階段,是數(shù)理統(tǒng)計(jì)的萌芽時(shí)期。瑞土數(shù)學(xué)家貝努里(1654-1795年)較早地系統(tǒng)論證了大數(shù)定律。1763年,英國(guó)數(shù)學(xué)家貝葉斯提出了一種歸納推理的理論,后被發(fā)展為一種統(tǒng)計(jì)推斷方法貝葉斯方法,開(kāi)創(chuàng)了數(shù)理統(tǒng)計(jì)的先河。法國(guó)數(shù)學(xué)家棣莫佛(1667-1754)于1733年首次發(fā)現(xiàn)了正態(tài)分布的密度函數(shù),并計(jì)算出該曲線(xiàn)在各種不同區(qū)間內(nèi)的概率,為整個(gè)大樣本理論奠定了基礎(chǔ)。1809年,德國(guó)數(shù)學(xué)家高斯(1777-1855)和法國(guó)數(shù)學(xué)家勒讓德(1752-1833)各自獨(dú)立地發(fā)現(xiàn)了最小二乘法,并應(yīng)用于觀(guān)測(cè)數(shù)據(jù)的誤差分析,在數(shù)理統(tǒng)計(jì)的理論與應(yīng)用方面都作出了重要貢獻(xiàn)。,近代時(shí)期(19世紀(jì)末至1845年):數(shù)理統(tǒng)計(jì)的主要分支建立,是數(shù)理統(tǒng)計(jì)的形成時(shí)期。1889年,英國(guó)數(shù)學(xué)家皮爾遜(1857-1936)提出了矩估計(jì)法,次年又提出了頻率曲線(xiàn)的理論,并于1900年在德國(guó)數(shù)學(xué)家赫爾梅特在發(fā)現(xiàn)卡方分布的基礎(chǔ)上提出了卡方檢驗(yàn),這是數(shù)理統(tǒng)計(jì)發(fā)展史上出現(xiàn)的第一個(gè)小樣本分布。1908年,英國(guó)的統(tǒng)計(jì)學(xué)家戈塞特(1876-1937)創(chuàng)立了小樣本檢驗(yàn)代替了大樣本檢驗(yàn)的理論和方法(即t分布和t法),這為數(shù)理統(tǒng)計(jì)的另一分支多元分析奠定理論基礎(chǔ)。1912年,英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)歇(1890-1962)推廣了t檢驗(yàn)法,同時(shí)發(fā)展了顯著性檢驗(yàn)及估計(jì)和方差分析等數(shù)理統(tǒng)計(jì)新分支。這樣,數(shù)理統(tǒng)計(jì)的一些重要分支如假設(shè)檢驗(yàn)、回歸分析、方差分析、正交設(shè)計(jì)等有了其決定其面貌的內(nèi)容和理論.數(shù)理統(tǒng)計(jì)成為應(yīng)用廣泛、方法獨(dú)特的一門(mén)數(shù)學(xué)學(xué)科。,現(xiàn)代時(shí)期(1945年以后):美籍羅馬尼亞數(shù)理統(tǒng)計(jì)學(xué)家瓦你德(1902-1950)致力于用數(shù)學(xué)方法使統(tǒng)計(jì)學(xué)精確化、嚴(yán)密化,取得了很多重要成果,他發(fā)展了決策理論,提出了一般的判別問(wèn)題,創(chuàng)立了序貫分析理論,提出著名的序貫概率比檢法。瓦爾德的兩本著作序貫分析和統(tǒng)計(jì)決策函數(shù)論,被認(rèn)為是數(shù)理發(fā)展史上的經(jīng)典之作。由于計(jì)算機(jī)的應(yīng)用,推動(dòng)了數(shù)理統(tǒng)計(jì)在理論研究和應(yīng)用方面不斷地向縱深發(fā)展,并產(chǎn)生一些新的分支和邊緣性的新學(xué)科,如最優(yōu)設(shè)計(jì)和非參數(shù)統(tǒng)計(jì)推斷等。當(dāng)前,數(shù)理統(tǒng)計(jì)的應(yīng)用范圍愈來(lái)愈廣泛,已滲透到許多科學(xué)領(lǐng)域,應(yīng)用到國(guó)民經(jīng)濟(jì)各個(gè)部門(mén),成為科學(xué)研究不可缺少的工具。,第四章抽樣分布,4.1.基本概念4.2.抽樣分布4.3.三種分布,抽樣調(diào)查:通過(guò)調(diào)查群體中的一部分個(gè)體來(lái)了解整個(gè)群體.概率論的任務(wù):對(duì)不同的抽樣結(jié)果出現(xiàn)的可能性大小進(jìn)行討論,為根據(jù)樣本情況推斷總體情況提供理論依據(jù).數(shù)理統(tǒng)計(jì)的任務(wù):根據(jù)樣本情況推斷總體情況.,4.1基本概念,一、總體與個(gè)體:,總體:某一個(gè)問(wèn)題的研究對(duì)象的全體.個(gè)體:組成總體每個(gè)基本單元.,把研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)的全體看作總體;把每個(gè)數(shù)值看作個(gè)體,一般地,我們把所研究的總體,即研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)記作X,它的取值在客觀(guān)上有一定的分布,X也是一個(gè)隨機(jī)變量,總體,R.V.X,有限總體,無(wú)限總體,例.研究一批燈泡的平均壽命.該批燈泡的全體:總體,其中每個(gè)燈泡:個(gè)體.,二、抽樣與樣本,抽樣:為了推斷總體的性態(tài)而從總體中抽取部分個(gè)體的過(guò)程稱(chēng)為抽樣.樣本:設(shè)從總體X中隨機(jī)抽取或觀(guān)察n個(gè)個(gè)體X1,X2Xn,所得的這一組個(gè)體(X1,X2Xn)稱(chēng)為總體X的一個(gè)樣本.其中個(gè)體的數(shù)目n稱(chēng)為樣本容量.,注意:,在抽取或觀(guān)察每個(gè)個(gè)體之前,X1,X2Xn都是未知的,因而它們都是隨機(jī)變量,(X1,X2Xn)為n維隨機(jī)變量當(dāng)n次抽取或觀(guān)察一經(jīng)完成,我們就得到一組實(shí)數(shù)(x1,x2,xn),稱(chēng)其為樣本觀(guān)察值或樣本值,三、簡(jiǎn)單隨機(jī)抽樣,定義:如果X1,Xn是相互獨(dú)立并且與X同分布的隨機(jī)變量,則稱(chēng)X1,Xn為來(lái)自總體X的容量為n的簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱(chēng)樣本.,注:有限總體時(shí),采用放回抽樣所得的樣本才是簡(jiǎn)單隨機(jī)樣本,今后只討論簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)單隨機(jī)樣本滿(mǎn)足的三個(gè)條件:(1).隨機(jī)性:抽樣或觀(guān)察應(yīng)隨機(jī)地進(jìn)行,每個(gè)個(gè)體被抽或被觀(guān)察的機(jī)會(huì)均等;(2).獨(dú)立性:每次抽取或觀(guān)察獨(dú)立進(jìn)行,其結(jié)果不受其它抽取或觀(guān)察結(jié)果的影響,(3).代表性:即從總體中抽出的一組樣本,它在所關(guān)注的指標(biāo)上可以代表該群體.,在上述三個(gè)條件之下,X1,X2Xn是相互獨(dú)立的,且與X有相同的分布,四、統(tǒng)計(jì)量,定義2:設(shè)X1,X2,Xn為總體X的一個(gè)容量為n的樣本,g(X1,X2,Xn)為一個(gè)連續(xù)函數(shù),如果g()中不包含未知參數(shù),則稱(chēng):g(X1,X2,Xn)為關(guān)于總體X的統(tǒng)計(jì)量.,統(tǒng)計(jì)量即不包含未知參數(shù)的樣本函數(shù),例.設(shè)X1,X2,Xn為來(lái)自總體N(,2)的樣本.其中已知,2未知,則,哪些是統(tǒng)計(jì)量?,注:幾種重要的統(tǒng)計(jì)量,4.2抽樣分布,注意:統(tǒng)計(jì)量是獨(dú)立同分布隨機(jī)變量X1,X2Xn的函數(shù),因而它也是一個(gè)隨機(jī)變量,從而也就有了統(tǒng)計(jì)量的分布。,一、和的分布,定理1:設(shè)X1,X2是兩個(gè)獨(dú)立隨機(jī)變量,其密度函數(shù)分別是fx1(x1),fx2(x2),如果X=X1+X2,則X的密度函數(shù)是,分析:,證明:,例:設(shè)X1,X2獨(dú)立同分布于N(,2),求X1+X2的分布.,故X1+X2N(2,22),解:由,知,類(lèi)似地X1-X2N(0,22),例:設(shè)X1和X2獨(dú)立,分別服從二項(xiàng)分布B(n1,p)和B(n2,p).求Y=X1+X2的分布.,解:,二、樣本均數(shù)的分布,定理2:設(shè)總體XN(,2),X1,X2,Xn為其容量為n的樣本,則,一般結(jié)果:隨機(jī)變量XN(,2),則它的線(xiàn)性函數(shù)Y=aX+b仍然服從正態(tài)分布,并且YN(a+b,a22)這里a,b為常數(shù).,更一般結(jié)果:X1,X2,Xn相互獨(dú)立,并且i=1,2,n,則其線(xiàn)性組合:仍然服從正態(tài)分布,并且這里ci為不全為零的常數(shù).,三、一個(gè)重要定理,設(shè)X1,X2,Xn是取自總體N(,2)的一個(gè)樣本,則,一、2分布,定義1:設(shè)X1,X2,Xn獨(dú)立同分布于N(0,1),則稱(chēng)服從自由度為n的分布,記,4.3三種分布,注:,2(n)分布的概率密度函數(shù)為:,這里:,1、數(shù)字特征:,2、可加性:,3、上側(cè)分位數(shù):,性質(zhì),二、t分布,定義2:設(shè)XN(0,1)與Y2(n)獨(dú)立,則稱(chēng)服從自由度為n的t分布,記tt(n).,1).圖形關(guān)于t=0對(duì)稱(chēng);即有E(X)=02).t分布的的極限是標(biāo)準(zhǔn)正態(tài)分布,即:事實(shí)上,當(dāng)n30時(shí),兩者就非常接近了.,t分布的幾個(gè)簡(jiǎn)單性質(zhì):,3).對(duì)于給定的01,稱(chēng)滿(mǎn)足件的點(diǎn)t(n)為t分布的上側(cè)分位點(diǎn)。,定理:,這里:XN(1,2),YN(2,2),且,從而由t分布的定義得:,證明:,且,例題:某克山病區(qū)測(cè)得11例急性克山病患者以及13名健康人的血膦值如表,問(wèn)該地克山病患者與健康人的血膦值是否不同?現(xiàn)假設(shè)兩組數(shù)據(jù)的方差是相同的,則這個(gè)題目實(shí)際是問(wèn)兩組數(shù)據(jù)的均值是否相同?,我們現(xiàn)在的問(wèn)題就是判斷EX是否等于EY,那我們自然選擇統(tǒng)計(jì)量作為我們的判定對(duì)象,也即當(dāng)時(shí)我們即可判定:EXEY!由于數(shù)據(jù)本身是隨機(jī)的,因此必定在一定范圍內(nèi)波動(dòng),因此我們只能利用的概率分布來(lái)判定!但是的分布是含有參數(shù)的,故我們選擇:作為我們的判定標(biāo)準(zhǔn)。,關(guān)于判別標(biāo)準(zhǔn)的幾個(gè)問(wèn)題:(1).什么樣的事件才足以使我們作出判決?由于事件發(fā)生的隨機(jī)性,只有某個(gè)事件的發(fā)生有足夠的信息量才能作出判決。(2).概率上的小概率事件必然發(fā)生和統(tǒng)計(jì)中的判別準(zhǔn)則有什么不同?(3).事件發(fā)生的合理性準(zhǔn)則,即小概率事件不該發(fā)生。,統(tǒng)計(jì)過(guò)程:假設(shè)總體服從一定的分布,那么我們得到的樣本就應(yīng)該是“合理的”!從而統(tǒng)計(jì)量的取值(樣本觀(guān)察值)就應(yīng)該是合理的,即不應(yīng)該是一個(gè)小概率事件。這就是樣本和樣本觀(guān)察值之間的關(guān)系,也是概率和統(tǒng)計(jì)之間的關(guān)系。,三、F分布,定義3:設(shè)隨機(jī)變量并且與相互獨(dú)立,則稱(chēng)隨機(jī)變量服從自由度為(n1,n2)的F分布,記FF(n1,n2).,證明:,F分布的上側(cè)臨界值(上分位點(diǎn)):,滿(mǎn)足上式(01)的點(diǎn)F(n1,n2)為F分布的上分位點(diǎn).,例題:某克山病區(qū)測(cè)得11例急性克山病患者以及13名健康人的血膦值如表,問(wèn)該地克山病患者與健康人的血膦值是否有相同的方差?也即這兩批數(shù)據(jù)是否有足夠的代表性?,我們現(xiàn)在的問(wèn)題就是判斷是否等于,那我們自然選擇統(tǒng)計(jì)量作為我們的判定對(duì)象,也即當(dāng)時(shí)我們即可判定:!由于數(shù)據(jù)本身是隨機(jī)的,因此必定在一定范圍內(nèi)波動(dòng),因此我們只能利用的概率分布來(lái)判定!我們的假定是,故我們選擇:作為我們的判定標(biāo)準(zhǔn)。,例:設(shè)總體X服從正態(tài)分布N(,2),從中抽取容量為16的樣本,試在:1)已知2=252)2未知,但已知樣本方差S2=20.8的情況下,求樣本均值與總體均值之差的絕對(duì)值小于2的概率.,解:1).由于統(tǒng)計(jì)量,2).由于2未知,但S2=20.8,這時(shí)統(tǒng)計(jì)量:,4.4.樣本分布圖,隨機(jī)變量的概率密度或分布函數(shù),可以通過(guò)函數(shù)圖來(lái)直觀(guān)刻畫(huà)總體的規(guī)律。對(duì)于樣本,我們也可以做出反映樣本頻率分布密度的直方圖和反映樣本累積頻率的經(jīng)驗(yàn)分布圖。,1。直方圖,例:給定某次考試成績(jī),現(xiàn)考察各個(gè)分?jǐn)?shù)段的分布情況。通常先分組,了解大致趨勢(shì),最后再給出總體分布;,Histogram,例:在散劑分裝過(guò)程中,隨機(jī)抽取100袋稱(chēng)重,結(jié)果如下.畫(huà)出袋裝散劑重量X的頻率直方圖.,2。作圖步驟,4.確定組距h5.計(jì)算各組的上、下邊界值6.計(jì)算各組的組中值xi7.統(tǒng)計(jì)落入各組的數(shù)據(jù)個(gè)數(shù),整理成頻數(shù)表8.作直方圖,Histogramwith10pointrange,Histogramwith5pointrange,思考題:1).組間距的大小對(duì)于直方圖的圖示有什么影響?2).什么樣的數(shù)據(jù)有更大的代表性?怎么衡量數(shù)據(jù)本身對(duì)總體的代表性呢?3).能否解釋統(tǒng)計(jì)中為什么要采用隨機(jī)抽樣!,3。經(jīng)驗(yàn)分布函數(shù),定義:如果總體X的n個(gè)獨(dú)立觀(guān)察值,其累積頻率:稱(chēng)Fn(x)為樣本分布函數(shù)或經(jīng)驗(yàn)分布函數(shù).,例.隨機(jī)地觀(guān)測(cè)總體X得8個(gè)數(shù)據(jù):2.5,3,2.5,3.5,3,2.7,2.5,2,求X的經(jīng)驗(yàn)分布函數(shù).22.5=2.5=2.52.73=33.5,例:設(shè)有150名學(xué)生進(jìn)行英語(yǔ)測(cè)驗(yàn),試完成下表:,例:根據(jù)已知數(shù)據(jù)列表如下,于是得頻率直方圖為,而積累頻率的直方圖為,4。理論分布函
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年兒童行為與發(fā)展專(zhuān)業(yè)考試卷及答案
- 2025年財(cái)務(wù)分析師職業(yè)資格考試試題及答案
- 2025年傳統(tǒng)文化傳播師資格考試試卷及答案發(fā)表
- 架子工安全交底
- 水利資料培訓(xùn)
- 2025年河北出租車(chē)資格證答題口訣
- 歷史文化遺址保護(hù)理論與實(shí)踐知識(shí)測(cè)驗(yàn)卷
- 看電影飛屋歷險(xiǎn)記有感作文5篇
- 三國(guó)演義人物形象分析:名著導(dǎo)讀與賞析
- 一件有意義的小物品物品話(huà)題類(lèi)作文(13篇)
- 發(fā)電機(jī)勵(lì)磁系統(tǒng)檢修與維護(hù)
- 2023-2024學(xué)年福建省泉州市小學(xué)語(yǔ)文六年級(jí)期末自測(cè)模擬試卷
- GB 29541-2013熱泵熱水機(jī)(器)能效限定值及能效等級(jí)
- 控規(guī)用地代碼
- 2023年上杭縣社區(qū)工作者招聘考試筆試題庫(kù)及答案解析
- 2021年曹楊二中自招數(shù)學(xué)試卷
- 中國(guó)近現(xiàn)代史綱要超星爾雅答案貴州大學(xué)-
- 新能源汽車(chē)底盤(pán)檢修全套課件
- 幼兒園大班數(shù)學(xué)口算練習(xí)題可打印
- 江蘇特種作業(yè)人員體檢表
- 堡壘主機(jī)用戶(hù)操作手冊(cè)運(yùn)維管理
評(píng)論
0/150
提交評(píng)論