




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
概率論與數(shù)理統(tǒng)計ProbabilityTheoryandMathematicalStatistics
主講人:周鑫Tel-Mail:zhxinou2011@163.com1/31/2023概率論與數(shù)理統(tǒng)計第六章數(shù)理統(tǒng)計的基本概念SichuanUniversityJinjiangCollege1/31/2023本章轉(zhuǎn)入課程的第二部分數(shù)理統(tǒng)計
數(shù)理統(tǒng)計的特點是應(yīng)用面廣,分支較多.社會的發(fā)展不斷向統(tǒng)計提出新的問題.計算機的誕生與發(fā)展,為數(shù)據(jù)處理提供了強有力的技術(shù)支持,數(shù)理統(tǒng)計與計算機的結(jié)合是必然的發(fā)展趨勢.1/31/2023從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計的工作.但是當時的統(tǒng)計,只是對有關(guān)事實的簡單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.1/31/2023到了十九世紀末二十世紀初,隨著近代數(shù)學和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計學這門學科.數(shù)理統(tǒng)計學1/31/2023
數(shù)理統(tǒng)計學是一門應(yīng)用性很強的學科.它是研究怎樣以有效的方式收集、整理和分析帶有隨機性的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動提供依據(jù)和建議.1/31/2023數(shù)理統(tǒng)計的任務(wù)就是研究怎樣有效地收集、整理、分析所獲得的有限的資料,對所研究的問題,盡可能地作出精確而可靠的結(jié)論.1/31/2023
由于推斷是基于抽樣數(shù)據(jù),抽樣數(shù)據(jù)又不能包括研究對象的全部信息.因而由此獲得的結(jié)論必然包含不肯定性.在數(shù)理統(tǒng)計中,不是對所研究的對象全體(稱為總體)進行觀察,而是抽取其中的部分(稱為樣本)進行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進行推斷.1/31/2023概率論與數(shù)理統(tǒng)計第六章數(shù)理統(tǒng)計的基本概念
第一節(jié)基本概念SichuanUniversityJinjiangCollege1/31/2023研究對象的全體稱為總體這樣定義的總體和個體是具體的對象,不符合數(shù)學研究的特點---抽象
考察某班級學生的數(shù)學課程學習成績,則全體學生構(gòu)成了一個總體,每個同學就是一個個體.
考察某工廠生產(chǎn)的某批燈泡的壽命,則該廠生產(chǎn)的該批燈泡構(gòu)成了一個總體,每個燈泡就是一個個體.1、數(shù)理統(tǒng)計的幾個基本概念總體個體總體中的一個具體對象稱為個體例例問題如何改進?不是研究它們而是研究數(shù)量指標這些數(shù)量指標是服從某種分布的r.v總體:研究對象的數(shù)量指標
個體:
的值一、總體和樣本1/31/2023以隨機變量X代表總體的特征總體 個體 特征一批產(chǎn)品每件產(chǎn)品等級一批燈泡 每個燈泡 壽命一年的日平均氣溫 每天日平均氣溫 度數(shù)數(shù)軸上某一線段 線段中每一點 坐標一批彩票 每張彩票 號碼人們感興趣的是總體的某一個或幾個數(shù)量指標的分布情況。每個個體所取的值不同,但它按一定規(guī)律分布。1/31/2023
考察某班級學生的英語課程學習成績
因為每個學生的成績都在全班平均成績
的附近波動,所以總體可視為例
考察某工廠生產(chǎn)的某批燈泡的壽命
因為每個燈泡的壽命都在該批燈泡平均壽命
的附近波動,所以總體可視為例1/31/2023如何收集數(shù)據(jù)這一過程稱為抽樣問從研究對象中任取
個“個體”,觀察它們的數(shù)量指標抽樣的特點每次取出的樣品與總體有相同的分布樣本的特點?稱為容量為的樣本.是相互獨立,與總體同分布的r.v觀察前:觀察后:樣本值為個具體的觀察數(shù)據(jù)樣本的二重性獨立性:要求各次取樣的結(jié)果互不影響代表性:在相同條件下對總體
進行
次重復(fù)、獨立觀察樣本觀察值2、樣本1/31/2023
某廠生產(chǎn)了一大批燈泡,現(xiàn)從中隨機抽取5只進行檢測,測得其壽命(小時)分別為總體為燈泡的壽命樣本容量為5,樣本為分析例樣本觀察值為樣本二重性總體為工件長度樣本容量為6,樣本為分析例樣本二重性對長度為的工件進行了6次測量,測量值為??樣本觀察值為工件實際長度未知連續(xù)型總體1/31/2023總體分析(零件合格或不合格)二重性總體分布律為
考察某工廠生產(chǎn)的零件是否合格,從該廠生產(chǎn)的一批產(chǎn)品中隨機抽檢了100個,若合格則記為0,若不合格則記為1,100個產(chǎn)品的檢查結(jié)果為其中
為零件的次品率。例樣本(獨立同分布分布)樣本觀察值離散型總體1/31/2023由于抽樣的目的是為了對總體進行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作“簡單隨機抽樣”.由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,它可以用與總體獨立同分布的n個相互獨立的隨機變量X1,X2,…,Xn
表示.1/31/2023定義6.1設(shè)X1,X2,…,Xn是來自總體X的容量為n的樣本,如果X1,X2,…,Xn
相互獨立且與總體X有相同的分布,則稱X1,X2,…,Xn為簡單隨機樣本,簡稱為樣本或子樣。代表性獨立性1/31/2023設(shè)為來自總體的樣本,則樣本的聯(lián)合分布函數(shù)為設(shè)為來自總體的樣本,則樣本的聯(lián)合概率函數(shù)為例設(shè)為來自總體的樣本,則樣本的聯(lián)合密度為n維正態(tài)分布樣本的聯(lián)合分布樣本的聯(lián)合概率函數(shù)1/31/2023事實上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班大學生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本.我們只能觀察到隨機變量取的值而見不到隨機變量.3.總體、樣本、樣本值的關(guān)系1/31/2023總體(理論分布)?樣本樣本值統(tǒng)計是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.樣本是聯(lián)系二者的橋梁1/31/2023二、統(tǒng)計量從總體抽取樣本怎樣集中、提煉出有用的信息統(tǒng)計推斷的基礎(chǔ):收集數(shù)據(jù)“雜亂無章”的數(shù)據(jù)包含了各種有用的“信息”問?下面的量能較好地反映全班整體學習情況
某班級《高等數(shù)學》課程考試成績單列出
個學生成績分別為如何評價全班整體學習情況?例分析通過構(gòu)造樣本函數(shù),加工提煉出有用信息1/31/2023數(shù)據(jù)的加工整理:統(tǒng)計量設(shè)為來自總體的樣本為
元函數(shù),若不含任何未知參數(shù),則稱為統(tǒng)計量.由樣本值去推斷總體情況,需要對樣本值進行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計量.它是完全由樣本決定的量.1/31/2023例設(shè)為來自總體的樣本,其中均未知,判斷下列哪些是統(tǒng)計量:
1/31/2023樣本均值樣本方差樣本標準差樣本k階矩樣本k階中心矩極小值極大值常用的統(tǒng)計量為什么不是(下章說明)與第4章介紹的矩有什么不同?1/31/2023例從一批燈泡中任意抽取10只,測試其壽命(單位:h),得到數(shù)據(jù)如下:
13601520153014701560138014601430試求樣本均值、樣本方差和樣本標準差。1/31/2023概率論與數(shù)理統(tǒng)計第六章數(shù)理統(tǒng)計的基本概念
第二節(jié)抽樣分布SichuanUniversityJinjiangCollege1/31/2023
統(tǒng)計量既然是依賴于樣本的,而后者又是隨機變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,這個分布叫做統(tǒng)計量的“抽樣分布”
.
1/31/2023
抽樣分布就是通常的隨機變量函數(shù)的分布.只是強調(diào)這一分布是由一個統(tǒng)計量所產(chǎn)生的.研究統(tǒng)計量的性質(zhì)和評價一個統(tǒng)計推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).抽樣分布精確抽樣分布漸近分布(小樣本問題中使用)(大樣本問題中使用)1/31/2023一、樣本均值的分布設(shè)總體X的期望和方差分別為E(X)=μ,D(X)=σ2
,X1,X2,…,Xn是X的一個樣本(子樣),則有1/31/2023定理6.1設(shè)總體是X的一個樣本,則定理6.2設(shè)非正態(tài)總體X具有分布F(x),且為總體X的一個樣本,則當n充分大時,對于非正態(tài)總體,由中心極限定理可以得到1/31/2023分位數(shù)定義6.4設(shè)統(tǒng)計量U~N(0,1),對給定的常數(shù)α(0<α<1),則(1)若常數(shù)zα滿足則稱為為標準正態(tài)分布的顯著性水平的上側(cè)分位數(shù)。(2)若常數(shù)zα/2滿足則稱為為標準正態(tài)分布的顯著性水平的雙側(cè)分位數(shù)。面積為1/31/2023樣本統(tǒng)計量包含了各種有用信息集中、提煉數(shù)據(jù)中包含的有用信息它們是隨機變量,必須確定其分布,稱為抽樣分布來自標準正態(tài)總體的抽樣分布主要討論:①②來自一般正態(tài)總體的抽樣分布分布分布分布五個抽樣分布定理二、三大抽樣分布1/31/2023隨著自由度的增加曲線重心向右下方移動(一)-分布是來自總體設(shè)的樣本,令稱服從自由度為的
分布,記為分布的密度函數(shù)及圖形伽馬函數(shù)分布的可加性且相互獨立,則設(shè)推廣:且設(shè)相互獨立,則,于是理解為可獨立變化的r.v個數(shù)則設(shè)證取個獨立同分布的則與同分布分布的數(shù)學期望與方差1/31/2023KarlPearsonBorn:27March1857inLondon,England
Died:27April1936inColdharbour,Surrey,England1/31/2023它既與α有關(guān),也與自由度n有關(guān)。書后表4給出了卡方分布的分位數(shù)1/31/2023例查
分布表,可求得1/31/2023隨著自由度的增加曲線越來越趨近(二)分布且設(shè)相互獨立,令稱服從自由度為的
分布,記為分布的密度函數(shù)及圖形易知:??利用伽馬函數(shù)的斯特林公式即故當較大時,可認為英國統(tǒng)計學家兼化學家戈塞特(GossetWS1876-1937
)于1908年用筆名Student發(fā)表了關(guān)于
t
分布的論文,這是一篇在統(tǒng)計學發(fā)展史上劃時代的文章,它創(chuàng)立了小樣本代替大樣本的方法,開創(chuàng)了現(xiàn)代統(tǒng)計學的新紀元.
Gosset,Student的最后一個字母都是t
,故取名為“t
分布”,又稱為“學生氏分布”.-分布是怎樣產(chǎn)生的t?1/31/2023WilliamSealeyGossetBorn:13June1876inCanterbury,England
Died:16Oct1937inBeaconsfield,England1/31/2023由t-分布的對稱性,可知書后表5給出了t分布的雙側(cè)分位數(shù)1/31/2023(三)分布且設(shè)相互獨立,令稱服從自由度為的
分布,記為分布的密度函數(shù)及圖形分布的重要性質(zhì)若則分布是為了紀念著名統(tǒng)計學家費歇耳(R.A.Fisher1890-1962)而命名1/31/2023SirRonaldAylmerFisherBorn:17Feb1890inLondon,England
Died:29July1962inAdelaide,Australia1/31/20231/31/2023(四)抽樣分布定理最重要的總體:問題question如何由樣本推斷?分析:對的推斷是通過構(gòu)造統(tǒng)計量實現(xiàn)的如何構(gòu)造“好”的統(tǒng)計量①②服從什么分布?統(tǒng)計推斷中最重要的結(jié)論:五個抽樣分布定理1/31/2023仍服從正態(tài)分布,且定理一證的樣設(shè)是來自總體本,則獨立同分布由正態(tài)分布的性質(zhì)知,線性組合1/31/2023n取不同值時樣本均值的分布1/31/2023定理二的樣本,設(shè)是總體分別為樣本均值和樣本方差,則有相互獨立①②分析???(證略)1/31/2023n取不同值時的分布1/31/2023定理三的樣本,設(shè)是總體分別為樣本均值和樣本方差,則有證由定理一、定理二有且與獨立,由分布的定義有結(jié)果分析即“平均”說來與的差別不大,故可用“代替”兩個未知參數(shù)一個未知參數(shù)1/31/2023定理四的樣本;設(shè)是總體的樣本,且兩樣本相互獨立,是總體兩樣本均值和樣本方差分別為則證由定理二,有因兩樣本獨立,故獨立1/31/2023定理五的樣本;設(shè)是總體的樣本,且兩樣本相互獨立,是總體兩樣本均值和樣本方差分別為則證其中,且相互獨立又由的獨立性及分布的可加性有由兩樣本的獨立性及分布的定義有1/31/2023設(shè)為總體的一個樣本,為樣本均值,則下列結(jié)論中正確的是(
)
D1/31/2023
總體樣本統(tǒng)計量描述作出推斷研究統(tǒng)計量的性質(zhì)和評價一個統(tǒng)計推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).隨機抽樣我們介紹了數(shù)理統(tǒng)計的基本概念.小結(jié)1/31/2023我們介紹了常用的統(tǒng)計三大分布:我們還介紹了5個抽樣分布定理,要牢固掌握.分布,t分布,F分布.注意它們的定義和基本性質(zhì).1/31/2023第六章數(shù)理統(tǒng)計的基本概念問6.1:數(shù)理統(tǒng)計的研究對象和目的是什么?答:“數(shù)理統(tǒng)計學”是數(shù)學的一個分支,它的任務(wù)是研究怎樣用有效的方法去收集和使用帶隨機性影響的數(shù)據(jù),它的具體含義包括以下幾層意思:1)能否假定數(shù)據(jù)有隨機性,是區(qū)別數(shù)理統(tǒng)計方法與其他數(shù)據(jù)處理方法的根本點。數(shù)據(jù)的隨機性來源有兩種:1/31/2023a)問題中涉及的研究對象為數(shù)很大,只能抽取部分樣品加以研究,如測定10000支燈管的壽命,只能抽取其中100支進行測試(測試結(jié)束,這100支燈管就失去了使用價值),而這100支燈管的抽取是帶隨機性的。b)數(shù)據(jù)的隨機性來源于測量誤差或者試驗的隨機誤差,如考察產(chǎn)品的質(zhì)量,溫度和壓力是重要因素。但當溫度和壓力取為定值時,質(zhì)量仍因大量其他因素的影響,如原材料的差異,使用的設(shè)備和操作人員的經(jīng)驗差異等而有一定的波動,試驗結(jié)果仍包含有隨機誤差。1/31/20232)所謂“用有效的方法收集數(shù)據(jù)”可歸結(jié)為:b)要使數(shù)據(jù)包含盡可能多的與研究問題有關(guān)的信息。例如對上海市居民收入的狀況進行研究時,我們應(yīng)調(diào)查多少戶居民比較合適,太少了沒有代表性,太多了費用昂貴,究竟確定幾戶合適就要用統(tǒng)計方法。另外若確定了選取1000戶,如何選???如果只從高收入人群調(diào)查,就失去了代表性,數(shù)據(jù)談不上有效性。a)建立一個數(shù)學上易于處理的盡可能簡單的模型描述所得的數(shù)據(jù)。1/31/2023如果用純隨機化方法抽取,則數(shù)據(jù)就有一定的代表性,本教材討論的正是這種模型。是否有更有效的方法,例如高收入人群占30%、低收入人群占70%,那么我們從高收入人群中隨機抽300戶,而從低收入人群中隨機抽700戶,這時的數(shù)據(jù)確實更為有效等等。由此產(chǎn)生了數(shù)理統(tǒng)計的兩個分支“抽樣理論”和“試驗設(shè)計”。3)“有效地使用隨機數(shù)據(jù)”的含義即將抽得的隨機數(shù)據(jù)用有效的方式去集中,提取與研究問題有關(guān)的信息,1/31/2023并利用它對提出問題作出一定的結(jié)論,這種結(jié)論稱為“統(tǒng)計推斷”。但統(tǒng)計推斷并不是絕對精確和可靠的,這正是數(shù)據(jù)隨機化帶來的影響,然而推斷應(yīng)盡可能的“可靠”。本教材中討論的“點估計,區(qū)間估計和假設(shè)檢驗”正是統(tǒng)計推斷中的重要內(nèi)容。顯著性水平,置信水平等相應(yīng)的概率大小正反映這些統(tǒng)計推斷方法的“可靠性”的大小?!敖y(tǒng)計推斷”中有許多統(tǒng)計方法來源于實踐中產(chǎn)生的“統(tǒng)計思想”,如“極大似然法”,“矩法”等,它有一定的合理性,但又不是“絕對精確”。1/31/2023答:樣本表現(xiàn)為一大批的數(shù)字,很難直接用來解決我們所要研究的具體問題,所以常常需要把樣本數(shù)據(jù)整理加工成若干個簡單明了的數(shù)字特征,當樣本數(shù)據(jù)確定后,統(tǒng)計量的值即可以知道了。所以統(tǒng)計量綜合了樣本的信息,是統(tǒng)計推斷的基礎(chǔ).只有理解了這些統(tǒng)計思想才會對統(tǒng)計方法深入理解。只有對“可靠性”大小的正確理解才能對研究的結(jié)論作出正確的闡述。問6.2:為什么要提出統(tǒng)計量?1/31/2023答:分布,t分布,F(xiàn)分布都是從正態(tài)總體中衍生出來的,幾種常用的統(tǒng)計量的分布都與這三大分布有關(guān),所以這三大分布在正態(tài)總體的統(tǒng)計推斷中起著重要的作用。問6.3三大分布的作用是什么?1/31/2023第六章
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 泰州防水涂裝施工方案
- 2025年中考語文滿分作文的精彩構(gòu)思:標題+開頭段+主體段+結(jié)尾段
- 廣東省深圳實驗學校高中部2024-2025學年高二上學期期末考試英語試題【含答案】
- 回填基坑施工方案范本
- 樹木粉碎施工方案
- 2025年液晶電視維修試題及答案
- 6年級科學小發(fā)明
- coqh2-細胞色素c還原酶
- cia年檢繼續(xù)教育積分填報流程
- cascode電流鏡環(huán)路增益
- GB/T 10895-2004離心機分離機機械振動測試方法
- 805不讀書-不吃苦-你要青春干嘛
- 研究生實驗報告模板(word可修改)
- 部編版語文市級公開教學講座《口語交際》培訓課件
- 高中英語-新外研版必修一unit5-The-Monarchs-Journey-公開課reading課件
- 建設(shè)項目用地預(yù)審與選址意見課件講解
- DB44∕T 1049-2012 物業(yè)服務(wù) 綠化養(yǎng)護檢查規(guī)范
- 腹膜透析治療的護理-課件資料
- 國家開放大學《調(diào)劑學(本)》形考任務(wù)1-4參考答案
- 幼兒園小班繪本:《一步一步_走啊走》 PPT課件
- 《基礎(chǔ)和聲學》試習題庫(6套答案)
評論
0/150
提交評論