應(yīng)用數(shù)理統(tǒng)計吳翊版第一章_第1頁
應(yīng)用數(shù)理統(tǒng)計吳翊版第一章_第2頁
應(yīng)用數(shù)理統(tǒng)計吳翊版第一章_第3頁
應(yīng)用數(shù)理統(tǒng)計吳翊版第一章_第4頁
應(yīng)用數(shù)理統(tǒng)計吳翊版第一章_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2023/1/13(C)中國民航大學(xué)1

數(shù)理統(tǒng)計編輯課件2023/1/132主講教師張春曉理學(xué)院副教授

研究興趣:統(tǒng)計預(yù)測與決策、優(yōu)化與控制辦公地點:理學(xué)院統(tǒng)計教研室(南1-316)

電話:E-mail:

編輯課件2023/1/133課程成績考試成績由期末考試成績和平時考核成績兩部分組成。平時成績占15%;期末考試采用閉卷(開卷)筆試方式進行,占85%。答疑時間地點課后或周五下午統(tǒng)計教研室編輯課件2023/1/134課程說明

⑴教學(xué)目的

應(yīng)用數(shù)理統(tǒng)計是一門科學(xué),實證的方法,尤其是數(shù)量分析方法是統(tǒng)計學(xué)研究的基本方法論。通過該門課程教學(xué),使學(xué)生掌握統(tǒng)計學(xué)的基本理論與方法,并能夠建立實用的應(yīng)用統(tǒng)計模型,解決實際問題。

⑵先修課程

微積分、線性代數(shù)、概率論與數(shù)理統(tǒng)計、數(shù)學(xué)軟件、統(tǒng)計學(xué)原理。編輯課件

應(yīng)用數(shù)理統(tǒng)計與經(jīng)濟理論、統(tǒng)計學(xué)和數(shù)學(xué)的聯(lián)系數(shù)學(xué)統(tǒng)計學(xué)數(shù)理統(tǒng)計

管理學(xué)工學(xué)其他學(xué)科編輯課件2023/1/136學(xué)習(xí)方法⑴理論與應(yīng)用并重。既要重視理論方法,也要重視應(yīng)用模型和應(yīng)用中實際問題的解決;⑵以教材中的經(jīng)典理論方法為主,也要理解適當(dāng)引入的、教材中沒有的非經(jīng)典理論方法;⑶對于理論方法,重點是思路而不是數(shù)學(xué)過程;⑷對于應(yīng)用模型,重點不是每種模型本身,而是它們演變與發(fā)展的方法論;⑸必須十分重視綜合練習(xí);⑹必須掌握一種應(yīng)用軟件,注意課堂的軟件應(yīng)用演示,“師傅領(lǐng)進門,修行在個人”,多練。編輯課件2023/1/137本課程:應(yīng)用數(shù)理統(tǒng)計;36學(xué)時;教材:吳翊等《應(yīng)用數(shù)理統(tǒng)計》,國防科技大學(xué)出版社,2003;參考書:清華大學(xué)編《現(xiàn)代應(yīng)用數(shù)學(xué)手冊(數(shù)理統(tǒng)計卷)》,科學(xué)出版社,2002。統(tǒng)計軟件:EXCEL、SPSS、MATLAB(統(tǒng)計分析工具箱)。基礎(chǔ)知識見附錄I,(以浙江大學(xué)《概率論與數(shù)理統(tǒng)計》為準)。

編輯課件2023/1/138能力培養(yǎng)數(shù)據(jù)的產(chǎn)生:數(shù)據(jù)怎么得來,非常重要,這是統(tǒng)計當(dāng)中影響最大的概念;資料分析:你會學(xué)到,即使用很簡單的方法,也能很睿智地解讀數(shù)據(jù);概率:利用概率進行思考,可以幫你把事實和無關(guān)緊要的干擾信息分離;統(tǒng)計推斷:讓你學(xué)會用手中少量的數(shù)據(jù),對一個較大的總體做出結(jié)論。編輯課件2023/1/139案例

許多統(tǒng)計學(xué)家在第二次世界大戰(zhàn)中發(fā)揮了重大的作用,沃德是其中之一。他發(fā)明的一些統(tǒng)計方法,在戰(zhàn)時被視為軍事機密。沃德在被咨詢飛機上什么部位的鋼板需要加強時,畫了飛機的輪廓,并且標出返航的戰(zhàn)斗機上受敵軍創(chuàng)傷的彈孔位置。資料積累了一段時間后,機身各部位幾乎都被填滿了。于是沃德建議,把剩下少數(shù)幾個沒有彈孔的位置加強。???

因為這些部位被擊中的飛機都沒有返航?!浴督y(tǒng)計學(xué)的世界》(美)戴維著。編輯課件2023/1/1310第一章數(shù)理統(tǒng)計的基本概念§1.1導(dǎo)言什么是數(shù)理統(tǒng)計?

統(tǒng)計:指數(shù)據(jù)的收集、整理和分析,由全部信息(數(shù)據(jù))得出正確的唯一結(jié)果;

數(shù)理統(tǒng)計:指有效地收集、整理和分析帶有隨機性影響的數(shù)據(jù),對所觀測的部分信息推斷合理的結(jié)果即進行統(tǒng)計推斷,直到為采取決策提供依據(jù)。為什么要用數(shù)理統(tǒng)計?

實際中,數(shù)據(jù)量大(抽取的數(shù)據(jù)具有隨機性),試驗具有破壞性(不可重復(fù))。編輯課件2023/1/1311數(shù)理統(tǒng)計的研究范疇:應(yīng)用廣泛傳統(tǒng)上,有生物統(tǒng)計(遺傳學(xué)、醫(yī)藥)、農(nóng)業(yè)統(tǒng)計、工業(yè)統(tǒng)計(民航統(tǒng)計)等;

現(xiàn)代,多元統(tǒng)計應(yīng)用領(lǐng)域:通信、質(zhì)量控制、氣象、地質(zhì)勘探、市場預(yù)測與決策等。數(shù)理統(tǒng)計的基本內(nèi)容:數(shù)據(jù)采集(抽樣理論、試驗設(shè)計等)與統(tǒng)計推斷(估計、檢驗等)。統(tǒng)計推斷的結(jié)果往往有賴于方法,盡可能采用“有效的”方法。

“有效的”標準:樣本盡可能少,而結(jié)果更合理,“大量重復(fù)使用該方法總體效果好”——基于概率論原理。編輯課件2023/1/1312§1.2樣本與總體樣本:經(jīng)觀察或試驗得到的數(shù)據(jù)——樣本(子樣);觀察或試驗的過程——抽樣;“抽樣調(diào)查”:是一種觀測研究,抽樣的精髓是從檢查一部分來得知全體。

“你不必吃完整頭牛,才知道肉是老的”——西方諺語。編輯課件2023/1/1313經(jīng)n次試驗得到n個數(shù)據(jù)——樣本容量為n;——一組數(shù)據(jù),一個(容量為n的)樣本(子樣);樣本所有可能取值的集合——樣本空間(n維空間的子集);數(shù)據(jù)可以是數(shù)值或?qū)傩裕ǖ脭?shù)值表示);以一維數(shù)據(jù)X或Y為研究對象——一元統(tǒng)計;以多維數(shù)據(jù)(X,Y)為研究對象——多元統(tǒng)計。隨機試驗(產(chǎn)生樣本)要求在相同條件下能夠獨立重復(fù)地進行。樣本是隨機試驗的結(jié)果。編輯課件2023/1/1314(2)樣本X1,X2

,…,Xn具有二重性:可看成一個n維隨機向量,記為(X1,X2

,…,Xn

);作為樣本值記為(x1,x2,…,xn);(1)樣本X1,X2

,…,Xn

相互獨立,且與總體X同分布;(3)若總體X具有分布函數(shù)F(x),概率密度f(x),則樣本

(X1,X2

,…,Xn

)的分布函數(shù)及概率密度為:(4)獲得簡單隨機樣本的抽樣方法稱為簡單隨機抽樣.編輯課件2023/1/1315【例1.3】(P6)設(shè)一組抽獎劵共10000張,其中5張有獎。問連續(xù)抽取3張有獎的概率為多少?討論:不放回抽樣和放回抽樣。隨機抽樣方式:放回抽樣(要求樣本獨立)由“隨機抽樣”得到“簡單樣本”。由于獨立同分布,設(shè)該分布函數(shù)為F(x),則樣本聯(lián)合分布函數(shù)為:F(X1)F(X2)…F(Xn);樣本聯(lián)合密度函數(shù)為:f(X1)f(X2)…f(Xn)。編輯課件2023/1/1316

總體一般定義:所研究對象的全體的集合——總體。集合的元素——個體??傮w和樣本的區(qū)別是統(tǒng)計里很基本的概念;如,電視收視率調(diào)查總體:所有5億有電視機的中國住戶;樣本:約5000個住戶,住戶同意使用“個人電視記錄器”來記錄該戶中每個人收視的節(jié)目。所記錄的變量包括住戶中的人數(shù)及其年齡、性別、收視時段、內(nèi)容等。普查:企圖把整個總體納入樣本的抽樣調(diào)查。編輯課件2023/1/1317從數(shù)學(xué)上也可如此定義:

總體是指某個隨機變量所有可能的取值的全體,或就是一個隨機變量X,而樣本即是與X同分布且相互獨立的一組隨機變量X1,X2,…,Xn?!纠?.4】兩臺車床,各車出m,n件零件,尺寸分別為X1,X2,…,Xm和Y1,Y2,…,Yn,視作取自兩個總體X,Y的容量分別為m,n的樣本。統(tǒng)計推斷即由樣本推斷總體的性質(zhì),如上例中,推斷兩臺車床總體上是否有差異??傮w的分布——統(tǒng)計模型,統(tǒng)計建模的目的即確定X的分布、參數(shù)等。編輯課件2023/1/13181.2.3參數(shù)與參數(shù)空間一般情況下總體分布未知,需要樣本信息去推斷。【例1.5】(P8)考慮如何由樣本X1,X2,…,Xn的實際背景確定統(tǒng)計模型,即總體X的分布函數(shù):(1)樣本記錄隨機抽取的n件產(chǎn)品的正品、廢品情況。(2)樣本表示同一批n個電子元件的壽命(小時)(3)樣本表示同一批n件產(chǎn)品某一尺寸(mm)編輯課件2023/1/13191.2.3參數(shù)與參數(shù)空間當(dāng)分布類型已知,其中參數(shù)未知,則由樣本推斷參數(shù)(估計、檢驗)。參數(shù)的所有可能取值的集合——參數(shù)空間(視具體問題而定)統(tǒng)計推斷:包括參數(shù)推斷(分布類型已知)和非參數(shù)推斷(分布類型未知)兩種。編輯課件2023/1/13201.3直方圖與經(jīng)驗分布函數(shù)1.3.1直方圖依據(jù)概率論的大數(shù)定理(附錄1柯爾莫哥洛夫強大數(shù)定理):頻率近似于概率。當(dāng)總體分布未知,要用樣本對總體分布進行非參數(shù)推斷,常用方法是直方圖和經(jīng)驗分布函數(shù)。編輯課件21取a略小于X(1),b略大于X

(n),將區(qū)間分成m個小區(qū)間,記落入小區(qū)間中觀察值的個數(shù)(頻數(shù)),計算頻率;在直角坐標系xoy中畫出以為底,為高的矩形,即得到直方圖,其對應(yīng)的分段函數(shù)

用來近似概率密度函數(shù)f(x)直方圖的具體做法將所有樣本由小到大排序,記為X(1),X(2),…,X

(n)編輯課件2023/1/13(C)中國民航學(xué)院理學(xué)院張春曉22【例1.6】P10編輯課件2023/1/1323【例1.6】(P10)齒輪的徑向綜合誤差ΔF

i的直方圖編輯課件2023/1/1324直方圖編輯課件以概率1成立.2023/1/13251.3.2經(jīng)驗分布函數(shù)設(shè)總體X的分布函數(shù)未知,樣本為X1,X2,…,Xn將樣本從小到大排序(即求順序統(tǒng)計量)得到定義:經(jīng)驗分布函數(shù)為右連續(xù),間斷點處躍度為1/n。以格里文科定理可以證明,編輯課件2023/1/13(C)中國民航大學(xué)理學(xué)院張春曉26當(dāng)時,0X(1)X(2)X(3)X(n)

Fn(x)1xFn(x)的圖形為編輯課件2023/1/13(C)中國民航大學(xué)理學(xué)院張春曉27

§1.4統(tǒng)計量及其分布在利用樣本推斷總體的性質(zhì)時,往往不能直接利用樣本,而需要對它進行一定的加工,這樣才能有效地利用其中的信息,否則,樣本只是呈現(xiàn)為一堆“雜亂無章”的數(shù)據(jù).【例1.7】從某地區(qū)隨機抽取50戶農(nóng)民,調(diào)查其人均年收入情況,得到數(shù)據(jù)(單位:元)如下:試對該地區(qū)農(nóng)民收入的水平和貧富懸殊程度做個大致分析.編輯課件解:顯然,如果不進行加工,面對這一大堆大小參差不齊的數(shù)據(jù),很難得出什么印象.但是可以對這些數(shù)據(jù)稍事加工,如記各農(nóng)戶的人均年收入分別為x1,x2,...,x50,計算得到這樣,就可以了解到該地區(qū)農(nóng)民的平均收入和該地區(qū)農(nóng)民貧富懸殊的大致情況:農(nóng)民的年人均平均收入大約為809.52元,標準差約為155.85元,貧富懸殊不算很大.1.4統(tǒng)計量與抽樣分布由此可見對樣本的加工是十分重要的.對樣本加工,主要就是構(gòu)造統(tǒng)計量.1.4.1統(tǒng)計量定義設(shè)X1,X2,…,Xn為來自總體X的樣本,稱不含未知參數(shù)的樣本的函數(shù)g(X1,X2,…,Xn)為統(tǒng)計量.若x1,x2,...,xn為樣本觀測值,則稱g(x1,x2,...,xn)為統(tǒng)計量g(X1,X2,…,Xn)的觀測值.統(tǒng)計量是處理、分析數(shù)據(jù)的主要工具.對統(tǒng)計量的一個最基本的要求就是可以將樣本觀測值代入進行計算,因而不能含有任何未知的參數(shù).1.4統(tǒng)計量與抽樣分布2023/1/1330幾個常用的統(tǒng)計量【例1.8】

設(shè)X1,X2

,…,Xn是來自總體X的一個樣本,(x1,x2,…,xn)

是其觀察值.樣本均值樣本標準差樣本k階原點矩樣本k階中心矩樣本方差**編輯課件2023/1/1331其觀察值:樣本均值樣本標準差樣本k階原點矩樣本k階中心矩樣本方差**編輯課件2023/1/1332有關(guān)二維總體的統(tǒng)計量:協(xié)方差相關(guān)系數(shù)定義1

稱E{[X-E(X)][Y-E(Y)]}為隨機變量X與Y的

協(xié)方差,記為Cov(X,Y).即[注]X與Y的相關(guān)系數(shù):當(dāng)XY=0時,稱隨機變量X與Y是不相關(guān)的.若X,Y相互獨立,則X與Y不相關(guān);反之不一定成立X和Y的k+l階混合中心矩編輯課件設(shè)(X1,Y1),(X2,Y2),…,(Xn,Yn)為二維總體(X,Y)的樣本,其觀測值為(x1,y1),(x2,y2),…,(xn,yn),則下列各量為統(tǒng)計量:(1)樣本協(xié)方差(2)樣本相關(guān)系數(shù)其中SXY和RXY常分別用來作為總體X和Y的協(xié)方差Cov(X,Y)與相關(guān)系數(shù)XY的估計量.

1.4.1統(tǒng)計量【例1.10】設(shè)X1,X2,…,Xn是來自總體X的樣本,X~N(,

2),其中、2為未知參數(shù),則X1,min{X1,X2,…,Xn}均為統(tǒng)計量,但諸如等均不是統(tǒng)計量,因它含有未知參數(shù)或.常用的統(tǒng)計量有如下幾種:1.4.1

統(tǒng)計量2023/1/1335【例1.11】(P14)設(shè)△是任意給定的樣本空間中的區(qū)域,則觀察值X1,X2

,…,Xn落在△中的頻數(shù)n△,頻率f△=n△/n都是統(tǒng)計量。因為對于固定的x,經(jīng)驗分布函數(shù)Fn(x)也是統(tǒng)計量。研究方法時,為隨機變量,從而也是隨機變量,統(tǒng)計量的分布稱為抽樣分布.為了研究抽樣分布,先研究數(shù)理統(tǒng)計中三種重要的分布.編輯課件2023/1/1336

設(shè)X1,X2

,…,Xn是來自總體

N(0,1)的樣本,則稱統(tǒng)計量

的概率密度為1.4.2分布

服從自由度n為的

分布,記為

這里自由度n表示相互獨立的隨機變量的個數(shù).分布來自正態(tài)總體的幾個常用統(tǒng)計量的分布編輯課件2023/1/1337f(y)的圖形

(與n有關(guān)):0yf(y)的推導(dǎo):由前例知,而Xi~N(0,1),由定義Xi2~2(1),再由X1,X2

,…,Xn的獨立性及分布的可加性即f(y)編輯課件2023/1/1338

分布的可加性

【定理1.1】且Y1,Y2

,…,Yk相互獨立,則有

分布的分位點對于給定的正數(shù)(0<<1),稱滿足的點為分布的分位點.1-當(dāng)n充分大(>45)時,有標準正態(tài)分布的上分位點

設(shè)編輯課件由于Xi獨立,且注意到N(0,1)的四階矩為3,可得

英國統(tǒng)計學(xué)家費歇(R.A.Fisher)曾證明:

當(dāng)n較大時,近似服從【定理1.2】卡方分布的期望與方差2023/1/1340

定義1.2設(shè)X~N(0,1),Y~2(n),且X與Y相互獨立,則稱隨機變量P(x)圖形:(關(guān)于x=0對稱,其形狀與n有關(guān))t(n)分布的概率密度函數(shù)為:1.4.3t

分布服從自由度是n

的t分布(Student分布),記作T~t(n).圖編輯課件2023/1/1341f(t)n=(正態(tài))n=10n=10tt分布的分位點:注意:若對給定(0<<1),稱滿足的點為t(n)分布的分位點.1-/2單側(cè)雙側(cè)編輯課件可看出,隨著n的增大,t(n)的概率密度曲線與N(0,1)的概率密度曲線越來越接近.可以證明t分布具有下面性質(zhì):即當(dāng)n趨向無窮時,t(n)近似于標準正態(tài)分布N(0,1).一般地,若n>30,就可認為t(n)基本與N(0,1)相差無幾了.1.4.3t分布2023/1/13431.4.3F分布F~F(n1,n2)分布的概率密度函數(shù)為:服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).設(shè)X~2(n1),Y~2(n2),且X與Y相互獨立,則稱隨機變量若F~F(n1,n2),則

1/F~F(n2,n1).編輯課件2023/1/13(C)中國民航學(xué)院理學(xué)院張春曉440p(x)的圖形F分布的分位點對給定(0<<1),稱滿足的點F(n1,n2)

為F(n1,n2)分布的分位點.

F(n1,n2)編輯課件1.4.4分位數(shù)設(shè)X為一隨機變量,我們知道對于給定的實數(shù)x,P{X<x}是事件{X<x}的概率.在統(tǒng)計中,我們常常需要對給定事件{X<x}的概率,由此確定的x取是一個臨界點,稱為分位數(shù)(點),有如下定義:定義6.6設(shè)X為隨機變量,若對給定的

(0,1),存在x滿足P{X<x}=,則稱x為X的

分位數(shù)(點).注意:與通常的定義相反!浙大版:P{X>x}=,則稱x為X的上

分位數(shù)(點).1.4統(tǒng)計量與抽樣分布若X具有密度f(x),P{X>x}=1-說明分位數(shù)x右邊的一塊陰影面積為,即

容易看出,X的分位數(shù)x是關(guān)于

的增函數(shù),即增大時x減少.1.4.4分位數(shù)1-1.設(shè)Z

N(0,1),記N(0,1)的上分位數(shù)為z,即有P{Z>z}=.由N(0,1)的概率密度的對稱性可知所以z1-=–z.2.設(shè)2

~2(n),記2(n)的上分位數(shù)為2(n),即有P{2>2(n)}=.附表中給出了時2(n)的值,當(dāng)n>40時,由2(n)的漸近性質(zhì),有

1.4.4分位數(shù)【例1.13】求下列分位數(shù)(1)z0.975;z0.9(2)t0.25(4);t0.9(25);t0.05(55);(3)20.5(20);20.025(50).(4)F0.05(10,15);F0.1(14,10);解:(1)可由標準正態(tài)分布函數(shù)表(附表2,P399),對函數(shù)值(z0.975)反查表得z0.,975=1.96.z0.9=(1.28+1.29)/2=1.285.(2)t0.25(4)=-t0.75(4)=-0.7407;t0.9(25)=1.3163t0.95(55)

z0.95=1.645.1.4.4分位數(shù)(3)查附表4得:20.5(20)=31.4104。在附表3表中查不到20.025(200),先查出z0.025=–1.96,再作如下近似計算(4)附表5得到F0.05(10,15)=2.54;在附表5中,查不到F0.1(14,10),但可查出F0.9(10,14)=2.10,故1.4.4分位數(shù)2023/1/13(C)中國民航大學(xué)理學(xué)院張春曉501.4.5正態(tài)總體的抽樣分布【定理1.3】設(shè)總體樣本(1);(2);(3)與相互獨立。*在數(shù)理統(tǒng)計問題中,正態(tài)分布占據(jù)著十分重要的位置,一方面因為在應(yīng)用中,許多隨機變量的分布或者是正態(tài)分布,或者接近于正態(tài)分布;另一方面,正態(tài)分布有許多優(yōu)良性質(zhì),便于進行較深入的理論研究.因此,我們著重討論正態(tài)總體下的抽樣分布,給出有關(guān)最重要的統(tǒng)計量樣本均值和樣本方差S2的抽樣分布定理.編輯課件2023/1/13(C)中國民航學(xué)院理學(xué)院張春曉51=推導(dǎo)(Ⅰ)所以*編輯課件2023/1/13(C)中國民航學(xué)院理學(xué)院張春曉52預(yù)備知識

相互獨立的標準正態(tài)隨機變量,則n元正態(tài)分布向量為,其中為n階單位矩陣,而,其中。性質(zhì):如果,則線性函數(shù)仍為正態(tài)隨機向量,且。(Ⅱ,Ⅲ)證明可以用隨機向量方法。編輯課件(2)證明:令T為正交矩陣所以:編輯課件2023

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論