版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第六章 數(shù)理統(tǒng)計的基本概念緒言數(shù)理統(tǒng)計包括兩大內(nèi)容:一、試驗(yàn)的設(shè)計和研究-研究更合理、更有效、更精確地獲取觀察資料的方法。二、統(tǒng)計推斷-研究如何利用一定的資料對所關(guān)心的問題作出盡可能精確、可靠的結(jié)論。例 為了解南京市民2002年收入情況,現(xiàn)抽樣調(diào)查10000人的收入。問題:1. 怎樣從10000人的收入情況去估計全體南京市民的平均收入?怎樣估計所有南京市民的收入與平均收入的偏離程度?2. 若市政府提出了全體南京市民平均收入應(yīng)達(dá)到的標(biāo)準(zhǔn),從抽查得到的10000人收入數(shù)據(jù),如何判斷全體南京市民的平均收入與收入標(biāo)準(zhǔn)有無差異?差異是否顯著?3. 抽查得到的10000人的收入有多有少,若這10000人來
2、自不同的行業(yè),那么,收入的差異是由于行業(yè)不同引起的,還是僅由隨機(jī)因素造成的?4. 假設(shè)收入與年齡有關(guān),從抽查得到的10000人收入和年齡的對應(yīng)數(shù)據(jù),如何表述全體南京市民的收入與年齡之間的關(guān)系?問題1實(shí)質(zhì):從10000人的收入出發(fā),估計全體南京市民收入分布的某些數(shù)字特征(此處是期望和方差)。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為參數(shù)估計。問題2實(shí)質(zhì):根據(jù)抽查得到的數(shù)據(jù),去檢驗(yàn)總體收入的某個數(shù)字特征(此處是期望)與給定值的差異。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為假設(shè)檢驗(yàn)。問題3實(shí)質(zhì):分析數(shù)據(jù)誤差的原因(此處是行業(yè))。當(dāng)有多個因素起作用時,還要分析哪些因素起主要作用。-在數(shù)理統(tǒng)計中,解決這類問題
3、的方法稱為方差分析。問題4實(shí)質(zhì):根據(jù)觀察數(shù)據(jù)研究變量間(此處是收入與年齡間)的關(guān)系。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為回歸分析。第一節(jié) 隨機(jī)樣本一、總體 在數(shù)理統(tǒng)計中,將所研究的對象的某項(xiàng)指標(biāo)值的全體稱為總體(或母體),而將構(gòu)成總體的每個單位稱為一個個體。 當(dāng)總體中包含的個體總數(shù)是有限的,就稱總體為有限總體,否則稱總體為無限總體。 設(shè)待研究的指標(biāo)為X,由于X的取值是對隨機(jī)抽取的個體觀察得到的,因而可將X視為隨機(jī)變量,并設(shè)其分布函數(shù)為F(x)。定義6.1 一個隨機(jī)變量X(或其分布函數(shù)F(x)叫做一個總體,X的每個可能值叫做一個個體。二、樣本 從總體X中,隨機(jī)地抽取n個個體進(jìn)行觀察,可得到n個
4、觀察值,將其依抽取的順序記為。,)(21nxxx 若將總體在進(jìn)行第 i 次抽樣時對應(yīng)的隨機(jī)變量記為 ,則 就是 的觀察值。iXixiX我們提出以下要求:1. 與X同分布;2. 相互獨(dú)立。iXnXXX,21抽樣方式為重復(fù)抽樣 實(shí)際應(yīng)用中,一般當(dāng)有限總體中包含個體數(shù)目 N10n 時,即使采用不重復(fù)抽樣,也認(rèn)為要求滿足。定義6.2 若 相互獨(dú)立,且均與總體X有相同分布,則稱隨機(jī)向量( )為總體X的一個容量為n 的簡單隨機(jī)樣本(簡稱樣本),稱 n 為樣本容量。 設(shè) 的觀察值為 ,稱( )為X的一個樣本觀察值(樣本點(diǎn)),稱=( )為樣本空間。niXi,21nXXX,21iXixnxxx,21nxxx,2
5、1說明:1. 是樣本觀察值全體所成集合,是 n 維空間上的點(diǎn)集,它不是總體X的樣本空間。2. 在一次抽樣之前,我們只知道樣本( )(n 維隨機(jī)變量),而在抽樣之后,則得到一個具體的 n 維實(shí)向量( ),它是中的一個點(diǎn),故稱其為樣本點(diǎn)。nXXX,21nxxx,21注意:對任何總體X,其容量為 n 的樣本是唯一的,而每次抽樣得到的樣本觀察值一般說來是不同的。 設(shè)X的分布函數(shù)為 F(x),由定義6.2,X的容量為n 的樣本 的第i 個分量 的分布函數(shù)為 )(21nXXX,iX.21)(nixFi, 因 相互獨(dú)立,故 分布函數(shù)為)(21nXXX,nXXX,21).()(121niinxFxxxF, 若
6、X是離散型隨機(jī)變量,其分布律為 P(X= ),i=1,2,.則 的分布律為ix)(21nXXX,).()(12211iniinnxXPxXxXxXP, 若X 是連續(xù)型隨機(jī)變量,其密度函數(shù)為 f(x),則 的密度函數(shù)為 )(21nXXX,).()(121niinxfxxxf,三、樣本分布函數(shù)問題:用樣本觀察值推斷總體,其結(jié)論可靠嗎?解決問題的途徑:根據(jù)抽樣得到的樣本觀察值構(gòu)造一個函數(shù)-樣本分布函數(shù),再證明當(dāng)n很大時,樣本分布函數(shù)近似于總體的分布函數(shù)。定義6.3 設(shè)總體X的一組樣本觀察值為 ,將這組值依大小順序重排成 。構(gòu)造函數(shù))(21nxxx,nxxx21.11210)(11nkknxxnkxx
7、xnkxxxF當(dāng),當(dāng),當(dāng),稱 為樣本分布函數(shù)(或稱經(jīng)驗(yàn)分布函數(shù))。)(xFn說明:1. 在定義6.3中,k/n 是不大于x的樣本觀察值出現(xiàn)的頻率。2. 對總體進(jìn)行兩次抽樣,會得到兩組不同的樣本觀察值,因而就會產(chǎn)生兩個不同的樣本分布函數(shù)。3. 樣本分布函數(shù)是一個階梯函數(shù):設(shè),lklkkkkxxxxx111則當(dāng) ,有kkxxx1,nkxFn1)(當(dāng) , 有l(wèi)kkxxx,nlkxFn1)(即: 在 處有 的躍度。)(xFnkxxnl /5. 當(dāng)n 越大, 的圖形與總體分布函數(shù) F(x) 的圖形越近似。)(xFn6. 由貝努利大數(shù)定律或 W. 格列汶科定理(1953) 可從理論上證明:當(dāng)n 很大時,有
8、).()(xFxFn4. 容易證明: 確是某隨機(jī)變量 的分布函數(shù),且有)(xFnn.)(1)(1)(121niinniinxxnDxxnE,第二節(jié) 抽樣分布一、統(tǒng)計量定義6.4 (教材p159) 設(shè) 是總體X 的一個樣本, 是不含任何未知參數(shù)的連續(xù)函數(shù),則稱 是一個統(tǒng)計量。)(21nXXX,)(21nyyyg,)(21nXXXg, 若 是一個統(tǒng)計量, 是一組樣本觀察值,則稱 是 的一個觀察值。)(21nXXXg,)(21nXXXg,)(21nxxxg,)(21nxxx,二、樣本數(shù)字特征定義6.5 (教材p160)設(shè) 是總體X 的一個樣本,稱以下統(tǒng)計量為樣本數(shù)字特征:)(21nXXX,為樣本均值
9、; 11niiXnX為樣本方差; )(11122niiXXnS為樣本標(biāo)準(zhǔn)差; )(1112niiXXnS當(dāng)k 為正整數(shù),稱階原點(diǎn)矩,為樣本k 11nikikXnA階中心矩。為樣本k )(11nikikXXnB 設(shè) 為來自總體X的樣本,為來自總體Y的樣本,稱)(21nXXX,)(21nYYY,為樣本協(xié)方差, )(11niiiYYXXnk為樣本相關(guān)系數(shù)。 )()()(12121niiniiniiiYYXXYYXXr說明:1. 樣本原點(diǎn)矩反映樣本的平均特征,樣本中心矩反映樣本的離散特征,樣本協(xié)方差反映兩個樣本的相關(guān)程度。2. 樣本數(shù)字特征是隨機(jī)變量,但對一組樣本觀察值,得到的樣本數(shù)字特征觀察值是一個
10、具體的數(shù),我們通常把這個數(shù)也稱為樣本均值、樣本方差、樣本相關(guān)系數(shù)等。3. 使用最多的樣本數(shù)字特征是樣本均值、樣本標(biāo)準(zhǔn)差和樣本相關(guān)系數(shù)。三、順序統(tǒng)計量說明:1.對兩次抽樣,盡管觀察值由小到大的排列順序可能改變,但對順序統(tǒng)計量來說,改變的僅是其取值,其形式不變。2. 順序統(tǒng)計量是樣本的函數(shù),因而是隨機(jī)變量。問題:順序統(tǒng)計量的表達(dá)式是什么?定義6.6 設(shè) ( ) 是樣本 ( ) 的一組觀察值,將 按由小到大的順序排列成 。設(shè) ,記 k=1,2,n.稱( ) 為( )的順序統(tǒng)計量。nxxx,21nXXX,21nxxx,21)()2()1(nxxxknkxx)()()(kkxX)()2()1(nXXX,
11、nXXX,21kknnxX max min21)(21) 1 (nnnXXXXXXXX,. 132minmax121121)()(nkXXXXknkniiiiiik,結(jié)論1. 是統(tǒng)計量。nkXk,21)(定義6.7 設(shè) 為 的順序統(tǒng)計量,稱)()()2()1(nXXX,)(21nXXX,為偶數(shù)。當(dāng),為奇數(shù),當(dāng),nXXnXmnnn21) 12()2()21(為樣本中位數(shù)。稱 為樣本極差。)1()(XXRn引入樣本矩的意義: 稱 為總體X 的k階原點(diǎn)矩對樣本 ,因 與 X 同分布,有)(21nXXX,iX,mkXEkk21)(.2121)(mkniXEkki,;,由辛欽大數(shù)定律,對樣本k階原點(diǎn)矩
12、,有.21mkAkk,kAP利用依概率收斂的性質(zhì),對任何連續(xù)函數(shù)有,)(21mxxxg).()(2121mmgAAAg,P結(jié)論2. 只要總體的k階矩存在,則樣本k階矩的任何連續(xù)函數(shù)依概率收斂于總體k階矩的同一函數(shù)。說明:結(jié)論2 正是我們進(jìn)行參數(shù)估計的理論基礎(chǔ)。四、 的分布X1. 設(shè) , 是X的一個樣本,則)(2,NX)(21nXXX,)(2nNX,2. 若X的分布類型未知,僅知 E(X)=,D(X)= ,則2)(2nNX,.五、 分布2定義6.8 (教材p162-163)設(shè)總體XN(0,1), 是總體的一個樣本,則稱 服從自由度為n的 分布,記為 。niiX1222)(22n)(21nXXX,
13、注:1. ;, )212()(2nn2. 的密度函數(shù)表達(dá)式和曲線見教材p163(不用掌握)。)(2n性質(zhì)1. 設(shè)XN(0,1),則).1 (22X性質(zhì)2. 設(shè) , 是X的一個樣本,則)(2,NX)(21nXXX,niinX1222).()(1性質(zhì)3. 設(shè) ,則)(22nX.2)( )(22nDnE,定理6.1. ). )( )( 2122221222122221221n(nnn則相互獨(dú)立,和且,設(shè)推論.).( 21)(1122222kikiiiiiinkin則相互獨(dú)立,且諸,設(shè)定理6.2. 設(shè) ,則對任何x,有)(22n.21)2(lim2 22xtndtexnnP說明:定理6.2保證了當(dāng) n
14、 很大時, 可近似地用正態(tài)分布代替,即 ,其中 XN(0,1)。2nXn22).10(2 2,即NXnnL 分布的用途: 分布在正態(tài)總體方差的估計和檢驗(yàn)問題和非參數(shù)檢驗(yàn)中起重要作用。22六、t-分布定義6.9. (教材p165) 設(shè)XN(0,1), ,且X與Y相互獨(dú)立,則稱 服從自由度為 n 的 t-分布,nYXT/)(2nY記為 Tt(n)。注:1. t-分布的密度函數(shù)表達(dá)式見教材p165 (不用掌握);2. t-分布的密度函數(shù)曲線見教材p165,曲線關(guān)于x=0對稱,和標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)曲線圖形類似,但當(dāng) n 較小時,t-分布與標(biāo)準(zhǔn)正態(tài)分布的差異較大。t-分布在尾部比標(biāo)準(zhǔn)正態(tài)分布在尾部有
15、較大的概率。定理6.3 設(shè) ,且X與Y相互獨(dú)立,則)(/ )(222nYNX,).(/ntnYX定理6.4 設(shè) Tt(n),則當(dāng) n1,E(T)=0;當(dāng) n2,D(T)=n/(n-2)。定理6.5 設(shè) Tt(n),t(n;x) 為T的密度函數(shù),則. )(21)(lim2 2xexntxn;說明:一般當(dāng)n30,取 t(n) N(0,1)。t-分布的用途:t-分布主要用于小樣本情形正態(tài)總體的均值估計和檢驗(yàn),以及正態(tài)線性模型可估函數(shù)的推斷。七、F-分布定義6.10 (教材166) 設(shè) ,且X與Y相互獨(dú)立,則稱)()(22nYmX,nYmXF/服從第一自由度為m,第二自由度為n 的 F-分布,記為FF
16、(m,n)。注:F-分布的密度函數(shù)表達(dá)式及其曲線見教材p166-167(不用掌握)。性質(zhì)6 設(shè) FF(m,n),則當(dāng) n2,E(F)=n/(n-2);當(dāng)n4, D(F)= 。)4()2()422(22nnmnmn).1 (2nFT,性質(zhì)5 設(shè) Tt(n),則F-分布的用途: F-分布在對兩個正態(tài)總體的未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)中及在方差分析理論中起重要作用。性質(zhì)4 對F-分布,若 FF(m,n),則1/FF(n,m)。八、抽樣分布的幾個重要結(jié)論定理6.6 (教材p168定理二、三) 設(shè)總體 為來自總體的樣本,為樣本均值, 為樣本方差, 則有1.2. 相互獨(dú)立;3.)( )(212nXXXNX,X2S
17、;) 1()(1) 1(212222nXXSnnii2SX與).1(ntnSXT推論 設(shè) , 為其樣本方差, 則 )(2,NX2S.)(22SE注:證明見教材p172-174附錄(可不掌握)。定理6.7 (教材p169定理四) 設(shè) , 和 分別為來自總體X和Y的樣本,且兩樣本相互獨(dú)立,設(shè) 分別為兩樣本的樣本均值, 分別為兩樣本的樣本方差, 則有 )( )(222211,NYNX)(21mXXX,)(21nYYY,YX、2221SS 、;, ) 10()()(222121NnmYXU1.;)2()2/() 1() 1()()(22222121222121nmtnmSnSmnmYXT2.特別,當(dāng)
18、,有 21;)2()2/() 1() 1( 11)()(222121nmtnmSnSmnmYXT).1, 1(22212122nmFSSF3.特別,當(dāng) ,有 21).1, 1(2221nmFSSF說明:1. 證明見教材p170(可不掌握);2. 這幾個結(jié)論在參數(shù)估計、假設(shè)檢驗(yàn)等統(tǒng)計問題的推斷中具有重要意義,也是考研內(nèi)容之一,要注意對結(jié)論的理解,并會簡單應(yīng)用。例1 設(shè) 是來自泊松分布()的一個樣本, 分別為樣本均值、樣本方差,求)(21nXXX,、X2S).()()(2SEXDXE、說明:本題求 的方法值得重視,因?yàn)樵趨?shù)估計的無偏性討論中要用到這種方法。)(2SE思考題1(2001年數(shù)學(xué)三考研試題填空題) 設(shè)總體X服從正態(tài)分布 ,而 是來自總體X的簡單隨機(jī)樣本,則隨機(jī)變量)20(2,N1521XXX,)(22152112102221XXXXXY服從 _ 分布,參數(shù)為_ 。思考題2(2003年數(shù)學(xué)一考研試題選擇題) 設(shè)隨機(jī)變量Xt(n),n1, ,則( )A. Y (n). B. Y (n-1).C. YF(n,1). D. YF(1,n).2/1 XY 22例2.(2001年數(shù)學(xué)一考研試題十二題) 設(shè)總體X服從正態(tài)分布 ,(0),從該總體中抽取簡單隨機(jī)樣本 ,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度水電能源供應(yīng)合同補(bǔ)充協(xié)議3篇
- 教育科技推動的小學(xué)數(shù)學(xué)教學(xué)變革實(shí)踐
- 2025年度高端商務(wù)酒店租賃合同-包含酒店管理服務(wù)協(xié)議2篇
- 足球大單元計劃 斜傳直插二過一 說課稿-2023-2024學(xué)年高一上學(xué)期體育與健康人教版必修第一冊
- 第三單元第3課時角的度量(說課稿)-2024-2025學(xué)年四年級上冊數(shù)學(xué)人教版
- 第二單元-走進(jìn)表格新世界-第一課《創(chuàng)建工作表》說課稿 2024-2025學(xué)年遼師大版(2015)初中信息技術(shù)七年級上冊
- 九下第六單元大單元說課稿
- 2023-2024學(xué)年北京版(2013)小學(xué)信息技術(shù)第一冊 第一單元第3課計算機(jī)的硬件和軟件(說課稿)
- 《智能網(wǎng)聯(lián)汽車 自動駕駛地圖增量更新 第2部分:情報資料要求》
- 《第四章 第5節(jié) 光的色散》說課稿-2023-2024學(xué)年初中物理人教版八年級上冊
- 企業(yè)年會攝影服務(wù)合同
- 電商運(yùn)營管理制度
- 2025年上半年上半年重慶三峽融資擔(dān)保集團(tuán)股份限公司招聘6人易考易錯模擬試題(共500題)試卷后附參考答案
- 城市公共交通運(yùn)營協(xié)議
- 內(nèi)燃副司機(jī)晉升司機(jī)理論知識考試題及答案
- 2024北京東城初二(上)期末語文試卷及答案
- 2024設(shè)計院與職工勞動合同書樣本
- 2024年貴州公務(wù)員考試申論試題(B卷)
- 電工高級工練習(xí)題庫(附參考答案)
- 村里干零工協(xié)議書
- 2024年高考八省聯(lián)考地理適應(yīng)性試卷附答案解析
評論
0/150
提交評論