




已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章 數(shù)理統(tǒng)計(jì)的基本概念,緒言,數(shù)理統(tǒng)計(jì)包括兩大內(nèi)容:,一、試驗(yàn)的設(shè)計(jì)和研究-研究更合理、更有效、更精確地獲取觀察資料的方法。,二、統(tǒng)計(jì)推斷-研究如何利用一定的資料對(duì)所關(guān)心的問(wèn)題作出盡可能精確、可靠的結(jié)論。,例 為了解南京市民2002年收入情況,現(xiàn)抽樣調(diào)查10000人的收入。,問(wèn)題:,1. 怎樣從10000人的收入情況去估計(jì)全體南京市民的平均收入?怎樣估計(jì)所有南京市民的收入與平均收入的偏離程度?,2. 若市政府提出了全體南京市民平均收入應(yīng)達(dá)到的標(biāo)準(zhǔn),從抽查得到的10000人收入數(shù)據(jù),如何判斷全體南京市民的平均收入與收入標(biāo)準(zhǔn)有無(wú)差異?差異是否顯著?,3. 抽查得到的10000人的收入有多有少,若這10000人來(lái)自不同的行業(yè),那么,收入的差異是由于行業(yè)不同引起的,還是僅由隨機(jī)因素造成的?,4. 假設(shè)收入與年齡有關(guān),從抽查得到的10000人收入和年齡的對(duì)應(yīng)數(shù)據(jù),如何表述全體南京市民的收入與年齡之間的關(guān)系?,問(wèn)題1實(shí)質(zhì):從10000人的收入出發(fā),估計(jì)全體南京市民收入分布的某些數(shù)字特征(此處是期望和方差)。,-在數(shù)理統(tǒng)計(jì)中,解決這類問(wèn)題的方法稱為參數(shù)估計(jì)。,問(wèn)題2實(shí)質(zhì):根據(jù)抽查得到的數(shù)據(jù),去檢驗(yàn)總體收入的某個(gè)數(shù)字特征(此處是期望)與給定值的差異。,-在數(shù)理統(tǒng)計(jì)中,解決這類問(wèn)題的方法稱為假設(shè)檢驗(yàn)。,問(wèn)題3實(shí)質(zhì):分析數(shù)據(jù)誤差的原因(此處是行業(yè))。當(dāng)有多個(gè)因素起作用時(shí),還要分析哪些因素起主要作用。,-在數(shù)理統(tǒng)計(jì)中,解決這類問(wèn)題的方法稱為方差分析。,問(wèn)題4實(shí)質(zhì):根據(jù)觀察數(shù)據(jù)研究變量間(此處是收入與年齡間)的關(guān)系。,-在數(shù)理統(tǒng)計(jì)中,解決這類問(wèn)題的方法稱為回歸分析。,第一節(jié) 隨機(jī)樣本,一、總體,在數(shù)理統(tǒng)計(jì)中,將所研究的對(duì)象的某項(xiàng)指標(biāo)值的全體稱為總體(或母體),而將構(gòu)成總體的每個(gè)單位稱為一個(gè)個(gè)體。,當(dāng)總體中包含的個(gè)體總數(shù)是有限的,就稱總體為有限總體,否則稱總體為無(wú)限總體。,設(shè)待研究的指標(biāo)為X,由于X的取值是對(duì)隨機(jī)抽取的個(gè)體觀察得到的,因而可將X視為隨機(jī)變量,并設(shè)其分布函數(shù)為F(x)。,定義6.1 一個(gè)隨機(jī)變量X(或其分布函數(shù)F(x)叫做一個(gè)總體,X的每個(gè)可能值叫做一個(gè)個(gè)體。,二、樣本,從總體X中,隨機(jī)地抽取n個(gè)個(gè)體進(jìn)行觀察,可得到n個(gè)觀察值,將其依抽取的順序記為,若將總體在進(jìn)行第 i 次抽樣時(shí)對(duì)應(yīng)的隨機(jī)變量記為 ,則 就是 的觀察值。,我們提出以下要求: 與X同分布; 2. 相互獨(dú)立。,抽樣方式為重復(fù)抽樣,實(shí)際應(yīng)用中,一般當(dāng)有限總體中包含個(gè)體數(shù)目 N10n 時(shí),即使采用不重復(fù)抽樣,也認(rèn)為要求滿足。,定義6.2 若 相互獨(dú)立,且均與總體X有相同分布,則稱隨機(jī)向量( )為總體X的一個(gè)容量為n 的簡(jiǎn)單隨機(jī)樣本(簡(jiǎn)稱樣本),稱 n 為樣本容量。 設(shè) 的觀察值為 ,稱( )為X的一個(gè)樣本觀察值(樣本點(diǎn)),稱=( )為樣本空間。,說(shuō)明:1. 是樣本觀察值全體所成集合,是 n 維空間上的點(diǎn)集,它不是總體X的樣本空間。,在一次抽樣之前,我們只知道樣本( )(n 維 隨機(jī)變量),而在抽樣之后,則得到一個(gè)具體的 n 維實(shí)向量 ( ),它是中的一個(gè)點(diǎn),故稱其為樣本點(diǎn)。,注意:對(duì)任何總體X,其容量為 n 的樣本是唯一的,而每次抽樣得到的樣本觀察值一般說(shuō)來(lái)是不同的。,設(shè)X的分布函數(shù)為 F(x),由定義6.2,X的容量為n 的樣本 的第i 個(gè)分量 的分布函數(shù)為,因 相互獨(dú)立,故 分布函數(shù)為,若X是離散型隨機(jī)變量,其分布律為 P(X= ),i=1,2,. 則 的分布律為,若X 是連續(xù)型隨機(jī)變量,其密度函數(shù)為 f(x),則 的密度函數(shù)為,三、樣本分布函數(shù),問(wèn)題:用樣本觀察值推斷總體,其結(jié)論可靠嗎?,解決問(wèn)題的途徑:根據(jù)抽樣得到的樣本觀察值構(gòu)造一個(gè)函數(shù)-樣本分布函數(shù),再證明當(dāng)n很大時(shí),樣本分布函數(shù)近似于總體的分布函數(shù)。,說(shuō)明:1. 在定義6.3中,k/n 是不大于x的樣本觀察值出現(xiàn)的頻率。,2. 對(duì)總體進(jìn)行兩次抽樣,會(huì)得到兩組不同的樣本觀察值,因而就會(huì)產(chǎn)生兩個(gè)不同的樣本分布函數(shù)。,3. 樣本分布函數(shù)是一個(gè)階梯函數(shù):設(shè),則當(dāng) ,有,當(dāng) , 有,即: 在 處有 的躍度。,5. 當(dāng)n 越大, 的圖形與總體分布函數(shù) F(x) 的圖形越近似。,6. 由貝努利大數(shù)定律或 W. 格列汶科定理(1953) 可從理論上證明:當(dāng)n 很大時(shí),有,4. 容易證明: 確是某隨機(jī)變量 的分布函數(shù),且有,第二節(jié) 抽樣分布,一、統(tǒng)計(jì)量,定義6.4 (教材p159) 設(shè) 是總體X 的一個(gè)樣本, 是不含任何未知參數(shù)的連續(xù)函數(shù),則稱 是一個(gè)統(tǒng)計(jì)量。,若 是一個(gè)統(tǒng)計(jì)量, 是一組樣本觀察值,則稱 是 的一個(gè)觀察值。,二、樣本數(shù)字特征,定義6.5 (教材p160) 設(shè) 是總體X 的一個(gè)樣本,稱以下統(tǒng)計(jì)量為樣本數(shù)字特征:,當(dāng)k 為正整數(shù),稱,設(shè) 為來(lái)自總體X的樣本, 為來(lái)自總體Y的樣本,稱,說(shuō)明:1. 樣本原點(diǎn)矩反映樣本的平均特征,樣本中心矩反映樣本的離散特征,樣本協(xié)方差反映兩個(gè)樣本的相關(guān)程度。,2. 樣本數(shù)字特征是隨機(jī)變量,但對(duì)一組樣本觀察值,得到的樣本數(shù)字特征觀察值是一個(gè)具體的數(shù),我們通常把這個(gè)數(shù)也稱為樣本均值、樣本方差、樣本相關(guān)系數(shù)等。,3. 使用最多的樣本數(shù)字特征是樣本均值、樣本標(biāo)準(zhǔn)差和樣本相關(guān)系數(shù)。,三、順序統(tǒng)計(jì)量,說(shuō)明:1.對(duì)兩次抽樣,盡管觀察值由小到大的排列順序可能改變,但對(duì)順序統(tǒng)計(jì)量來(lái)說(shuō),改變的僅是其取值,其形式不變。,2. 順序統(tǒng)計(jì)量是樣本的函數(shù),因而是隨機(jī)變量。,問(wèn)題:順序統(tǒng)計(jì)量的表達(dá)式是什么?,定義6.6 設(shè) ( ) 是樣本 ( ) 的 一組觀察值,將 按由小到大的順序排列成 。設(shè) ,記 k=1,2,n.稱( ) 為( )的順序統(tǒng)計(jì)量。,結(jié)論1. 是統(tǒng)計(jì)量。,引入樣本矩的意義:,稱 為總體X 的k階原點(diǎn)矩 對(duì)樣本 ,因 與 X 同分布,有,結(jié)論2. 只要總體的k階矩存在,則樣本k階矩的任何連續(xù)函數(shù)依概率收斂于總體k階矩的同一函數(shù)。,說(shuō)明:結(jié)論2 正是我們進(jìn)行參數(shù)估計(jì)的理論基礎(chǔ)。,四、 的分布,1. 設(shè) , 是X的一個(gè)樣本,則,五、 分布,定義6.8 (教材p162-163)設(shè)總體XN(0,1), 是總體的一個(gè)樣本,則稱 服從自由度為n的 分布,記為 。,注:1.,2. 的密度函數(shù)表達(dá)式和曲線見教材p163(不用掌握)。,性質(zhì)1. 設(shè)XN(0,1),則,性質(zhì)2. 設(shè) , 是X的一個(gè)樣本,則,性質(zhì)3. 設(shè) ,則,定理6.1.,推論.,定理6.2. 設(shè) ,則對(duì)任何x,有,說(shuō)明:定理6.2保證了當(dāng) n 很大時(shí), 可近似地用正態(tài)分布代替,即 ,其中 XN(0,1)。,L,分布的用途: 分布在正態(tài)總體方差的估計(jì)和檢驗(yàn)問(wèn)題和非參數(shù)檢驗(yàn)中起重要作用。,六、t-分布,注:1. t-分布的密度函數(shù)表達(dá)式見教材p165 (不用掌握);,2. t-分布的密度函數(shù)曲線見教材p165,曲線關(guān)于x=0對(duì)稱,和標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)曲線圖形類似,但當(dāng) n 較小時(shí),t-分布與標(biāo)準(zhǔn)正態(tài)分布的差異較大。t-分布在尾部比標(biāo)準(zhǔn)正態(tài)分布在尾部有較大的概率。,定理6.3 設(shè) ,且X與Y相互獨(dú)立,則,定理6.4 設(shè) Tt(n),則當(dāng) n1,E(T)=0;當(dāng) n2,D(T)=n/(n-2)。,定理6.5 設(shè) Tt(n),t(n;x) 為T的密度函數(shù),則,說(shuō)明:一般當(dāng)n30,取 t(n) N(0,1)。,t-分布的用途:t-分布主要用于小樣本情形正態(tài)總體的均值估計(jì)和檢驗(yàn),以及正態(tài)線性模型可估函數(shù)的推斷。,七、F-分布,性質(zhì)6 設(shè) FF(m,n),則當(dāng) n2,E(F)=n/(n-2); 當(dāng)n4, D(F)= 。,性質(zhì)5 設(shè) Tt(n),則,F-分布的用途: F-分布在對(duì)兩個(gè)正態(tài)總體的未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)中及在方差分析理論中起重要作用。,性質(zhì)4 對(duì)F-分布,若 FF(m,n),則1/FF(n,m)。,八、抽樣分布的幾個(gè)重要結(jié)論,定理6.6 (教材p168定理二、三) 設(shè)總體 為來(lái)自總體的樣本, 為樣本均值, 為樣本方差, 則有 1. 2. 相互獨(dú)立; 3.,推論 設(shè) , 為其樣本方差, 則,注:證明見教材p172-174附錄(可不掌握)。,定理6.7 (教材p169定理四) 設(shè) , 和 分別為來(lái)自總體X和Y的樣本,且兩樣本相互獨(dú)立,設(shè) 分別為兩樣本的樣本均值, 分別為兩樣本的樣本方差, 則有,1.,2.,特別,當(dāng) ,有,3.,特別,當(dāng) ,有,說(shuō)明:1. 證明見教材p170(可不掌握);,2. 這幾個(gè)結(jié)論在參數(shù)估計(jì)、假設(shè)檢驗(yàn)等統(tǒng)計(jì)問(wèn)題的推斷中具有重要意義,也是考研內(nèi)容之一,要注意對(duì)結(jié)論的理解,并會(huì)簡(jiǎn)單應(yīng)用。,例1 設(shè) 是來(lái)自泊松分布()的一個(gè)樣本, 分別為樣本均值、樣本方差,求,說(shuō)明:本題求 的方法值得重視,因?yàn)樵趨?shù)估計(jì)的無(wú)偏性討論中要用到這種方法。,思考題2(2003年數(shù)學(xué)一考研試題選擇題) 設(shè)隨機(jī)變量Xt(n),n1, ,則( ) Y (n). B. Y (n-1). C. YF(n,1). D. YF(1,n).,九、概率分布的分位數(shù),定義6.11 設(shè)X為隨機(jī)變量,對(duì)任何0 )= 的數(shù) 為X的上側(cè)分位數(shù);稱滿足 P(X )= 的數(shù) 為X的雙側(cè)分位數(shù)。,1. N(0,1)的上側(cè)分位數(shù),設(shè) XN(0,1),對(duì)任何0 )= , =?,由 ( )=1- ,查標(biāo)準(zhǔn)正態(tài)分布表(p439表2)即可求出 。,公式:對(duì)任何0 1,,2. N(0,1)的雙側(cè)分位數(shù),設(shè) XN(0,1),對(duì)任何0 )= , =?,,即 P(X )= ,,其中 由( )=1- /2 求出。,3. -分布的上側(cè)分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 豆類作物種植的農(nóng)業(yè)科技成果轉(zhuǎn)化考核試卷
- 2025年除草劑混劑合作協(xié)議書
- 管道工程行業(yè)政策環(huán)境與競(jìng)爭(zhēng)力分析考核試卷
- 茶葉種類與品質(zhì)鑒定考核試卷
- 康復(fù)輔具的標(biāo)準(zhǔn)化與模塊化設(shè)計(jì)考核試卷
- 船舶涂料性能測(cè)試與選用考核試卷
- 商場(chǎng)導(dǎo)視系統(tǒng)設(shè)計(jì)
- 2025年耐火土石類項(xiàng)目發(fā)展計(jì)劃
- 河南送變電運(yùn)維安全考試
- 圓柱側(cè)面積計(jì)算
- 起重機(jī)維護(hù)保養(yǎng)記錄表
- 《煤礦重大危險(xiǎn)源評(píng)估報(bào)告》
- 部編版《道德與法治》六年級(jí)下冊(cè)第1課《學(xué)會(huì)尊重》精美課件
- 企業(yè)VI設(shè)計(jì)報(bào)價(jià)清單
- 監(jiān)控工程驗(yàn)收單-范本模板
- 浙江開放大學(xué)2024年《法律文化》形考作業(yè)1-4答案
- 政治審查表(模板)
- T∕CACM 1107-2018 中醫(yī)治未病實(shí)踐指南 亞健康中醫(yī)干預(yù)
- 數(shù)字貿(mào)易學(xué) 課件 第20、21章 數(shù)字絲綢之路與數(shù)字基礎(chǔ)設(shè)施、數(shù)字自由貿(mào)易與數(shù)字貿(mào)易壁壘
- 地理畢業(yè)生實(shí)習(xí)報(bào)告5000字范本2篇
- (完整版)鋁合金門窗施工合同范本
評(píng)論
0/150
提交評(píng)論