統(tǒng)計(jì)量與抽樣分布_第1頁(yè)
統(tǒng)計(jì)量與抽樣分布_第2頁(yè)
統(tǒng)計(jì)量與抽樣分布_第3頁(yè)
統(tǒng)計(jì)量與抽樣分布_第4頁(yè)
統(tǒng)計(jì)量與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、引例,1899年,戈塞特進(jìn)入都柏林A.吉尼斯父子釀酒公司擔(dān)任釀酒化學(xué)技師,從事統(tǒng)計(jì)和試驗(yàn)工作。他發(fā)現(xiàn),供釀酒的每批麥子質(zhì)量相差很大,而同一批麥子仲能抽樣供試驗(yàn)的麥子又很少,每批樣本在不同的溫度下做式樣其結(jié)果相差很大,這決定了不同批次和溫度的麥子樣本是不同的,不能進(jìn)行樣本合并,這樣一來(lái)實(shí)際上取得的麥子樣本不可能是大樣本,只能是小樣本。小樣本得出的結(jié)果和正態(tài)分布有較大差異,特別是尾部比正態(tài)分布高 大樣本和小樣本有什么差異?如何用樣本推斷總體,統(tǒng)計(jì)方法,描述統(tǒng)計(jì),推斷統(tǒng)計(jì),假設(shè)檢驗(yàn),所謂統(tǒng)計(jì)推斷,就是根據(jù)概率論所揭示的隨機(jī)變量的一般規(guī)律性,利用抽樣調(diào)查所獲得的樣本信息,對(duì)總體的某些性質(zhì)或數(shù)量特征進(jìn)行

2、推斷。 參數(shù)估計(jì) 假設(shè)檢驗(yàn)這兩類問(wèn)題的基本原理是一致的,只是側(cè)重點(diǎn)不同而已。參數(shù)估計(jì)問(wèn)題側(cè)重于用樣本統(tǒng)計(jì)量估計(jì)總體的某一未知參數(shù);假設(shè)檢驗(yàn)問(wèn)題側(cè)重于用樣本資料驗(yàn)證總體是否具有某種性質(zhì)或數(shù)量特征,統(tǒng)計(jì)推斷,由于統(tǒng)計(jì)推斷是根據(jù)觀察到的部分?jǐn)?shù)據(jù)對(duì)總體作出推測(cè),因此推測(cè)就不可能絕對(duì)準(zhǔn)確,有一定的不確定性。這種不確定性的程度可以用概率的大小來(lái)表示,總體與樣本,統(tǒng)計(jì)學(xué)的重要意義就是用樣本統(tǒng)計(jì)量的性質(zhì)推斷總體參數(shù)的特征,第6章 統(tǒng)計(jì)量與抽樣分布,主要內(nèi)容,總體和樣本的統(tǒng)計(jì)分布 統(tǒng)計(jì)量 抽樣分布,第一節(jié) 總體和樣本的統(tǒng)計(jì)分布,一、統(tǒng)計(jì)推斷中的總體及總體分布 總體的概念 總體是根據(jù)一定的目的確定的所要研究的事物

3、的全體,它是由客觀存在的、具有某種共同性質(zhì)的眾多個(gè)體構(gòu)成。總體中的各個(gè)單位稱為個(gè)體。 由引例:每批麥子 每批麥子的每單位出酒量的數(shù)值 編制變量的分布數(shù)列 實(shí)物總體 數(shù)值總體 分布總體,總體的含義可抽象為所感興趣的變量及其分布,第6章 統(tǒng)計(jì)量與抽樣分布,二、統(tǒng)計(jì)推斷中的樣本及其性質(zhì) 按照隨機(jī)原則,通過(guò)觀測(cè)或?qū)嶒?yàn)的方法所獲得的總體中一部分個(gè)體的取值稱為樣本。每個(gè)個(gè)體的取值稱為樣本點(diǎn)或樣品。 樣本是隨機(jī)的,樣本觀測(cè)值是確定的。 如果樣本滿足同分布、獨(dú)立性(iid)則為簡(jiǎn)單隨機(jī)樣本。 樣本所包含的總體單位個(gè)數(shù)稱為樣本容量,一般用表示。在實(shí)際工作中,人們通常把30的樣本稱為大樣本,而把n30的樣本稱為小

4、樣本,是一堆“雜亂無(wú)章”的數(shù)據(jù),設(shè) 是來(lái)自總體 的樣本,對(duì)樣本的一些認(rèn)識(shí),是對(duì)總體進(jìn)行推斷的依據(jù),包含了有關(guān)總體的“信息,在觀察前 是一組獨(dú)立同分布r.v,在觀察后 是一組具體的數(shù)據(jù),總體X 隨機(jī)變量N(,2,觀察值 隨機(jī)變量N(,2)的值,對(duì)象:某大學(xué)新生的身高,2、樣本的聯(lián)合分布,設(shè) 為來(lái)自總體 的樣本,則樣本的聯(lián)合分布函數(shù)為,設(shè) 為來(lái)自總體 的樣本,則樣本的聯(lián)合概率函數(shù)為,例,則樣本的聯(lián)合密度為,n,維正態(tài)分布,樣本的聯(lián)合分布,樣本的聯(lián)合概率函數(shù),第二節(jié) 統(tǒng)計(jì)量,一、統(tǒng)計(jì)量與統(tǒng)計(jì)量的分布,設(shè)(X1,X2,Xn)是總體X的樣本,則由樣本(X1,X2Xn)構(gòu)成的且不含任何未知參數(shù)的函數(shù)T(X

5、1,X2Xn)稱為統(tǒng)計(jì)量,例:設(shè)(X1,X2)是總體N(,2) 的一個(gè)樣本,其中 已知,未知參數(shù),則下列哪個(gè)不是統(tǒng)計(jì)量,1 、統(tǒng)計(jì)量定義,推斷統(tǒng)計(jì)研究的重點(diǎn)尋找統(tǒng)計(jì)量及其分布利用概率論對(duì)總體進(jìn)行推斷,統(tǒng)計(jì)量通常是隨機(jī)變量,但統(tǒng)計(jì)量的觀測(cè)值是確定的,沒有隨機(jī)性。比如,如果(x1,x2,xn)是樣本(X1,X2,,Xn)的觀測(cè)值,那么T(x1,x2,xn)為統(tǒng)計(jì)量T(X1,X2Xn)的觀測(cè)值。則T(X1,X2Xn)是隨機(jī)變量。 統(tǒng)計(jì)量是隨機(jī)變量,那么它應(yīng)該有概率分布。統(tǒng)計(jì)量的分布也稱抽樣分布。 統(tǒng)計(jì)量的分布不一定和總體分布一致。 在統(tǒng)計(jì)推斷中,一個(gè)重要的工作就是尋找統(tǒng)計(jì)量,導(dǎo)出統(tǒng)計(jì)量的抽樣分布或漸

6、近分布,2、常用統(tǒng)計(jì)量,設(shè)(X1,X2,,Xn)為總體X的樣本,則,此外,還有,1、順序統(tǒng)計(jì)量,X1,X2,Xn)是總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本,(x1,x2,xn)是一個(gè)樣本觀察值,將它由小到大的順序排列,得到x(1)x(2)x(n) ,取x(i)作為X(i)的觀測(cè)值,由此得到的統(tǒng)計(jì)量X(1),X(2),X(n)稱為樣本(X1,X2,Xn)的一組順序統(tǒng)計(jì)量,X(i)稱為第i個(gè)順序統(tǒng)計(jì)量其中, 最大順序統(tǒng)計(jì)量X(n)=max X1,X2,Xn 最小順序統(tǒng)計(jì)量X(1)=min X1,X2,Xn,2、樣本中位數(shù),3、樣本極差,R=X(n)- X(1,4、樣本p階分位數(shù),其中,0p1,np取整數(shù),5、樣

7、本切尾均值,第三節(jié) 抽樣分布,正態(tài)分布 如果連續(xù)型隨機(jī)變量X的密度函數(shù)為 則稱隨機(jī)變量X服從均值為,方差為2的正態(tài)分布,記為XN(,2)。 如果一個(gè)正態(tài)分布的=0,=1,則稱該正態(tài)布為標(biāo)準(zhǔn)正態(tài)分布,相應(yīng)的隨機(jī)變量稱為標(biāo)準(zhǔn)正態(tài)隨機(jī)變量,用Z表示,即ZN(0,1),相應(yīng)的分布密度函數(shù)為,一般正態(tài)分布 與標(biāo)準(zhǔn)正態(tài)分布 的關(guān)系: 若隨機(jī)變量X服從正態(tài)分布N (,2),則隨機(jī)變量 Z = 服從標(biāo)準(zhǔn)正態(tài)分布,即ZN(0,1,第三節(jié) 抽樣分布,一、 分布,2 (n)分布的概率密度: 其中 為 函數(shù) 在 處的函數(shù)值,性質(zhì)2:設(shè) X (n1),Y (n2),且X與Y相互獨(dú)立, 則 X+Y (n1+n2) 性質(zhì)3

8、:設(shè) 為X的樣本,則 證: 性質(zhì)4:設(shè) (n),則對(duì)任意實(shí)數(shù)x,有,5、2分布的自由度 可以自由選擇數(shù)值的變量個(gè)數(shù),自由度,一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù) 當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n -1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值 例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值,例,由卡方分布的可加性有,則有該卡方分布自由度為2,且C=1/3,二、t 分布(學(xué)生分布,1定義 設(shè)XN (0

9、,1),Y (n),且 X 與Y 獨(dú)立,則稱隨機(jī)變量 服從自由度為 n 的 t 分布,記作 t t (n,2t (n)分布的概率密度,3性質(zhì):t (n) 分布的概率密度關(guān)于 y 軸對(duì)稱,且,E(t)=0, D(t)=n/(n-2,4t (n) 分布的上 分位點(diǎn): 設(shè) t t (n),對(duì)于給定正數(shù) ,稱滿足條件 的點(diǎn) 為 t (n) 分布的上 分位點(diǎn),且有,5.t分布自由度越小,分布的方差越大,分布比較平坦。當(dāng)自由度較大時(shí),方差較小,越接近標(biāo)準(zhǔn)正態(tài)分布。 6.t分布的自由度由生成t分布的分母卡方分布隨機(jī)變量的自由度決定,三、F分布,2F(m,n)分布的概率密度為,4F (m, n) 分布的上 分

10、位點(diǎn): 設(shè) FF(m, n),對(duì)于給定正數(shù) ,稱滿足條件 的點(diǎn) 為F(m, n)分布的上 分位點(diǎn),且有,如F 0.01(10,15)=3.8,6.3.4 抽樣分布定理(正態(tài)總體統(tǒng)計(jì)量的分布,本節(jié)介紹來(lái)自正態(tài)總體的樣本均值與樣本方差的抽樣分布這是參數(shù)估計(jì)與假設(shè)檢驗(yàn)的基礎(chǔ),定理1 設(shè) 為來(lái)自總體 X 的簡(jiǎn)單隨機(jī)樣本,則 ,,樣本均值與樣本方差 相互獨(dú)立,證明,且兩者獨(dú)立, 由 t 分布的定義知,化簡(jiǎn)即可,定理2,定理3,設(shè)總體 ,總體 ,且 X 與 Y 獨(dú)立X1,X2,與Y1,Y2,分別為來(lái)自總體 X 與總體 Y 的樣本,且這兩組樣本相互獨(dú)立 ,則有,ii) 若 ,則 , 其中,iii),解 . 由 , 即 ,得所求概率為,例1 從總體

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。