第五章統(tǒng)計(jì)量及其分布_第1頁(yè)
第五章統(tǒng)計(jì)量及其分布_第2頁(yè)
第五章統(tǒng)計(jì)量及其分布_第3頁(yè)
第五章統(tǒng)計(jì)量及其分布_第4頁(yè)
第五章統(tǒng)計(jì)量及其分布_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、5.1 總體與樣本5.2 樣本數(shù)據(jù)的整理與顯示5.3 統(tǒng)計(jì)量及其分布5.4 三大抽樣分布5.5 充分統(tǒng)計(jì)量 5.1 總體與個(gè)體總體與個(gè)體總體的三層含義:例5.1.2 在二十世紀(jì)七十年代后期,美國(guó)消費(fèi)者購(gòu)買日產(chǎn)SONY彩電的熱情高于購(gòu)買美產(chǎn) SONY彩電,原因何在? 1979年4月17日日本朝日新聞刊登調(diào)查報(bào) 告指出N(m, (5/3)2),日產(chǎn)SONY彩電的彩色濃 度服從正態(tài)分布,而美產(chǎn)SONY彩電的彩色濃 度服從(m5 , m+5)上的均勻分布。原因在于總體的差異上!圖5.1.1 SONY彩電彩色濃度分布圖等級(jí) I II III IV美產(chǎn) 33.3 33.3 33.3 0 日產(chǎn) 68.3 2

2、7.1 4.3 0.3第六章第六章 樣本與統(tǒng)計(jì)量樣本與統(tǒng)計(jì)量 由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出其規(guī)律性,由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出其規(guī)律性,因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次的觀察,隨機(jī)現(xiàn)象的規(guī)律性就一定能夠清楚次的觀察,隨機(jī)現(xiàn)象的規(guī)律性就一定能夠清楚地呈現(xiàn)出來(lái)。地呈現(xiàn)出來(lái)。 但是,但是,客觀上只允許我們對(duì)隨機(jī)現(xiàn)象進(jìn)行客觀上只允許我們對(duì)隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察或試驗(yàn),也就是說(shuō):我們獲得次數(shù)不多的觀察或試驗(yàn),也就是說(shuō):我們獲得的只能是局部的或有限的觀察資料。的只能是局部的或有限的觀察資料。 一方面,由于樣本是從總體中隨機(jī)抽取的,抽 取前無(wú)法預(yù)知它們的數(shù)

3、值,因此,樣本是隨機(jī) 變量,用大寫字母 X1, X2, , Xn 表示; 另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的 觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小 寫字母 x1, x2, , xn 表示是恰當(dāng)?shù)?。?jiǎn)單起見(jiàn),無(wú)論是樣本還是其觀測(cè)值,樣本一般均用 x1, x2, xn 表示,應(yīng)能從上下文中加以區(qū)別。例例1 1:研究某地區(qū)研究某地區(qū) N 個(gè)農(nóng)戶的年收人。個(gè)農(nóng)戶的年收人。 在這里,總體既指這在這里,總體既指這 N 個(gè)農(nóng)戶,又指我們個(gè)農(nóng)戶,又指我們所關(guān)心的所關(guān)心的 N個(gè)農(nóng)戶的個(gè)農(nóng)戶的數(shù)量指標(biāo)數(shù)量指標(biāo)他們的年收他們的年收入入( ( N 個(gè)數(shù)字個(gè)數(shù)字) )。 如果從這如果從這 N 個(gè)農(nóng)戶中隨機(jī)地抽

4、出個(gè)農(nóng)戶中隨機(jī)地抽出 n 個(gè)農(nóng)戶個(gè)農(nóng)戶作為調(diào)查對(duì)象,那么,這作為調(diào)查對(duì)象,那么,這 n 個(gè)農(nóng)戶以及他們的個(gè)農(nóng)戶以及他們的數(shù)量指標(biāo)數(shù)量指標(biāo)年收入年收入( ( n個(gè)數(shù)字個(gè)數(shù)字) )就是就是樣本樣本。 注意:注意:上例中的總體是直觀的,看得見(jiàn)、上例中的總體是直觀的,看得見(jiàn)、摸得著的。但是,摸得著的。但是,客觀情況并非總是這樣??陀^情況并非總是這樣。例例2 2:用一把尺子測(cè)量一件物體的長(zhǎng)度。用一把尺子測(cè)量一件物體的長(zhǎng)度。 假定假定 n 次測(cè)量值分別為次測(cè)量值分別為X1, ,X2 , , ,Xn。顯。顯然,在該問(wèn)題中,我們把測(cè)量值然,在該問(wèn)題中,我們把測(cè)量值X1, ,X2 , , ,Xn看成樣本。但總體

5、是什么呢看成樣本。但總體是什么呢? ? 事實(shí)上,這里事實(shí)上,這里沒(méi)有一個(gè)現(xiàn)實(shí)存在的個(gè)體沒(méi)有一個(gè)現(xiàn)實(shí)存在的個(gè)體的集合可以作為上述問(wèn)題的總體的集合可以作為上述問(wèn)題的總體??墒?,我們。可是,我們可以這樣考慮,既然可以這樣考慮,既然 n 個(gè)測(cè)量值個(gè)測(cè)量值 X1, ,X2, , ,Xn 是樣本,那么,總體就應(yīng)該理解為是樣本,那么,總體就應(yīng)該理解為一切所有可一切所有可能的測(cè)量值的全體。能的測(cè)量值的全體。又如又如:為研究某種安眠藥的藥效,讓:為研究某種安眠藥的藥效,讓 n 個(gè)病人個(gè)病人同時(shí)服用這種藥,記錄服藥者各自服藥后的睡同時(shí)服用這種藥,記錄服藥者各自服藥后的睡眠時(shí)間比未服藥時(shí)增加睡眠的小時(shí)數(shù)眠時(shí)間比未服

6、藥時(shí)增加睡眠的小時(shí)數(shù) X1, ,X2, , ,Xn,則則這些數(shù)字就是樣本這些數(shù)字就是樣本。 那么,什么是總體呢那么,什么是總體呢? ? 設(shè)想讓某個(gè)地區(qū)設(shè)想讓某個(gè)地區(qū)( (或某國(guó)家,甚至全世界或某國(guó)家,甚至全世界) )所有患失眠癥的病人都服用此藥,則他們所增所有患失眠癥的病人都服用此藥,則他們所增加睡眠的小時(shí)數(shù)之全體就是研究問(wèn)題的總體。加睡眠的小時(shí)數(shù)之全體就是研究問(wèn)題的總體。 對(duì)一個(gè)總體,如果用對(duì)一個(gè)總體,如果用X表示其數(shù)量指標(biāo),表示其數(shù)量指標(biāo),那么,那么,X的值對(duì)不同的個(gè)體就取不同的值。因的值對(duì)不同的個(gè)體就取不同的值。因此,如果我們隨機(jī)地抽取個(gè)體,則此,如果我們隨機(jī)地抽取個(gè)體,則X的值也就的值

7、也就隨著抽取個(gè)體的不同而不同。隨著抽取個(gè)體的不同而不同。 所以,所以,X是一個(gè)隨機(jī)變量是一個(gè)隨機(jī)變量! ! 既然總體是隨機(jī)變量既然總體是隨機(jī)變量X,自然就有其概率,自然就有其概率分布。我們把分布。我們把X的分布稱為的分布稱為總體分布??傮w分布。 總體的特性是由總體分布來(lái)刻畫的。因此,總體的特性是由總體分布來(lái)刻畫的。因此,常把總體和總體分布視為同義語(yǔ)。常把總體和總體分布視為同義語(yǔ)。. .總體分布總體分布樣本的二重性樣本的二重性 假設(shè)假設(shè) X1, X2, , Xn 是總體是總體X中的樣本,在一中的樣本,在一 次具體的觀測(cè)或試驗(yàn)中,它們是一批測(cè)量值次具體的觀測(cè)或試驗(yàn)中,它們是一批測(cè)量值, , 是已經(jīng)

8、取到的一組數(shù)。這就是說(shuō),是已經(jīng)取到的一組數(shù)。這就是說(shuō),樣本具有樣本具有 數(shù)的屬性。數(shù)的屬性。 由于在具體試驗(yàn)或觀測(cè)中,受各種隨機(jī)因素由于在具體試驗(yàn)或觀測(cè)中,受各種隨機(jī)因素 的影響,在不同試驗(yàn)或觀測(cè)中,樣本取值可的影響,在不同試驗(yàn)或觀測(cè)中,樣本取值可 能不同。因此,當(dāng)脫離特定的具體試驗(yàn)或觀能不同。因此,當(dāng)脫離特定的具體試驗(yàn)或觀 測(cè)時(shí),我們并不知道樣本測(cè)時(shí),我們并不知道樣本 X1 1, ,X2 2, , ,Xn n 的的具具 體取值到底是多少。因此,可將樣本看成隨體取值到底是多少。因此,可將樣本看成隨 機(jī)變量。故,機(jī)變量。故,樣本又具有隨機(jī)變量的屬性。樣本又具有隨機(jī)變量的屬性。.樣本樣本X1, ,

9、X2, , ,Xn既被看成數(shù)值,又被看成隨既被看成數(shù)值,又被看成隨機(jī)變量,這就是所謂的樣本的二重性。機(jī)變量,這就是所謂的樣本的二重性。在前面測(cè)量物體長(zhǎng)度的例子中,如果我們?cè)谕暝谇懊鏈y(cè)量物體長(zhǎng)度的例子中,如果我們?cè)谕耆嗤臈l件下,獨(dú)立地測(cè)量了全相同的條件下,獨(dú)立地測(cè)量了n 次,把這次,把這 n 次測(cè)量結(jié)果,即樣本記為次測(cè)量結(jié)果,即樣本記為 X1, ,X2, , ,Xn . . 隨機(jī)隨機(jī)樣本樣本那么,我們就認(rèn)為:那么,我們就認(rèn)為:這些樣本相互獨(dú)立,且有這些樣本相互獨(dú)立,且有相同的分布;其分布與總體分布相同的分布;其分布與總體分布 N( , 2)相同。相同。 將上述結(jié)論將上述結(jié)論推廣到一般的分布推

10、廣到一般的分布: :如果在相如果在相同條件下對(duì)總體同條件下對(duì)總體 X 進(jìn)行進(jìn)行 n 次重復(fù)、獨(dú)立觀測(cè),次重復(fù)、獨(dú)立觀測(cè),就可以認(rèn)為所獲得的樣本就可以認(rèn)為所獲得的樣本X1, ,X2, , ,Xn是是 n 個(gè)個(gè)獨(dú)立且與總體獨(dú)立且與總體 X 有同樣分布的隨機(jī)變量。有同樣分布的隨機(jī)變量。 在統(tǒng)計(jì)文獻(xiàn)中,通常稱統(tǒng)計(jì)文獻(xiàn)中,通常稱相互獨(dú)立且有相同相互獨(dú)立且有相同分布的樣本分布的樣本為為隨機(jī)樣本隨機(jī)樣本或或簡(jiǎn)單樣本簡(jiǎn)單樣本, , n 為為樣本樣本大小大小或或樣本容量樣本容量。 既然樣本既然樣本 X1, ,X2, , ,Xn 被看作隨機(jī)向量被看作隨機(jī)向量,自然需要研究其聯(lián)合分布。自然需要研究其聯(lián)合分布。樣本分

11、布樣本分布 假設(shè)總體假設(shè)總體 X 具有概率密度函數(shù)具有概率密度函數(shù) f ( (x) ),因,因樣本樣本X1, ,X2, , ,Xn獨(dú)立獨(dú)立同分布同分布于于 X,于是,樣,于是,樣本的本的聯(lián)合概率密度函數(shù)為聯(lián)合概率密度函數(shù)為 121(,)().nniig xxxf x統(tǒng)計(jì)數(shù)據(jù)的分類 統(tǒng)計(jì)數(shù)據(jù)的分類統(tǒng)計(jì)數(shù)據(jù)的分類 按計(jì)量層按計(jì)量層次次分分類類的的數(shù)數(shù)據(jù)據(jù)順順序序的的數(shù)數(shù)據(jù)據(jù)數(shù)數(shù)值值型型數(shù)數(shù)據(jù)據(jù) 按時(shí)間狀按時(shí)間狀況況截截面面的的數(shù)數(shù)據(jù)據(jù)時(shí)時(shí)序序的的數(shù)數(shù)據(jù)據(jù) 按收集方按收集方法法觀觀察察的的數(shù)數(shù)據(jù)據(jù)試試驗(yàn)驗(yàn)的的數(shù)數(shù)據(jù)據(jù)數(shù)據(jù)類型及圖示 (小結(jié))條條 形形 圖圖 餅餅 圖圖 環(huán)環(huán) 形形 圖圖匯匯 總總 表

12、表品品 質(zhì)質(zhì) 數(shù)數(shù) 據(jù)據(jù)直直 方方 圖圖折折 線線 圖圖分分 組組 數(shù)數(shù) 據(jù)據(jù)莖莖 葉葉 圖圖箱箱 線線 圖圖原原 始始 數(shù)數(shù) 據(jù)據(jù)線線 圖圖時(shí)時(shí) 序序 數(shù)數(shù) 據(jù)據(jù)雷雷 達(dá)達(dá) 圖圖多多 元元 數(shù)數(shù) 據(jù)據(jù)數(shù)數(shù) 值值 型型 數(shù)數(shù) 據(jù)據(jù)數(shù)數(shù) 據(jù)據(jù) 的的 類類 型型分組數(shù)據(jù)的圖示(直方圖的繪制)直方圖下的面積之和等于1未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)在要比較兩組樣本時(shí),可畫出它們的背靠背的莖葉圖。甲車間 6 2 0 5 6 乙車間8 7 7 7 5 5 5 4 2 1 1 6 6 7 7 8 8 8 7 7 6 6 4 4 2 1 7 2 2 4 5 5 5 5 6 6 6 8 8 9 8 7 6

13、 6 5 3 2 8 0 1 1 3 3 3 4 4 4 6 6 7 7 8 7 3 2 1 0 9 0 2 3 5 8 5 3 0 0 10 7 注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較 大,數(shù)據(jù)很分散,橫跨二、三個(gè)數(shù)量級(jí)時(shí), 莖葉圖并不適用。數(shù)據(jù)分布特征的測(cè)度數(shù)據(jù)特征的測(cè)度數(shù)據(jù)特征的測(cè)度分布的形狀分布的形狀集中趨勢(shì)集中趨勢(shì)離散程度離散程度眾眾 數(shù)數(shù)中位數(shù)中位數(shù)5.2.1 經(jīng)驗(yàn)分布函數(shù)5.2 樣本數(shù)據(jù)的整理與顯示設(shè) x1, x2, , xn 是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測(cè)值由小到大進(jìn)行排列,為 x(1), x(2), , x(n),則稱 x(1), x(2), , x(n

14、) 為有序樣本,用有序樣本定義如下函數(shù) (1)( )(1)( )0, 0為右偏分布4.偏態(tài)系數(shù) 0為左偏分布峰態(tài)(kurtosis)1. 統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出2. 數(shù)據(jù)分布扁平程度的測(cè)度3. 峰態(tài)系數(shù)=0扁平峰度適中4. 峰態(tài)系數(shù)0為尖峰分布計(jì)算變異度指標(biāo)的excel函數(shù) 四分位數(shù):quartile(,quart=?) 平均差:adedev 總體方差:varp 總體標(biāo)準(zhǔn)差:stdevp 樣本方差:var 樣本標(biāo)準(zhǔn)差:stdev 偏態(tài)系數(shù):skew 峰態(tài)系數(shù):kurt5.3.5 次序統(tǒng)計(jì)量及其分布 另一類常見(jiàn)的統(tǒng)計(jì)量是次序統(tǒng)計(jì)量。一、定義5.3.7 設(shè) x1, x2, ,

15、xn 是取自總體X的樣本, x(i) 稱為該樣本的第i 個(gè)次序統(tǒng)計(jì)量,它的取值 是將樣本觀測(cè)值由小到大排列后得到的第 i 個(gè) 觀測(cè)值。其中x(1)=minx1, x2, xn稱為該樣本 的最小次序統(tǒng)計(jì)量,稱 x(n)=maxx1,x2,xn為 該樣本的最大次序統(tǒng)計(jì)量。我們知道,在一個(gè)樣本中,x1, x2,xn 是獨(dú)立同分布的,而次序統(tǒng)計(jì)量 x(1), x(2), x(n) 則既不獨(dú)立,分布也不相同。次序統(tǒng)計(jì)量的分布定理5.3.5 設(shè)總體X的密度函數(shù)為p(x),分布 函數(shù)為F(x), x1, x2, xn為樣本,則第k個(gè) 次序統(tǒng)計(jì)量x(k)的密度函數(shù)為)()(1 ()()!()!1(!)(1xp

16、xFxFknknxpknkk定理5.3.6 在定理5.3.5的記號(hào)下,次序統(tǒng)計(jì) 量 (x(i), x(j), (i j) 的聯(lián)合分布密度函數(shù)為zyzpypzFyFzFyFjnijinzypjnijiij),()()(1 )()()()!()!1()!1(!),(11樣本極差 Rn = x(n) x(1) ,密度函數(shù)為:,密度函數(shù)為: ,)(1 1)(*minnxFxF的分布的分布時(shí)時(shí)的分布函數(shù)為的分布函數(shù)為當(dāng)總體當(dāng)總體)(,)(1XxFX的分布函數(shù)為的分布函數(shù)為)(nX.)()(*maxnxFxF1220( )(1)()d(1)(1)rnnRprn nyryyn nrr這正是參數(shù)為(n1, 2

17、)的貝塔分布。樣本中位數(shù)也是一個(gè)很常見(jiàn)的統(tǒng)計(jì)量,它也是次序統(tǒng)計(jì)量的函數(shù),通常如下定義:更一般地,樣本p分位數(shù)mp可如下定義: 120.5122,12nnnxnmxxn 為奇數(shù),為偶數(shù)(1)()(1),1(2nppnpnpxnpmxxnp若不是整數(shù)), 若是整數(shù)定理5.3.7 設(shè)總體密度函數(shù)為p(x),xp為其p分 位數(shù), p(x)在xp處連續(xù)且 p(xp) 0,則特別,對(duì)樣本中位數(shù),當(dāng)n時(shí)近似地有當(dāng)n 時(shí)樣本 p 分位數(shù) mp 的漸近分布為2(1),()pppppmNxn px0.50.520.51,4()mNxn px柯西分布:p(x,)= 1/(1+(x)2) , 中位數(shù) m0.5 AN(

18、, 2/4n) .5.4 三大抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有廣泛的應(yīng)用,這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“ 三大抽樣分布 ” 。該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布 22,Var()2Enn該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布 由 F 分布的構(gòu)造知 F(n,m) = 1/F1(m,n)。 ( , ),1/ ( , )FF nmFF mn若則 t 分布的密度函數(shù)的圖象是一個(gè)關(guān)于縱軸對(duì)稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些尾部的概

19、率比標(biāo)準(zhǔn)正態(tài)分布的大一些。 n1時(shí), t 分布的數(shù)學(xué)期望存在且為0; n2時(shí),t 分布的方差存在,且為n/(n2); 當(dāng)自由度較大 (如n30) 時(shí), t 分布可以用 正態(tài)分布 N(0,1)近似。t(n1)= t1(n1)定理5.4.1 設(shè) x1, x2, xn 是來(lái)自N(, 2) 的 樣本,其樣本均值和樣本方差分別為和x = xi/n s2= (xix)2/(n1)(3) (n1) s2/2 1則有(1) x 與 s2 相互獨(dú)立;(2) x N(, 2/n) ;推論5.4.3 設(shè) x1, x2, xn 是來(lái)自N(1, 12) 的 樣本,y1, y2, yn 是來(lái)自N(2, 22) 的樣本,

20、且此兩樣本相互獨(dú)立,則有特別,若12 =22 ,則F=sx2/sy2 F(m1,n1)221222/(1,1)/xysFF mns推論5.4.4 在推論5.4.3的記號(hào)下,設(shè) 12 =22 = 2 , 并記則2)()(2) 1() 1(1122222nmyyxxnmsnsmsminiiiyxw)2(11)()(21nmtnmsyxw定義5.5.1 設(shè) x1, x2, , xn 是來(lái)自某個(gè)總體 的樣本,總體分布函數(shù)為F( x ; ),統(tǒng)計(jì) 量 T = T(x1, x2, , xn) 稱為 的充分統(tǒng)計(jì) 量,如果在給定T 的取值后,x1, x2, xn 的條件分布與 無(wú)關(guān).5.5.2 因子分解定理充分性原則: 在統(tǒng)計(jì)學(xué)中有一個(gè) 基本原則- 在充分統(tǒng)計(jì)量存在的場(chǎng)合,任何統(tǒng)計(jì)推斷都 可以基于充分統(tǒng)計(jì)量進(jìn)行,這可以簡(jiǎn)化統(tǒng)計(jì) 推斷的程序。定理5.5.1 設(shè)總體概率函數(shù)為 p(x ; ), X1, , Xn 為樣本,則 T=T(X1, Xn) 為充分統(tǒng)計(jì)量的充分 必要條件是:存在兩個(gè)函數(shù)g(t; )和h(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論