概率論與數(shù)理統(tǒng)計第五章最新版本課件_第1頁
概率論與數(shù)理統(tǒng)計第五章最新版本課件_第2頁
概率論與數(shù)理統(tǒng)計第五章最新版本課件_第3頁
概率論與數(shù)理統(tǒng)計第五章最新版本課件_第4頁
概率論與數(shù)理統(tǒng)計第五章最新版本課件_第5頁
已閱讀5頁,還剩147頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第五章統(tǒng)計量及其分布

§5.1

總體與樣本§5.2

樣本數(shù)據(jù)的整理與顯示§5.3

統(tǒng)計量及其分布§5.4

三大抽樣分布§5.5

充分統(tǒng)計量

第五章統(tǒng)計量及其分布§5.1總體與樣本例5.0.1

某公司要采購一批產(chǎn)品,每件產(chǎn)品不

是合格品就是不合格品,但該批產(chǎn)品總有一

個不合格品率

p。由此,若從該批產(chǎn)品中隨

機抽取一件,用

x

表示這一批產(chǎn)品的不合格

數(shù),不難看出

x

服從一個二點分布b(1,p),

但分布中的參數(shù)

p是不知道的。一些問題:

例5.0.1某公司要采購一批產(chǎn)品,每件產(chǎn)品不

是合

p

的大小如何;

p

大概落在什么范圍內(nèi);

能否認(rèn)為

p

滿足設(shè)定要求(如p

0.05)。p的大小如何;p大概落在什么范圍內(nèi);能§5.1總體與個體總體的三層含義:

研究對象的全體;

數(shù)據(jù);

分布§5.1總體與個體總體的三層含義:研究對象的全例5.1.1

考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則總體={該廠生產(chǎn)的全部合格品與不合格品}={由0或1組成的一堆數(shù)}若以

p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個二點分布表示:X0

1P1

pp例5.1.1考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記X比如:兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體

分布:X01p0.9830.017X01p0.9150.085比如:兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體

例5.1.2

在二十世紀(jì)七十年代后期,美國消費者購買日產(chǎn)SONY彩電的熱情高于購買美產(chǎn)SONY彩電,原因何在?

1979年4月17日日本《朝日新聞》刊登調(diào)查報告指出N(m,(5/3)2),日產(chǎn)SONY彩電的彩色濃度服從正態(tài)分布,而美產(chǎn)SONY彩電的彩色濃度服從(m5,m+5)上的均勻分布。原因在于總體的差異上!例5.1.2在二十世紀(jì)七十年代后期,美國消費1979圖5.1.1SONY彩電彩色濃度分布圖圖5.1.1SONY彩電彩色濃度分布圖等級

I

IIIII

IV美產(chǎn)33.333.333.30

日產(chǎn)68.327.14.30.3表5.1.1各等級彩電的比例(%)等級III5.1.2樣本樣品、樣本、樣本量:樣本具有兩重性一方面,由于樣本是從總體中隨機抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機變量,用大寫字母X1,X2,…,Xn

表示;另一方面,樣本在抽取以后經(jīng)觀測就有確定的觀測值,因此,樣本又是一組數(shù)值。此時用小寫字母x1,x2,…,xn表示是恰當(dāng)?shù)?。簡單起見,無論是樣本還是其觀測值,樣本一般均用x1,x2,…xn

表示,應(yīng)能從上下文中加以區(qū)別。5.1.2樣本樣品、樣本、樣本量:樣本具有兩重性一方例5.1.3

啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640

克。由于隨機性,事實上不可能使得所有的啤酒凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機抽取10瓶測定其凈含量,得到如下結(jié)果:641,635,640,637,642,638,645,643,639,640這是一個容量為10的樣本的觀測值,對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。這樣的樣本稱為完全樣本。例5.1.3啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640這例5.1.4

考察某廠生產(chǎn)的某種電子元件的壽命,選了100只進(jìn)行壽命試驗,得到如下數(shù)據(jù):例5.1.4考察某廠生產(chǎn)的某種電子元件的表5.1.2

100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀測值沒有具體的數(shù)值,只有一個范圍,這樣的樣本稱為分組樣本。

壽命范圍

元件數(shù)

壽命范圍

元件數(shù)

壽命范圍

元件數(shù)(024]4(192216]6(384408]4(2448]8(216240]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]3(504528]3(144168]5(336360]5(528552]1(168192]4(360184]1>55213表5.1.2100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀獨立性:

樣本中每一樣品的取值不影響其它樣品的取值--

x1,x2,…,xn

相互獨立。要使得推斷可靠,對樣本就有要求,使樣本能很好地代表總體。通常有如下兩個要求:隨機性:總體中每一個個體都有同等機會被選入樣本--

xi

與總體X有相同的分布。樣本的要求:簡單隨機樣本獨立性:樣本中每一樣品的取值不影響其要使得推斷可靠設(shè)總體X具有分布函數(shù)F(x),

x1,x2,…,xn

為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為用簡單隨機抽樣方法得到的樣本稱為簡單隨機樣本,也簡稱樣本。于是,樣本

x1,x2,…,xn

可以看成是獨立同分布(iid)的隨機變量,其共同分布即為總體分布。設(shè)總體X具有分布函數(shù)F(x),

x1,x2,…,xn總體分為有限總體與無限總體實際中總體中的個體數(shù)大多是有限的。當(dāng)個體數(shù)充分大時,將有限總體看作無限總體是一種合理的抽象。對無限總體,隨機性與獨立性容易實現(xiàn),困難在于排除有意或無意的人為干擾。對有限總體,只要總體所含個體數(shù)很大,特別是與樣本量相比很大,則獨立性也可基本得到滿足。總體分為有限總體與無限總體實際中總體中的個體數(shù)大多是有限的。例5.1.5

設(shè)有一批產(chǎn)品共N個,需要進(jìn)行抽樣檢驗以了解其不合格品率p?,F(xiàn)從中采取不放回抽樣抽出2個產(chǎn)品,這時,第二次抽到不合格品的概率依賴于第一次抽到的是否是不合格品,如果第一次抽到不合格品,則而若第一次抽到的是合格品,則第二次抽到不合格品的概率為P(x2=1|x1

=1)=(Np1)/(N1)P(x2=1|x1

=0)=(Np)(N1)例5.1.5設(shè)有一批產(chǎn)品共N個,需要進(jìn)行抽樣檢而若第一次顯然,如此得到的樣本不是簡單隨機樣本。但是,當(dāng)N很大時,我們可以看到上述兩種情形的概率都近似等于p。所以當(dāng)N很大,而n不大(一個經(jīng)驗法則是

nN0.1)時可以把該樣本近似地看成簡單隨機樣本。思考:

若總體的密度函數(shù)為p(x),則其樣本的(聯(lián)

合)密度函數(shù)是什么?顯然,如此得到的樣本不是簡單隨機樣本。但是,當(dāng)N很大時,我5.2.1經(jīng)驗分布函數(shù)§5.2

樣本數(shù)據(jù)的整理與顯示設(shè)

x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測值由小到大進(jìn)行排列,為x(1),x(2),…,x(n),則稱

x(1),x(2),…,x(n)為有序樣本,用有序樣本定義如下函數(shù)

5.2.1經(jīng)驗分布函數(shù)§5.2樣本數(shù)據(jù)的整理與顯示設(shè)則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0和Fn()=1由此可見,F(xiàn)n(x)是一個分布函數(shù),并稱Fn(x)為經(jīng)驗分布函數(shù)。則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0例5.2.1

某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機抽取5聽飲料,稱得其凈重(單位:克)351347355344351x(1)=344,x(2)=347,x(3)=351,x(4)=354,x(5)=355這是一個容量為5的樣本,經(jīng)排序可得有序樣本:例5.2.1某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上x(其經(jīng)驗分布函數(shù)為由伯努里大數(shù)定律:只要n相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x)。

0,x<344

0.2,344x

<347Fn(x)=0.4,347x

<3510.8,344x

<3471,x355其經(jīng)驗分布函數(shù)為由伯努里大數(shù)定律:更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理5.2.1(格里紋科定理)設(shè)x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,Fn(x)是其經(jīng)驗分布函數(shù),當(dāng)n時,有PsupFn(x)F(x)0=1格里紋科定理表明:當(dāng)n相當(dāng)大時,經(jīng)驗分布函數(shù)是總體分布函數(shù)F(x)的一個良好的近似。經(jīng)典的統(tǒng)計學(xué)中一切統(tǒng)計推斷都以樣本為依據(jù),其理由就在于此。更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理5.2.1(160196164148170

175178166181162

161168166162172

156170157162154

5.2.2頻數(shù)--頻率分布表樣本數(shù)據(jù)的整理是統(tǒng)計研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表。例5.2.2

為研究某廠工人生產(chǎn)某種產(chǎn)品的能力,我們隨機調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品的數(shù)量,數(shù)據(jù)如下160196(1)對樣本進(jìn)行分組:作為一般性的原則,組數(shù)通常在5~20個,對容量較小的樣本;(2)

確定每組組距:近似公式為組距d=(最大觀測值

最小觀測值)/組數(shù);(3)

確定每組組限:各組區(qū)間端點為a0,a1=a0+d,

a2=a0+2d,…,ak=a0+kd,形成如下的分組區(qū)間(a0,a1],(a1,a2],…,(ak-1

,ak]對這20個數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:其中a0

略小于最小觀測值,ak

略大于最大觀測值.(1)對樣本進(jìn)行分組:作為一般性的原則,組數(shù)通(2(4)

統(tǒng)計樣本數(shù)據(jù)落入每個區(qū)間的個數(shù)——頻數(shù),

并列出其頻數(shù)頻率分布表。表5.2.1

例5.2.2的頻數(shù)頻率分布表

組序分組區(qū)間組中值頻數(shù)頻率累計頻率(%)1(147,157]152

4

0.20

20

2

(157,167]162

8

0.4060

3(167,177]172

5

0.25

85

4

(177,187]18220.10955(187,197]19210.05100合計201(4)統(tǒng)計樣本數(shù)據(jù)落入每個區(qū)間的個數(shù)——頻數(shù),

5.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無變化。5.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的把每一個數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面部分(個位)稱為葉,然后畫一條豎線,在豎線的左側(cè)寫上莖,右側(cè)寫上葉,就形成了莖葉圖。如:二、莖葉圖數(shù)值分開莖和葉11211|211和2把每一個數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面例5.2.3

某公司對應(yīng)聘人員進(jìn)行能力測試,測試成績總分為150分。下面是50位應(yīng)聘人員的測試成績(已經(jīng)過排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我們用這批數(shù)據(jù)給出一個莖葉圖,見下頁。例5.2.3某公司對應(yīng)聘人員進(jìn)行能力測試,測試6467圖5.2.3測試成績的莖葉圖47024669012235681123335667790024667882246899235683

圖5.2.3測試成績的莖葉圖47在要比較兩組樣本時,可畫出它們的背靠背的莖葉圖。甲車間62056乙車間87775554211667788877664421722455556668898766532801133344466778732109023585300107注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較大,數(shù)據(jù)很分散,橫跨二、三個數(shù)量級時,莖葉圖并不適用。在要比較兩組樣本時,甲車間6205.3.1統(tǒng)計量與抽樣分布§5.3統(tǒng)計量及其分布當(dāng)人們需要從樣本獲得對總體各種參數(shù)的認(rèn)識時,最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義5.3.1

設(shè)x1,x2,…,xn

為取自某總體的樣本,若樣本函數(shù)T=T(x1,x2,…,xn)中不含有任何未知參數(shù)。則稱T為統(tǒng)計量。統(tǒng)計量的分布稱為抽樣分布。5.3.1統(tǒng)計量與抽樣分布§5.3統(tǒng)計量及其分布當(dāng)人按照這一定義:若x1,x2,…,xn為樣本,則以及經(jīng)驗分布函數(shù)Fn(x)都是統(tǒng)計量。而當(dāng),2未知時,x1,x1/等均不是統(tǒng)計量。盡管統(tǒng)計量不依賴于未知參數(shù),但是它的分布一般是依賴于未知參數(shù)的。下面介紹一些常見的統(tǒng)計量及其抽樣分布。按照這一定義:若x1,x2,…,xn為樣本,盡管統(tǒng)5.3.2樣本均值及其抽樣分布

定義5.3.2

設(shè)x1,x2,…,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即思考:在分組樣本場合,樣本均值如何計算?二者結(jié)果相同嗎?

xx=

(x1+…+xn)/n5.3.2樣本均值及其抽樣分布定義5.3.2定理5.3.2

數(shù)據(jù)觀測值與均值的偏差平方和最小,即在形如(xic)2的函數(shù)中,樣本均值的基本性質(zhì):定理5.3.1

若把樣本中的數(shù)據(jù)與樣本均值之差稱為偏差,則樣本所有偏差之和為0,即

最小,其中c為任意給定常數(shù)。定理5.3.2數(shù)據(jù)觀測值與均值的偏差平方和樣本均值的基樣本均值的抽樣分布:定理5.3.3

設(shè)x1,x2,…,xn是來自某個總體的樣本,x為樣本均值。(1)若總體分布為N(,2),則xx的精確分布為N(,2/n)

;若總體分布未知或不是正態(tài)分布,但E(x)=,Var(x)=2,則n較大時的漸近分布為N(,2/n)

,常記為。xAN(,2/n)這里漸近分布是指n較大時的近似分布.樣本均值的抽樣分布:定理5.3.3設(shè)x1,x2,…5.3.3樣本方差與樣本標(biāo)準(zhǔn)差稱為樣本標(biāo)準(zhǔn)差。s*=

s*2定義5.3.3稱為樣本方差,其算術(shù)平方根在n不大時,常用作為樣本方差,其算術(shù)平方根也稱為樣本標(biāo)準(zhǔn)差。5.3.3樣本方差與樣本標(biāo)準(zhǔn)差稱為樣本標(biāo)準(zhǔn)差。s*=在這個定義中,

(

xix)2n1稱為偏差平方和的自由度。其含義是:x在確定后,

n個偏差x1x,x2x,…,xnx能自由取值,因為只有n1個數(shù)據(jù)可以自由變動,而第n個則不

(xix)=0.稱為偏差平方和,中樣本偏差平方和有三個不同的表達(dá)式:(

xix)2=xi2–(xi)2/n=xi2–nx它們都可用來計算樣本方差。思考:分組樣本如何計算樣本方差?在這個定義中,(xix)2n1稱為偏差平方和樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不依賴于總體的分布形式。定理5.3.4

設(shè)總體X具有二階矩,即

E(x)=

,Var(x)=2

,

x1,x2,…,xn為從該總體得到的樣本,x和s2分別是樣本均值和樣本方差,則E(x)=,Var(x)=2/n,E(s2)=2樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不依賴于總5.3.4樣本矩及其函數(shù)

樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計量。定義5.3.4

ak=(xik)/n稱為樣本k階原點矩,

特別,樣本一階原點矩就是樣本均值。

稱為樣本k階中心矩。

特別,樣本二階中心矩就是樣本方差。

bk=

(xi

x)k/n5.3.4樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推當(dāng)總體關(guān)于分布中心對稱時,我們用x和s刻畫樣本特征很有代表性,而當(dāng)其不對稱時,只用

就顯得很不夠。為此,需要一些刻畫分布形狀的統(tǒng)計量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。樣本偏度1反映了總體分布密度曲線的對稱性信息。樣本峰度2反映了總體分布密度曲線在其峰值附近的陡峭程度。定義:1=b3/b23/2稱為樣本偏度,

2=b4/b22稱為樣本峰度。x和s當(dāng)總體關(guān)于分布中心對稱時,我們用x和s刻畫樣本特征很有代表5.3.5次序統(tǒng)計量及其分布

另一類常見的統(tǒng)計量是次序統(tǒng)計量。一、定義5.3.7

設(shè)x1,x2,…,xn是取自總體X的樣本,x(i)稱為該樣本的第i個次序統(tǒng)計量,它的取值是將樣本觀測值由小到大排列后得到的第i個觀測值。其中x(1)=minx1,x2,…,xn稱為該樣本的最小次序統(tǒng)計量,稱x(n)=maxx1,x2,…,xn為該樣本的最大次序統(tǒng)計量。5.3.5次序統(tǒng)計量及其分布另一類常見的統(tǒng)計量是次序統(tǒng)例5.3.6設(shè)總體X的分布為僅取0,1,2的離散

均勻分布,分布列為0

1

2

1/3

1/31/3我們知道,在一個樣本中,x1,x2,…,xn是獨立同分布的,而次序統(tǒng)計量x(1),x(2),…,x(n)則既不獨立,分布也不相同,看下例?,F(xiàn)從中抽取容量為3的樣本,其一切可能取值有33=27種,表5.3.6列出了這些值,由此例5.3.6設(shè)總體X的分布為僅取0,1,2的離散

012012我們可以清楚地看到這三個次序統(tǒng)計量的分布是不相同的??山o出的x(1),x(2),x(3)分布列如下:012012進(jìn)一步,我們可以給出兩個次序統(tǒng)計量的聯(lián)合分布,如,x(1)和x(2)的聯(lián)合分布列為01207/279/273/27104/273/272001/27x(1)x(2)進(jìn)一步,我們可以給出兩個次序統(tǒng)計量的聯(lián)合分布,如,x(1)因為P(x(1)=0,x(2)=0)=7/27,二者不等,由此可看出x(1)和x(2)是不獨立的。而P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),因為P(x(1)=0,x(2)=0)=7/2二、單個次序統(tǒng)計量的分布定理5.3.5設(shè)總體X的密度函數(shù)為p(x),分布函數(shù)為F(x),x1,x2,…,xn為樣本,則第k個次序統(tǒng)計量x(k)的密度函數(shù)為二、單個次序統(tǒng)計量的分布定理5.3.5設(shè)總體X的密度函例5.3.7設(shè)總體密度函數(shù)為p(x)=3x2,0x1.

從該總體抽得一個容量為5的樣本,試計算P(x(2)1/2)。解:有兩種求法:從古典概型出發(fā);從次序統(tǒng)計量密度函數(shù)出發(fā)。例5.3.8設(shè)總體分布為U(0,1),x1,x2,…,xn為樣本,試求第k個次序統(tǒng)計量的分布。例5.3.7設(shè)總體密度函數(shù)為p(x)=3x2,0三、多個次序統(tǒng)計量的聯(lián)合分布對任意多個次序統(tǒng)計量可給出其聯(lián)合分布,以兩個為例說明:定理5.3.6在定理5.3.5的記號下,次序統(tǒng)計量(x(i),x(j)),(ij)的聯(lián)合分布密度函數(shù)為三、多個次序統(tǒng)計量的聯(lián)合分布對任意多個次序統(tǒng)計量可給出其聯(lián)合次序統(tǒng)計量的函數(shù)在實際中經(jīng)常用到。如樣本極差Rn

=x(n)

x(1),

樣本中程[x(n)

x(1)]/2。樣本極差是一個很常用的統(tǒng)計量,其分布只在很少幾種場合可用初等函數(shù)表示。次序統(tǒng)計量的函數(shù)在實際中經(jīng)常用到。樣本極差是一個很常用的統(tǒng)計令R

=x(n)

x(1),由R0,可以推出0

x(1)

=

x(n)R

1

R

,則例5.3.9設(shè)總體分布為U(0,1),x1,x2,…,xn為樣本,則(x(n),x(1))的聯(lián)合密度函數(shù)為p1,n(y,z)=n(n1)(zy)n-2,0

yz1這正是參數(shù)為(n1,2)的貝塔分布。令R=x(n)x(1),由R0,可以5.3.6樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)也是一個很常見的統(tǒng)計量,它也是次序統(tǒng)計量的函數(shù),通常如下定義:更一般地,樣本p分位數(shù)mp可如下定義:5.3.6樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)也是一個很常見定理5.3.7設(shè)總體密度函數(shù)為p(x),xp為其p分位數(shù),p(x)在xp處連續(xù)且p(xp)0,則特別,對樣本中位數(shù),當(dāng)n時近似地有當(dāng)n時樣本p分位數(shù)mp的漸近分布為定理5.3.7設(shè)總體密度函數(shù)為p(x),xp為其p分特例5.3.10設(shè)總體為柯西分布,密度函數(shù)為p(x,)=1/[(1+(x)2)],x+通常,樣本均值在概括數(shù)據(jù)方面具有一定的優(yōu)勢。但當(dāng)數(shù)據(jù)中含有極端值時,使用中位數(shù)比使用均值更好,中位數(shù)的這種抗干擾性在統(tǒng)計中稱為具有穩(wěn)健性。

不難看出是該總體的中位數(shù),即x0.5=。設(shè)x1,x2,…,xn是來自該總體的樣本,當(dāng)樣本量n較大時,樣本中位數(shù)m0.5的漸近分布為m0.5AN(,2/4n).例5.3.10設(shè)總體為柯西分布,密度函數(shù)為p(x,)5.3.7五數(shù)概括與箱線圖次序統(tǒng)計量的應(yīng)用之一是五數(shù)概括與箱線圖。在得到有序樣本后,容易計算如下五個值:最小觀測值

xmin=x(1),最大觀測值xmax=x(n),中位數(shù)

m0.5,第一4分位數(shù)

Q1=m0.25,第三4分位數(shù)

Q3=m0.75.所謂五數(shù)概括就是指用這五個數(shù):xmin,Q1,m0.5,Q3,xmax來大致描述一批數(shù)據(jù)的輪廓。5.3.7五數(shù)概括與箱線圖次序統(tǒng)計量的應(yīng)用之一是五數(shù)概括§5.4三大抽樣分布大家很快會看到,有很多統(tǒng)計推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個著名統(tǒng)計量在實際中有廣泛的應(yīng)用,這是因為這三個統(tǒng)計量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計中的“三大抽樣分布”?!?.4三大抽樣分布大家很快會看到,有很多統(tǒng)計推斷是5.4.12

分布(卡方分布)定義5.4.1設(shè)X1,X2,…,Xn,獨立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則2=

X12+…Xn2的分布稱為自由度為n的2分布,記為2

2(n)

。當(dāng)隨機變量

2

2(n)時,對給定

(01),稱滿足P(2

12(n))的12(n)是自由度為n1的卡方分布的1

分位數(shù).分位數(shù)

12(n)可以從附表3中查到。5.4.12分布(卡方分布)定義5.4.1該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布

該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布5.4.2F分布定義5.4.2

設(shè)X1

2(m),X2

2(n),X1與X2獨立,則稱F=(X1/m)/(X2/n)的分布是自由度為

m與n

的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。當(dāng)隨機變量FF(m,n)時,對給定(01),稱滿足P(F

F1(m,n))=1的F1(m,n)是自由度為m與n的F分布的1分位數(shù)。由F分布的構(gòu)造知F(n,m)=1/F1(m,n)。5.4.2F分布定義5.4.2設(shè)X1該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布

該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布5.4.3t

分布

定義5.4.3

設(shè)隨機變量X1

與X2

獨立,且X1N(0,1),X2

2(n),則稱t=X1/X2/n的分布為自由度為n

的t分布,記為tt(n)。

5.4.3t分布定義5.4.3設(shè)隨機變量t分布的密度函數(shù)的圖象是一個關(guān)于縱軸對稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。t分布的密度函數(shù)的圖象是一個關(guān)于縱軸對稱的分布,與標(biāo)準(zhǔn)正

n1時,t分布的數(shù)學(xué)期望存在且為0;n2時,t分布的方差存在,且為n/(n2);當(dāng)自由度較大(如n30)時,t分布可以用正態(tài)分布

N(0,1)近似。自由度為1的t分布就是標(biāo)準(zhǔn)柯西分布,

它的均值不存在;n1時,t分布的數(shù)學(xué)期望存在且為0;自由度為1的當(dāng)隨機變量tt(n)時,稱滿足P(t

t1(n))=1的t1(n)是自由度為n的t分布的1分位數(shù).分位數(shù)t1(n)可以從附表4中查到。譬如n=10,=0.05,那么從附表4上查得t10.05(10)=t0.95(10)=1.812.由于t分布的密度函數(shù)關(guān)于0對稱,故其分位數(shù)間有如下關(guān)系t(n1)=t1(n1)當(dāng)隨機變量tt(n)時,稱滿足由于t分布的密度函數(shù)5.4.4一些重要結(jié)論定理5.4.1設(shè)x1,x2,…,xn是來自N(,2)的樣本,其樣本均值和樣本方差分別為和x=xi/n

s2=

(xix)2/(n1)(3)(n1)s2/2

2(n1)。則有(1)x與s2相互獨立;(2)xN(,2/n)

;5.4.4一些重要結(jié)論定理5.4.1設(shè)x1,推論5.4.3

設(shè)x1,x2,…,xn是來自N(1,12)的樣本,y1,y2,…,yn是來自N(2,22)的樣本,且此兩樣本相互獨立,則有特別,若12=22,則F=sx2/sy2

F(m1,n1)推論5.4.3設(shè)x1,x2,…,xn是來自N(推論5.4.4在推論5.4.3的記號下,設(shè)12=22=2,并記則推論5.4.4在推論5.4.3的記號下,設(shè)則§5.5充分統(tǒng)計量5.5.1充分性的概念例5.5.1

為研究某個運動員的打靶命中率,我們對該運動員進(jìn)行測試,觀測其10次,發(fā)現(xiàn)除第三、六次未命中外,其余8次都命中。這樣的觀測結(jié)果包含了兩種信息:(1)打靶10次命中8次;(2)2次不命中分別出現(xiàn)在第3次和第6次打靶上。§5.5充分統(tǒng)計量5.5.1充分性的概念例5.5.第二種信息對了解該運動員的命中率是沒有什么幫助的。一般地,設(shè)我們對該運動員進(jìn)行n次觀測,得到x1,x2,…,xn,每個xj

取值非0即1,命中為1,不命中為0。令T=x1+…+xn

,T為觀測到的命中次數(shù)。在這種場合僅僅記錄使用T不會丟失任何與命中率有關(guān)的信息,統(tǒng)計上將這種“樣本加工不損失信息”稱為“充分性”。樣本x=(x1,x2,…,xn)有一個樣本分布F

(x),這個分布包含了樣本中一切有關(guān)的信息。第二種信息對了解該運動員的命中率是沒有什么幫助的。一般地,設(shè)統(tǒng)計量T=T(x1,x2,…,xn)也有一個抽樣分布FT(t),當(dāng)我們期望用統(tǒng)計量T代替原始樣本并且不損失任何有關(guān)的信息時,也就是期望抽樣分布FT(t)像F(x)一樣概括了有關(guān)的一切信息,這即是說在統(tǒng)計量

T的取值為t的情況下樣本x的條件分布

F(x|T=t)已不含的信息,這正是統(tǒng)計量具有充分性的含義。統(tǒng)計量T=T(x1,x2,…,xn)也有一個抽樣分布F定義5.5.1

設(shè)x1,x2,…,xn

是來自某個總體的樣本,總體分布函數(shù)為F

(x;),統(tǒng)計量T=T(x1,x2,…,xn)稱為的充分統(tǒng)計量,如果在給定T的取值后,x1,x2,…,xn

的條件分布與無關(guān).定義5.5.1設(shè)x1,x2,…,xn是來自5.5.2因子分解定理充分性原則:在統(tǒng)計學(xué)中有一個基本原則--在充分統(tǒng)計量存在的場合,任何統(tǒng)計推斷都可以基于充分統(tǒng)計量進(jìn)行,這可以簡化統(tǒng)計推斷的程序。定理5.5.1設(shè)總體概率函數(shù)為p(x;),X1,…,Xn

為樣本,則T=T(X1,…Xn)為充分統(tǒng)計量的充分必要條件是:存在兩個函數(shù)g(t;)和h(x1,…,xn),使得對任意的和任一組觀測值x1,x2,…,xn,有p(x1,x2,…,xn;)=g(T(x1,x2,…,xn);)h(x1,x2,…,xn)(5.5.1)5.5.2因子分解定理充分性原則:在統(tǒng)計學(xué)中有一個例5.5.4設(shè)x1,x2,…,xn是取自總體U(0,)的樣本,即總體的密度函數(shù)為其中g(shù)(t,)是通過統(tǒng)計量T的取值而依賴于樣本的。p(x;)=1/,0x0,其他于是樣本的聯(lián)合密度函數(shù)為例5.5.4設(shè)x1,x2,…,xn是取自總體U(取T=x(n),并令g(t;)=(1/)nIt,h(x)=1,由因子分解定理知T=x(n)

是的充分統(tǒng)計量。p(x1;)…p(xn;)=0,其它

(1/)n,0minximaxxi由于諸xi0,所以我們可將上式改寫為p(x1;)…p(xn;)=(1/)nIx(n)例5.5.5設(shè)x1,x2,…,xn

是取自總體N(,2)的樣本,=(,2)是未知的,則聯(lián)合密度函數(shù)為取T=x(n),并令g(t;)=(1/)nI取t1=xi,t2=xi2,并令g(t1,t2,)=(22)-n/2exp-n2/(22)exp(t22t1)/(22),其中h(x)=1,由因子分解定理,T=(xi,xi2)是充分統(tǒng)計量。取t1=xi,t2=xi2,并令g(t1

是一一對應(yīng)的,這說明在正態(tài)總體場合常用的進(jìn)一步,我們指出這個統(tǒng)計量與(x,s2

)(x,s2

)是充分統(tǒng)計量。是一一對應(yīng)的,這說明在正態(tài)總體場合進(jìn)一步,我們指出這個統(tǒng)第五章統(tǒng)計量及其分布

§5.1

總體與樣本§5.2

樣本數(shù)據(jù)的整理與顯示§5.3

統(tǒng)計量及其分布§5.4

三大抽樣分布§5.5

充分統(tǒng)計量

第五章統(tǒng)計量及其分布§5.1總體與樣本例5.0.1

某公司要采購一批產(chǎn)品,每件產(chǎn)品不

是合格品就是不合格品,但該批產(chǎn)品總有一

個不合格品率

p。由此,若從該批產(chǎn)品中隨

機抽取一件,用

x

表示這一批產(chǎn)品的不合格

數(shù),不難看出

x

服從一個二點分布b(1,p),

但分布中的參數(shù)

p是不知道的。一些問題:

例5.0.1某公司要采購一批產(chǎn)品,每件產(chǎn)品不

是合

p

的大小如何;

p

大概落在什么范圍內(nèi);

能否認(rèn)為

p

滿足設(shè)定要求(如p

0.05)。p的大小如何;p大概落在什么范圍內(nèi);能§5.1總體與個體總體的三層含義:

研究對象的全體;

數(shù)據(jù);

分布§5.1總體與個體總體的三層含義:研究對象的全例5.1.1

考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則總體={該廠生產(chǎn)的全部合格品與不合格品}={由0或1組成的一堆數(shù)}若以

p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個二點分布表示:X0

1P1

pp例5.1.1考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記X比如:兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體

分布:X01p0.9830.017X01p0.9150.085比如:兩個生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體

例5.1.2

在二十世紀(jì)七十年代后期,美國消費者購買日產(chǎn)SONY彩電的熱情高于購買美產(chǎn)SONY彩電,原因何在?

1979年4月17日日本《朝日新聞》刊登調(diào)查報告指出N(m,(5/3)2),日產(chǎn)SONY彩電的彩色濃度服從正態(tài)分布,而美產(chǎn)SONY彩電的彩色濃度服從(m5,m+5)上的均勻分布。原因在于總體的差異上!例5.1.2在二十世紀(jì)七十年代后期,美國消費1979圖5.1.1SONY彩電彩色濃度分布圖圖5.1.1SONY彩電彩色濃度分布圖等級

I

IIIII

IV美產(chǎn)33.333.333.30

日產(chǎn)68.327.14.30.3表5.1.1各等級彩電的比例(%)等級III5.1.2樣本樣品、樣本、樣本量:樣本具有兩重性一方面,由于樣本是從總體中隨機抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機變量,用大寫字母X1,X2,…,Xn

表示;另一方面,樣本在抽取以后經(jīng)觀測就有確定的觀測值,因此,樣本又是一組數(shù)值。此時用小寫字母x1,x2,…,xn表示是恰當(dāng)?shù)?。簡單起見,無論是樣本還是其觀測值,樣本一般均用x1,x2,…xn

表示,應(yīng)能從上下文中加以區(qū)別。5.1.2樣本樣品、樣本、樣本量:樣本具有兩重性一方例5.1.3

啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640

克。由于隨機性,事實上不可能使得所有的啤酒凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機抽取10瓶測定其凈含量,得到如下結(jié)果:641,635,640,637,642,638,645,643,639,640這是一個容量為10的樣本的觀測值,對應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。這樣的樣本稱為完全樣本。例5.1.3啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640這例5.1.4

考察某廠生產(chǎn)的某種電子元件的壽命,選了100只進(jìn)行壽命試驗,得到如下數(shù)據(jù):例5.1.4考察某廠生產(chǎn)的某種電子元件的表5.1.2

100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀測值沒有具體的數(shù)值,只有一個范圍,這樣的樣本稱為分組樣本。

壽命范圍

元件數(shù)

壽命范圍

元件數(shù)

壽命范圍

元件數(shù)(024]4(192216]6(384408]4(2448]8(216240]3(408432]4(4872]6(240264]3(432456]1(7296]5(264288]5(456480]2(96120]3(288312]5(480504]2(120144]4(312336]3(504528]3(144168]5(336360]5(528552]1(168192]4(360184]1>55213表5.1.2100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀獨立性:

樣本中每一樣品的取值不影響其它樣品的取值--

x1,x2,…,xn

相互獨立。要使得推斷可靠,對樣本就有要求,使樣本能很好地代表總體。通常有如下兩個要求:隨機性:總體中每一個個體都有同等機會被選入樣本--

xi

與總體X有相同的分布。樣本的要求:簡單隨機樣本獨立性:樣本中每一樣品的取值不影響其要使得推斷可靠設(shè)總體X具有分布函數(shù)F(x),

x1,x2,…,xn

為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為用簡單隨機抽樣方法得到的樣本稱為簡單隨機樣本,也簡稱樣本。于是,樣本

x1,x2,…,xn

可以看成是獨立同分布(iid)的隨機變量,其共同分布即為總體分布。設(shè)總體X具有分布函數(shù)F(x),

x1,x2,…,xn總體分為有限總體與無限總體實際中總體中的個體數(shù)大多是有限的。當(dāng)個體數(shù)充分大時,將有限總體看作無限總體是一種合理的抽象。對無限總體,隨機性與獨立性容易實現(xiàn),困難在于排除有意或無意的人為干擾。對有限總體,只要總體所含個體數(shù)很大,特別是與樣本量相比很大,則獨立性也可基本得到滿足??傮w分為有限總體與無限總體實際中總體中的個體數(shù)大多是有限的。例5.1.5

設(shè)有一批產(chǎn)品共N個,需要進(jìn)行抽樣檢驗以了解其不合格品率p?,F(xiàn)從中采取不放回抽樣抽出2個產(chǎn)品,這時,第二次抽到不合格品的概率依賴于第一次抽到的是否是不合格品,如果第一次抽到不合格品,則而若第一次抽到的是合格品,則第二次抽到不合格品的概率為P(x2=1|x1

=1)=(Np1)/(N1)P(x2=1|x1

=0)=(Np)(N1)例5.1.5設(shè)有一批產(chǎn)品共N個,需要進(jìn)行抽樣檢而若第一次顯然,如此得到的樣本不是簡單隨機樣本。但是,當(dāng)N很大時,我們可以看到上述兩種情形的概率都近似等于p。所以當(dāng)N很大,而n不大(一個經(jīng)驗法則是

nN0.1)時可以把該樣本近似地看成簡單隨機樣本。思考:

若總體的密度函數(shù)為p(x),則其樣本的(聯(lián)

合)密度函數(shù)是什么?顯然,如此得到的樣本不是簡單隨機樣本。但是,當(dāng)N很大時,我5.2.1經(jīng)驗分布函數(shù)§5.2

樣本數(shù)據(jù)的整理與顯示設(shè)

x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測值由小到大進(jìn)行排列,為x(1),x(2),…,x(n),則稱

x(1),x(2),…,x(n)為有序樣本,用有序樣本定義如下函數(shù)

5.2.1經(jīng)驗分布函數(shù)§5.2樣本數(shù)據(jù)的整理與顯示設(shè)則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0和Fn()=1由此可見,F(xiàn)n(x)是一個分布函數(shù),并稱Fn(x)為經(jīng)驗分布函數(shù)。則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn()=0例5.2.1

某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機抽取5聽飲料,稱得其凈重(單位:克)351347355344351x(1)=344,x(2)=347,x(3)=351,x(4)=354,x(5)=355這是一個容量為5的樣本,經(jīng)排序可得有序樣本:例5.2.1某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上x(其經(jīng)驗分布函數(shù)為由伯努里大數(shù)定律:只要n相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x)。

0,x<344

0.2,344x

<347Fn(x)=0.4,347x

<3510.8,344x

<3471,x355其經(jīng)驗分布函數(shù)為由伯努里大數(shù)定律:更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理5.2.1(格里紋科定理)設(shè)x1,x2,…,xn是取自總體分布函數(shù)為F(x)的樣本,Fn(x)是其經(jīng)驗分布函數(shù),當(dāng)n時,有PsupFn(x)F(x)0=1格里紋科定理表明:當(dāng)n相當(dāng)大時,經(jīng)驗分布函數(shù)是總體分布函數(shù)F(x)的一個良好的近似。經(jīng)典的統(tǒng)計學(xué)中一切統(tǒng)計推斷都以樣本為依據(jù),其理由就在于此。更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理5.2.1(160196164148170

175178166181162

161168166162172

156170157162154

5.2.2頻數(shù)--頻率分布表樣本數(shù)據(jù)的整理是統(tǒng)計研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表。例5.2.2

為研究某廠工人生產(chǎn)某種產(chǎn)品的能力,我們隨機調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品的數(shù)量,數(shù)據(jù)如下160196(1)對樣本進(jìn)行分組:作為一般性的原則,組數(shù)通常在5~20個,對容量較小的樣本;(2)

確定每組組距:近似公式為組距d=(最大觀測值

最小觀測值)/組數(shù);(3)

確定每組組限:各組區(qū)間端點為a0,a1=a0+d,

a2=a0+2d,…,ak=a0+kd,形成如下的分組區(qū)間(a0,a1],(a1,a2],…,(ak-1

,ak]對這20個數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:其中a0

略小于最小觀測值,ak

略大于最大觀測值.(1)對樣本進(jìn)行分組:作為一般性的原則,組數(shù)通(2(4)

統(tǒng)計樣本數(shù)據(jù)落入每個區(qū)間的個數(shù)——頻數(shù),

并列出其頻數(shù)頻率分布表。表5.2.1

例5.2.2的頻數(shù)頻率分布表

組序分組區(qū)間組中值頻數(shù)頻率累計頻率(%)1(147,157]152

4

0.20

20

2

(157,167]162

8

0.4060

3(167,177]172

5

0.25

85

4

(177,187]18220.10955(187,197]19210.05100合計201(4)統(tǒng)計樣本數(shù)據(jù)落入每個區(qū)間的個數(shù)——頻數(shù),

5.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無變化。5.2.3樣本數(shù)據(jù)的圖形顯示一、直方圖直方圖是頻數(shù)分布的把每一個數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面部分(個位)稱為葉,然后畫一條豎線,在豎線的左側(cè)寫上莖,右側(cè)寫上葉,就形成了莖葉圖。如:二、莖葉圖數(shù)值分開莖和葉11211|211和2把每一個數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面例5.2.3

某公司對應(yīng)聘人員進(jìn)行能力測試,測試成績總分為150分。下面是50位應(yīng)聘人員的測試成績(已經(jīng)過排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我們用這批數(shù)據(jù)給出一個莖葉圖,見下頁。例5.2.3某公司對應(yīng)聘人員進(jìn)行能力測試,測試6467圖5.2.3測試成績的莖葉圖47024669012235681123335667790024667882246899235683

圖5.2.3測試成績的莖葉圖47在要比較兩組樣本時,可畫出它們的背靠背的莖葉圖。甲車間62056乙車間87775554211667788877664421722455556668898766532801133344466778732109023585300107注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較大,數(shù)據(jù)很分散,橫跨二、三個數(shù)量級時,莖葉圖并不適用。在要比較兩組樣本時,甲車間6205.3.1統(tǒng)計量與抽樣分布§5.3統(tǒng)計量及其分布當(dāng)人們需要從樣本獲得對總體各種參數(shù)的認(rèn)識時,最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義5.3.1

設(shè)x1,x2,…,xn

為取自某總體的樣本,若樣本函數(shù)T=T(x1,x2,…,xn)中不含有任何未知參數(shù)。則稱T為統(tǒng)計量。統(tǒng)計量的分布稱為抽樣分布。5.3.1統(tǒng)計量與抽樣分布§5.3統(tǒng)計量及其分布當(dāng)人按照這一定義:若x1,x2,…,xn為樣本,則以及經(jīng)驗分布函數(shù)Fn(x)都是統(tǒng)計量。而當(dāng),2未知時,x1,x1/等均不是統(tǒng)計量。盡管統(tǒng)計量不依賴于未知參數(shù),但是它的分布一般是依賴于未知參數(shù)的。下面介紹一些常見的統(tǒng)計量及其抽樣分布。按照這一定義:若x1,x2,…,xn為樣本,盡管統(tǒng)5.3.2樣本均值及其抽樣分布

定義5.3.2

設(shè)x1,x2,…,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即思考:在分組樣本場合,樣本均值如何計算?二者結(jié)果相同嗎?

xx=

(x1+…+xn)/n5.3.2樣本均值及其抽樣分布定義5.3.2定理5.3.2

數(shù)據(jù)觀測值與均值的偏差平方和最小,即在形如(xic)2的函數(shù)中,樣本均值的基本性質(zhì):定理5.3.1

若把樣本中的數(shù)據(jù)與樣本均值之差稱為偏差,則樣本所有偏差之和為0,即

最小,其中c為任意給定常數(shù)。定理5.3.2數(shù)據(jù)觀測值與均值的偏差平方和樣本均值的基樣本均值的抽樣分布:定理5.3.3

設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論