




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第6章 統(tǒng)計量與抽樣分布【引例】 1899年,戈塞特(1876-1937)進入都柏林A.吉尼斯父子釀酒公司擔任釀酒化學技師,主要從事統(tǒng)計和實驗工作。他在工作中發(fā)現(xiàn),供釀酒的每批麥子質(zhì)量相差很大,而同一批麥子中能抽樣供試驗的麥子又很少,每批樣本在不同的溫度下做實驗,其結(jié)果相差很大。這就決定了不同批次和溫度的麥子樣本是不相同的,不能進行樣本合并。這樣一來,實際上取得的麥子樣本,不可能是大樣本,只能是小樣本。他在工作中還發(fā)現(xiàn),利用小樣本得出的結(jié)果,和正態(tài)分布有較大的差異,特別是兩端尾部的概率,比正態(tài)分布明顯高。因此1907年戈塞特決心把小樣本和大樣本之間的差別搞清楚。為此,他試圖把一個總體中的所有小
2、樣本的平均數(shù)的分布刻畫出來。做法是:在一個大容器里放了一批紙牌,把它們弄亂,隨機地抽若干張(小樣本),對這一樣本記錄觀察值,然后再把紙牌弄亂,抽出幾張,對相應的樣本再記錄觀察值。大量地記錄這種隨機抽樣的小樣本觀察值,就可以獲得小樣本觀察值的分布。1908年,戈塞特以“學生(Student)”為筆名在生物計量學雜志發(fā)表了論文平均數(shù)的規(guī)律誤差。這篇論文開創(chuàng)了小樣本統(tǒng)計理論的先河,為研究樣本分布理論奠定了重要基礎。被統(tǒng)計學家譽為統(tǒng)計推斷理論發(fā)展史上的里程碑。那么總體和樣本是如何聯(lián)系的?大樣本和小樣本下究竟有什么差異?什么是t分布?它和正態(tài)分布有什么不同?它有什么作用?統(tǒng)計推斷中常用的分布還有哪些?這
3、些問題都將在本章中找到答案。統(tǒng)計研究的目的是為了探索現(xiàn)象內(nèi)在的數(shù)量規(guī)律性。為了解總體的數(shù)量特征,可以直接對總體進行全面調(diào)查,得到總體數(shù)據(jù),進而歸納出數(shù)量特征;也可以對總體進行抽樣,利用樣本對總體進行推斷,后一種方法稱為統(tǒng)計推斷。抽樣分布是進行統(tǒng)計推斷的理論基礎。本章將主要介紹統(tǒng)計推斷所涉及的總體、樣本、統(tǒng)計量及抽樣分布等概念,以及在統(tǒng)計推斷中最常用的分布,分布和分布和抽樣分布定理。§6.1 總體與樣本的統(tǒng)計分布 總體與樣本是統(tǒng)計推斷中的兩個基本概念。統(tǒng)計推斷的目的是從樣本信息出發(fā),運用概率論的方法,推斷總體的特征;因此如何將統(tǒng)計學的總體、樣本和概率論的基礎隨機變量與分布聯(lián)系起來,就成
4、為統(tǒng)計推斷首先要解決的問題。§6.1.1 統(tǒng)計推斷中的總體及總體分布第一章中已經(jīng)明確統(tǒng)計所研究的是由同類事物構(gòu)成的總體的數(shù)量特征,總體是根據(jù)一定的目的確定的所要研究的事物的全體,它是由客觀存在的、具有某種共同性質(zhì)的眾多個體構(gòu)成的??傮w中的每個單位稱為個體。比如前面引例中,每一批麥子的全體就是一個總體,而其中每單位的麥子就是個體。這是統(tǒng)計學中關于總體的概念,我們可以稱其為實物總體。在前面章節(jié)的學習中,我們已經(jīng)發(fā)現(xiàn):我們真正關心和收集研究的并不是這些總體中的個體本身,而是這些個體的某些特征及其數(shù)值,在前面我們將這些特征用變量來描述,對應的數(shù)值稱為變量值。關心這批麥子,主要關心的是其釀酒的
5、效果出酒量。此時出酒量成為需要研究的變量,每單位麥子出酒量的具體數(shù)值成為變量值。在研究這批麥子時,并不需要將全部這批麥子都收集過來,只需要記錄這批麥子每單位出酒量的數(shù)值,再對這些數(shù)值進行研究就可以了。此時的總體實質(zhì)是這批麥子的出酒量對應的若干個數(shù)值,總體已經(jīng)從實物抽象到了數(shù)值,可以稱之為數(shù)值總體。這是對總體概念的第一次抽象。如果實物總體中個體很多,則對應的數(shù)值總體其規(guī)模將非常大,而且往往其中重復的值會很多,即使沒有重復值(變量取值連續(xù)時),在不同值周圍的“密集程度”也會不相同。逐一研究每個變量值將會非常繁瑣,當總體規(guī)模趨于無窮時,研究每個變量值更是變得不可能。若統(tǒng)計出變量的所有不同取值(或取值
6、區(qū)間)及其出現(xiàn)的頻率,編制變量的分布數(shù)列,則可以對變量的全部取值情況一覽無遺。研究一個變量的全部數(shù)值,就轉(zhuǎn)化為研究該變量的分布了。用變量及其分布來描述一個總體,可以稱之為分布總體。例如研究某批麥子的出酒量X,這是個連續(xù)變量,可以統(tǒng)計出X在不同區(qū)間取值的頻率,得到X的分布。對全部單位出酒量的數(shù)值的研究,就可轉(zhuǎn)化研究出酒量X的分布了。這是對總體概念的第二次抽象。對于隨機變量X,其取值是隨機的,關注該變量的全部取值,也就是要關注其各個可能取值(或取值區(qū)間)及其相應概率,即關注該隨機變量的概率分布。在統(tǒng)計推斷中利用隨機變量X及其概率分布來描述一個總體,應用起來非常有優(yōu)勢,尤其是當總體容量趨于無窮時,另
7、外一個好處是可以利用概率論的理論和方法來研究總體。例如麥子出酒量的總體分布如果是正態(tài)分布,就可以利用正態(tài)分布的密度函數(shù)計算出酒量在各區(qū)間的概率。經(jīng)過上述討論,完成了從“實物總體數(shù)值總體分布總體”的兩次抽象,也完成了我們將統(tǒng)計學中“總體”與概率論中“分布”的銜接,這是統(tǒng)計推斷對總體概念的延伸,也是概率論知識應用于統(tǒng)計推斷的基礎。以后在本章及以后統(tǒng)計推斷的相關章節(jié)中,如無特別說明,總體均表示分布總體,給定一個總體,只需要給出總體的分布即可。§6.1.2 統(tǒng)計推斷中的樣本及樣本性質(zhì) 統(tǒng)計推斷的重要任務是通過對總體中隨機抽取的部分個體的觀測結(jié)果來推斷總體的特征。按照隨機原則,通過觀測或試驗的
8、方法所獲得的總體中一部分個體的取值稱為樣本,每個個體的取值稱為樣本點或樣品。抽出樣本之前,由于總體中各個體有同等被抽中的可能,抽中那個個體不能確定,因此樣本是一組隨機變量,每個樣本點都可以取總體中任意一個值;但是當樣本被抽取并觀測記錄后,若干個體被抽出,各樣本點的取值確定,樣本成為是一組確定的數(shù)值。統(tǒng)計推斷中為了區(qū)分此二重性,將抽取前具有隨機性的樣本稱為樣本,用大寫字母表示;將抽取的一組確定的數(shù)值稱為樣本觀測值,用小寫字母表示。如要推斷某種燈泡使用壽命總體X的特征,擬隨機抽取n只燈泡進行測試,其使用壽命(X1, X2,Xn)稱為燈泡使用壽命總體X的樣本,一次具體抽樣測試得到n個燈泡使用壽命的數(shù)
9、值(x1, x2,xn),稱為總體X的樣本觀察值。統(tǒng)計推斷中,把具有以下兩個重要性質(zhì)的樣本稱為簡單隨機樣本:1. 樣本點與總體同分布這一點很容易從數(shù)值總體的角度加以理解:由于采取隨機原則抽取樣本點,每個個體被抽中的可能性相同。假設總體容量為N,則每個個體被抽中的概率為1/N,假設對離散型總體取值等于x,或?qū)B續(xù)型總體取值在區(qū)間(x, x+x)中的個體總數(shù)為M,那么抽出樣本點取值為x或在區(qū)間(x, x+x)中的概率就是M/N,恰好等于總體X取值為x或取值在區(qū)間(x, x+x)中的頻率(或概率),從而可以看出樣本點與總體分布相同。2. 樣本點之間相互獨立從總體中抽取樣本的方法有重復抽樣和不重復抽樣
10、兩種。采用重復抽樣時,每次隨機抽取一個樣本點并記錄其特征以后,又將它放回總體中參加下一次抽取,每次抽取樣本點都是在總體的N個單位中進行的,前一次抽取的結(jié)果不會影響后一次抽取的結(jié)果,因此樣本點之間相互獨立。采用不重復抽樣時,每次隨機抽出一個樣本點后不再將它放回總體中,下一次只能在其余個體中抽取,前面抽取的結(jié)果就會影響后面的抽取,因此樣本點之間不是相互獨立的。但通常實際工作中總體容量非常大,采用不重復抽樣時也可以近似認為樣本點之間相互獨立。對于總體容量無限的情形,無論采取重復抽樣還是不重復抽樣,都可以認為樣本點是相互獨立的。在本書后面的敘述中,常常將以上兩個性質(zhì)一同簡寫為 “樣本點獨立同分布(i.
11、i.d)”。沒有特別說明的情況下,我們討論的樣本均指的是簡單隨機樣本。§6.2 統(tǒng)計量§6.2.1 統(tǒng)計量的概念在統(tǒng)計推斷中,總體信息是未知的,但從總體中抽取的樣本中含有總體的信息,統(tǒng)計推斷就是利用樣本的信息來推測總體的信息。然而樣本的信息是隱蔽的、分散的,必須經(jīng)過必要的加工對樣本信息進行集中和提煉才能用來推斷總體信息,構(gòu)造樣本統(tǒng)計量是集中和提煉樣本信息來推斷總體信息的有效手段之一。設是來自總體的一個樣本,如果是樣本的函數(shù), 中不含任何未知參數(shù),則稱為一個統(tǒng)計量。如果為樣本的觀測值,則為統(tǒng)計量的觀測值。統(tǒng)計量的觀測值是確定的,沒有隨機性。統(tǒng)計量有以下兩個特征:統(tǒng)計量是樣本的
12、函數(shù),統(tǒng)計量通常為隨機變量;統(tǒng)計量不能含有未知的參數(shù)。例如,當從正態(tài)總體中抽出樣本時,考查隨機變量,當總體均值為已知時,該變量是統(tǒng)計量;當總體均值未知時,該變量就不是統(tǒng)計量。統(tǒng)計量既然是隨機變量,那么它應該有概率分布,統(tǒng)計量的分布稱為抽樣分布。抽樣分布和統(tǒng)計推斷有著密切的聯(lián)系。統(tǒng)計量明確以后,必須要知道其抽樣分布才能在統(tǒng)計推斷中使用,因為只有知道了統(tǒng)計量的分布,才能利用概率論對總體的特征進行推斷,并得到相應的推斷置信度。所以在統(tǒng)計推斷中,一項重要的工作就是尋找統(tǒng)計量和導出統(tǒng)計量的抽樣分布或漸近抽樣分布。【例6-1】總體X服從兩點分布,概率分布律如下:,從總體中抽取容量為n的樣本,構(gòu)造統(tǒng)計量,求
13、此統(tǒng)計量的分布。解:由于樣本是獨立的,服從兩點分布,統(tǒng)計量T為隨機變量,其取值是0到n之間的所有整數(shù),其分布恰好是二項分布:,從上面的例子中,可以看出抽樣分布未必與總體的分布一致。【例6-2】總體分布為,抽取容量為n的樣本,構(gòu)造如下三個統(tǒng)計量:,和。求此三個統(tǒng)計量的抽樣分布。解:由于樣本是獨立的,服從均值和方差都為1的正態(tài)分布,三個統(tǒng)計量都是樣本的線性函數(shù),由正態(tài)分布的性質(zhì),三個統(tǒng)計量仍服從正態(tài)分布,下面分別求解其均值和方差:,由上面計算可以得出,統(tǒng)計量服從均值和方差都為1的正態(tài)分布,這和總體的分布相同;統(tǒng)計量服從均值和方差都為2的正態(tài)分布,而統(tǒng)計量服從均值為1,方差為1/n的正態(tài)分布。
14、67;6.2.2 常用統(tǒng)計量 常用統(tǒng)計量還包括樣本相關系數(shù),我們將在第9章介紹。1.樣本均值和樣本方差設是總體中抽出的簡單隨機樣本,則樣本均值為,樣本方差為。2.樣本矩稱為樣本的原點矩,稱為樣本的中心矩。特別當時,稱為樣本的未修正方差,常記,顯然有。3.順序統(tǒng)計量設是總體中抽出的簡單隨機樣本,把樣本點排序為,則稱為順序統(tǒng)計量,其中稱為第個順序統(tǒng)計量?;陧樞蚪y(tǒng)計量計算的常用統(tǒng)計量有:最大順序統(tǒng)計量和最小順序統(tǒng)計量; 樣本極差 ;樣本中位數(shù)樣本的p分位數(shù) 其中,為不超過np的最大整數(shù);樣本的切尾均值 ,樣本的切尾均值是分別去掉k個最小的和k個最大的觀測值后得到的均值。§6.3 抽樣分布
15、及抽樣分布定理為了在正態(tài)分布假定下,得到樣本統(tǒng)計量的精確分布,本節(jié)需要討論幾個十分重要的隨機變量函數(shù)的分布,它們是分布、分布和分布。在此基礎上討論抽樣分布的重要定理。§6.3.1 分布分布是海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)分別于1875年和1890年提出的,是統(tǒng)計推斷中的重要分布。它主要應用于對總體方差的估計或檢驗以及對總體概率密度函數(shù)的檢驗等。1. 分布的定義及其密度函數(shù)定義6-1 若隨機變量獨立且同標準正態(tài)分布,則它們的平方和 (6.1)服從自由度為的分布,記為。根據(jù)服從卡方分布隨機變量的定義,我們可以根據(jù)求隨機變量函數(shù)的概率分布的方法求出分布的概率密
16、度函數(shù) 推導過程略,有興趣的讀者可以參考陳希孺,數(shù)理統(tǒng)計引論,高教出版社。如果隨機變量服從自由度為的分布,其概率密度為: (6.2)其中為gamma函數(shù)。2. 分布的性質(zhì)特征(1)分布的數(shù)學期望與方差若X服從自由度為n的分布,其數(shù)學期望和方差分別為, (6.3)可見隨著自由度的增大,分布的期望和方差隨之增大,自由度決定了分布的形狀。從密度函數(shù)定義可以看出,分布是一種不對稱偏峰分布,其取值區(qū)域為;隨著自由度的逐漸增大,分布曲線的最高點逐漸下降并向右移動,分布曲線趨于對稱,如圖6-1所示。n=20n=4圖6-1的概率密度曲線自由度為的分布上側(cè)分位數(shù)記為,滿足關于分布上側(cè)分位數(shù)可以通過書后附表求得,
17、附表給出了自由度的分布上側(cè)分位數(shù)。也可通過EXCEL的CHINV函數(shù)求得。例如,。(2)分布的自由度分布中稱為自由度。對于變量,如果存在一組不全為零的常數(shù),使得成立,則稱變量之間存在一個線性約束條件。如果變量中存在個獨立的線性約束條件,則中獨立變量的個數(shù)為,稱它為自由度。自由度也可粗略解釋為可以自由選擇數(shù)值的變量個數(shù)。例如,由個獨立的隨機變量構(gòu)成,由于它們之間沒有線性約束條件(即),所以它的自由度為。的自由度為,這是因為計算時要用,滿足限制條件,即相對于的個離差變量,只有個可以任意確定,第個失去了“自由”,所以能其自由度為。(3)分布的可加性若、相互獨立,且分別服從自由度為、的分布,則服從自由
18、度為+的分布,即【例6-3】設是獨立同服從分布的隨機變量,求a,b和c使服從分布。因為獨立同分布,所以,則,從而,則,從而,則,從而。由于分布的可加性,則,自由度為3。且,和。§6.3.2 t分布t分布又稱為“學生分布”,是統(tǒng)計推斷中的重要分布。它在總體均值的估計與檢驗、相關與回歸分析等方面有著廣泛的應用。1. t分布的定義及其密度函數(shù)定義6-2 若隨機變量,隨機變量,且隨機變量與相互獨立,則隨機變量 (6.4)服從自由度為的分布,記為。分布的概率密度函數(shù)比較復雜。如果隨機變量服從自由度為的分布,則其概率密度函數(shù)為 (6.5)觀察分布的概率密度函數(shù),可以發(fā)現(xiàn)它是偶函數(shù),所以分布是關于
19、原點對稱的,這一點和分布是不同的,卻和標準正態(tài)分布相似。圖6-2的三條曲線分別是標準正態(tài)曲線以及自由度為19和5的t分布曲線。n=5的分布n=19的分布標準正態(tài)分布圖6-2密度函數(shù)曲線通過比較可以發(fā)現(xiàn)分布和標準正態(tài)分布類似,都是對稱分布,均在上取值。但是分布與標準正態(tài)分布也有區(qū)別, 分布尾部厚,即服從分布的隨機變量取到尾部值的概率比標準正態(tài)分布略大。而對于接近原點的坐標點,分布密度函數(shù)的值比標準正態(tài)分布密度函數(shù)的值小。因而分布曲線尾部厚于標準正態(tài)分布,而峰低于標準正態(tài)分布。滿足的稱為自由度為的分布上側(cè)分位數(shù)。關于分布上側(cè)分位數(shù)可以通過書后附表求得,附表給出了自由度的分布上側(cè)分位數(shù)。例如,由于分
20、布是對稱分布,所以。2. t分布的性質(zhì)特征(1) 分布的數(shù)學期望與方差分布的數(shù)學期望與方差分別是, (6.6) 由于分布是對稱分布,其數(shù)學期望當然為0。需要注意的是:只有當自由度大于1,其數(shù)學期望才為0,自由度為1時,數(shù)學期望不存在;同時注意到分布的方差與其自由度有關,自由度小于等于2時,方差不存在,當自由度,方差極限為1。(2) 分布的自由度分布的自由度是由生成分布的分母即卡方分布隨機變量的自由度而來。 分布的形狀和自由度有較大關系,自由度越小,分布曲線與標準正態(tài)分布曲線的區(qū)別越明顯,分布“比較平”,而自由度增大,分布曲線與標準正態(tài)分布曲線的差異逐漸縮小。這一點也可以由分布的方差來說明,當自
21、由度較小時,分布的方差較大,此時其分布就“比較平”;而當自由度較大時,方差較小,而且越來越接近1,此時分布與標準正態(tài)分布逐漸接近。【例6-4】設是獨立同服從分布的隨機變量,如果隨機變量服從自由度為5的t分布,求c等于多少。因為獨立同服從分布,所以,則。又因為而與相互獨立,則由t分布的構(gòu)造,有 所以。§6.3.3 F分布F分布是統(tǒng)計學家費雪(R.A.Fisher)于1924年提出的,F(xiàn)分布在假設檢驗、總體方差的統(tǒng)計推斷、方差分析、回歸分析和多元統(tǒng)計分析等方面有著廣泛的應用。1 F分布的定義及其密度函數(shù)定義6-3 若隨機變量、分別服從自由度為、的卡方分布,且、相互獨立,則隨機變量 (6.
22、7)服從第一自由度為,第二自由度為的分布,記為。從F分布的定義可以看出,F(xiàn)分布是兩個獨立的卡方分布隨機變量與其各自自由度商的比值,因而F分布具有兩個自由度,作為分子的卡方分布隨機變量的自由度稱為第一自由度,作為分母的卡方分布隨機變量的自由度稱為第二自由度。F分布的密度函數(shù)比較復雜,若隨機變量F服從第一自由度為,第二自由度為的F分布,那么其密度函數(shù)為:(6.8)如圖6-3所示,F(xiàn)分布曲線有些類似于卡方分布,也是一種非對稱的正偏分布。其值域為,但它有兩個自由度和。F分布的分布曲線隨著兩個自由度的不同組合而不同。兩個自由度的不同組合形成F分布曲線的不同形態(tài),這在F分布的圖形中可清楚看到。隨著第一自由
23、度的增大,分布曲線逐漸趨向?qū)ΨQ,隨著兩個自由度的增大,分布曲線逐漸趨于正態(tài)分布。 圖6-3F分布密度函數(shù)曲線滿足的稱為自由度為的F分布上側(cè)分位數(shù)。由于F分布有兩個自由度,所以附表僅僅給出了某些較小值對應的值。例如。對于任意的和自由度,其分位數(shù)都可通過EXCEL的FINV函數(shù)求得。2. F分布的性質(zhì)特征(1) F分布的數(shù)學期望和方差F分布的數(shù)學期望和方差分別為(6.9) 從F分布的均值和方差表達式可以看出,隨著第二自由度增大,F(xiàn)分布的均值趨于1,而方差則取決于兩個自由度。(2)F分布的自由度F分布的自由度是由構(gòu)造F分布的分子和分母的兩個分布的自由度而來,由于其分子和分母的分布可以交換,所以F分布
24、的兩個自由度有一個重要性質(zhì),就是它們是可以互相轉(zhuǎn)化的。若,則1/F 。這個重要性質(zhì)對于查F分布求大的分位數(shù)提供了方便: (6.10)【例6-5】給定顯著水平,查的上側(cè)分位點。因為一般F分布表并未給出的上側(cè)分位點。則要根據(jù)F分布的性質(zhì),首先查,根據(jù)公式(6.9)可求得: 也可以通過EXCEL的統(tǒng)計函數(shù)功能中的函數(shù)FINV直接計算該分位數(shù) 分布和分布的百分位點,也可分別通過EXCEL的統(tǒng)計函數(shù)CHINV和TINV得到。調(diào)出EXCEL的函數(shù),選中函數(shù)FINV,根據(jù)對話框輸入相關信息即可。FINV的對話框如圖6-4所示。圖6-4 EXCEL的函數(shù)FINV的對話框§6.3.4 抽樣分布定理下面
25、討論總體為正態(tài)分布時樣本統(tǒng)計量的抽樣分布。這是因為在實際應用中許多總體分布或是正態(tài)分布,或是近似可以認為是正態(tài)的。即使總體分布非正態(tài),由中心極限定理可知,大樣本下,樣本均值的分布也可以近似認為是正態(tài)分布。定理6-1若是從總體抽取的一個簡單隨機樣本,則有:1. (6.11) (6.12)2. (6.13)3.樣本均值與樣本方差相互獨立定理證明略,讀者可以參看茆詩松等著概率論與數(shù)理統(tǒng)計。 其中,。【例6-6】在正態(tài)總體中抽出一個容量為25的樣本, 為樣本方差,這里和均為未知。求(1)當時,求;(2);(3); 解:(1)因為,所以當,時有: =2×0.985-1=0.97(2)因為樣本來
26、自于總體,樣本容量,所以則 (查分布表得出)(3)因為,所以由式(6.3)可知:。而 定理6-2 若總體服從,從中抽取容量為的樣本,則 (6.14)證明:樣本相互獨立,且都服從,由公式(6.12)和(6.13)有:和 而且隨機變量與相互獨立。結(jié)合分布的定義有: 【例6-7】設總體服從正態(tài)分布,是來自總體的一個樣本,記和,試求的分布。由于來自總體的簡單隨機樣本,則分別有和,且和相互獨立,則,且。因為,而且根據(jù)定理6-1的結(jié)論有和相互獨立, 所以 。定理6-3 若總體服從,總體服從,且兩個總體相互獨立。從兩總體中分別抽取容量為和的樣本和。則(1) (6.15)(2)當,則 (6.16)其中。證明:
27、(1)因為,并且兩組樣本是相互獨立的。所以,并且和相互獨立,從而則。(2)因為由(6.12)式可以得到:,且和相互獨立,從而并且(1)中的和上述相互獨立。根據(jù)t分布定義并化簡可得所以,上述變量服從自由度為的分布。定理6-4 若總體,另一總體,從第一總體中抽取容量為的樣本,從第二個總體中抽取容量為的樣本,兩個總體是獨立的,則變量 (6.17)證明:因為樣本相互獨立且和總體具有相同的分布,所以由前面定理6-13,兩個總體相互獨立,所以隨機變量和相互獨立,從而所以該隨機變量服從第一自由度為,第二自由度為的F分布。本章小結(jié)1.總體可抽象為所感興趣的變量及其取值的分布。通過觀測或試驗的方法獲得的總體中一
28、部分個體稱為樣本,樣本中每個個體稱為樣本點。2.統(tǒng)計量是樣本的函數(shù)且不含任何未知參數(shù)。在統(tǒng)計推斷問題中,經(jīng)常需要利用取自總體的樣本構(gòu)造出合適的統(tǒng)計量,并使其服從或漸進地服從已知的分布。常用統(tǒng)計量有樣本均值和方差等。統(tǒng)計量的分布為抽樣分布。3.在正態(tài)分布假定下三種常用分布分布、t分布和F分布。本章介紹了三種分布的定義、構(gòu)造原理和重要性質(zhì),以及相應分位數(shù)的含義和計算方法。4. 本章介紹了抽樣分布理論中的幾個重要定理。它們是對正態(tài)總體的均值、方差等參數(shù)進行統(tǒng)計推斷的重要理論基礎。基本知識梳理基本知識點含義或公式總體指所研究事物的全體(實物總體),或指所研究事物在某個特征上的取值的全體(數(shù)值總體)。樣
29、本按照隨機原則從總體中抽出的n個個體。簡單隨機樣本的性質(zhì):(1)樣本點和總體具有相同的分布(2)樣本點之間是獨立的統(tǒng)計量是樣本的函數(shù),如果中不含任何未知參數(shù),則稱為一個統(tǒng)計量。常用統(tǒng)計量有:樣本均值和樣本方差、樣本矩統(tǒng)計量、樣本相關函數(shù)、樣本的順序統(tǒng)計量。抽樣分布統(tǒng)計量的分布稱為抽樣分布,常用的抽樣分布有分布、t分布、F分布。分布相互獨立的且服從標準正態(tài)分布,則它們的平方和服從自由度為n的分布,即。分布的性質(zhì)自由度為n的分布變量,均值和方差分別為n和2n;隨自由度的增加,分布趨近正態(tài)分布;獨立分布變量具有可加性。自由度自由度也可粗略解釋為可以自由選擇數(shù)值的變量個數(shù),即變量的總個數(shù)減去線性約束的
30、個數(shù)。t分布相互獨立;,;即服從自由度為n的t分布,即。t分布的性質(zhì)均值,方差;t分布的自由度和分母中Y的自由度相同;分布曲線比標準正態(tài)曲線低峰厚尾,隨自由度的增加,分布趨近標準正態(tài)分布。F分布相互獨立;, ;即服從第一自由度為,第二自由度為的F分布,即。F分布的性質(zhì)F分布的均值隨著第二自由度增大而趨于1,方差則取決于兩個自由度;若,則1/F 。抽樣分布重要定理在正態(tài)總體的假定條件下,有,;練習題一、單項選擇題(在4個備選答案中選擇1個正確答案)1. 某產(chǎn)品出廠檢驗規(guī)定:次品率p不超過4%才能出廠,現(xiàn)從一批產(chǎn)品中抽取12件進行檢查,假設取值為1代表次品,取值為0代表合格品,則數(shù)值總體是( )A
31、.0 B.1 C.0和1 D.許多取值為0或1的數(shù)的全體2. 某廠生產(chǎn)的螺絲釘,其標準長度為6.8,而其真實的長度,從上述敘述中,假設總體均值就是標準長度,從生產(chǎn)的螺絲釘中抽取了1個螺絲釘作為樣本,其長度為6.7mm,則該樣本的分布是( )A. B. C. D.3. 樣本和樣本觀測值的關系是( )A.兩者都是隨機變量,分布相同 B.兩者都是隨機變量,但分布不同C.樣本觀測值是樣本的一次實現(xiàn) D.樣本只能取樣本觀測值4. 設總體服從參數(shù)的Poisson分布,從總體中抽取n個樣本,樣本的聯(lián)合分布為( )A. B.C. D.以上都不對5. 以下不是統(tǒng)計量是( )A.樣本均值 B.樣本方差 C.樣本極
32、差 D.樣本量6. 設總體XN(0,1),從總體中抽取n個樣本,下列統(tǒng)計量中不服從分布的是( )A. B. C. D.7. 設總體X服從自由度為3的分布,從總體中抽取n個樣本,下列統(tǒng)計量服從自由度為9的卡方分布的是( )A. B. C. D.8. 比較標準正態(tài)分布和自由度為5的t分布的0.05分位數(shù)和,可以得到( )A.< B.> C.= D.不能比較9. 假設獨立總體X和Y都服從標準正態(tài)分布,從兩個總體中分別抽取10個和15個樣本,則下列說法中,正確的是( )A.服從自由度為10的分布 B.服從自由度為14的分布 C.服從自由度為15和10的F分布 D.服從自由度為15和10的F
33、分布10. 根據(jù)抽樣分布重要定理,以下結(jié)論錯誤的是( )A.服從正態(tài)分布 B.服從自由度為(n-1)的分布C. D. 二、多項選擇題(在5個備選答案中選擇2-5個正確答案)1.設表示從總體X中抽出的樣本,表示樣本觀測值,總體的均值和標準差都是未知的,以下是統(tǒng)計量的有( )A. B. C. D. E.2. 設總體X是標準正態(tài)分布, 表示從總體中抽出的樣本,以下統(tǒng)計量中,服從自由度為1的分布的有( )A. B. C. D.E.3. 假設總體是標準正態(tài)分布,用表示從總體中抽出的樣本,以下統(tǒng)計量中,服從自由度為1的t分布的有( )A. B. C. D. E.4. 假設獨立總體.Y是標準正態(tài)分布,用,表
34、示從總體中抽出的兩個樣本,以下統(tǒng)計量中,服從F分布的有( )A. B. C. D. E. 5.正態(tài)總體的抽樣分布定理和統(tǒng)計量,以下說法正確的是( )A. 樣本均值的分布是正態(tài)分布 B. 當總體方差未知時,不能用正態(tài)分布對總體均值進行推斷C. 當兩個獨立總體方差已知時,應該用t分布對均值的差異進行推斷D. 當兩個獨立總體方差未知且相等時,可以用t分布對均值差異進行推斷E. 可以用F分布統(tǒng)計量對兩個獨立總體的方差是否相等進行推斷三、判斷分析題1. 樣本點是相互獨立的,并且和總體具有同一分布。2. 因為具有可加性,所以t分布也具有可加性。3. t分布隨機變量的平方服從F分布。四、簡答題1. 什么叫抽樣分布?為什么要研究抽樣分布?2. 和的百分位點有什么關系?3.統(tǒng)計量的定義是什么?樣本點是不是統(tǒng)計量?4.為什么說標準正態(tài)分布是抽樣分布理論的重要基礎?五、計算題1.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 先進電池維護技術租賃協(xié)議為新能源汽車保駕護航
- 未成年人教育信息共享與隱私保護協(xié)議
- 海外市場調(diào)研與分析咨詢合同
- 網(wǎng)紅奶茶店全國區(qū)域獨家代理加盟合作協(xié)議
- 股權(quán)投資股權(quán)信息披露與投資咨詢協(xié)議
- 環(huán)境保護控制補充協(xié)議
- 校招時政常識題庫及答案
- 直播平臺虛擬偶像形象版權(quán)授權(quán)合同
- 地鐵盾構(gòu)區(qū)間隧道施工環(huán)境保護與風險防范合同
- 校招面試題目及答案
- 2024藥店質(zhì)量負責人聘用合同范本
- CJ/T 156-2001 溝槽式管接頭
- 黑龍江省齊齊哈爾市五縣聯(lián)考2023-2024學年七年級下學期期末數(shù)學試題
- CJJT81-2013 城鎮(zhèn)供熱直埋熱水管道技術規(guī)程
- 留置導尿法操作評分標準
- 《筵席設計與制作》考試復習題庫(含答案)
- 圖集04S206自動噴水與水噴霧滅火設施安裝
- JTS153-3-2007 海港工程鋼結(jié)構(gòu)防腐蝕技術規(guī)范
- (高清版)DZT 0319-2018 冶金行業(yè)綠色礦山建設規(guī)范
- 三年級下冊語文課件-綜合性學習《中華傳統(tǒng)節(jié)日》-14人教部編版
- 改革開放史智慧樹知到期末考試答案2024年
評論
0/150
提交評論