版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
新時(shí)代高職數(shù)學(xué)系列教材高等數(shù)學(xué)(工科類)知識(shí)目標(biāo)理解總體與個(gè)體、樣本、簡(jiǎn)單隨機(jī)樣本和統(tǒng)計(jì)量等基本概念;了解分布、分布和分布的定義;掌握分位數(shù)的概念并會(huì)查相應(yīng)的分布表.了解點(diǎn)估計(jì)和區(qū)間估計(jì)的概念;掌握矩法及最大似然法的原理及估計(jì)方法;了解估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn);掌握單個(gè)正態(tài)總體的均值與方差的雙側(cè)及單側(cè)置信區(qū)間的計(jì)算.了解假設(shè)檢驗(yàn)的基本思想和基本原理;了解假設(shè)檢驗(yàn)的兩類錯(cuò)誤;掌握單個(gè)正態(tài)總體的均值和方差的假設(shè)檢驗(yàn)基本步驟.第十章數(shù)理統(tǒng)計(jì)基礎(chǔ)第一節(jié)數(shù)理統(tǒng)計(jì)的基本概念情景與問題引例1
眾所周知,《紅樓夢(mèng)》一書共120回,普遍認(rèn)為前80回為曹雪芹所著,后40回為高鄂所續(xù).長(zhǎng)期以來紅學(xué)界對(duì)這個(gè)問題一直有爭(zhēng)議.一般的,每個(gè)人使用某些詞的習(xí)慣是特有的,比如同一情節(jié)大家描述的都差不多,但由于個(gè)人寫作特點(diǎn)和習(xí)慣的不同,所用的虛詞不會(huì)一樣.有人分別統(tǒng)計(jì)出《紅樓夢(mèng)》前80回與后40回中與情節(jié)無關(guān)的虛詞出現(xiàn)次數(shù),并與曹雪芹的其他著作進(jìn)行對(duì)比.運(yùn)用統(tǒng)計(jì)學(xué)方法進(jìn)行分析后證實(shí):前80回確實(shí)為曹雪芹所著,而后40回并非是高鶚一個(gè)人所寫,而是曹雪芹親友將其草稿整理而成,寶黛故事為一人所寫,賈府衰敗情景當(dāng)為另一人所寫等等.這些研究成果使紅學(xué)界大為贊嘆.引例2
全球最大的零售商沃爾瑪通過統(tǒng)計(jì)分析顧客購(gòu)物的數(shù)據(jù)后發(fā)現(xiàn),很多周末購(gòu)買尿布的顧客同時(shí)也購(gòu)買啤酒.人們?yōu)槭裁磿?huì)同時(shí)購(gòu)買這兩樣看上去毫不沾邊的生活物品呢?通過深入觀察和研究發(fā)現(xiàn),美國(guó)家庭買尿布的多是爸爸,而年輕的爸爸們下班后在超市買尿布的同時(shí),往往會(huì)順便給自己捎帶點(diǎn)啤酒,好在周末看棒球賽時(shí)過把酒癮.后來沃爾瑪就把尿布和啤酒擺放得很近,從而雙雙促進(jìn)了尿布和啤酒的銷量.引例3二戰(zhàn)前期,英軍從敦刻爾克撤回到本島期間,德軍每天對(duì)英國(guó)進(jìn)行狂轟亂炸.英國(guó)空軍在抵御中,雙方空戰(zhàn)不斷.為了能夠提高飛機(jī)的防護(hù)能力,英國(guó)的飛機(jī)設(shè)計(jì)師們決定給飛機(jī)增加護(hù)甲,但是盔甲會(huì)增加飛機(jī)的重量,在飛機(jī)的什么部位能最有效的保護(hù)好飛機(jī)呢?統(tǒng)計(jì)學(xué)家將每架中彈之后仍然安全返航的飛機(jī)的中彈部位描繪在一張圖上,然后將所有中彈飛機(jī)的圖都疊放在一起,這樣就形成了濃密不同的彈孔分布.繪圖完成后,統(tǒng)計(jì)學(xué)家很肯定地指出,沒有彈孔的地方就是應(yīng)該增加護(hù)甲的地方,因?yàn)檫@個(gè)部位中彈的飛機(jī)都沒能幸免于難.上述引例均聚焦于從實(shí)際數(shù)據(jù)和資料分析中,找尋研究對(duì)象的規(guī)律性特征,由此便衍生出了一門新學(xué)科——數(shù)理統(tǒng)計(jì).數(shù)理統(tǒng)計(jì)不僅僅是科學(xué)研究的利器,也是一門應(yīng)用性很強(qiáng)的學(xué)科,它與人們?nèi)粘5纳a(chǎn)和生活接下來,我們從幾個(gè)重要概念的介紹來開始數(shù)理統(tǒng)計(jì)學(xué)習(xí)之旅.密切相關(guān).10.1.1總體與樣本當(dāng)我們把每袋面粉的重量看作是隨機(jī)變量時(shí),
在數(shù)理統(tǒng)計(jì)中,我們把研究對(duì)象的全體稱為總體,而把組成總體的每一個(gè)對(duì)象稱為個(gè)體.例如:整個(gè)城市全體中學(xué)生的身高組成一個(gè)總體,每位學(xué)生的身高就是個(gè)體;檢查某個(gè)批次面粉的裝袋重量,整個(gè)批次的面粉的裝袋重量構(gòu)成一個(gè)總體,分布時(shí),我們稱總體為正態(tài)總體.研究某城市中學(xué)生的身高,●該批次每袋面粉的重量就是個(gè)體.●總體就是該隨機(jī)變量可能取值的全體.當(dāng)服從正態(tài)要考察每個(gè)個(gè)體來全面了解總體,往往是不現(xiàn)實(shí)的.一方面會(huì)消耗大量的資源和時(shí)間.另一方面有些試驗(yàn)是具有破壞性的.比如研究一批電池的壽命,當(dāng)我們逐一獲得了每個(gè)電池的壽命數(shù)據(jù)后,整批電池也就報(bào)廢了,這樣的研究是●●沒有意義的.記為,從總體中隨機(jī)抽取個(gè)個(gè)體進(jìn)行測(cè)試,然后根據(jù)這個(gè)個(gè)體的性質(zhì)來推斷總體的性質(zhì).我們把被抽取的個(gè)個(gè)體的集合叫做總體的一個(gè)樣本,實(shí)際中的做法是,我們從該批電池中隨機(jī)抽取一部分進(jìn)行試驗(yàn),記錄這部分電池的壽命去推斷整批電池的壽命特征.稱為該樣本的樣本容量.在實(shí)際問題中,樣本是一組具體觀測(cè)數(shù)據(jù),稱為樣本的觀測(cè)值.
統(tǒng)計(jì)學(xué)的基本思想是:適當(dāng)?shù)爻槿颖疽酝茰y(cè)總體的性質(zhì),達(dá)到花費(fèi)較小代價(jià)而推斷結(jié)果又足夠準(zhǔn)確的目的.為了使樣本很好地反映總體的特性,對(duì)抽樣的方法提出一定的要求.在隨機(jī)抽樣中,如果每個(gè)個(gè)體被這里提到的簡(jiǎn)單隨機(jī)抽樣具有以下兩個(gè)特征:抽到的機(jī)會(huì)均等,則稱為簡(jiǎn)單隨機(jī)抽樣.(1)代表性:樣本的每個(gè)分量與總體有相同的分布;(2)獨(dú)立性:相互獨(dú)立.此時(shí)與的分布已經(jīng)并不相同.抽出一個(gè)或者有限的個(gè)時(shí),通常時(shí),盡管為無放回抽樣,當(dāng)抽樣過程中采用放回抽樣時(shí),這往往是簡(jiǎn)單隨機(jī)抽樣.若采用的是無放回的抽樣,其分布已經(jīng)產(chǎn)生的變化,對(duì)總體分布的影響是非常微小的.所得的樣本分量分布仍認(rèn)為是沒有差異的,每個(gè)分布相同.在第一次抽取之后,總體的個(gè)數(shù)減少了一個(gè),如果總體中個(gè)體的數(shù)量龐大,10.1.2統(tǒng)計(jì)量定義10.1設(shè)是來自總體的一個(gè)樣本,若為一連續(xù)函數(shù),且不含任何參數(shù),則稱為樣本的一個(gè)統(tǒng)計(jì)量.例如,是從總體中抽取的一個(gè)三維樣本,其中參數(shù)已知,未知,則不是統(tǒng)計(jì)量,而都是統(tǒng)計(jì)量.
抽樣得到的樣本是一堆散沙,雜亂無章.為了在樣本中提取出有用信息,需要對(duì)樣本值進(jìn)行加工.比如在研究某城市中學(xué)生的身高時(shí),抽樣得到的樣本數(shù)據(jù)很難看出規(guī)律.我們關(guān)心的是中學(xué)生們的身高的整體水平此時(shí)構(gòu)造的隨機(jī)變量“樣本均值”為總體均值的合理估計(jì).這種針對(duì)不同問題構(gòu)造出樣本的某種函數(shù),在統(tǒng)計(jì)學(xué)中稱為統(tǒng)計(jì)量.有沒有提高,也就是估計(jì)總體均值.設(shè)是總體
的一個(gè)樣本,常用統(tǒng)計(jì)量如下:當(dāng)總體時(shí),常用統(tǒng)計(jì)量(5)階樣本中心矩(1)樣本均值(2)樣本方差(3)樣本標(biāo)準(zhǔn)差(4)階樣本原點(diǎn)矩
案例1某食品加工廠某日運(yùn)進(jìn)一批生豬,從中隨機(jī)取10頭,稱得其重量如下(單位:kg):75,78,77.5,74,80.5,82.5,80,85.5,87,85.求樣本均值和樣本方差.應(yīng)用與實(shí)踐解第十章數(shù)理統(tǒng)計(jì)基礎(chǔ)第二節(jié)常用統(tǒng)計(jì)分布
引例1質(zhì)檢部門想要了解某企業(yè)生產(chǎn)的電子元件壽命是否達(dá)到質(zhì)量要求.數(shù)據(jù)的采集是帶有破壞性的,質(zhì)檢部門從某日生產(chǎn)的成品元件中,只隨機(jī)抽取總量的,試驗(yàn)并記錄了壽命數(shù)據(jù).壽命的抽樣并不是僅僅讓我們認(rèn)識(shí)抽出來的這些樣品,可是我們?nèi)绾尾拍芡ㄟ^樣本去推測(cè)整體的狀況呢?
引例2在使用天平稱量物體質(zhì)量時(shí),測(cè)量的結(jié)果與實(shí)際值之間存在一定的差異叫做誤差.由于天平的靈敏度、操作環(huán)境、操作人員等影響,測(cè)量誤差在所難免.實(shí)際操作中多次重復(fù)測(cè)量是有效降低誤差的辦法之一.某實(shí)驗(yàn)室重復(fù)稱量了質(zhì)量為克的物品,每次稱量的結(jié)果獨(dú)立同服從.現(xiàn)在需要讓測(cè)量平均值與真實(shí)值之間的差異不超過克的把握不小于0.95%,此時(shí)至少需要測(cè)量幾次呢?情景與問題在前面的學(xué)習(xí)中,我們已經(jīng)知道統(tǒng)計(jì)量為隨機(jī)變量.對(duì)統(tǒng)計(jì)量所有可能的取值以及出現(xiàn)可能性的大小進(jìn)行描述是非常有必要的,這可以反映樣本統(tǒng)計(jì)量的分布特征,從而全面的把握和了解統(tǒng)計(jì)量.對(duì)統(tǒng)計(jì)量的取值進(jìn)行的概率描述就是下面要介紹的抽樣分布.
即使求出了精出的三大重要的抽樣分布:分布,分布和分布.
是服從自由度為的分布,記作定義10.2設(shè)為取自正態(tài)總體的樣本,則稱統(tǒng)計(jì)量樣本統(tǒng)計(jì)量所服從的分布稱為抽樣分布.英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)希爾曾把抽樣分布、參數(shù)估計(jì)、和假設(shè)檢驗(yàn)看做統(tǒng)計(jì)推斷的三個(gè)中心內(nèi)容.一般來說,要獲得統(tǒng)計(jì)量的抽樣分布是一件非常困難的事情,確分布,也會(huì)因?yàn)檫^于復(fù)雜而難以應(yīng)用.統(tǒng)計(jì)分析中,正態(tài)總體占有特別重要的地位,本節(jié)介紹由正態(tài)總體導(dǎo)其中,分布的密度函數(shù)為對(duì)于已知的和,上分位點(diǎn)的值可以根據(jù)附錄Ⅱ表二查表得到.圖10-1圖10-2
分布圖形如圖10-1所示.從圖中可以看到分布具有以下特征:(1)分布的密度函數(shù)曲線隨自由度的不同而有較大改變;(2)分布為非對(duì)稱分布.越大,密度函數(shù)的圖形越對(duì)稱.則稱為分布的上分位點(diǎn)或上側(cè)臨界值,其幾何意義如圖10-2所示.定義10.3設(shè),其概率密度函數(shù)為,對(duì)于給定的正數(shù),若存在實(shí)數(shù)滿足例1已知,求.解由定理10.1設(shè)為來自總體的樣本,則統(tǒng)計(jì)量證明從略.查分布表,得例2求的值.得,解由反查分布表,即定義10.4設(shè),且X
與Y相互獨(dú)立,則稱統(tǒng)計(jì)量是服從自由度為的分布,也稱為學(xué)生分布,記作(1)分布是偶函數(shù),圖形關(guān)于Y軸對(duì)稱;(2)即很大時(shí),t
分布的密度函數(shù)曲線形態(tài)與標(biāo)準(zhǔn)正態(tài)曲線很相似.事實(shí)上,當(dāng)自由度時(shí),10.2.2
t
分布其圖形如圖10-3所示.兩者幾乎沒有什么差別.分布的密度函數(shù)為從圖中可以看到分布具有以下特征:例如:
圖10-3與分布的上分位點(diǎn)相似,設(shè),概率密度函數(shù)為,對(duì)于給定的正數(shù),若存在實(shí)數(shù)滿足圖10-4稱為t分布的上分位點(diǎn)或上側(cè)臨界值,幾何意義如圖10-4所示.對(duì)于已知的和,上分位點(diǎn)的值可以根據(jù)附錄Ⅱ表三查表得到.例3
求的值.解由反查分布表,得解由例4已知求的值.查分布表,得即定理10.2設(shè)為來自總體的樣本,則統(tǒng)計(jì)量例5設(shè)總體,已知樣本容量,樣本方差,求概率解由查
t分布表得故應(yīng)用與實(shí)踐
案例
軋鋼廠粗軋?jiān)O(shè)備的精度是關(guān)系到成材率的重要指標(biāo).一批粗軋鋼材的長(zhǎng)度服從正態(tài)分,
現(xiàn)軋鋼25根,為這25根鋼材偏離設(shè)計(jì)均值的樣本方差.求超過的概率.解由,可知:故超過的把握在以上.第十章數(shù)理統(tǒng)計(jì)基礎(chǔ)第三節(jié)參數(shù)估計(jì)情景與問題引例
對(duì)某型號(hào)的20輛汽車記錄其每5升汽油的行駛里程(公里),觀測(cè)數(shù)據(jù)如下:29.8,27.6,28.3,27.9,30.1,28.7,29.9,28.0,27.9,28.728.4,27.2,29.5,28.5,28.0,30.0,29.1,29.8,29.6,26.9該型號(hào)汽車每5升汽油行駛公里數(shù)服從的分布尚不清楚,如何對(duì)總體的均值、方差進(jìn)行估計(jì)呢?引例中的問題是在總體分布類型未知或已知的情況下,對(duì)總體的一個(gè)或多個(gè)未知參數(shù)進(jìn)行的估計(jì),這類問題稱為參數(shù)估計(jì).參數(shù)估計(jì)是統(tǒng)計(jì)推斷的基本形式,是數(shù)理統(tǒng)計(jì)的一個(gè)重要分支內(nèi)容之一.如何根據(jù)樣本來估計(jì)總體中的未知參數(shù)呢?下面來看看幾種常見的方法.
參數(shù)估計(jì)根據(jù)結(jié)果表達(dá)形式不同分為點(diǎn)估計(jì)法和區(qū)間估計(jì)法兩種.比如,當(dāng)我們猜測(cè)某位公司高層管理人員收入時(shí),給出的結(jié)論是年收入50萬.這樣用某一個(gè)具體值作為總體未知參數(shù)的估計(jì)為點(diǎn)估計(jì)值.或者我們可以換一種方法,估計(jì)45至55萬元的區(qū)間包含其收入真實(shí)值的把握達(dá)到了90%,這個(gè)結(jié)論是在一定置信度下包含了未知參數(shù)真值的區(qū)間估計(jì)值.設(shè)是總體X分布中的未知參數(shù)觀測(cè)值,估計(jì)量是一個(gè)隨機(jī)變量,對(duì)不同的樣本值觀測(cè)值,的估計(jì)值一般是不同的.如果我們用統(tǒng)計(jì)量來估計(jì),10.3.1點(diǎn)估計(jì)以下介紹點(diǎn)估計(jì)的兩種常見方法:矩估計(jì)法與最大似然法.為來自總體X的一組樣本,為一組樣本的觀測(cè)值,就稱為的估計(jì)量,這類問題稱為點(diǎn)估計(jì)問題.將樣本觀測(cè)值代入估計(jì)量中,就可以得到的點(diǎn)估計(jì)值因?yàn)闃颖镜拿總€(gè)分量與總體X有相同的分布,比如常用到的樣本矩有樣本一階原點(diǎn)矩,1.矩估計(jì)法如果隨機(jī)變量X
所服從的分布律見下表:
在簡(jiǎn)單隨機(jī)抽樣中,一個(gè)直觀的想法是用樣本的樣本二階矩作為隨機(jī)變量最容易獲得的數(shù)字特征,且矩估計(jì)法的替換原理簡(jiǎn)單明確,得到了大眾的普遍接受,使用場(chǎng)合甚廣.各階矩估計(jì)相應(yīng)的總體矩.中心矩因而由皮爾遜在1894年正式提出后,如何才能求未知參數(shù)的矩估計(jì)量?此處為了求得未知參數(shù)的估計(jì)量,我們用樣本的一階原點(diǎn)矩,即樣本均值去代替總體一階原點(diǎn)矩,即總體期望.先計(jì)算出總體的期望:所以.由,得即為未知參數(shù)的矩估計(jì)量.解例1設(shè)是來自正太總體的一個(gè)樣本,試求μ
和的估計(jì)量.
因?yàn)槭莵碜哉傮w的一個(gè)樣本,所以我們知道正態(tài)總體的一階原點(diǎn)矩是期望,二階原點(diǎn)矩是因此用樣本的一階原點(diǎn)矩,即均值估計(jì)總體的均值用樣本的二階原點(diǎn)矩,即估計(jì)總體的二階原點(diǎn)矩得到從上式解出和,得到和的估計(jì)量為
解已知指數(shù)分布的期望.由,得練習(xí)求引例2中指數(shù)分布的未知參數(shù)的矩估計(jì)量.即為未知參數(shù)的矩估計(jì)量.,其中為未知參數(shù),定義似然函數(shù),2.最大似然估計(jì)法兩個(gè)箱子中各裝有紅球與白球若干.其中甲箱裝有99個(gè)紅球1個(gè)白球,乙箱裝有1個(gè)紅球99個(gè)白球.便挑選一箱,甲箱.這個(gè)結(jié)果的發(fā)生,或者說選擇甲箱可以使“摸出紅球”發(fā)生的概率最大.現(xiàn)在隨從中摸出一個(gè)球,結(jié)果發(fā)現(xiàn)為紅球.如果要推測(cè)這只紅球是從哪個(gè)箱子摸出的,我們自然會(huì)認(rèn)為是因?yàn)閺募紫渲忻黾t球的概率遠(yuǎn)大于從乙箱中摸出紅球的概率.我們選擇甲箱實(shí)際上是最有利于紅球這種以概率大小作為判斷依據(jù)的思路,便是最大似然原理的體現(xiàn).稱的函數(shù)為的似然函數(shù).定義10.5設(shè)隨機(jī)變量有聯(lián)合密度,其中是未知參數(shù),且的觀測(cè)值為例如,連續(xù)型總體X的概率密度為定義似然函數(shù)所選取的參數(shù)的估計(jì)量應(yīng)使觀測(cè)值出現(xiàn)的概率最大,也即是使達(dá)到的最大值.最大似然估計(jì)法的基本思想是:這可由方程解得.一般地,由于與同時(shí)到達(dá)最大值,為了計(jì)算上的方便,往往通過解方程求得.使似然函數(shù)取到最大值的稱為參數(shù)的最大似然估計(jì)量.例2設(shè)是正態(tài)總體的一個(gè)樣本,試求和的最大似然估計(jì).
解似然函數(shù)是取對(duì)數(shù)求偏導(dǎo),令其為0,得方程組解方程組得到和的最大似然估計(jì)分別是兩邊取對(duì)數(shù)得解由總體的概率密度函數(shù)為,兩邊對(duì)求導(dǎo)得由此得到的最大似然估計(jì)量為練習(xí)求引例2中指數(shù)分布的未知參數(shù)的最大似然估計(jì)量.對(duì)應(yīng)的似然函數(shù)為:1.無偏性總體的同一個(gè)未知參數(shù),若采用不同的估計(jì)方法,會(huì)得到不同的估計(jì)量.我們會(huì)問,這些不同的估計(jì)量哪一個(gè)更好?這就必須先建立評(píng)價(jià)標(biāo)準(zhǔn).在常用的標(biāo)準(zhǔn)中,本節(jié)介紹無偏性與有效性.容易證明,樣本均值與樣本方差分別是總體均值與方差的無偏估計(jì)量.
定義10.6設(shè)是總體未知參數(shù)的估計(jì)量,若,則稱為的無偏估計(jì)量.10.3.2估計(jì)量的評(píng)選標(biāo)準(zhǔn)例3取容量的樣本判斷均值的下面五個(gè)統(tǒng)計(jì)量中,哪些是無偏估計(jì)量?解顯然,而所以都是的無偏估計(jì)量.2.有效性證明由在例3中我們看到都是的無偏估計(jì)量.同一個(gè)參數(shù)可能有多個(gè)無偏估計(jì)量,我們又如何在這些估計(jì)量中,自然應(yīng)選用對(duì)參數(shù)的偏離程度較小的為好,即一個(gè)較好的估計(jì)量由此引入評(píng)選估計(jì)量的另一個(gè)標(biāo)準(zhǔn).比較他們的優(yōu)劣呢?的方差應(yīng)該較小.定義10.7設(shè)是的兩個(gè)無偏估計(jì)量,若,則稱較有效.例4在例3中,證明:較,都有效.有,即證明了較,都有效.則稱為的置信區(qū)間,稱概率為置信度,和分別稱為置信下限和置信上限.稱為顯著性水平.10.3.3區(qū)間估計(jì)未知參數(shù)的點(diǎn)估計(jì)值僅僅是未知參數(shù)的近似值,它與參數(shù)的精確值之間存在多大的差異并不清楚.原籍波蘭的統(tǒng)計(jì)學(xué)家奈曼,在1934年提出的置信區(qū)間理論的到了廣泛的應(yīng)用.和點(diǎn)估計(jì)不同,區(qū)間估計(jì)給出了參數(shù)真值的范圍,并且指出真值落在這樣的范圍內(nèi)的可靠程度.這樣的估計(jì)更具有參考價(jià)值.
定義10.8設(shè)是總體X的未知參數(shù),是來自總體X的一組樣本,對(duì)于給定的,若能確定兩個(gè)統(tǒng)計(jì)量與,使作為總體X
的參數(shù)是客觀存在的確定的數(shù)值.置信度的含義應(yīng)該是置信區(qū)間包含的2.置信度與估計(jì)精度是一對(duì)矛盾.
1.與是統(tǒng)計(jì)量,置信區(qū)間是隨機(jī)區(qū)間.比如,當(dāng)取置信度時(shí),參數(shù)的置信區(qū)間的意思是:取100組容量為
n
的樣本觀測(cè)值所而不是落在置信區(qū)間內(nèi)的可能性為.或者說由一個(gè)樣本所確定的一個(gè)置信區(qū)間中含有真值的可能性為.置信度越大,置信區(qū)間包含真值的概率越大,置信區(qū)間長(zhǎng)度越長(zhǎng).反之,參數(shù)估計(jì)的精度要求越高,置信區(qū)間長(zhǎng)度越短,概率越小,概率為確定的100個(gè)置信區(qū)間中,約有95個(gè)區(qū)間含有的真值,實(shí)際上這使得參數(shù)估計(jì)的精度降低.置信區(qū)間包含真值的置信度也就越小.這表明置信度并不是越高越好.在實(shí)際中的做法是:如果樣本容量不能進(jìn)一步增加,則是在保證盡可能提高估計(jì)精度.置信度的情況下,以下討論正態(tài)總體均值的區(qū)間估計(jì).1.總體方差已知時(shí),的置信區(qū)間由于已知,含有及的統(tǒng)計(jì)量存在于是對(duì)給定的置信度,成立(圖10-5所示).使得該式變形后即有:所以總體方差已知時(shí),的置信區(qū)間為:圖10-5解因?yàn)槔?某工廠生產(chǎn)的滾珠直徑可以認(rèn)為服從方差正態(tài)分布,今隨機(jī)抽取5個(gè)測(cè)得直徑(單位:mm)為:14.7,14.9,15.0,15.1,15.2.試求的0.95置信區(qū)間.查標(biāo)準(zhǔn)正態(tài)分布表得,的置信區(qū)間為,這表明區(qū)間包含真值的概率為所以很多實(shí)際問題中,根本無法獲知的值,此時(shí)之前的方法不再適用.此時(shí)需要選擇統(tǒng)計(jì)量進(jìn)行估計(jì).實(shí)際上,同樣一組樣本觀測(cè)值,按同一置信度對(duì)作區(qū)間估計(jì),類似于之前的討論,參照?qǐng)D10-6可得的置信區(qū)間對(duì)估計(jì)的精度會(huì)高一些,置信區(qū)間的長(zhǎng)度會(huì)更短.圖10-62.總體方差未知時(shí),的置信區(qū)間為:在其他條件相同時(shí),因?yàn)樵谝阎獣r(shí),我們掌握的信息比較多,在已知和未知時(shí),估計(jì)出的結(jié)果是不一樣的.
例6假設(shè)輪胎壽命服從正態(tài)分布,為估計(jì)某輪胎的平均壽命,現(xiàn)隨機(jī)地抽取12只輪胎試用,測(cè)得它們的壽命(單位:萬千米),如下4.684.854.324.854.615.025.204.604.584.724.384.70試求平均壽命0.95的置信區(qū)間.解此處正態(tài)總體標(biāo)準(zhǔn)差未知,可使用t
分布求均值的區(qū)間.首先求得取查表知于是得到平均壽命的0.95的置信區(qū)間(單位:萬千米)為應(yīng)用與實(shí)踐
案例1某地區(qū)進(jìn)行家庭消費(fèi)調(diào)查,為此,在該地區(qū)隨機(jī)抽查了10戶家庭,得每戶家庭消費(fèi)支出(單位:元)為設(shè)家庭消費(fèi)支出服從正態(tài)分布,試估計(jì)未知參數(shù).解首先即為該地區(qū)每戶家庭消費(fèi)支出的均值.由得,設(shè)的估計(jì)值為,則(元).1150800970102011009501640133012801400
案例2
某稱重設(shè)備的稱量結(jié)果可以認(rèn)為服從正態(tài)分布,已知設(shè)備的標(biāo)準(zhǔn)差
.為了使均值的置信度為0.95的置信區(qū)間長(zhǎng)度不超過1.2,樣本容量應(yīng)為多少?解由已知條件知,問題涉及總體方差已知時(shí),的區(qū)間估計(jì).現(xiàn)要求,時(shí),查表得,已知,從而即樣本容量至少為11時(shí)才能保證的置信度為0.95的置信區(qū)間長(zhǎng)度不超過1.2.因?yàn)榇藭r(shí)置信區(qū)間為其置信區(qū)間的長(zhǎng)度為它依賴于樣本容量即而與樣本的具體取值無關(guān).第十章數(shù)理統(tǒng)計(jì)基礎(chǔ)第四節(jié)假設(shè)檢驗(yàn)此時(shí)樣本均值偏離總體的均值應(yīng)該不會(huì)太大.情景與問題
引例1某大米加工廠生產(chǎn)的大米,額定標(biāo)準(zhǔn)為每包100,可以認(rèn)為每包重量服從正態(tài)分布.某日從倉(cāng)庫(kù)中隨機(jī)抽取9包,測(cè)得重量(單位:)為99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5.請(qǐng)問該大米加工廠該日的打包機(jī)工作是否正常?我們知道,由于隨機(jī)誤差的存在,即使打包機(jī)工作狀態(tài)完全正常,每袋大米的重量也不會(huì)全部為100kg,而是在100kg的附近波動(dòng).不再是最初設(shè)定的是否成立.這個(gè)問題屬于假設(shè)檢驗(yàn)的基本問題之一.但是與的差異還有可能是由于打包機(jī)工作不正常導(dǎo)致,實(shí)際上已經(jīng)發(fā)生了改變,換種說法,也就是實(shí)際總體的均值那么,該問題就是要根據(jù)樣本進(jìn)行判斷如果總體分布已知,統(tǒng)計(jì)假設(shè)是針對(duì)于總體的參數(shù)提出的,這類問題稱為參數(shù)假設(shè)檢驗(yàn)問題,引例1的問題屬于參數(shù)假設(shè)檢驗(yàn)問題.針對(duì)總體服從何種分布的統(tǒng)計(jì)假設(shè),屬于非參數(shù)假設(shè)檢驗(yàn)問題.本節(jié)只討論參數(shù)假設(shè)檢驗(yàn).提出一個(gè)關(guān)于總體的假設(shè),利用樣本提供的信息,檢驗(yàn)統(tǒng)計(jì)假設(shè)是否合理,以確定接受或舍棄假設(shè),這就是假設(shè)檢驗(yàn).概率小到什么程度才能稱為小?通常可取.10.4.1假設(shè)檢驗(yàn)的基本思想與兩類錯(cuò)誤不同的問題,的值會(huì)有不同的要求,例1某接待站在一周內(nèi)接待了12次來訪,結(jié)果所有的來訪都安排在周二和周三.現(xiàn)在能不能斷定接待的實(shí)踐是有規(guī)定的?解首先假設(shè)接待的時(shí)間是沒有規(guī)定的,即從周一到周日每一天去接待站的可能性都相同.那么12這么小概率的事件居然在一次試驗(yàn)中發(fā)生,有理由懷疑假設(shè)的正確性,所以應(yīng)當(dāng)拒絕最初的假設(shè),認(rèn)為接待的時(shí)間是有規(guī)定的.次來訪都出現(xiàn)在周二和周三的概率為假設(shè)檢驗(yàn)的基本思想是小概率原理.小概率原理認(rèn)為“小概率事件在一次試驗(yàn)中幾乎不會(huì)發(fā)生”.例如,因?yàn)橘I彩票中500萬大獎(jiǎng)的概率極小,如果張三今天出門買彩票,我們完全有信心和他打賭,張三如果張三回來后宣布他居然中了大獎(jiǎng),那我們會(huì)懷疑到中獎(jiǎng)率是不是向?qū)ν饨裉觳粫?huì)中500萬的大獎(jiǎng).公布的那么低.檢驗(yàn)?zāi)硞€(gè)假設(shè)時(shí),首先假定是正確的.如果事件A沒有出現(xiàn),那么表明沒有理由拒絕.如果認(rèn)為原假設(shè)是正確的,則接受,拒絕;如果認(rèn)為原假設(shè)是不正確的,則拒絕,接受.無論進(jìn)行何種檢驗(yàn),無論最初假設(shè)的內(nèi)容如何,假設(shè)檢驗(yàn)的基本思想都是相同的,就是“帶有概率性質(zhì)的反證法”.具體做法是:在此假設(shè)下,根據(jù)事先確定的小概率,構(gòu)造一個(gè)小概率事件A
.如果經(jīng)過一次試驗(yàn),事件A
竟然出現(xiàn)了,那么自然懷疑假設(shè)A的正確性,因而拒絕通常把假設(shè)稱為原假設(shè),而把與對(duì)立的假設(shè)稱為備擇假設(shè).檢驗(yàn)的目的是要在原假設(shè)與備擇假設(shè)二者之間選擇其中之一:第一類錯(cuò)誤:也稱為“棄真”的錯(cuò)誤,其中一個(gè)減小,另一個(gè)就會(huì)增大.的概率稱為檢驗(yàn)的顯著性水平.第二類錯(cuò)誤:也稱為“存?zhèn)巍钡腻e(cuò)誤,的概率通常記為.但研究表明,當(dāng)樣本容量一定時(shí),不可能同時(shí)把和都減小.原假設(shè):認(rèn)為新藥無效.此時(shí)應(yīng)該嚴(yán)格控制的值,讓的取值在合理范圍內(nèi)盡量的小.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤假設(shè)檢驗(yàn)中無論最終接受還是拒絕原假設(shè),都不可避免的會(huì)犯以下兩種錯(cuò)誤:犯第二類錯(cuò)誤即本來是正確的,但經(jīng)檢驗(yàn)被拒絕的錯(cuò)誤.犯第一類錯(cuò)誤我們當(dāng)然希望這兩類錯(cuò)誤越小越好.實(shí)際使用中,人們會(huì)根據(jù)實(shí)際問題的需要來控制兩類錯(cuò)誤的概率.比如在新藥的檢驗(yàn)中,第一類錯(cuò)誤是“新藥實(shí)際無效,但經(jīng)檢驗(yàn)被認(rèn)為犯此錯(cuò)誤時(shí),無效的新藥會(huì)被允許流入市場(chǎng).第二類錯(cuò)誤是“新藥實(shí)際有效,但經(jīng)檢驗(yàn)認(rèn)為無效”,此時(shí)新藥盡管有效但仍會(huì)被拒絕進(jìn)入市場(chǎng).這兩類錯(cuò)誤相比,顯然第一類錯(cuò)誤對(duì)社會(huì)產(chǎn)生的危害大很多,有效”,當(dāng)即當(dāng)本來是不正確的,但經(jīng)檢驗(yàn)被接受的錯(cuò)誤.10.4.2正態(tài)總體均值μ假設(shè)檢驗(yàn)1.檢驗(yàn)法這里關(guān)心的是總體的均值是否變化,由于拒絕域位于兩側(cè),該檢驗(yàn)被稱為雙邊檢驗(yàn).
(1)已知,對(duì)均值的檢驗(yàn).檢驗(yàn)選擇檢驗(yàn)統(tǒng)計(jì)量,在成立的假設(shè)下,.對(duì)給定的顯著性水平,由查標(biāo)準(zhǔn)正態(tài)分布表可得臨界值.由,說明事件為小概率事件.將樣本觀測(cè)值代入到中,算出統(tǒng)計(jì)量的值,如果,則表明在一次試驗(yàn)中小概率事件A發(fā)生了,其中不等式所確定的范圍稱為檢驗(yàn)的拒絕域.因而拒絕,而接受;否則接受.
(2)已知,對(duì)均值的檢驗(yàn).檢驗(yàn)這里我們只關(guān)心總體的均值是否減小,此時(shí)檢驗(yàn)為右側(cè)單邊檢驗(yàn).選擇檢驗(yàn)統(tǒng)計(jì)量,對(duì)給定的顯著性水平,由查標(biāo)準(zhǔn)正態(tài)分布表可得臨界值.的拒絕域?yàn)槿?,則拒絕,接受;否則接受
(3)已知,對(duì)均值的檢驗(yàn).檢驗(yàn)這里我們只關(guān)心總體的均值是否增大,此時(shí)檢驗(yàn)為左側(cè)單邊檢驗(yàn).選擇檢驗(yàn)統(tǒng)計(jì)量,的拒絕域?yàn)榇朔ㄒ驒z驗(yàn)量常用U來表示,故習(xí)慣上稱為U檢驗(yàn)法.假設(shè)檢驗(yàn)中,當(dāng)接受原假設(shè)時(shí),并不代表原假設(shè)一定是正確,只是差異還不夠顯著,還不足以拒絕原假設(shè).所以假設(shè)檢驗(yàn)也被稱為“顯著性檢驗(yàn)”.例2某煉鋼廠的鐵水含碳量X
服從正態(tài)分布,現(xiàn)測(cè)定了9爐鋼水,其平均含碳量為,如果估計(jì)方差不會(huì)有太大變化,可否認(rèn)為現(xiàn)在生產(chǎn)的鐵水平均含碳量仍為()?解
第一步:提出假設(shè).第二步:將第三步:對(duì)給定的顯著性水平,所以的拒絕域?yàn)榈谒牟?由于,仍為.計(jì)算得統(tǒng)計(jì)量的觀測(cè)值查標(biāo)準(zhǔn)正態(tài)分布表得臨界值代入,所以沒有理由拒絕.即認(rèn)為現(xiàn)在生產(chǎn)的鐵水平均含碳量不變,
解提出假設(shè)
例3據(jù)長(zhǎng)期資料分析,某廠生產(chǎn)的產(chǎn)品的某項(xiàng)指標(biāo).改革工藝后,在所生產(chǎn)的一批產(chǎn)品中任抽25件,得到該項(xiàng)指標(biāo)的樣本均值為79.若方差不變,試問改進(jìn)工藝后產(chǎn)品的該項(xiàng)指標(biāo)是否比以往產(chǎn)品的該項(xiàng)指標(biāo)要高()?將代入,對(duì)給定的顯著性水平,查標(biāo)準(zhǔn)正態(tài)分布表得臨界值所以拒絕.因?yàn)?,得到的拒絕域?yàn)?即認(rèn)為改進(jìn)工藝后,產(chǎn)品的該項(xiàng)指標(biāo)較以往有顯著提高.本例中,我們關(guān)心的是新工藝生產(chǎn)下產(chǎn)品的指標(biāo)是否有顯著的提高,為了謹(jǐn)慎起見,原工藝不能輕易否定,計(jì)算得統(tǒng)計(jì)量的觀測(cè)值改進(jìn)工藝的目的是為了提高指標(biāo)的值.只有在有很強(qiáng)的證據(jù)下才能認(rèn)為新工藝對(duì)指標(biāo)有提高,所以此處適合于單邊檢驗(yàn).(1)未知,對(duì)均值的檢驗(yàn).檢驗(yàn).選取檢驗(yàn)統(tǒng)計(jì)量為,對(duì)給定的顯著性水平,
由查t
分布表,可得臨界值,的拒絕域?yàn)榇藭r(shí)該檢驗(yàn)為雙邊檢驗(yàn).當(dāng)時(shí),拒絕,接受,否則接受.(2)未知,對(duì)均值的檢驗(yàn).檢驗(yàn).選取檢驗(yàn)統(tǒng)計(jì)量為,對(duì)給定的顯著性水平,
由查t
分布表,可得臨界值,的拒絕域?yàn)榇藭r(shí)該檢驗(yàn)為右側(cè)單邊檢驗(yàn).當(dāng)時(shí),拒絕,接受,否則接受.2.檢驗(yàn)法(3)未知,對(duì)均值的檢驗(yàn).檢驗(yàn).選取檢驗(yàn)統(tǒng)計(jì)量為,的拒絕域?yàn)榇藭r(shí)該檢驗(yàn)為左側(cè)單邊檢驗(yàn).由于這種檢驗(yàn)法選擇的統(tǒng)計(jì)量服從t
分布,所以稱為t檢驗(yàn).因?yàn)?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版機(jī)械行業(yè)科技創(chuàng)新合作合同書3篇
- 二零二五版藝術(shù)品字畫購(gòu)銷與倉(cāng)儲(chǔ)管理合同2篇
- 二零二五版農(nóng)業(yè)用地土壤環(huán)境質(zhì)量調(diào)查委托合同3篇
- 二零二五版LED顯示屏安全防護(hù)與應(yīng)急響應(yīng)合同3篇
- 美容院商鋪?zhàn)赓U合同(2025版):美容院美容美體設(shè)備租賃及售后服務(wù)協(xié)議2篇
- 二零二五年綠色建筑空調(diào)系統(tǒng)設(shè)計(jì)與施工合同3篇
- 二零二五版廢舊設(shè)備買賣及環(huán)保處理合同2篇
- 二零二五版房地產(chǎn)投資合作三方買賣合同3篇
- 二零二五版二手車鑒定評(píng)估及轉(zhuǎn)讓合同3篇
- 2025年度不銹鋼太陽(yáng)能板安裝工程合同3篇
- GB/T 12914-2008紙和紙板抗張強(qiáng)度的測(cè)定
- GB/T 1185-2006光學(xué)零件表面疵病
- ps6000自動(dòng)化系統(tǒng)用戶操作及問題處理培訓(xùn)
- 家庭教養(yǎng)方式問卷(含評(píng)分標(biāo)準(zhǔn))
- 城市軌道交通安全管理課件(完整版)
- 線纜包覆擠塑模設(shè)計(jì)和原理
- TSG ZF001-2006 安全閥安全技術(shù)監(jiān)察規(guī)程
- 部編版二年級(jí)語文下冊(cè)《蜘蛛開店》
- 鍋爐升降平臺(tái)管理
- 200m3╱h凈化水處理站設(shè)計(jì)方案
- 個(gè)體化健康教育記錄表格模板1
評(píng)論
0/150
提交評(píng)論