第三章 有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)_第1頁(yè)
第三章 有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)_第2頁(yè)
第三章 有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)_第3頁(yè)
第三章 有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)_第4頁(yè)
第三章 有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章有限數(shù)據(jù)的統(tǒng)計(jì)與檢驗(yàn)3.1數(shù)學(xué)期望與方差隨機(jī)變量x及它所取的數(shù)和相應(yīng)頻率的乘積和,稱為x的平均數(shù)(屬于加權(quán)平均)也稱為隨機(jī)變量的數(shù)學(xué)期望或均值。

(一)離散型隨機(jī)變量的數(shù)學(xué)期望定義1離散型隨機(jī)變量X有概率函數(shù)

P(X=xk)=Pk(k=1,2,....)若級(jí)數(shù)絕對(duì)收斂,則稱這個(gè)級(jí)數(shù)為X的數(shù)學(xué)期望=一、數(shù)學(xué)期望例3-1甲在機(jī)床上生產(chǎn)某產(chǎn)品,若一等品能賺5元,二等品賺3元,次品虧2元.甲生產(chǎn)時(shí)一等品、二等品及次品的概率為0.6,0.3,0.1。問(wèn)生產(chǎn)每件產(chǎn)品平均能創(chuàng)造多少財(cái)富?數(shù)學(xué)期望為3.7。表示生產(chǎn)一件產(chǎn)品能創(chuàng)造3.7元。x53-2p0.60.30.1解:

(二)連續(xù)型隨機(jī)變量的數(shù)學(xué)期望若稱為X的數(shù)學(xué)期望。

(1)

定義設(shè)連續(xù)型隨機(jī)變量X有概率密度絕對(duì)收斂,則隨機(jī)變量X的數(shù)學(xué)期望是隨機(jī)變量的平均數(shù)。它是將隨機(jī)變量x及它所取的數(shù)和相應(yīng)頻率的乘積和。

例3-2計(jì)算在區(qū)間[a,b]上服從均勻分布的隨機(jī)變量X的數(shù)學(xué)期望??梢?jiàn)均勻分布的數(shù)學(xué)期望為區(qū)間的中值。解:3.1數(shù)學(xué)期望與方差二、方差定義為變量X的方差對(duì)于離散型變量對(duì)于連續(xù)型變量例3-3計(jì)算在區(qū)間[a,b]上服從均勻分布的隨機(jī)變量X的方差。3.2置信區(qū)間與顯著性水平二、方差定義為變量X的方差對(duì)于離散型變量對(duì)于連續(xù)型變量用樣本研究總體時(shí),樣本均值x并不等于總體均值μ,但可以肯定,只要消除了系統(tǒng)誤差,在某一置信度下,一定存在著一個(gè)以樣本均值x為中心,包括總體均值μ在內(nèi)的某一范圍,稱為平均值的置信區(qū)間。由t的定義式得:3.2置信區(qū)間與顯著性水平式中稱為置信區(qū)間,其大小取決于測(cè)定的標(biāo)準(zhǔn)偏差、測(cè)定次數(shù)和置信度的選擇,置信區(qū)間愈小平均值愈接近總體平均值μ。(→

μ

)表示的意義:有68.3%把握認(rèn)為本鋼樣磷含量的真值落在0.0087±0.0011(%)范圍內(nèi)。下面有三種結(jié)果報(bào)告,第一種報(bào)告:例3-4對(duì)某一鋼樣含磷量平行測(cè)定了四次,平均值為0.0087%。己知標(biāo)準(zhǔn)誤差σ=0.0022。磷含量的第二種報(bào)告表示的意義為:有95.5%把握認(rèn)為本鋼樣磷含量的真值落在0.0087±0.0022(%)范圍內(nèi)。磷含量的第三種報(bào)告表示的意義為:有99.7%把握認(rèn)為本鋼樣磷含量的真值落在0.0087±0.0033(%)范圍內(nèi)。1)置信度(P):例中有68.3%把握、95.5%把握和99.7%把握均稱為置信度也稱置信水平;2)顯著性水平(α):在上面三個(gè)區(qū)間外的概率稱為顯者性水平。置信度(P)與顯著性水平(α)的關(guān)系兩者的關(guān)系為:α=1-P例:α(顯著性水平)=0.05時(shí),則p(置信度)=1-0.05=0.95,即等于95%置信度的選擇應(yīng)合適,一般的判斷若有95%把握,則以為這種判斷基本正確。在統(tǒng)計(jì)學(xué)中通常取95%置信度。處理分析測(cè)試的數(shù)據(jù)時(shí),也取95%的置信度。當(dāng)然并非絕對(duì),根據(jù)具體的情況有時(shí)也取90%或99%。3.3假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn)(testofsignificance)。顯著性檢驗(yàn)的方法很多,常用的有t檢驗(yàn)、F檢驗(yàn)和

2檢驗(yàn)等。盡管這些檢驗(yàn)方法的用途及使用條件不同,但其檢驗(yàn)的基本原理是相同的。3.4t檢驗(yàn)t檢驗(yàn)是用t分布函數(shù)對(duì)不同樣本間均值差異性的檢驗(yàn)方法。由于測(cè)量次數(shù)有限,σ和μ無(wú)從知道。英國(guó)統(tǒng)計(jì)學(xué)與化學(xué)家Gosset提出用t分布解決了這一問(wèn)題。使不致因?yàn)橛胹代替σ而引起對(duì)正態(tài)分布的偏離。

t分布函數(shù)是由英國(guó)統(tǒng)計(jì)學(xué)家兼化學(xué)家Gosset提出,因當(dāng)時(shí)他用“Student”的筆名發(fā)表該論文,所以又稱為“學(xué)生氏分布”1)t分布曲線隨自由度f(wàn)變化;2)當(dāng)f=∞時(shí),t分布則為正態(tài)分布。t檢驗(yàn)的基本原理例3-5

隨機(jī)抽測(cè)10頭白豬和10頭黑豬經(jīng)產(chǎn)母豬的產(chǎn)仔數(shù),資料如下:白:11,11,9,12,10,13,13,8,10,13黑:8,11,12,10,9,8,8,9,10,7經(jīng)計(jì)算,得白豬10頭經(jīng)產(chǎn)母豬產(chǎn)仔平均數(shù)X1=11頭,標(biāo)準(zhǔn)差S1=1.76頭;黑豬10頭經(jīng)產(chǎn)母豬產(chǎn)仔平均數(shù)X2=9.2頭,標(biāo)準(zhǔn)差S2=1.549頭。下一張

主頁(yè)

退出

上一張

能否僅憑這兩個(gè)平均數(shù)的差值X1-X2=1.8頭,立即得出白與黑兩品種經(jīng)產(chǎn)母豬產(chǎn)仔數(shù)不同的結(jié)論呢?統(tǒng)計(jì)學(xué)認(rèn)為,這樣得出的結(jié)論是不可靠的。下一張

主頁(yè)

退出

上一張

總體與樣本的關(guān)系取樣次數(shù)取樣值平均值126.531.227.930.829.128.7+0.4228.728.325.129.627.928.7-0.8325.130.828.532.429.228.7+0.5429.127.924.231.728.228.7-0.5527.229.626.532.829.028.7+0.3總和28.7表明樣本平均數(shù)并非總體平均數(shù),它還包含試驗(yàn)誤差的成分。對(duì)于接受不同處理的兩個(gè)樣本來(lái)說(shuō),則有:這說(shuō)明兩個(gè)樣本平均數(shù)之差包括了兩部分:一部分是兩個(gè)總體平均數(shù)的差稱試驗(yàn)的處理效應(yīng)另一部分是試驗(yàn)誤差也就是說(shuō)樣本平均數(shù)的差包含有試驗(yàn)誤差,它只是試驗(yàn)的表面效應(yīng)。因此,僅憑就對(duì)總體平均數(shù)μ1、μ2

是否相同下結(jié)論是不可靠的。只有通過(guò)顯著性檢驗(yàn)才能獲得結(jié)論。對(duì)進(jìn)行顯著性檢驗(yàn)就是要分析:試驗(yàn)的表面效應(yīng)主要由處理效應(yīng)引起的,還是主要由試驗(yàn)誤差所造成。下一張

主頁(yè)

退出

上一張

這里我們做出如下假設(shè):下一張

主頁(yè)

退出

上一張

零假設(shè)備擇假設(shè)對(duì)于統(tǒng)計(jì)量服從自由度為(n1+n2-2)t分布其中下一張

主頁(yè)

退出

上一張

接受H0,差異不顯著拒絕H0,差異顯著拒絕H0,差異非常顯著飼料種類甲乙增重量26.531.228.728.325.130.829.127.927.229.6平均值27.329.6例3-6

為了考察兩種不同的飼料對(duì)鯽魚喂養(yǎng)的效果,測(cè)量了其增重量(g/week),數(shù)據(jù)如下,試問(wèn)兩種飼料喂養(yǎng)效果是否存在差異?由于所以,兩種飼料的喂養(yǎng)效果沒(méi)有明顯差異。差異不顯著方差分析下一張

主頁(yè)

退出

上一張

——F

檢驗(yàn)t檢驗(yàn)法適用于兩樣本平均數(shù)間的差異顯著性檢驗(yàn),但在生產(chǎn)和科學(xué)研究中經(jīng)常會(huì)遇到比較多個(gè)處理優(yōu)劣的問(wèn)題,即需進(jìn)行多個(gè)平均數(shù)間的差異顯著性檢驗(yàn)。這時(shí),若仍采用t檢驗(yàn)法就不適宜了。這是因?yàn)椋合乱粡?/p>

主頁(yè)

退出

上一張

1、檢驗(yàn)過(guò)程煩瑣例如,一試驗(yàn)包含5個(gè)處理,采用t檢驗(yàn)法要進(jìn)行=10次兩兩平均數(shù)的差異顯著性檢驗(yàn);若有k個(gè)處理,則要作k(k-1)/2次類似的檢驗(yàn)。下一張

主頁(yè)

退出

上一張

2、無(wú)統(tǒng)一的試驗(yàn)誤差,誤差估計(jì)的精確性和檢驗(yàn)的靈敏性低對(duì)同一試驗(yàn)的多個(gè)處理進(jìn)行比較時(shí),應(yīng)該有一個(gè)統(tǒng)一的試驗(yàn)誤差的估計(jì)值。若用t檢驗(yàn)法作兩兩比較,由于每次比較需計(jì)算一個(gè),故使得各次比較誤差的估計(jì)不統(tǒng)一,同時(shí)沒(méi)有充分利用資料所提供的信息而使誤差估計(jì)的精確性降低,從而降低檢驗(yàn)的靈敏性。下一張

主頁(yè)

退出

上一張

3、推斷的可靠性低,檢驗(yàn)的I型錯(cuò)誤率大假設(shè)兩個(gè)樣本之間的I型錯(cuò)誤率為0.05,則如果有五個(gè)樣本進(jìn)行兩兩比較,共10次,則總犯I型錯(cuò)誤的概率由于上述原因,多個(gè)平均數(shù)的差異顯著性檢驗(yàn)不宜用t檢驗(yàn),須采用方差分析法。方差分析(analysisofvariance,ANOVA)是由英國(guó)統(tǒng)計(jì)學(xué)家R.A.Fisher于1923年提出的。例3-7為了考察5個(gè)品系的小麥之間株高是否存在差別,進(jìn)行隨機(jī)取樣后數(shù)據(jù)如下,試分析品系間株高是否存在差別?株號(hào)品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.23

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論