第三章理論分布與抽樣分布_第1頁
第三章理論分布與抽樣分布_第2頁
第三章理論分布與抽樣分布_第3頁
第三章理論分布與抽樣分布_第4頁
第三章理論分布與抽樣分布_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)概率-頻率的穩(wěn)定性一、統(tǒng)計(jì)概率的概念事件的概率:在相同條件下進(jìn)行n次重復(fù)試驗(yàn),事件A發(fā)生的次數(shù)為α,則α與n之比,稱為事件A的頻率,如果試驗(yàn)次數(shù)逐漸增多,事件A的頻率越來越穩(wěn)定地接近定值ρ,ρ就稱為事件A的概率。P(A)=ρ目前一頁\總數(shù)三十五頁\編于六點(diǎn)統(tǒng)計(jì)概率的概念當(dāng)n充分大時(shí),事件A的頻率作為該事件概率的近似值,稱為統(tǒng)計(jì)概率。概率的基本性質(zhì):任一事件的概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件的概率等于1[P(A)=1];不可能事件的概率等于0[P(A)=0]目前二頁\總數(shù)三十五頁\編于六點(diǎn)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)就是根據(jù)總體的理論分布和小概率原理,對(duì)未知或不完全知道的總體提出兩種彼此對(duì)立的假設(shè),然后由樣本的實(shí)際結(jié)果,經(jīng)過一定的計(jì)算.作出在一定概率意義上應(yīng)該接受的那種假設(shè)的推斷。如果抽樣結(jié)果使小概率發(fā)生。則拒絕假設(shè).如抽樣結(jié)果沒有使小概率發(fā)生,則接受假設(shè)。一般認(rèn)為小于0.05或0.01的概率為小概率。通過假設(shè)檢驗(yàn),可以正確分析處理效應(yīng)和隨機(jī)誤差,作出可取的結(jié)論。目前三頁\總數(shù)三十五頁\編于六點(diǎn)隨機(jī)事件的概率表示了隨機(jī)事件在一次試驗(yàn)中出現(xiàn)的可能性大小。若隨機(jī)事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。小概率事件實(shí)際不可能性原理目前四頁\總數(shù)三十五頁\編于六點(diǎn)小概率事件雖然不是不可能事件,但在一次試驗(yàn)中出現(xiàn)的可能性很小,不出現(xiàn)的可能性很大,以至于實(shí)際上可以看成是不可能發(fā)生的。在統(tǒng)計(jì)學(xué)上,把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件稱為小概率事件實(shí)際不可能性原理,亦稱為小概率原理。小概率事件實(shí)際不可能性原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。目前五頁\總數(shù)三十五頁\編于六點(diǎn)假設(shè)檢驗(yàn)的步驟1.提出假設(shè)無效假設(shè)(nullhypothesis):備選假設(shè)(alternativehypothesis):“無效”指處理效應(yīng)與總體參數(shù)之間沒有真實(shí)的差異,試驗(yàn)結(jié)果中的差異乃誤差所致。引進(jìn)一醋的新曲種,以原生產(chǎn)標(biāo)準(zhǔn)為對(duì)照,已知原生產(chǎn)標(biāo)準(zhǔn)醋酸含量為=9.75%,采用新曲種釀造10個(gè)樣本的醋酸含量平均數(shù)為11.99%,標(biāo)準(zhǔn)差S為1.3%,試分析采用新曲種是否提高了醋酸的含量。假設(shè):

即:是來自隨機(jī)誤差目前六頁\總數(shù)三十五頁\編于六點(diǎn)2.確定顯著水平以多大概率接受或否定無效假設(shè)?通常規(guī)定5%()和1%()為測(cè)試差異是否顯著的概率標(biāo)準(zhǔn),稱為檢驗(yàn)水平或顯著標(biāo)準(zhǔn),一般以a表示。目前七頁\總數(shù)三十五頁\編于六點(diǎn)3.推斷是否接受假設(shè)當(dāng)時(shí),認(rèn)為差異顯著,標(biāo)記為“*”,否定;當(dāng)時(shí),便認(rèn)為差異非常顯著,標(biāo)記“**”號(hào);當(dāng)時(shí),則認(rèn)為其差異不顯著,其差值為零,差值是來自誤差,接受目前八頁\總數(shù)三十五頁\編于六點(diǎn)二、概率的運(yùn)算法則1.概率的加法定理:互斥事件。某種產(chǎn)品的正品率與次品率。2.概率的乘法定理:互不排斥或相容的事件。某生產(chǎn)流水線上第一道工序產(chǎn)品與第二道工序產(chǎn)品的正品率。目前九頁\總數(shù)三十五頁\編于六點(diǎn)第二節(jié)二項(xiàng)分布有些總體的各個(gè)個(gè)體的某種性狀,只有兩種結(jié)果,非此即彼,此和彼是對(duì)立事件。這種由非此即彼事件構(gòu)成的總體,叫做二項(xiàng)總體。這些資料的理論分布為二項(xiàng)分布。目前十頁\總數(shù)三十五頁\編于六點(diǎn)二項(xiàng)分布的概念

如某實(shí)驗(yàn)中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,故對(duì)一只小白鼠進(jìn)行實(shí)驗(yàn)的結(jié)果為:死(概率為P)或生(概率為1-P)

對(duì)二只小白鼠(甲乙)進(jìn)行實(shí)驗(yàn)的結(jié)果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2

依此類推,對(duì)n只小白鼠進(jìn)行實(shí)驗(yàn),所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項(xiàng)式通式,cnx=n!/x!(n-x)!,P為總體率。

因此,二項(xiàng)分布是說明結(jié)果只有兩種情況的n次實(shí)驗(yàn)中發(fā)生某種結(jié)果為x次的概率分布。其概率密度為:

,x=0,1,...n。

目前十一頁\總數(shù)三十五頁\編于六點(diǎn)二項(xiàng)分布的應(yīng)用條件每次實(shí)驗(yàn)只有兩類對(duì)立的結(jié)果;n次事件相互獨(dú)立;每次實(shí)驗(yàn)?zāi)愁惤Y(jié)果的發(fā)生的概率是一個(gè)常數(shù)。目前十二頁\總數(shù)三十五頁\編于六點(diǎn)二項(xiàng)分布的形狀(1)二項(xiàng)分布圖形的形狀取決于P和n的大??;(2)當(dāng)P=0.5時(shí),無論n的大小,均為對(duì)稱分布;(3)當(dāng)P<>0.5,n較小時(shí)為偏態(tài)分布,n較大時(shí)逼近正態(tài)分布。目前十三頁\總數(shù)三十五頁\編于六點(diǎn)目前十四頁\總數(shù)三十五頁\編于六點(diǎn)二項(xiàng)分布的參數(shù)平均數(shù)和標(biāo)準(zhǔn)差二項(xiàng)分布的平均數(shù)μ=np,二項(xiàng)分布的標(biāo)準(zhǔn)差為np(1-p)的算術(shù)平方根。目前十五頁\總數(shù)三十五頁\編于六點(diǎn)正態(tài)分布

1、正態(tài)分布也稱高斯(Gauss)分布,是一種連續(xù)型隨機(jī)變量的理論分布。它的分布狀態(tài)是多數(shù)變量都圍繞在平均值左右,由平均值到分布的兩側(cè),變量數(shù)減少。正態(tài)分布的概率函數(shù)為:

為正態(tài)分布的概率密度函數(shù),表示某一定x值出現(xiàn)的概率密度。表示總體平均數(shù),表示總體方差。

正態(tài)分布是一種在統(tǒng)計(jì)理論和應(yīng)用上最重要的分布。試驗(yàn)誤差的分布一般服從于這種分布,許多生物現(xiàn)象的計(jì)量資料均近似服從這種分布。正態(tài)分布記為N(,)。

目前十六頁\總數(shù)三十五頁\編于六點(diǎn)當(dāng)時(shí),f(x)值最大,所以正態(tài)分布曲線是以平均數(shù)為中心分布。當(dāng)?shù)慕^對(duì)值相等時(shí),f(x)值也相等,所以正態(tài)分布是以為中心向左右兩側(cè)對(duì)稱的分布。標(biāo)準(zhǔn)離差u=的絕對(duì)值越大,f(x)值就越小,但f(x)永遠(yuǎn)不會(huì)等于0,所以正態(tài)分布以x軸為漸近線,x的取值區(qū)間為。正態(tài)分布曲線完全由位置參數(shù)和形態(tài)參數(shù)來決定。確定正態(tài)分布曲線在x軸上的中心位置,確定正態(tài)分布的變異度。正態(tài)分布具有以下特征:

目前十七頁\總數(shù)三十五頁\編于六點(diǎn)目前十八頁\總數(shù)三十五頁\編于六點(diǎn)值不同,值相同的三條正態(tài)分布曲線值相同,值不同的三條正態(tài)分布曲線目前十九頁\總數(shù)三十五頁\編于六點(diǎn)標(biāo)準(zhǔn)正態(tài)分布記為N(0,1)

標(biāo)準(zhǔn)正態(tài)分布目前二十頁\總數(shù)三十五頁\編于六點(diǎn)為了方便,令即可將的正態(tài)分布轉(zhuǎn)化為的標(biāo)準(zhǔn)正態(tài)分布。欲求一定區(qū)間標(biāo)準(zhǔn)正態(tài)分布曲線下的面積只需查附表1即可。目前二十一頁\總數(shù)三十五頁\編于六點(diǎn)有一批面包,重量平均為100g,標(biāo)準(zhǔn)差為1.2g,試求其單個(gè)面包重量從100g到102g的概率是多少?根據(jù)公式得:查表得當(dāng)u=1.66時(shí),對(duì)應(yīng)的概率P=0.451,從100g到102g的面包占總面包數(shù)量的45.1%目前二十二頁\總數(shù)三十五頁\編于六點(diǎn)t分布

當(dāng)樣本容量較大(),用樣本方差估計(jì)。但當(dāng)樣本容量不大()時(shí),如果仍用估計(jì),這時(shí)標(biāo)準(zhǔn)離差就不呈正態(tài)分布,而是服從自由度為的t分布。

目前二十三頁\總數(shù)三十五頁\編于六點(diǎn)t分布具有以下特征:

t分布曲線也是左右對(duì)稱的,以0為中心向兩側(cè)遞降。t分布受自由度df=n-1的制約,每個(gè)自由度都有一條t分布曲線。和正態(tài)分布相比,t分布的頂部偏低,尾部偏高,自由度df>30時(shí),其曲線就比較接近正態(tài)分布曲線,當(dāng)時(shí)則和正態(tài)分布曲線重合。目前二十四頁\總數(shù)三十五頁\編于六點(diǎn)抽樣誤差目前二十五頁\總數(shù)三十五頁\編于六點(diǎn)系統(tǒng)誤差和隨機(jī)誤差系統(tǒng)誤差是指測(cè)定值的數(shù)學(xué)期望與真值之差用ε表示。

ε=x∞-x真值

隨機(jī)誤差是指n次測(cè)量中各次測(cè)量值x與測(cè)量數(shù)學(xué)期望之差。用σi表示:

σi=xi-x∞

數(shù)學(xué)期望:指當(dāng)測(cè)量次數(shù)n趨向無窮大(n→∞)時(shí)算術(shù)平均值的極限。用x∞表示:

目前二十六頁\總數(shù)三十五頁\編于六點(diǎn)x真值、x∞和xi關(guān)系的示意圖。從圖中得知,隨機(jī)誤差σi說明各次測(cè)量值與x∞的離散程度,即精密度,σi越小說明數(shù)據(jù)的重復(fù)性好、精密度高;而系統(tǒng)誤差ε可做為x∞與真值x真值偏離的尺度,ε越小,即準(zhǔn)確度越高。目前二十七頁\總數(shù)三十五頁\編于六點(diǎn)平均誤差與標(biāo)準(zhǔn)誤差平均誤差可用下式表示:

其中:;用平均誤差表示測(cè)量誤差,計(jì)算方便,但由于采用平均值的方法,容易掩蓋個(gè)別質(zhì)量不高的測(cè)量。

目前二十八頁\總數(shù)三十五頁\編于六點(diǎn)標(biāo)準(zhǔn)誤差σ又稱均方根誤差。通常真值x是未知的,而且測(cè)量次數(shù)n有限,這時(shí)可以用貝塞爾(Bessel)式得出在有限次測(cè)量情況下,單次測(cè)量值的標(biāo)準(zhǔn)離差S,且把測(cè)量的標(biāo)準(zhǔn)離差(S)作為標(biāo)準(zhǔn)誤差(σ)的估計(jì),σ≈S,這樣標(biāo)準(zhǔn)誤差σ就表示為:

目前二十九頁\總數(shù)三十五頁\編于六點(diǎn)絕對(duì)誤差與相對(duì)誤差絕對(duì)誤差是測(cè)量值與真值之間的偏差,某次實(shí)驗(yàn)的絕對(duì)誤差可用下式計(jì)算:

絕對(duì)誤差=測(cè)量值-真值

視測(cè)量值與真值相比較大小不同,絕對(duì)誤差可以是正值,也可以是負(fù)值,它的單位與測(cè)量的單位相同。

相對(duì)誤差是絕對(duì)誤差與真值的比值(百分?jǐn)?shù)表示),某次實(shí)驗(yàn)的相對(duì)誤差可用下式計(jì)算:目前三十頁\總數(shù)三十五頁\編于六點(diǎn)樣本異常值的判斷和處理

1、概念

樣本異常值是指樣本中的個(gè)別值,其數(shù)值明顯偏離它所在樣本的其余觀測(cè)值。

異常值可能僅僅是數(shù)據(jù)中固有的隨機(jī)誤差的極端表現(xiàn),也可能是過失誤差。異常值檢驗(yàn)的顯著性水平,推薦的值為1%。目前三十一頁\總數(shù)三十五頁\編于六點(diǎn)2、異常值的處理

A、異常值保留在樣本中參加其后的數(shù)據(jù)統(tǒng)計(jì)計(jì)算。B、允許剔除異常值,即把異常值從樣本中排除。C、允許剔除異常值并追加適宜的觀測(cè)值代入樣本。D、在找到實(shí)際原因時(shí)修正異常值。處理規(guī)則為:(1)對(duì)于任何異常值,若無充分的技術(shù)上的原因,則不得剔除或修正。(2)異常值中除有充分的技術(shù)上的或?qū)嶒?yàn)上的理由外,在統(tǒng)計(jì)上表現(xiàn)為高異常,才允許剔除或修正。目前三十二頁\總數(shù)三十五頁\編于六點(diǎn)3、簡(jiǎn)單的壞值及其剔除原則

(1)拉依達(dá)原則

如果某個(gè)測(cè)量值Xd的離差Ud滿足:

Ud>3

就認(rèn)為Xd是含有過失誤差的壞值,須剔除,誤差絕對(duì)值大于3的概率為0.26%.(2)肖維勒準(zhǔn)則

如果某個(gè)測(cè)量值Xd的離差Ud滿足:

Ud>Wn

式中wn與測(cè)量值的測(cè)試次數(shù)n有關(guān)

壞值Xd應(yīng)剔除。目前三十三頁\總數(shù)三十五頁\編于六點(diǎn)肖維勒系數(shù)wn數(shù)值表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論