概率與抽樣分布_第1頁
概率與抽樣分布_第2頁
概率與抽樣分布_第3頁
概率與抽樣分布_第4頁
概率與抽樣分布_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于概率與抽樣分布第1頁,共58頁,2022年,5月20日,3點57分,星期五Section3.1

RandomVariables

隨機變量第2頁,共58頁,2022年,5月20日,3點57分,星期五

事件的實際發(fā)生率稱為頻率。設(shè)在相同條件下,獨立重復進行n次試驗,事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。

概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。一、頻率與概率frequencyandprobability第3頁,共58頁,2022年,5月20日,3點57分,星期五

1.樣本頻率總是圍繞概率上下波動

2.樣本含量n越大,波動幅度越小,頻率越接近概率。頻率與概率的關(guān)系:調(diào)查株數(shù)(n)52550100200500100015002000受害株數(shù)(a)212153372177351525704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.352表在相同條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果一、頻率與概率frequencyandprobability第4頁,共58頁,2022年,5月20日,3點57分,星期五一、頻率與概率frequencyandprobability

小概率原理若事件A發(fā)生的概率較小,如小于0.05或0.01,則認為事件A在一次試驗中不太可能發(fā)生,這稱為小概率事件實際不可能性原理,簡稱小概率原理。這里的0.05或0.01稱為小概率標準,農(nóng)業(yè)試驗研究中通常使用這兩個小概率標準。第5頁,共58頁,2022年,5月20日,3點57分,星期五二、隨機變量用以記錄隨機試驗結(jié)果(outcome)的變量,稱為隨機變量(randomvariable),用大寫英文字母X,Y等代表。隨機變量X的概率分布,表達X的可能取值和取這些值的概率規(guī)則。第6頁,共58頁,2022年,5月20日,3點57分,星期五離散型和連續(xù)型隨機變量隨機變量的可能取值是離散的數(shù)字,如計數(shù)型或分類型等,稱為離散型隨機變量(discreterandomvariable)。{0,1,…,9}。20次實驗中成功的次數(shù),二項式分布。隨機變量的可能取值是某一實數(shù)的區(qū)間,如“大于0”或“-2~2之間”等,稱為連續(xù)型隨機變量(continuousrandomvariable)。正態(tài)隨機變量二、隨機變量第7頁,共58頁,2022年,5月20日,3點57分,星期五三、離散型隨機變量的概率分布X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pn列出離散型隨機變量X的所有可能取值列出隨機變量取這些值的概率通常用下面的表格來表示P(X=xi)=pi稱為離散型隨機變量的概率函數(shù)第8頁,共58頁,2022年,5月20日,3點57分,星期五四、連續(xù)型隨機變量的概率密度若觀察資料數(shù)量夠大,則直方圖(組數(shù)適當增加)的整體形態(tài)可用一近似的平滑曲線顯示。直方圖中縱軸改為次數(shù)比例,則該平滑曲線稱為密度曲線(densitycurve)。第9頁,共58頁,2022年,5月20日,3點57分,星期五概率密度曲線第10頁,共58頁,2022年,5月20日,3點57分,星期五密度曲線的性質(zhì)曲線都在水平線上(密度函數(shù)>=0)。曲線下所涵蓋的全部面積正好為1(所有可能性為1)。曲線下任何范圍所涵蓋的面積,為觀察值落在該范圍的比例(概率)。密度曲線可視為是觀察變量的理論分布圖形。

四、連續(xù)型隨機變量的概率密度第11頁,共58頁,2022年,5月20日,3點57分,星期五隨機變量X的一切可能取值的完備組中,各可能取值xi與其相對應的概率pi乘積之和描述隨機變量取值的集中程度計算公式為五、隨機變量的數(shù)學期望第12頁,共58頁,2022年,5月20日,3點57分,星期五隨機變量X的每一個取值與期望值的離差平方和的數(shù)學期望,記為D(X)描述離散型隨機變量取值的分散程度計算公式為六、隨機變量的方差第13頁,共58頁,2022年,5月20日,3點57分,星期五Section3.2

TheBinomialDistributions

二項分布第14頁,共58頁,2022年,5月20日,3點57分,星期五一、二項分布設(shè)定

TheBinomialSetting固定的觀察次數(shù)n。n次的觀察都獨立,每次的觀察都不會對其他觀察提供任何信息。每次的觀察都只有兩種可能的結(jié)果,多假設(shè)為“成功”或“失敗”兩種。每次的觀察“成功”的概率都一樣,設(shè)定為p。第15頁,共58頁,2022年,5月20日,3點57分,星期五二、二項分布

BinomialDistribution滿足二項分布設(shè)定的試驗,以X記錄n次觀察中“成功”的次數(shù),則稱X的分布為參數(shù)為n與p的二項分布(binomial),記為B(n,p)。X的所有可能取值為{0,1,…,n}。對應的概率函數(shù)為P(X=x)=P(x)。第16頁,共58頁,2022年,5月20日,3點57分,星期五[例1]某種昆蟲在某地區(qū)的死亡率為40%,即p=0.4,現(xiàn)對這種害蟲用一種新藥進行治療試驗,每次抽樣10頭作為一組治療。試問如新藥無療效,則在10頭中死3頭、2頭、1頭,以及全部愈好的概率為多少?按上述二項分布概率函數(shù)式計算

7頭愈好,3頭死去概率:8頭愈好,2頭死去概率:9頭愈好,1頭死去概率:10頭全部愈好的概率:三、示例第17頁,共58頁,2022年,5月20日,3點57分,星期五

若問10頭中不超過2頭死去的概率為多少?則應該應用累積函數(shù),即三、示例第18頁,共58頁,2022年,5月20日,3點57分,星期五四、二項分布的期望值與標準差期望值:E(X)=np方差: Var(X)=np(1-p)標準差:第19頁,共58頁,2022年,5月20日,3點57分,星期五Section3.3

NormalDistributions

正態(tài)分布第20頁,共58頁,2022年,5月20日,3點57分,星期五一、特點正態(tài)曲線所有正態(tài)曲線都有相同的外型具有對稱、單峰及鐘形的特性。正態(tài)曲線所代表的分布即為正態(tài)分布(normaldistribution)每一正態(tài)分布都有其平均值μ

與標準差σ

第21頁,共58頁,2022年,5月20日,3點57分,星期五ms一、特點第22頁,共58頁,2022年,5月20日,3點57分,星期五正態(tài)曲線σ較大ms一、特點第23頁,共58頁,2022年,5月20日,3點57分,星期五正態(tài)曲線的拐點拐點落在一個σ處拐點落在-σ處一、特點第24頁,共58頁,2022年,5月20日,3點57分,星期五二、為什么這么重要Gooddescriptionsforsomedistributionsofrealdata身高,體重,考試成績GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第25頁,共58頁,2022年,5月20日,3點57分,星期五三、68-95-99.7規(guī)則正態(tài)分布有其特定的數(shù)據(jù)分布規(guī)則:平均值為μ,標準差為σ的正態(tài)分布68%的觀察資料落在m的1σ之內(nèi)95%的觀察資料落在m的2σ之內(nèi)99.7%的觀察資料落在m的3σ之內(nèi)第26頁,共58頁,2022年,5月20日,3點57分,星期五0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的資料95%的資料99.7%的資料三、68-95-99.7規(guī)則第27頁,共58頁,2022年,5月20日,3點57分,星期五四、變量標準化(Standardization)令觀察值x服從平均值為μ,標準差為σ的分布,則x的標準化值(standardizedvalue)定義為標準化值又稱為z-值(z-score)。第28頁,共58頁,2022年,5月20日,3點57分,星期五標準化變量可以證明z的平均值為0z的標準差為1

四、變量標準化(Standardization)第29頁,共58頁,2022年,5月20日,3點57分,星期五五、標準正態(tài)分布變量X服從平均值為μ,標準差為σ的正態(tài)分布,簡記為X~N(μ,σ2)。X經(jīng)過標準化后為Z(=(X-μ)/s),則Z也服從正態(tài)分布,并且平均值為0,標準差為1,即Z~N(0,1)。我們稱Z服從標準正態(tài)(standardnormal)。第30頁,共58頁,2022年,5月20日,3點57分,星期五六、標準正態(tài)表z表列數(shù)字是z左邊的面積z=-0.44z左邊的面積為0.33-0.440.33第31頁,共58頁,2022年,5月20日,3點57分,星期五z表列數(shù)字是z左邊的面積z=0.44z左邊的面積為0.67六、標準正態(tài)表第32頁,共58頁,2022年,5月20日,3點57分,星期五七、雙側(cè)臨界值在標準正態(tài)曲線圖下,右方與左方的面積和為a,則稱為標準正態(tài)分布概率為a

的雙側(cè)臨界值??刹楸?。m=0面積為a/2面積為a/2第33頁,共58頁,2022年,5月20日,3點57分,星期五八、單側(cè)臨界值在標準正態(tài)曲線圖下,右方的面積為a,則稱為標準正態(tài)分布概率為a

的單側(cè)臨界值。可查表。m=0面積為a第34頁,共58頁,2022年,5月20日,3點57分,星期五

[例2]假定y是一隨機變數(shù)具有正態(tài)分布,平均數(shù)

=30,標準差=5,試計算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。首先計算:先將x轉(zhuǎn)換為u值

九、計算第35頁,共58頁,2022年,5月20日,3點57分,星期五同理可得:

FN(40)=0.9773

所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654

P(x>40)=1-P(x≤40)=1-0.9773=0.0227

查附表,當u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,x≤26概率為0.2119.九、計算第36頁,共58頁,2022年,5月20日,3點57分,星期五[例3]在應用正態(tài)分布時,經(jīng)常要討論隨機變數(shù)x離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計算離均差絕對值等于小于和等于大于1

的概率為:也可以簡寫為

九、計算第37頁,共58頁,2022年,5月20日,3點57分,星期五

相應地,離均差絕對值等于小于2

、等于大于2

、等于小于3

和等于大于3

的概率值為:九、計算第38頁,共58頁,2022年,5月20日,3點57分,星期五[例4]計算正態(tài)分布曲線的中間概率為0.99時,其y或u值應等于多少?

因為正態(tài)分布是對稱的,故在曲線左邊從-∞到-

u的概率和在曲線右邊從u到∞的概率都應等于1/2(1-0.99)=0.005。查表,u=-2.58時,fN(x)

=0.00494≈0.005。于是知,當±2.58時,在其范圍內(nèi)包括99%的變量,僅有1%變量在此范圍之外。上述結(jié)果寫作:九、計算第39頁,共58頁,2022年,5月20日,3點57分,星期五同理可求得:九、計算第40頁,共58頁,2022年,5月20日,3點57分,星期五同理,亦可寫成:

以上

乃正態(tài)曲線下左邊一尾x從-∞到

上的面積和右邊一尾y從到∞上的面積之和,亦可寫成:九、計算第41頁,共58頁,2022年,5月20日,3點57分,星期五Section3.4

SamplingDistributions

抽樣分布第42頁,共58頁,2022年,5月20日,3點57分,星期五一、總體與樣本

populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分研究對象

第43頁,共58頁,2022年,5月20日,3點57分,星期五二、總體容量與樣本容量populationsizeandsamplesize總體容量(N):總體中所包含的個體數(shù)目。根據(jù)N大小,總體分有限總體和無限總體樣本(n):從總體中隨機抽取的部分研究對象

第44頁,共58頁,2022年,5月20日,3點57分,星期五三、隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到)。第45頁,共58頁,2022年,5月20日,3點57分,星期五四、參數(shù)與統(tǒng)計量parameterandstatistic參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、標準差,采用希臘字母分別記為μ、σ。固定的常數(shù)

總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

推斷inference統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用英文字母分別記為。參數(shù)附近波動的隨機變量。第46頁,共58頁,2022年,5月20日,3點57分,星期五五、總體均值、方差與標準差總體均值總體方差總體標準差第47頁,共58頁,2022年,5月20日,3點57分,星期五六、樣本均值、方差與標準差總體均值總體方差總體標準差第48頁,共58頁,2022年,5月20日,3點57分,星期五七、樣本的概率分布統(tǒng)計量(為樣本的函數(shù)),亦為隨機變量,其概率分布稱為抽樣分布(samplingdistribution)。一般統(tǒng)計量的抽樣分布,則多根據(jù)重復抽樣(實驗)結(jié)果來了解其概率分布。的抽樣分布大數(shù)法則,中心極限定理第49頁,共58頁,2022年,5月20日,3點57分,星期五八、大數(shù)法則由具有有限(finite)平均數(shù)m

的總體隨機抽樣,隨著樣本容量的增加,樣本平均數(shù)越接近總體的均數(shù)m。樣本平均數(shù)的這種行為稱為大數(shù)法則(lawoflargenumbers)。第50頁,共58頁,2022年,5月20日,3點57分,星期五以代表樣本容量為n的資料平均數(shù),逐漸增加樣本容量,將n及對應的圖示如后。八、大數(shù)法則第51頁,共58頁,2022年,5月20日,3點57分,星期五Numberofobservations,n前n個樣本的均數(shù)2223242526272829303132331510501005001000500010000八、大數(shù)法則第52頁,共58頁,2022年,5月20日,3點57分,星期五九、樣本平均數(shù)的均數(shù)與標準差令為樣本容量為n的一組SRS的平均數(shù),其總體平均數(shù)為m

與標準差為s。則的分布平均數(shù)為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論