版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
觀測數(shù)據(jù)的分析與處理
隨機變量及其分布:概率密度和分布函數(shù)
[例]設(shè)某工廠產(chǎn)品中成分A的含量受不可控的隨機因素影響而有波動。工廠每2小時測量一次A的百分含量,記為x。下表是一個時間段的數(shù)據(jù)。日期產(chǎn)品中成分A的百分含量數(shù)據(jù)11.401.281.361.381.441.401.341.541.441.461.801.4421.461.501.581.541.501.481.521.581.521.461.421.5831.701.621.581.621.761.681.681.661.621.721.601.6241.461.381.421.381.601.441.461.281.341.381.241.3651.581.381.341.281.181.081.361.501.461.281.181.28重點:介紹有關(guān)隨機變量和概率分布的基本概念,討論各種常見的有實用價值的分布函數(shù)。
觀測數(shù)據(jù)的分析與處理
隨機變量及其分布:概率密度和分布函數(shù)1級寬或段寬(將隨機變量x的整個取值范圍分成有限個區(qū)段,每個級段的取值范圍即為級寬或段寬)級頻數(shù)(每個級段中數(shù)據(jù)值出現(xiàn)的次數(shù))相對頻數(shù)或頻率(將級頻數(shù)被樣本中數(shù)據(jù)總個數(shù)相除,相當(dāng)于x取值在該級段的概率。)隨機變量及其分布:
概率密度和分布函數(shù)
級寬或段寬隨機變量及其分布:
概2將上表數(shù)據(jù)從到取級寬0.1分為9級將上表數(shù)據(jù)從到取級寬0.1分為9級3分級頻數(shù)分布圖
分級頻數(shù)分布圖4概率密度
為了使分布圖有更好的泛化可以性,將相對頻數(shù)除以級寬,得到概率密度:級寬取微量:概率密度p對x的曲線稱為概率密度分布曲線,簡稱概率分布曲線、分布曲線等。概率密度為了使分布圖有更好的泛化可以性,將相對頻數(shù)除以級寬5隨機變量及其分布:
概率分布的數(shù)字特征不同性質(zhì)事物對象具有各種不同形狀的分布,為了定量地區(qū)別各種分布的特征,通常采用的一組判別指標(biāo),稱為分布的數(shù)字特征。[1]算術(shù)平均值總體:樣本:一階原點矩(隨機變量取值可能性最大的位置)一階原點矩的樣本估計值隨機變量及其分布:
概率分布6隨機變量及其分布:
概率分布的數(shù)字特征[2]方差總體:樣本:二階中心矩(隨機變量的變異程度)二階中心矩的樣本估計值隨機變量及其分布:
概率分布7隨機變量及其分布:
概率分布的數(shù)字特征[3]偏斜度總體:樣本:三階中心矩和二階中心矩的3/2次冪的商
(曲線偏離對稱的程度)樣本估計值隨機變量及其分布:
概率分布8概率密度和分布函數(shù)課件9隨機變量及其分布:
概率分布的數(shù)字特征[4]峭度或峰態(tài)總體:樣本:四階中心矩和二階中心矩平方的商
(一階原點矩附近的斜率,和偏離后斜率的變化率)樣本估計值隨機變量及其分布:
概率分布10概率密度和分布函數(shù)課件11隨機變量及其分布:
離散型隨機變量的概率分布客觀世界很多隨機過程經(jīng)分析后可以用某種數(shù)學(xué)模型表示。不同的物質(zhì)現(xiàn)象有可能用類似的模型描述。重點:介紹若干重要的隨機分布模型。 離散均勻分布 二項分布 多項分布 負二項分布 幾何分布 超幾何分布 擴充幾何分布 泊桑分布隨機變量及其分布:
離散型隨機變量的概率12離散均勻分布分布模型條件:(1)每次試驗可以有k種結(jié)果:(2)每種結(jié)果出現(xiàn)的概率均相等。
數(shù)學(xué)模型:
均勻分布的數(shù)字特征:離散均勻分布分布模型條件:13二項分布
分布模型條件:(1)設(shè)試驗系由n次觀測組成。(2)每次觀測只有“是”和“非”兩種可能的結(jié)果出現(xiàn)。(3)觀測結(jié)果中出現(xiàn)“是”的概率為常數(shù)p,而出現(xiàn)“非”的概率為q=1-p。(4)每一次觀測均為獨立的,即每次觀測的結(jié)果不受其它任何一次觀測的影響。
二項分布分布模型條件:14二項分布
在n次觀測中“是”出現(xiàn)x次的概率呈二項分布,模型:C(n|x)表示組合數(shù),即從n個事物中拿出x個的方法數(shù).
二項分布在n次觀測中“是”出現(xiàn)x次的概率呈二項分布,模型:15二項分布
二項分布的數(shù)字特征:總體平均值對的方差總體的方差為其中可以是0或1,表示“非”或“是”。二項分布二項分布的數(shù)字特征:其中可以是0或1,16二項分布
[例]
已知某廠生產(chǎn)某A產(chǎn)品的合格率75%,現(xiàn)進行一試驗,隨機地檢查3個產(chǎn)品,看它是否合格。定義不合格產(chǎn)品為“是”,則試驗結(jié)果為“是”的次數(shù)x作為隨機變量,可?。?,1,2,3中一個值。
二項分布[例]已知某廠生產(chǎn)某A產(chǎn)品的合格率75%,現(xiàn)進行17多項分布
分布模型條件(二項分布的一種擴充模型):(1)每次觀測可以有k種可能的結(jié)果出現(xiàn):,而各種結(jié)果都相互排斥。(2)各種結(jié)果出現(xiàn)的概率分別為常數(shù):。(3)每一次觀測均為獨立,即每次觀測的結(jié)果不受其他任何一次觀測的影響。多項分布分布模型條件(二項分布的一種擴充模型):18多項分布
則n次試驗的結(jié)果,出現(xiàn):次,次,…,次的概率系多項分布,表示為:多項分布則n次試驗的結(jié)果,出現(xiàn):次,次19負二項分布
分布模型條件:(條件與二項試驗相仿,考慮問題的角度相反)(1)由多次獨立觀測構(gòu)成的試驗。(2)每次觀測只有“是”和“非”兩種可能的結(jié)果出現(xiàn)。(3)結(jié)果為“是”的概率為常數(shù)p。得到k次“是”所需的觀測次數(shù)x的概率系負二項分布:負二項分布分布模型條件:20負二項分布
[例]由統(tǒng)計知道某藥劑的有效率為60%,將該藥劑用于一組病人。當(dāng)用到第7名病人時,累計有效的病人數(shù)增加到5名的概率為多少?解:除了最后一次按題意必須成功之外,其余(7-1)次中有(5-1)次成功的方式共有種,因此,滿足要求的概率為:
負二項分布[例]由統(tǒng)計知道某藥劑的有效率為60%,將該藥21負二項分布
負二項分布的數(shù)字特征為:負二項分布負二項分布的數(shù)字特征為:22幾何分布
這是負二項分布當(dāng)時的一個特例,即:得到第一次“是”所需要的試驗次數(shù)為x時的概率。設(shè),出現(xiàn)“是”的概率為p,幾何分布的模型描述為:幾何分布的數(shù)字特征為:
幾何分布這是負二項分布當(dāng)時的一個特例,23幾何分布
[例]由統(tǒng)計結(jié)果已知某生產(chǎn)過程平均每100件產(chǎn)品中有1件廢品。隨機檢查到第5件產(chǎn)品,發(fā)現(xiàn)廢品的概率為多少?解:這是幾何分布,,則幾何分布[例]由統(tǒng)計結(jié)果已知某生產(chǎn)過程平均每100件產(chǎn)品24超幾何分布
是二項分布的一種變型,其條件為:(1)對象為有限的N個物體,其中k件為“是”,N-k為“非”。(2)從N個物件中,隨機地逐個取出n件,且每次取出后沒有替換。則在n件中出現(xiàn)“是”的次數(shù)x系超幾何分布,其模型描述為:超幾何分布是二項分布的一種變型,其條件為:25超幾何分布
[例]
某車間生產(chǎn)的元件按40個裝箱后進行質(zhì)量檢驗,其步驟為:從每箱隨機檢查5個元件,若出現(xiàn)二等品,則把該箱退回車間返裝?,F(xiàn)若車間采取每40個元件中允許有3個二等品的質(zhì)量控制標(biāo)準(zhǔn),則返裝的概率p為多少?解:用超幾何分布模型計算:超幾何分布[例]某車間生產(chǎn)的元件按40個裝箱后進行質(zhì)量檢26超幾何分布
超幾何分布的數(shù)字特征:
超幾何分布超幾何分布的數(shù)字特征:27擴充幾何分布
將超幾何分布擴充到以下條件:(1)全體為有限的N個物體,可分為m類:,它們在N中分別含件。(2)從N物件中,隨機地逐個取出n件,且每次取出后不再替換,則得到個類,個類,…,個類物件的概率為擴充超幾何分布,其模型為:
擴充幾何分布將超幾何分布擴充到以下條件:28泊桑分布這是一種常見的重要離散分布,其條件是:(1)已知某種事件在一定時間區(qū)段內(nèi)出現(xiàn)的平均次數(shù)為。(2)這種事件可能出現(xiàn)的次數(shù)遠大于。(3)該事件每次出現(xiàn)均為獨立。(4)該事件出現(xiàn)的次數(shù)僅與時間區(qū)段長度有關(guān),而與區(qū)段外這種事件出現(xiàn)的次數(shù)無關(guān)。
則在某個給定的時間區(qū)段內(nèi),該事件出現(xiàn)x次的概率為泊桑分布,其模型描述為:
泊桑分布這是一種常見的重要離散分布,其條件是:29[例]1910年Rutherford和Geiger在鏷放射源前的小屏幕上記錄粒子每分鐘撞擊次數(shù)x的頻數(shù)列于下表。每分鐘撞擊次數(shù)觀測到的頻數(shù)撞擊次數(shù)按泊桑分布計算的頻數(shù)057054120320321123837664073525157552645352128508540820403946273163825471399731408453606892724329101010011116666總計2608100922608[例]1910年Rutherford和Geiger在鏷放射30[例]1910年Rutherford和Geiger在鏷放射源前的小屏幕上記錄粒子每分鐘撞擊次數(shù)x的頻數(shù)列于下表。解:考慮到不太長的時期內(nèi),粒子放出的平均次數(shù)為常數(shù),每個粒子的放出可認為獨立,且放出次數(shù)只與時間有關(guān),故可假設(shè)符合泊桑分布。首先計算粒子放出的平均次數(shù):則泊桑分布模型:計算不同值時的頻數(shù)列于表,可見與實際觀測值非常接近。[例]1910年Rutherford和Geiger在鏷放射31泊桑分布泊桑分布的數(shù)字特征:泊桑分布泊桑分布的數(shù)字特征:32泊桑分布與二項分布之間的關(guān)系由二項分布的數(shù)字特征得:由二項分布模型得:
泊桑分布與二項分布之間的關(guān)系由二項分布的數(shù)字特征得:33泊桑分布與二項分布之間的關(guān)系當(dāng)時,上式有又因為:所以得:但是只有當(dāng)時,才為有限值,所以應(yīng)寫為:泊桑分布與二項分布之間的關(guān)系當(dāng)34幾種離散分布模型之間的關(guān)系幾種離散分布模型之間的關(guān)系35隨機變量及其分布:
連續(xù)型隨機變量的概率分布當(dāng)隨機變量可以在數(shù)軸的一個連續(xù)區(qū)段內(nèi)取任意值,則需要用連續(xù)型概率分布模型。重點:介紹連續(xù)型隨機變量若干重要的分布模型。 連續(xù)均勻分布 指數(shù)分布 Gamma分布 Beta分布 Weibull分布 Chi平方分布隨機變量及其分布:
連續(xù)型隨機變量的概率36連續(xù)均勻分布(矩形分布)特點:在一定范圍內(nèi)(從上限a到下限b),事件出現(xiàn)的概率密度q為常數(shù),而在該范圍之外為0。概率密度的數(shù)學(xué)模型:連續(xù)均勻分布(矩形分布)特點:在一定范圍內(nèi)(從上限a到下限b37連續(xù)均勻分布(矩形分布)對x積分后得到分布函數(shù)Q:連續(xù)均勻分布(矩形分布)對x積分后得到分布函數(shù)Q:38連續(xù)均勻分布(矩形分布)矩形分布的數(shù)字特征:連續(xù)均勻分布(矩形分布)矩形分布的數(shù)字特征:39指數(shù)分布適用于描述出現(xiàn)某事件所需等待時間的概率分布。(例如設(shè)備從開始運行到出現(xiàn)故障的延續(xù)時間。)數(shù)學(xué)形式可在以下假設(shè)條件下引出:(1)在任一時間段內(nèi),事件發(fā)生的概率僅與時間段的長度有關(guān),而與時間的起點或終點無關(guān)。(2)在一小段時間內(nèi),事件發(fā)生的概率近似地正比于時間段長,即。(3)在不相重疊的各時間段內(nèi),事件的發(fā)生是獨立的。
指數(shù)分布適用于描述出現(xiàn)某事件所需等待時間的概率分布。40指數(shù)分布將不發(fā)生事件的時間段(0,x)分成n等份:各時間段內(nèi)事件系獨立發(fā)生,又令p為不發(fā)生事件的概率:t為發(fā)生事件的時刻根據(jù)條件(1)和(2):為發(fā)生事件的概率指數(shù)分布將不發(fā)生事件的時間段(0,x)分成n等份:各時間段41指數(shù)分布因此,在時發(fā)生事件的概率為:這是分布函數(shù),相應(yīng)的密度函數(shù)為分布函數(shù)的導(dǎo)數(shù):其中為壽命參數(shù)。(這是和離散型的幾何分布相對應(yīng)的一種連續(xù)分布模型。它在設(shè)備和元件的壽命問題中有廣泛的應(yīng)用,實際上是可靠性研究領(lǐng)域中的一種標(biāo)準(zhǔn)分布。)指數(shù)分布因此,在時發(fā)生事件的概率為:42指數(shù)分布當(dāng)時,指數(shù)分布的密度函數(shù)當(dāng)時,指數(shù)分布的分布函數(shù)指數(shù)分布當(dāng)時,指數(shù)分布的密度函數(shù)當(dāng)43指數(shù)分布指數(shù)分布的數(shù)字特征為:指數(shù)分布指數(shù)分布的數(shù)字特征為:44指數(shù)分布[例]某設(shè)備采用一元件,它的故障時間T遵循指數(shù)分布,并已測得參數(shù)為。現(xiàn)將該種元件分別用于5臺設(shè)備中,試問:8年以后,至少還有2個該種元件仍在工作著的概率為多少?解:根據(jù)指數(shù)分布,8年后該元件仍在工作著的概率為:令x表示8年后仍在工作著的元件數(shù),由于這是離散性問題,所以采用二項分布:指數(shù)分布[例]某設(shè)備采用一元件,它的故障時間T遵循指數(shù)分布45Gamma分布(第三類Pearson分布)設(shè)在時間區(qū)段內(nèi),事件的平均出現(xiàn)率為每單位時間次。Gamma分布系用來描述出現(xiàn)r次事件所需要的時間長度x的概率分布。數(shù)學(xué)模型:[1]將時間區(qū)段離散化,把它等分為n個子區(qū)段,長度均為T/n。取n足夠大,使每個區(qū)段出現(xiàn)1次以上事件的概率可以忽略不計。又設(shè)各子區(qū)段中事件的出現(xiàn)均為獨立。因此,在任一子區(qū)段出現(xiàn)一個事件的概率為:[2]出現(xiàn)r次事件所需要的時間區(qū)段個數(shù)k的概率可以用負二項分布描述為:Gamma分布(第三類Pearson分布)設(shè)在時間區(qū)段46數(shù)學(xué)模型:[3]得到x的密度函數(shù)為:數(shù)學(xué)模型:[3]得到x的密度函數(shù)為:47Gamma分布考慮Gamma函數(shù):當(dāng)r為非負整數(shù)時出現(xiàn)每次事件平均所需時間單參數(shù)Gamma分布Gamma分布考慮Gamma函數(shù):出現(xiàn)每次事件平均所需時間48Gamma分布二參數(shù)Gamma分布的數(shù)字特征為:Gamma分布二參數(shù)Gamma分布的數(shù)字特征為:49單參數(shù)Gamma分布當(dāng)r=1時,單參數(shù)Gamma分布就是的指數(shù)分布。
設(shè)有r個獨立的隨機變量都符合的指數(shù)分布,定義另一隨機變量:則y將符合單參數(shù)Gamma分布。單參數(shù)Gamma分布當(dāng)r=1時,單參數(shù)Gamma分布就是50Beta分布(第一類Pearson分布)最簡單的二參數(shù)形式的密度函數(shù)為(r和s是二參數(shù)):二參數(shù)Beta分布的數(shù)字特征:Beta分布(第一類Pearson分布)最簡單的二參數(shù)形式51Weibull分布最常用的是它最簡單的二參數(shù)形式密度函數(shù):k為標(biāo)度參數(shù),s為形狀參數(shù)。二參數(shù)Weibull分布的數(shù)字特征為:廣泛應(yīng)用于壽命檢驗,可靠性研究等方面的模型。Weibull分布最常用的是它最簡單的二參數(shù)形式密度函數(shù):廣52單參數(shù)Weibull分布的密度函數(shù)單參數(shù)Weibull分布的密度函數(shù)53Chi分布Gamma分布的另一種特殊情況是當(dāng):時稱為Chi平方分布。它是假設(shè)檢驗的重要工具,其密度函數(shù)為:稱為自由度(它的含義將在以后章節(jié)中介紹)。Chi平方分布的數(shù)字特征為:Chi分布Gamma分布的另一種特殊情況是當(dāng):54幾種分布之間的關(guān)系幾種分布之間的關(guān)系55幾種連續(xù)和離散分布之間的關(guān)系
離散對象連續(xù)對象單次事件幾何分布出現(xiàn)一次事件需要測試的次數(shù)指數(shù)分布出現(xiàn)一次事件需要延續(xù)的時間長度多次事件負二項分布出現(xiàn)k次事件需要測試的次數(shù)xGamma分布出現(xiàn)r次事件需要延續(xù)的時間長度x幾種連續(xù)和離散分布之間的關(guān)系
離散對象連續(xù)對象單次事件幾何分56隨機變量及其分布:
正態(tài)分布這是連續(xù)型隨機變量的一種最常見分布模型。在很多實際情況下可以用它描述或近似地描述隨機變量的分布。當(dāng)觀測數(shù)據(jù)中包含的誤差純屬隨機性,則這種隨機變量的概率密度函數(shù)一般可用正態(tài)分布模型描述。隨機誤差的特點:(1)大小相等而符號相反的誤差出現(xiàn)的概率密度相同。(2)概率密度隨誤差的絕對值增大而單調(diào)下降。(3)絕對值很大的誤差出現(xiàn)的概率密度趨于零。隨機變量及其分布:
57正態(tài)分布正態(tài)分布的密度函數(shù)為:(精確度指數(shù))
和分別表示觀測數(shù)據(jù)總體平均值和標(biāo)準(zhǔn)差。正態(tài)分布密度函數(shù)曲線的位置和形狀決定于和兩個參數(shù),可以簡單地表示為:正態(tài)分布正態(tài)分布的密度函數(shù)為:58正態(tài)分布曲線正態(tài)分布曲線59正態(tài)分布根據(jù)誤差定義只包含隨機因素影響的觀測數(shù)據(jù),為隨機誤差。得:這就是隨機誤差的概率密度函數(shù),或稱隨機誤差的正態(tài)分布。因為它們的形狀只決定于單個參數(shù),所以表示為:又稱其為Gauss誤差分布概率方程。正態(tài)分布根據(jù)誤差定義60隨機誤差的正態(tài)分布隨機誤差的正態(tài)分布61標(biāo)準(zhǔn)正態(tài)分布引入一個新的隨機變量:得:標(biāo)準(zhǔn)正態(tài)分布引入一個新的隨機變量:62(1)時,,為概率密度最大位置。(2)從正負兩方面離開0后,概率密度的值都下降。(3)密度曲線對垂直線對稱,。(4)在和處各有一個變凹點。(5)在和之間,密度曲線下的面積表示取值在區(qū)間的概率,即:(6)從到,曲線下的面積為1.0。(7)正態(tài)分布的數(shù)字特征為:(8)規(guī)則:標(biāo)準(zhǔn)正態(tài)分布有下列性質(zhì)(1)時,63設(shè)為n個具有正態(tài)分布的隨機變量,它們的總體平均值和方差分別為:和則由線性組合而構(gòu)成的隨機變量也將具有正態(tài)分布。且它的總體平均值為:方差為:正態(tài)分布的重現(xiàn)性??梢宰C明:泊桑分布和Chi平方分布也具有重現(xiàn)性。重要特性設(shè)為n個具有正態(tài)64正態(tài)分布和其他分布的關(guān)系對于具有二項分布的隨機變量x,當(dāng)時,它經(jīng)變換后的變量:將遵循標(biāo)準(zhǔn)正態(tài)分布,即。對于Gamma分布,在r值逐漸增大后,將趨于正態(tài)分布。例如,設(shè),則Gamma分布的數(shù)字特征:和正態(tài)分布的數(shù)字特征已非常接近。正態(tài)分布和其他分布的關(guān)系對于具有65正態(tài)分布判斷過程測量變量:(1)平均值附近出現(xiàn)的概率最大。(2)離平均值正負兩方面偏差出現(xiàn)的概率差不多。(3)很大的偏差出現(xiàn)的概率很小。如果:則可以滿意地用正態(tài)分布。正態(tài)分布判斷過程測量變量:66對數(shù)正態(tài)分布對數(shù)正態(tài)分布是描述不對稱分布最重要的一種模型:對數(shù)正態(tài)分布的數(shù)字特征:若x為具有對數(shù)正態(tài)分布的隨機變量,則將是一個具有正態(tài)分布的隨機變量。對數(shù)正態(tài)分布對數(shù)正態(tài)分布是描述不對稱分布最重要的一種模型:對67對數(shù)正態(tài)分布的密度函數(shù)對數(shù)正態(tài)分布的密度函數(shù)68隨機變量的函數(shù)設(shè)x和y是兩個隨機變量,它們同時取某兩個值時的概率稱為x和y的聯(lián)合概率分布函數(shù)。若x和y為離散型隨機變量,在二維空間x-y中任一區(qū)域A上取值,如果:(1)對所有的,函數(shù)值。(2)。(3)x和y在區(qū)域A上概率為:則是x和y的聯(lián)合概率密度。隨機變量的函數(shù)設(shè)x和y是兩個隨機變量,它們同時取某兩個值時的69隨機變量的函數(shù)若x和y為連續(xù)型隨機變量,在二維空間x-y中任一區(qū)間A取值,如果:(1)對所有的,函數(shù)值。(2)。(3)x和y在區(qū)域A上概率為:則是x和y的聯(lián)合概率密度。隨機變量的函數(shù)若x和y為連續(xù)型隨機變量,在二維空間x-y中任70隨機變量的函數(shù)一個或多個隨機變量的函數(shù)的概率分布:有離散型隨機變量x的概率分布為,而表示x和y之間“一對一”的函數(shù)變換關(guān)系,且為用y表示的x值。則y的概率分布為:隨機變量的函數(shù)一個或多個隨機變量的函數(shù)的概率分布:有離散型71隨機變量的函數(shù)一個或多個隨機變量的函數(shù)的概率分布:連續(xù)型隨機變量x的概率密度分布為,而表示x和y之間“一對一”的函數(shù)變換關(guān)系,且為用y表示的x值。則y取值在區(qū)間內(nèi)的概率分布為:由此可知y的概率密度函數(shù)為:隨機變量的函數(shù)一個或多個隨機變量的函數(shù)的概率分布:連續(xù)型隨72
觀測數(shù)據(jù)的分析與處理
隨機變量及其分布:概率密度和分布函數(shù)
[例]設(shè)某工廠產(chǎn)品中成分A的含量受不可控的隨機因素影響而有波動。工廠每2小時測量一次A的百分含量,記為x。下表是一個時間段的數(shù)據(jù)。日期產(chǎn)品中成分A的百分含量數(shù)據(jù)11.401.281.361.381.441.401.341.541.441.461.801.4421.461.501.581.541.501.481.521.581.521.461.421.5831.701.621.581.621.761.681.681.661.621.721.601.6241.461.381.421.381.601.441.461.281.341.381.241.3651.581.381.341.281.181.081.361.501.461.281.181.28重點:介紹有關(guān)隨機變量和概率分布的基本概念,討論各種常見的有實用價值的分布函數(shù)。
觀測數(shù)據(jù)的分析與處理
隨機變量及其分布:概率密度和分布函數(shù)73級寬或段寬(將隨機變量x的整個取值范圍分成有限個區(qū)段,每個級段的取值范圍即為級寬或段寬)級頻數(shù)(每個級段中數(shù)據(jù)值出現(xiàn)的次數(shù))相對頻數(shù)或頻率(將級頻數(shù)被樣本中數(shù)據(jù)總個數(shù)相除,相當(dāng)于x取值在該級段的概率。)隨機變量及其分布:
概率密度和分布函數(shù)
級寬或段寬隨機變量及其分布:
概74將上表數(shù)據(jù)從到取級寬0.1分為9級將上表數(shù)據(jù)從到取級寬0.1分為9級75分級頻數(shù)分布圖
分級頻數(shù)分布圖76概率密度
為了使分布圖有更好的泛化可以性,將相對頻數(shù)除以級寬,得到概率密度:級寬取微量:概率密度p對x的曲線稱為概率密度分布曲線,簡稱概率分布曲線、分布曲線等。概率密度為了使分布圖有更好的泛化可以性,將相對頻數(shù)除以級寬77隨機變量及其分布:
概率分布的數(shù)字特征不同性質(zhì)事物對象具有各種不同形狀的分布,為了定量地區(qū)別各種分布的特征,通常采用的一組判別指標(biāo),稱為分布的數(shù)字特征。[1]算術(shù)平均值總體:樣本:一階原點矩(隨機變量取值可能性最大的位置)一階原點矩的樣本估計值隨機變量及其分布:
概率分布78隨機變量及其分布:
概率分布的數(shù)字特征[2]方差總體:樣本:二階中心矩(隨機變量的變異程度)二階中心矩的樣本估計值隨機變量及其分布:
概率分布79隨機變量及其分布:
概率分布的數(shù)字特征[3]偏斜度總體:樣本:三階中心矩和二階中心矩的3/2次冪的商
(曲線偏離對稱的程度)樣本估計值隨機變量及其分布:
概率分布80概率密度和分布函數(shù)課件81隨機變量及其分布:
概率分布的數(shù)字特征[4]峭度或峰態(tài)總體:樣本:四階中心矩和二階中心矩平方的商
(一階原點矩附近的斜率,和偏離后斜率的變化率)樣本估計值隨機變量及其分布:
概率分布82概率密度和分布函數(shù)課件83隨機變量及其分布:
離散型隨機變量的概率分布客觀世界很多隨機過程經(jīng)分析后可以用某種數(shù)學(xué)模型表示。不同的物質(zhì)現(xiàn)象有可能用類似的模型描述。重點:介紹若干重要的隨機分布模型。 離散均勻分布 二項分布 多項分布 負二項分布 幾何分布 超幾何分布 擴充幾何分布 泊桑分布隨機變量及其分布:
離散型隨機變量的概率84離散均勻分布分布模型條件:(1)每次試驗可以有k種結(jié)果:(2)每種結(jié)果出現(xiàn)的概率均相等。
數(shù)學(xué)模型:
均勻分布的數(shù)字特征:離散均勻分布分布模型條件:85二項分布
分布模型條件:(1)設(shè)試驗系由n次觀測組成。(2)每次觀測只有“是”和“非”兩種可能的結(jié)果出現(xiàn)。(3)觀測結(jié)果中出現(xiàn)“是”的概率為常數(shù)p,而出現(xiàn)“非”的概率為q=1-p。(4)每一次觀測均為獨立的,即每次觀測的結(jié)果不受其它任何一次觀測的影響。
二項分布分布模型條件:86二項分布
在n次觀測中“是”出現(xiàn)x次的概率呈二項分布,模型:C(n|x)表示組合數(shù),即從n個事物中拿出x個的方法數(shù).
二項分布在n次觀測中“是”出現(xiàn)x次的概率呈二項分布,模型:87二項分布
二項分布的數(shù)字特征:總體平均值對的方差總體的方差為其中可以是0或1,表示“非”或“是”。二項分布二項分布的數(shù)字特征:其中可以是0或1,88二項分布
[例]
已知某廠生產(chǎn)某A產(chǎn)品的合格率75%,現(xiàn)進行一試驗,隨機地檢查3個產(chǎn)品,看它是否合格。定義不合格產(chǎn)品為“是”,則試驗結(jié)果為“是”的次數(shù)x作為隨機變量,可?。?,1,2,3中一個值。
二項分布[例]已知某廠生產(chǎn)某A產(chǎn)品的合格率75%,現(xiàn)進行89多項分布
分布模型條件(二項分布的一種擴充模型):(1)每次觀測可以有k種可能的結(jié)果出現(xiàn):,而各種結(jié)果都相互排斥。(2)各種結(jié)果出現(xiàn)的概率分別為常數(shù):。(3)每一次觀測均為獨立,即每次觀測的結(jié)果不受其他任何一次觀測的影響。多項分布分布模型條件(二項分布的一種擴充模型):90多項分布
則n次試驗的結(jié)果,出現(xiàn):次,次,…,次的概率系多項分布,表示為:多項分布則n次試驗的結(jié)果,出現(xiàn):次,次91負二項分布
分布模型條件:(條件與二項試驗相仿,考慮問題的角度相反)(1)由多次獨立觀測構(gòu)成的試驗。(2)每次觀測只有“是”和“非”兩種可能的結(jié)果出現(xiàn)。(3)結(jié)果為“是”的概率為常數(shù)p。得到k次“是”所需的觀測次數(shù)x的概率系負二項分布:負二項分布分布模型條件:92負二項分布
[例]由統(tǒng)計知道某藥劑的有效率為60%,將該藥劑用于一組病人。當(dāng)用到第7名病人時,累計有效的病人數(shù)增加到5名的概率為多少?解:除了最后一次按題意必須成功之外,其余(7-1)次中有(5-1)次成功的方式共有種,因此,滿足要求的概率為:
負二項分布[例]由統(tǒng)計知道某藥劑的有效率為60%,將該藥93負二項分布
負二項分布的數(shù)字特征為:負二項分布負二項分布的數(shù)字特征為:94幾何分布
這是負二項分布當(dāng)時的一個特例,即:得到第一次“是”所需要的試驗次數(shù)為x時的概率。設(shè),出現(xiàn)“是”的概率為p,幾何分布的模型描述為:幾何分布的數(shù)字特征為:
幾何分布這是負二項分布當(dāng)時的一個特例,95幾何分布
[例]由統(tǒng)計結(jié)果已知某生產(chǎn)過程平均每100件產(chǎn)品中有1件廢品。隨機檢查到第5件產(chǎn)品,發(fā)現(xiàn)廢品的概率為多少?解:這是幾何分布,,則幾何分布[例]由統(tǒng)計結(jié)果已知某生產(chǎn)過程平均每100件產(chǎn)品96超幾何分布
是二項分布的一種變型,其條件為:(1)對象為有限的N個物體,其中k件為“是”,N-k為“非”。(2)從N個物件中,隨機地逐個取出n件,且每次取出后沒有替換。則在n件中出現(xiàn)“是”的次數(shù)x系超幾何分布,其模型描述為:超幾何分布是二項分布的一種變型,其條件為:97超幾何分布
[例]
某車間生產(chǎn)的元件按40個裝箱后進行質(zhì)量檢驗,其步驟為:從每箱隨機檢查5個元件,若出現(xiàn)二等品,則把該箱退回車間返裝?,F(xiàn)若車間采取每40個元件中允許有3個二等品的質(zhì)量控制標(biāo)準(zhǔn),則返裝的概率p為多少?解:用超幾何分布模型計算:超幾何分布[例]某車間生產(chǎn)的元件按40個裝箱后進行質(zhì)量檢98超幾何分布
超幾何分布的數(shù)字特征:
超幾何分布超幾何分布的數(shù)字特征:99擴充幾何分布
將超幾何分布擴充到以下條件:(1)全體為有限的N個物體,可分為m類:,它們在N中分別含件。(2)從N物件中,隨機地逐個取出n件,且每次取出后不再替換,則得到個類,個類,…,個類物件的概率為擴充超幾何分布,其模型為:
擴充幾何分布將超幾何分布擴充到以下條件:100泊桑分布這是一種常見的重要離散分布,其條件是:(1)已知某種事件在一定時間區(qū)段內(nèi)出現(xiàn)的平均次數(shù)為。(2)這種事件可能出現(xiàn)的次數(shù)遠大于。(3)該事件每次出現(xiàn)均為獨立。(4)該事件出現(xiàn)的次數(shù)僅與時間區(qū)段長度有關(guān),而與區(qū)段外這種事件出現(xiàn)的次數(shù)無關(guān)。
則在某個給定的時間區(qū)段內(nèi),該事件出現(xiàn)x次的概率為泊桑分布,其模型描述為:
泊桑分布這是一種常見的重要離散分布,其條件是:101[例]1910年Rutherford和Geiger在鏷放射源前的小屏幕上記錄粒子每分鐘撞擊次數(shù)x的頻數(shù)列于下表。每分鐘撞擊次數(shù)觀測到的頻數(shù)撞擊次數(shù)按泊桑分布計算的頻數(shù)057054120320321123837664073525157552645352128508540820403946273163825471399731408453606892724329101010011116666總計2608100922608[例]1910年Rutherford和Geiger在鏷放射102[例]1910年Rutherford和Geiger在鏷放射源前的小屏幕上記錄粒子每分鐘撞擊次數(shù)x的頻數(shù)列于下表。解:考慮到不太長的時期內(nèi),粒子放出的平均次數(shù)為常數(shù),每個粒子的放出可認為獨立,且放出次數(shù)只與時間有關(guān),故可假設(shè)符合泊桑分布。首先計算粒子放出的平均次數(shù):則泊桑分布模型:計算不同值時的頻數(shù)列于表,可見與實際觀測值非常接近。[例]1910年Rutherford和Geiger在鏷放射103泊桑分布泊桑分布的數(shù)字特征:泊桑分布泊桑分布的數(shù)字特征:104泊桑分布與二項分布之間的關(guān)系由二項分布的數(shù)字特征得:由二項分布模型得:
泊桑分布與二項分布之間的關(guān)系由二項分布的數(shù)字特征得:105泊桑分布與二項分布之間的關(guān)系當(dāng)時,上式有又因為:所以得:但是只有當(dāng)時,才為有限值,所以應(yīng)寫為:泊桑分布與二項分布之間的關(guān)系當(dāng)106幾種離散分布模型之間的關(guān)系幾種離散分布模型之間的關(guān)系107隨機變量及其分布:
連續(xù)型隨機變量的概率分布當(dāng)隨機變量可以在數(shù)軸的一個連續(xù)區(qū)段內(nèi)取任意值,則需要用連續(xù)型概率分布模型。重點:介紹連續(xù)型隨機變量若干重要的分布模型。 連續(xù)均勻分布 指數(shù)分布 Gamma分布 Beta分布 Weibull分布 Chi平方分布隨機變量及其分布:
連續(xù)型隨機變量的概率108連續(xù)均勻分布(矩形分布)特點:在一定范圍內(nèi)(從上限a到下限b),事件出現(xiàn)的概率密度q為常數(shù),而在該范圍之外為0。概率密度的數(shù)學(xué)模型:連續(xù)均勻分布(矩形分布)特點:在一定范圍內(nèi)(從上限a到下限b109連續(xù)均勻分布(矩形分布)對x積分后得到分布函數(shù)Q:連續(xù)均勻分布(矩形分布)對x積分后得到分布函數(shù)Q:110連續(xù)均勻分布(矩形分布)矩形分布的數(shù)字特征:連續(xù)均勻分布(矩形分布)矩形分布的數(shù)字特征:111指數(shù)分布適用于描述出現(xiàn)某事件所需等待時間的概率分布。(例如設(shè)備從開始運行到出現(xiàn)故障的延續(xù)時間。)數(shù)學(xué)形式可在以下假設(shè)條件下引出:(1)在任一時間段內(nèi),事件發(fā)生的概率僅與時間段的長度有關(guān),而與時間的起點或終點無關(guān)。(2)在一小段時間內(nèi),事件發(fā)生的概率近似地正比于時間段長,即。(3)在不相重疊的各時間段內(nèi),事件的發(fā)生是獨立的。
指數(shù)分布適用于描述出現(xiàn)某事件所需等待時間的概率分布。112指數(shù)分布將不發(fā)生事件的時間段(0,x)分成n等份:各時間段內(nèi)事件系獨立發(fā)生,又令p為不發(fā)生事件的概率:t為發(fā)生事件的時刻根據(jù)條件(1)和(2):為發(fā)生事件的概率指數(shù)分布將不發(fā)生事件的時間段(0,x)分成n等份:各時間段113指數(shù)分布因此,在時發(fā)生事件的概率為:這是分布函數(shù),相應(yīng)的密度函數(shù)為分布函數(shù)的導(dǎo)數(shù):其中為壽命參數(shù)。(這是和離散型的幾何分布相對應(yīng)的一種連續(xù)分布模型。它在設(shè)備和元件的壽命問題中有廣泛的應(yīng)用,實際上是可靠性研究領(lǐng)域中的一種標(biāo)準(zhǔn)分布。)指數(shù)分布因此,在時發(fā)生事件的概率為:114指數(shù)分布當(dāng)時,指數(shù)分布的密度函數(shù)當(dāng)時,指數(shù)分布的分布函數(shù)指數(shù)分布當(dāng)時,指數(shù)分布的密度函數(shù)當(dāng)115指數(shù)分布指數(shù)分布的數(shù)字特征為:指數(shù)分布指數(shù)分布的數(shù)字特征為:116指數(shù)分布[例]某設(shè)備采用一元件,它的故障時間T遵循指數(shù)分布,并已測得參數(shù)為?,F(xiàn)將該種元件分別用于5臺設(shè)備中,試問:8年以后,至少還有2個該種元件仍在工作著的概率為多少?解:根據(jù)指數(shù)分布,8年后該元件仍在工作著的概率為:令x表示8年后仍在工作著的元件數(shù),由于這是離散性問題,所以采用二項分布:指數(shù)分布[例]某設(shè)備采用一元件,它的故障時間T遵循指數(shù)分布117Gamma分布(第三類Pearson分布)設(shè)在時間區(qū)段內(nèi),事件的平均出現(xiàn)率為每單位時間次。Gamma分布系用來描述出現(xiàn)r次事件所需要的時間長度x的概率分布。數(shù)學(xué)模型:[1]將時間區(qū)段離散化,把它等分為n個子區(qū)段,長度均為T/n。取n足夠大,使每個區(qū)段出現(xiàn)1次以上事件的概率可以忽略不計。又設(shè)各子區(qū)段中事件的出現(xiàn)均為獨立。因此,在任一子區(qū)段出現(xiàn)一個事件的概率為:[2]出現(xiàn)r次事件所需要的時間區(qū)段個數(shù)k的概率可以用負二項分布描述為:Gamma分布(第三類Pearson分布)設(shè)在時間區(qū)段118數(shù)學(xué)模型:[3]得到x的密度函數(shù)為:數(shù)學(xué)模型:[3]得到x的密度函數(shù)為:119Gamma分布考慮Gamma函數(shù):當(dāng)r為非負整數(shù)時出現(xiàn)每次事件平均所需時間單參數(shù)Gamma分布Gamma分布考慮Gamma函數(shù):出現(xiàn)每次事件平均所需時間120Gamma分布二參數(shù)Gamma分布的數(shù)字特征為:Gamma分布二參數(shù)Gamma分布的數(shù)字特征為:121單參數(shù)Gamma分布當(dāng)r=1時,單參數(shù)Gamma分布就是的指數(shù)分布。
設(shè)有r個獨立的隨機變量都符合的指數(shù)分布,定義另一隨機變量:則y將符合單參數(shù)Gamma分布。單參數(shù)Gamma分布當(dāng)r=1時,單參數(shù)Gamma分布就是122Beta分布(第一類Pearson分布)最簡單的二參數(shù)形式的密度函數(shù)為(r和s是二參數(shù)):二參數(shù)Beta分布的數(shù)字特征:Beta分布(第一類Pearson分布)最簡單的二參數(shù)形式123Weibull分布最常用的是它最簡單的二參數(shù)形式密度函數(shù):k為標(biāo)度參數(shù),s為形狀參數(shù)。二參數(shù)Weibull分布的數(shù)字特征為:廣泛應(yīng)用于壽命檢驗,可靠性研究等方面的模型。Weibull分布最常用的是它最簡單的二參數(shù)形式密度函數(shù):廣124單參數(shù)Weibull分布的密度函數(shù)單參數(shù)Weibull分布的密度函數(shù)125Chi分布Gamma分布的另一種特殊情況是當(dāng):時稱為Chi平方分布。它是假設(shè)檢驗的重要工具,其密度函數(shù)為:稱為自由度(它的含義將在以后章節(jié)中介紹)。Chi平方分布的數(shù)字特征為:Chi分布Gamma分布的另一種特殊情況是當(dāng):126幾種分布之間的關(guān)系幾種分布之間的關(guān)系127幾種連續(xù)和離散分布之間的關(guān)系
離散對象連續(xù)對象單次事件幾何分布出現(xiàn)一次事件需要測試的次數(shù)指數(shù)分布出現(xiàn)一次事件需要延續(xù)的時間長度多次事件負二項分布出現(xiàn)k次事件需要測試的次數(shù)xGamma分布出現(xiàn)r次事件需要延續(xù)的時間長度x幾種連續(xù)和離散分布之間的關(guān)系
離散對象連續(xù)對象單次事件幾何分128隨機變量及其分布:
正態(tài)分布這是連續(xù)型隨機變量的一種最常見分布模型。在很多實際情況下可以用它描述或近似地描述隨機變量的分布。當(dāng)觀測數(shù)據(jù)中包含的誤差純屬隨機性,則這種隨機變量的概率密度函數(shù)一般可用正態(tài)分布模型描述。隨機誤差的特點:(1)大小相等而符號相反的誤差出現(xiàn)的概率密度相同。(2)概率密度隨誤差的絕對值增大而單調(diào)下降。(3)絕對值很大的誤差出現(xiàn)的概率密度趨于零。隨機變量及其分布:
129正態(tài)分布正態(tài)分布的密度函數(shù)為:(精確度指數(shù))
和分別表示觀測數(shù)據(jù)總體平均值和標(biāo)準(zhǔn)差。正態(tài)分布密度函數(shù)曲線的位置和形狀決定于和兩個參數(shù),可以簡單地表示為:正態(tài)分布正態(tài)分布的密度函數(shù)為:130正態(tài)分布曲線正態(tài)分布曲線131正態(tài)分布根據(jù)誤差定義只包含隨機因素影響的觀測數(shù)據(jù),為隨機誤差。得:這就是隨機誤差的概率密度函數(shù),或稱隨機誤差的正態(tài)分布。因為它們的形狀只決定于單個參數(shù),所以表示為:又稱其為Gauss誤差分布概率方程。正態(tài)分布根據(jù)誤差定義132隨機誤差的正態(tài)分布隨機誤差的正態(tài)分布133標(biāo)準(zhǔn)正態(tài)分布引入一個新的隨機變量:得:標(biāo)準(zhǔn)正態(tài)分布引入一個新的隨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 焦作新材料職業(yè)學(xué)院《GNSS測量原理及應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北理工學(xué)院《精準(zhǔn)協(xié)作》2023-2024學(xué)年第一學(xué)期期末試卷
- 河源職業(yè)技術(shù)學(xué)院《多聲部音樂基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江藝術(shù)職業(yè)學(xué)院《建筑設(shè)計基礎(chǔ)A1》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江工商職業(yè)技術(shù)學(xué)院《工程預(yù)算課程設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 中山火炬職業(yè)技術(shù)學(xué)院《電子工藝技術(shù)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州職業(yè)技術(shù)學(xué)院《功能性食品概況》2023-2024學(xué)年第一學(xué)期期末試卷
- 小學(xué)黨員活動量化積分制度
- 長沙衛(wèi)生職業(yè)學(xué)院《民族民間音樂》2023-2024學(xué)年第一學(xué)期期末試卷
- 云南農(nóng)業(yè)職業(yè)技術(shù)學(xué)院《現(xiàn)代生物技術(shù)綜合實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 校園熱水方案
- 跟蹤服務(wù)項目活動實施方案
- 新能源汽車產(chǎn)業(yè)鏈中的區(qū)域發(fā)展不均衡分析與對策
- 財務(wù)機器人技術(shù)在會計工作中的應(yīng)用
- 《保單檢視專題》課件
- 建筑保溫隔熱構(gòu)造
- 智慧財務(wù)綜合實訓(xùn)
- 安徽省合肥市2021-2022學(xué)年七年級上學(xué)期期末數(shù)學(xué)試題(含答案)3
- 教育專家報告合集:年度得到:沈祖蕓全球教育報告(2023-2024)
- 肝臟腫瘤護理查房
- 護士工作壓力管理護理工作中的壓力應(yīng)對策略
評論
0/150
提交評論