版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
概率論與數(shù)理統(tǒng)計第1章隨機事件第2章隨機變量第3章多維隨機變量第4章隨機變量的數(shù)字特征第5章大數(shù)定律與中心極限定理第6章樣本及抽樣分布第7章參數(shù)估計第8章假設(shè)概念1.2隨機事件的概率1.31.4條件概型與乘法公式1.5全概率公式與貝葉斯公式第一章隨機事件古典概型與幾何概型獨立性隨機事件1.61.1概率論與數(shù)理統(tǒng)計是現(xiàn)代數(shù)學(xué)的一個重要分支,它是研究隨機現(xiàn)象統(tǒng)計規(guī)律的一門學(xué)科.該學(xué)科的應(yīng)用遍布各個領(lǐng)域,已成為科技工作者和經(jīng)濟管理工作者必備的數(shù)學(xué)工具.本章通過隨機試驗,介紹概率論中樣本空間、隨機事件及概率等基本概念,討論概率的性質(zhì)及計算方法,為本門課程的學(xué)習(xí)打好基礎(chǔ).章前導(dǎo)讀第一章隨機事件70%在自然界及人類社會活動中可以觀察到很多現(xiàn)象,但從其結(jié)果能否確定的角度概括起來無非兩類現(xiàn)象.一類是在一定條件下,事件未發(fā)生之前就確定出現(xiàn)什么結(jié)果的現(xiàn)象,稱為確定性現(xiàn)象或必然現(xiàn)象.例如樹上熟透了的蘋果總是落到地上,將一塊石頭向上拋必然會下落等.另一類是在一定條件下,事件未發(fā)生之前不能確定出現(xiàn)什么結(jié)果的現(xiàn)象,稱為隨機現(xiàn)象或偶然現(xiàn)象.例如從裝有不同顏色小球的黑盒子中摸球,摸出的球是什么顏色?擲一枚質(zhì)地均勻的硬幣時,是正面朝上還是反面朝上?僅就一次或少數(shù)幾次實驗而言,隨機現(xiàn)象似乎帶有偶然性或不確定性.但經(jīng)過人們長期的實踐和研究后,發(fā)現(xiàn)隨機現(xiàn)象在大量重復(fù)試驗中,它的每種可能出現(xiàn)的的結(jié)果呈現(xiàn)某種規(guī)律性,下面這個著名的例子就表明了這種規(guī)律性.例如,均勻的硬幣拋擲足夠多次數(shù),出現(xiàn)正面向上和反面向上的次數(shù)比例近似1∶1,且擲的次數(shù)越多,越接近這個比例.歷史上多位數(shù)學(xué)家作過拋擲一枚均勻硬幣的試驗(見表1-1).1.1隨機事件1.1.1隨機現(xiàn)象70%在一定條件下,隨機現(xiàn)象有多種可能的結(jié)果發(fā)生,事先不能預(yù)知將出現(xiàn)哪種結(jié)果,但通過大量的重復(fù)觀察,出現(xiàn)的結(jié)果會呈現(xiàn)出某種規(guī)律,稱為隨機現(xiàn)象的統(tǒng)計規(guī)律性.概率論與數(shù)理統(tǒng)計就是研究和揭示隨機現(xiàn)象統(tǒng)計規(guī)律性的一門數(shù)學(xué)學(xué)科.1.1隨機事件1.1.1隨機現(xiàn)象70%要想了解隨機現(xiàn)象的統(tǒng)計規(guī)律性,就必須在相同的條件下,對隨機現(xiàn)象進行觀察或者進行科學(xué)實驗,概率論和數(shù)理統(tǒng)計學(xué)中把這種觀察和科學(xué)實驗統(tǒng)稱為試驗.例如:E1:記錄某種產(chǎn)品的使用壽命;E2:記錄某位播音員在某次播音節(jié)目中發(fā)音的錯誤次數(shù);E3:觀察某一路段在一段時間內(nèi)出現(xiàn)交通事故的次數(shù);E4:記錄某一運動員在十次投籃中投中的次數(shù).上述試驗具有以下共同特征:(1)重復(fù)性.試驗可在相同條件下重復(fù)進行;(2)觀察性.試驗的可能結(jié)果不唯一,但能事先明確試驗的所有可能結(jié)果;(3)隨機性.每次試驗只會出現(xiàn)一種結(jié)果,但出現(xiàn)哪一種結(jié)果,在試驗前不能確定.1.1隨機事件1.1.2隨機試驗、樣本空間70%我們把具有上述三個特征的試驗稱為隨機試驗,簡稱試驗,記為E.本書后面所提到的試驗皆指隨機試驗.做試驗的目的在于研究試驗結(jié)果出現(xiàn)的統(tǒng)計規(guī)律性,盡管在每次試驗之前不能預(yù)知試驗的結(jié)果,但試驗的所有可能結(jié)果組成的集合是已知的.在統(tǒng)計學(xué)中,我們把隨機試驗的每一個可能結(jié)果稱為一個樣本點,記為ω.全部可能結(jié)果,即所有樣本點全體構(gòu)成的集合稱為這個隨機試驗的樣本空間,記為Ω,Ω=ω.對于一個具體的問題,確定一個相應(yīng)的樣本空間是研究隨機現(xiàn)象的第一步.由此可見,由于所考察的隨機試驗不同,因而相應(yīng)的樣本空間可能很簡單也可能很復(fù)雜.但是即使在同一隨機試驗中,由于試驗的目的不同,樣本點和樣本空間都可能不相同,例如例2和例3中同是將一枚硬幣拋兩次,但是由于試驗的目的不一樣,樣本空間就不一樣.從上面的例子還可以看出,有的樣本空間是數(shù)集,有的樣本空間不是數(shù)集,有的樣本空間是有限集,有的樣本空間是無限集.1.1隨機事件1.1.2隨機試驗、樣本空間70%1.隨機事件的概念隨機試驗E的樣本空間Ω的子集,稱為隨機事件,簡稱為事件,通常用大寫字母A,B,C等表示,也可以用語言描述加花括號表示.例如E2中,{出錯次數(shù)不超過兩次}就是一個隨機事件.在每次試驗中,當且僅當這一子集A中的一個樣本點出現(xiàn)時,稱事件A發(fā)生,否則稱事件A沒有發(fā)生.例如拋擲一顆質(zhì)地均勻的骰子,若用A表示{出現(xiàn)奇數(shù)點},則A={1,3,5},這是一個隨機事件,它在一次試驗中可能發(fā)生,也可能不發(fā)生.當且僅當擲出的點數(shù)是1,3,5中的任意一個數(shù)時,A事件發(fā)生.下面介紹幾個特殊的隨機事件.基本事件由一個樣本點構(gòu)成的事件稱為基本事件,記為{ωi}.如例1中的試驗有兩個基本事件:{H},{T}.必然事件每次試驗中都必然發(fā)生的事件稱為必然事件.樣本空間Ω包含所有的樣本點,它是Ω自身的子集,每次試驗中都必然發(fā)生,故它就是一個必然事件,因而必然事件也用Ω來表示.不可能事件每次試驗中都不可能發(fā)生的事件稱為不可能事件.空集?不包含任何樣本點,它作為樣本空間的子集,在每次試驗中都不可能發(fā)生,故?就是一個不可能事件.因而不可能事件也用?來表示.1.1隨機事件1.1.3隨機事件的概念、關(guān)系與運算70%嚴格說來必然事件和不可能事件不具有隨機性,但是,為了使隨機事件的集合更完善,我們規(guī)定必然事件和不可能事件也是隨機事件.2.隨機事件間的關(guān)系在研究隨機現(xiàn)象時,我們看到,同一個試驗下可以有很多隨機事件,其中有些隨機事件比較簡單,有些隨機事件則比較復(fù)雜.為了從較簡單事件發(fā)生的規(guī)律來尋求較復(fù)雜事件發(fā)生的規(guī)律,我們需要研究同一試驗下各種事件間的關(guān)系和運算.1.1隨機事件1.1.3隨機事件的概念、關(guān)系與運算3.隨機事件間的運算設(shè)Ω是給定試驗的樣本空間,)都是事件A,B,C,Ak(k=1,2,…Ω的子集(1)和事件(2)積事件(3)差事件(4)逆事件(5)完備事件組1.1隨機事件1.1.3隨機事件的概念、關(guān)系與運算70%4.隨機事件的運算律與集合的運算相似!可以驗證事件間的運算滿足如下運算規(guī)律'1.1隨機事件1.1.3隨機事件的概念、關(guān)系與運算上述各運算律可以推廣到有限個或可數(shù)個事件的情形!70%1.概率的描述定義對于隨機試驗,僅僅了解樣本空間是不夠的,我們更關(guān)心某些結(jié)果出現(xiàn)的可能性大小,希望對這種可能性大小進行定量描述,進而找出這些事件內(nèi)在的統(tǒng)計規(guī)律.定義1隨機事件A發(fā)生的可能性大小,稱為事件A發(fā)生的概率,記為P(A).顯然,P(?)=0,P(Ω)=1,0≤P(A)≤1.但定義1沒有給出P(A)的具體數(shù)值.2.概率的統(tǒng)計定義在相同條件下將試驗重復(fù)進行n次,在n次重復(fù)試驗中,隨機事件A發(fā)生的次數(shù)記為rn(A),則事件A發(fā)生的頻率隨機事件在一次試驗中是否發(fā)生不確定,但在大量重復(fù)試驗中它的發(fā)生具有統(tǒng)計規(guī)律性.由表1-1可看出,在大量重復(fù)試驗中,某個事件A發(fā)生的頻率是穩(wěn)定的,其數(shù)值在某個確定的常數(shù)附近擺動.隨著重復(fù)試驗的次數(shù)n的增加,事件A發(fā)生的頻率越來越趨近于這個確定的常數(shù).隨機事件A發(fā)生的可能性大小就是這個頻率的穩(wěn)定中心.1.2隨機事件的概率1.2.1概率的定義70%定義2在相同條件下重復(fù)進行n次試驗,若當試驗的重復(fù)次數(shù)充分多時,事件A發(fā)生的頻率fn(A)穩(wěn)定地在某常數(shù)p附近波動,并隨著試驗次數(shù)的增大逐漸穩(wěn)定于p,則稱常數(shù)p為事件A的概率,記為P(A).概率的統(tǒng)計定義不能確定試驗次數(shù)為多少時,我們才能得到概率的數(shù)值,且有些試驗不能大量進行,但可用試驗次數(shù)n較大時的頻率作為概率的估計值.頻率具有下列性質(zhì):概率是頻率的穩(wěn)定中心,頻率滿足的性質(zhì)概率也應(yīng)該滿足.1.2隨機事件的概率1.2.1概率的定義70%3.概率的公理化定義定義3設(shè)Ω是隨機試驗E的樣本空間,若對于E的每一個隨機事件A,都有一個實數(shù)P(A)與A對應(yīng),且滿足以下三條公理.1.2隨機事件的概率1.2.1概率的定義70%1.2隨機事件的概率1.2.2概率的性質(zhì)利用公理化定義中的三條公理!我們可以推導(dǎo)出概率的幾個重要性質(zhì)!1.2隨機事件的概率1.2.2概率的性質(zhì)這是互斥事件的加法公式.性質(zhì)3:對任一事件A,有70%1.3古典概型與幾何概型1.3.1古典概型(1)每次試驗中,可能發(fā)生的結(jié)果只有有限個,即(2)每次試驗中!每一種結(jié)果發(fā)生的可能性相同,即顯然,由上式定義的概率滿足概率的公理化定義及其導(dǎo)出的基本性質(zhì).70%顯然,由上式定義的概率滿足概率的公理化定義及其導(dǎo)出的基本性質(zhì).在計算古典概率下的事件概率時,首先要利用排列、組合及乘法原理、加法原理的知識確定樣本空間的基本事件總數(shù),然后在樣本空間中找尋事件A包含的基本事件數(shù),進而求得相應(yīng)的概率.排列,組合的基本概念(1)加法原理(2)乘法原理(3)排列(4)組合1.3古典概型與幾何概型1.3.1古典概型70%條件概率是一個重要的概念,它是在已知事件A發(fā)生的條件下事件B發(fā)生可能性大小的客觀度量,記為P(BA).由于諸事件之間往往有一定聯(lián)系,因而事件A發(fā)生以后,事件B發(fā)生的概率可能會發(fā)生變化1.4條件概型與乘法公式1.4.1條件概率70%1.4條件概型與乘法公式1.4.2乘法公式由條件概率的定義,我們可以得到下面的定理:定理1設(shè)有隨機事件A和B,若P(A)>0,則70%對于一些簡單的事件,我們可以利用概率性質(zhì)及公式計算其概率.對于較復(fù)雜事件的概率,在計算中往往把它分解為若干個互斥的較簡單事件之和.先求出這些較簡單事件的概率,再利用概率的有限可加性及乘法公式得到所求事件的概率,這就是全概率公式的思想.1.5全概率公式與貝葉斯公式1.5.1全概率公式70%1.5全概率公式與貝葉斯公式1.5.2貝葉斯公式理論和實際中經(jīng)常見到這樣一類問題:某復(fù)雜事件B已發(fā)生,且是由若干“原因”事件Ai,i=1,2,…,n引起的.若已知各種“原因”事件發(fā)生的概率P(Ai),求其中某個“原因”發(fā)生的條件概率P(Ai︱B)是多少?解決這一問題的公式就是下面介紹的另一重要公式——貝葉斯公式.事件B的發(fā)生受多個兩兩互斥“原因”事件A1,A2,…,An的影響,用全概率公式計算P(B);若事件B已經(jīng)發(fā)生,已知P(Ai),P(B︱Ai),i=1,2,…,n,計算事件B由“原因”事件Aj引起的可能性,用貝葉斯公式.70%條件概率反映某個事件B發(fā)生對另一個事件A發(fā)生的概率有影響.一般情況下,PAB≠PA定義5設(shè)同一樣本空間中的任意兩個事件A,B,若PAB=PAPB,則稱事件A與事件B相互獨立.1.6獨立性1.6.1獨立性70%從事件的獨立性,我們聯(lián)系到試驗的獨立性.試驗E1與試驗E2是獨立的,直觀解釋是試驗E1的結(jié)果的發(fā)生與試驗E2的結(jié)果的發(fā)生是獨立的.進行n次試驗,如果任何一次試驗中各結(jié)果發(fā)生的概率都不受其他各次試驗結(jié)果發(fā)生與否的影響,則稱這n次試驗是相互獨立的.在商品質(zhì)量抽樣檢查中是抽到正品還是次品;在擲硬幣時是出現(xiàn)正面還是反面,籃球比賽中某隊是贏還是輸,這些結(jié)果是人們感興趣的.在這類問題中,試驗的可能結(jié)果只有兩個:A出現(xiàn)或者出現(xiàn),這種只有兩個可能結(jié)果的試驗稱為伯努利(Bernoulli)試驗.若隨機試驗滿足:(1)進行n次獨立重復(fù)試驗;1.6獨立性1.6.2伯努利概型70%1.6獨立性1.6.2伯努利概型本章首先從試驗觀察結(jié)果介紹隨機事件的不確定性和頻率的穩(wěn)定性,進一步認識隨機現(xiàn)象,通過引入大量經(jīng)濟實例,幫助學(xué)生了解概率的意義;通過數(shù)學(xué)試驗,觀察、發(fā)現(xiàn)隨機事件的統(tǒng)計規(guī)律性,幫助學(xué)生了解通過大量重復(fù)試驗,用頻率估計概率的方法,進而引出概率的三個定義,仔細討論了概率的三條公理和概率的性質(zhì),運用概率的性質(zhì)解決相關(guān)問題;著重研究了兩種重要的概率模型:古典概型和幾何概型,并討論了摸球問題、質(zhì)點入盒問題以及會面問題;給出條件概率的概念,由此得到求積事件概率的乘法公式,進而綜合概率的完備事件組的加法公式與乘法公式得到了全概率公式及貝葉斯公式;由一個事件對另一事件發(fā)生的概率是否有影響引出事件的獨立性概念.本章小結(jié)第一章謝謝觀賞概率論與數(shù)理統(tǒng)計2.2離散型隨機變量2.32.4隨機變量的分布函數(shù)2.5隨機變量函數(shù)的分布第二章隨機變量連續(xù)型隨機變量隨機變量的定義2.1隨機變量是概率論的另一個重要概念.隨機變量的引入使概率論的研究由對個別隨機事件的研究擴大為對隨機變量所表征的隨機現(xiàn)象的研究.本章將介紹離散型隨機變量和連續(xù)型隨機變量及其分布.章前導(dǎo)讀第二章隨機變量70%為了方便研究隨機試驗的各種結(jié)果及各種結(jié)果出現(xiàn)的概率,我們常把隨機試驗的結(jié)果與實數(shù)對應(yīng)起來,即把隨機試驗的結(jié)果進行數(shù)量化,引入隨機變量的概念.2.1隨機變量的定義從定義知道,隨機變量是一個函數(shù),它定義在樣本空間Ω上,而取值在實軸上.因此,它與通常函數(shù)所不同的是,它的自變量是隨機試驗的結(jié)果.由于隨機試驗結(jié)果的出現(xiàn)具有隨機性,即在一次具體試驗前,我們無法預(yù)先知道試驗會出現(xiàn)哪一個結(jié)果.因此,隨機變量的取值也具有一定的隨機性.這正是隨機變量與一般函數(shù)的最大不同之處,正是由于對隨機變量這一特殊性質(zhì)的研究需要,產(chǎn)生了現(xiàn)代概率論.70%定義2如果隨機變量的所有可能取值是有限個或可列無限多個,則稱這種隨機變量為離散型隨機變量.定義3設(shè)離散型隨機變量X的所有可能取值為xi(i=1,2,3,…),則稱X取xi的概率2.2
離散型隨機變量2.2.1離散型隨機變量的概率分布70%在理論和應(yīng)用上,離散型隨機變量的分布有很多,但其中重要的有兩點分布、二項分布和泊松(Poisson)分布.在本小節(jié)和后續(xù)章節(jié)中,我們將對這三種離散型分布做詳細討論,對其他離散型分布,讀者可參閱書后的附錄.2.2
離散型隨機變量2.2.2常見的離散型隨機變量的概率分布來描述該隨機試驗的結(jié)果.例如,對射手射擊是否“中靶”,擲硬幣是否“幣值面朝上”,檢查產(chǎn)品是否“合格”,明天是否“下雨”,種子是否“發(fā)芽”等試驗,均可用服從兩點分布的隨機變量來描述.其中0<p<1,q=1-p,則稱X服從參數(shù)為p的兩點分布或(0-1)分布,記為X~B(1,p).對于任何一個只有兩種可能結(jié)果的隨機試驗E,如果用Ω={ω1,ω2}表示其樣本空間,我們總可以在Ω上定義一個服從兩點分布的隨機變量70%在實際問題中,有時一個隨機試驗可能有多個結(jié)果.例如,在產(chǎn)品質(zhì)量檢查中,檢查結(jié)果有四種:一等品、二等品、三等品和不合格品.但是,如果把前三種統(tǒng)稱為合格品,則試驗的結(jié)果就只有合格品和不合格品兩種.于是,也可以用兩點分布來描述這類隨機試驗.又如,研究者記錄了某城市每月交通事故發(fā)生的次數(shù),則它可能取的值為0,1,2,…,這是無限多個結(jié)果.但是,如果我們關(guān)心的問題是每月發(fā)生交通事故的可能性,我們可以把觀測的結(jié)果分成“發(fā)生交通事故”和“不發(fā)生交通事故”兩種情況.于是,就可用兩點分布來研究每月發(fā)生交通事故的可能性.2.二項分布將試驗E在相同條件下重復(fù)進行n次,如果將第i次試驗的結(jié)果記成Ai(i=1,2,…,n),總有A1,A2,…,An相互獨立,即每次試驗結(jié)果出現(xiàn)的概率都不依賴于其他各試驗的結(jié)果,則稱這n次試驗是相互獨立的.2.2
離散型隨機變量2.2.2常見的離散型隨機變量的概率分布伯努利試驗概型是從現(xiàn)實世界許多的隨機現(xiàn)象中抽象出來的一種基本的概率模型.例如,在一批產(chǎn)品的質(zhì)量檢查中,若將檢查結(jié)果分為“合格”和“不合格”兩種,且采用放回抽樣,則檢查n件產(chǎn)品就是n重伯努利試驗.又如,在對某種新開發(fā)產(chǎn)品的市場調(diào)查中,70%要了解消費者對于這種產(chǎn)品的態(tài)度.若分為“喜歡”和“不喜歡”兩種,且采用放回抽樣,則隨機訪問n位消費者的調(diào)查就是n次伯努利試驗(在這個問題中,由于消費者群體很大,而n一般相對較小,即便不采用放回抽樣,仍然可以近似看成伯努利試驗).這樣的例子還可以舉出很多,因此伯努利試驗與其對應(yīng)的概率分布,即下面將引進的二項分布在概率論與數(shù)理統(tǒng)計的理論與應(yīng)用上有十分重要的地位.2.2
離散型隨機變量2.2.2常見的離散型隨機變量的概率分布70%3.泊松分布如果隨機變量X的概率分布為2.2
離散型隨機變量2.2.2常見的離散型隨機變量的概率分布即P{X=k}滿足概率分布的兩個條件.在許多實際問題中,我們所關(guān)心的量都近似地服從泊松分布.例如,某醫(yī)院每天來就診的病人數(shù);某地區(qū)一段時間間隔內(nèi)發(fā)生火災(zāi)的次數(shù)、發(fā)生交通事故的次數(shù);一段時間間隔內(nèi)某放射性物質(zhì)放射出的粒子數(shù);一段時間間隔內(nèi)某容器內(nèi)部的細菌數(shù);某地區(qū)一年內(nèi)發(fā)生暴雨次數(shù)等,都近似地服從某一參數(shù)的泊松分布.70%在2.2中,我們討論了一類重要的隨機變量——離散型隨機變量.在這一節(jié)中,先介紹直方圖的概念,進而討論另一類重要的隨機變量——連續(xù)型隨機變量,最后介紹隨機變量的分布函數(shù).【例11】某工廠生產(chǎn)一種零件,由于生產(chǎn)過程中各隨機因素的影響,零件長度不盡相同.現(xiàn)有該廠生產(chǎn)的零件100個,測得其長度(單位:mm)如下:129,132,136,145,140,145,147,142,138,144,147,142,137,144,144,134,149,142,137,137,155,128,143,144,148,139,143,142,135,142,148,137,142,144,141,149,132,134,145,132,140,142,130,145,148,143,148,135,136,152,141,146,138,131,138,136,144,142,142,137,141,134,142,133,153,143,145,140,137,142,150,141,139,139,150,139,137,139,140,143,149,136,142,134,146,145,130,136,140,134,142,142,135,131,136,139,137,144,141,136.2.3
連續(xù)型隨機變量2.3.1直方圖70%用隨機變量X表示零件的長度,和§2.1中的【例3】及【例4】中的隨機變量類似,他們都是連續(xù)型隨機變量的例子,其共同特點是:它們可能取某一區(qū)間內(nèi)的所有值.這樣,再使用刻畫離散型隨機變量概率分布的方法來刻畫連續(xù)型隨機變量的概率分布就會出現(xiàn)問題,必須尋找另外的方法.畫直方圖就是一種近似的方法,下面使用【例11】中的數(shù)據(jù)說明畫直方圖的過程.這100個數(shù)據(jù)的最小值是128,最大值是155.在畫直方圖時,先取一個區(qū)間,其左端點比數(shù)據(jù)的最小值稍小一些,右端點比最大值稍大一些,例如可?。?27.5,131.5),(131.5,135.5),(135.5,139.5),(139.5,143.5),(143.5,147.5),(147.5,151.5),(151.5,155.5).上述這些區(qū)間的端點均比數(shù)據(jù)多取一位小數(shù),其目的是使數(shù)據(jù)不落在區(qū)間的端點上.每個小區(qū)間稱為一個組,數(shù)據(jù)落入每個組的個數(shù)是頻數(shù),每個組的頻數(shù)與數(shù)據(jù)總個數(shù)的比值是頻率,這樣可得到數(shù)據(jù)統(tǒng)計表,見表2-3.2.32.3.1直方圖
連續(xù)型隨機變量70%2.32.3.1直方圖
連續(xù)型隨機變量70%在平面直角坐標系的橫軸上截出各組的區(qū)間,每組的區(qū)間長度稱為組距,比例中組距為4.在各組上以組距為底向上作出長方形,使該長方形的面積等于該組的頻率,即長方形的高=頻率÷組距=頻率/4.這樣的圖形稱為直方圖,如圖2-2所示.2.32.3.1直方圖
連續(xù)型隨機變量70%由于概率可以由頻率近似得到,因此,這個直方圖可以近似地刻畫零件長度X的概率分布情況.用上述直方圖刻畫X的概率分布情況是比較粗糙的.為了更加準確地刻畫X的概率分布情況,應(yīng)該增加數(shù)據(jù)的個數(shù),同時要把組分得更細.可以設(shè)想:當數(shù)據(jù)個數(shù)越來越多,組分得越來越細時,直方圖的外形輪廓越來越接近某一條曲線,如圖22所示.這條曲線可以準確地刻畫X的概率分布情況,它就是下面要定義的連續(xù)型隨機變量的概率密度函數(shù)的圖形.這就是說,刻畫連續(xù)型隨機變量的概率密度要使用概率密度函數(shù).2.32.3.1直方圖
連續(xù)型隨機變量定義4若存在非負函數(shù)f(x),使隨機變量X取值于任意區(qū)間(a,b\]上的概率可以表示為2.32.3.2概率密度函數(shù)則稱X為連續(xù)型隨機變量,f(x)為X的概率密度函數(shù),簡稱概率密度.容易看出,概率密度函數(shù)具有如下性質(zhì):(2)對連續(xù)型隨機變量X和任意常數(shù)a,總有P{X=a}=0.性質(zhì)(2)說明,連續(xù)型隨機變量取任意一點的概率為0.同時也說明,從P(A)=0,并不能推出A是不可能事件.因為在這里,雖然P{X=a}=0,但事件X=a并非不可能事件.這樣,連續(xù)型隨機變量X落在區(qū)間[a,b],(a,b),(a,b\],\[a,b)上的概率都相等,即P{a≤X≤b}=P{a<X<b}=P{a<X≤b}=P{a≤X<b}(2-9)且都等于f(x)在區(qū)間[a,b]上的積分,即曲線y=f(x)和直線x=a,x=b及y=0所圍成的曲邊梯形的面積.
連續(xù)型隨機變量70%1.均勻分布若果隨機變量X的概率密度函數(shù)為2.指數(shù)分布如果隨機變量X的概率密度函數(shù)為2.32.3.3常見的連續(xù)型隨機變量的概率密度函數(shù)其中λ>0為常數(shù),則稱X服從參數(shù)為λ的指數(shù)分布,記做X~Exp(λ).指數(shù)分布是最常用的壽命分布,許多電子產(chǎn)品或元件的壽命都服從指數(shù)分布.
連續(xù)型隨機變量70%2.33.正態(tài)分布如果隨機變量X的概率密度函數(shù)為其中μ,σ(σ>0)為常數(shù),則稱X服從參數(shù)為μ,σ的正態(tài)分布或高斯(Gauss)分布,記為X~N(μ,σ2).這里的字母N取自英文單詞Normal(正常的)的首字母.同時稱X為正態(tài)隨機變量.正態(tài)分布的概率密度函數(shù)f(x)圖形如圖2-3所示.
連續(xù)型隨機變量2.3.3常見的連續(xù)型隨機變量的概率密度函數(shù)70%2.3從圖2-3中容易看出,f(x)的圖形呈鐘形,且有如下特征:(1)關(guān)于直線x=μ對稱;如果固定σ,改變μ的值,則圖形沿著x軸平移,而圖形的形狀不變;如果固定μ,改
連續(xù)型隨機變量2.3.3常見的連續(xù)型隨機變量的概率密度函數(shù)70%2.3由φ(x)的對稱性,可推出Φ(x)的如下重要性質(zhì):Φ(-x)=1-Φ(x)(2-15)Φ(x)的函數(shù)值已制成標準正態(tài)分布表(見附表2).利用此表,我們可以計算參數(shù)已知的情形下,正態(tài)隨機變量落在一個區(qū)間內(nèi)的概率.先來看下面的定理.特別地,當μ=0,σ=1時的正態(tài)分布N(0,1)稱為標準正態(tài)分布.對于標準正態(tài)分布N(0,1),其概率密度函數(shù)通常用φ(x)來表示,即
連續(xù)型隨機變量2.3.3常見的連續(xù)型隨機變量的概率密度函數(shù)70%對離散型隨機變量,我們用概率分布來刻畫它的概率分布情況.對連續(xù)型隨機變量,我們用概率密度函數(shù)來刻畫它的概率分布情況.現(xiàn)在,我們引入分布函數(shù)的概念,它可以對上述兩類隨機變量的概率分布情況進行刻畫.它在概率論的理論研究中具有重要意義.2.4隨機變量的分布函數(shù)這里的和式(2.23)是對所有滿足xk≤x的pk求和.分布函數(shù)F(x)在x=xk(k=1,2,…)處有跳躍值pk,且分布函數(shù)F(x)是一個右連續(xù)的函數(shù).70%在很多實際問題中,我們常常對某些隨機變量函數(shù)(也是隨機變量)感興趣.這是因為在一些試驗中,我們所關(guān)心的量往往不能通過直接觀測來得到,而它恰是某個能直接觀測到的隨機變量的已知函數(shù).比如,我們能直接測量到圓軸正截面的直徑D,而所關(guān)心的卻是該截面的面積A=πD24.這里,隨機變量A是隨機變量D的函數(shù).本節(jié)我們將討論如何由已知隨機變量X的分布來求X的函數(shù)Y=g(X)的分布.在這里,g是一個已知的連續(xù)函數(shù).2.5隨機變量函數(shù)的分布70%2.5隨機變量函數(shù)的分布2.5.1離散型隨機變量函數(shù)的分布設(shè)離散型隨機變量X的概率分布為P{X=xk}=pk,k=1,2,…,g是一個已知的單值函數(shù).令Y=g(X),則Y也是一個離散型隨機變量.70%2.5隨機變量函數(shù)的分布2.5.2續(xù)型隨機變量函數(shù)的分布對于連續(xù)型隨機變量X,求Y=g(X)的概率密度函數(shù)的基本方法是:根據(jù)分布函數(shù)的定義先求Y=g(X)的分布函數(shù),即然后求上式對y的導(dǎo)數(shù),得到Y(jié)的概率密度函數(shù)fY(y)=F′Y(y).下面我們通過一些例子加以說明.定理2若隨機變量X有概率密度函數(shù)fX(x),x∈(-∞,+∞),y=g(x)為嚴格單調(diào)函數(shù),且g′(x)對一切x都存在,記(a,b)為g(x)的值域,則隨機變量Y=g(X)的概率密度函數(shù)為a=g(+∞),b=g(-∞).這里x=h(y)是y=g(x)的反函數(shù).顯然,當g(x)為嚴格單調(diào)增函數(shù)時,a=g(-∞),b=g(+∞);當g(x)為嚴格單調(diào)減函數(shù)時,a=g(+∞),b=g(-∞).本章首先引入了隨機變量的概念,使隨機試驗中的各種事件可以用隨機變量來描述,從而將對隨機現(xiàn)象的研究轉(zhuǎn)化成對隨機變量的研究.本書只討論兩類重要的隨機變量:離散型隨機變量和連續(xù)型隨機變量.主要研究這兩類隨機變量及其分布.通過本章的學(xué)習(xí),學(xué)生應(yīng)理解隨機變量、概率分布、概率密度以及分布函數(shù)的概念,掌握概率分布、概率密度、分布函數(shù)的性質(zhì),熟知兩點分布、二項分布、泊松分布、均勻分布、指數(shù)分布、正態(tài)分布這六大重要分布,會利用分布函數(shù)、概率分布或概率密度計算隨機事件的概率,會利用概率分布或概率密度求分布函數(shù),會利用分布函數(shù)求概率分布或概率密度,掌握隨機變量函數(shù)的分布的求解方法.本章小結(jié)第二章謝謝觀賞概率論與數(shù)理統(tǒng)計3.2二維離散型隨機變量3.33.4邊緣分布3.5第三章多維隨機變量二維連續(xù)型隨機變量二維隨機變量及其分布函數(shù)3.1條件分布隨機變量的獨立性3.6在實際問題中,除了經(jīng)常遇到一個隨機變量的情形外,還會遇到多個隨機變量的情形.例如,炮彈在地面彈著點的位置X,Y是二維隨機變量,需要用它的橫坐標X與縱坐標Y來確定,而橫坐標和縱坐標是定義在同一個樣本空間Ω={所有可能的彈著點}上的兩個隨機變量;又如,某鋼鐵廠煉鋼時每爐鋼出爐時的基本指標必須考察由鋼的硬度X、含碳量Y和含硫量Z組成的三維隨機變量X,Y,Z的情況,它們也是定義在同一個樣本空間Ω上的三個隨機變量。因此,在實際應(yīng)用問題上,有時只用一個隨機變量是不夠的,要考慮多個隨機變量及其相互聯(lián)系.本章以兩個隨機變量的情形為代表,講述多維隨機變量的一些基本內(nèi)容.章前導(dǎo)讀第三章多維隨機變量70%3.1二維隨機變量及其分布函數(shù)定義1設(shè)隨機試驗E的樣本空間為Ω,X=X(ω)與Y=Y(ω)是定義在Ω上的兩個隨機變量,由它們構(gòu)成的向量(X,Y)稱為二維隨機變量.類似地,可定義n維隨機變量.設(shè)E是一個隨機試驗,它的樣本空間是Ω,設(shè)隨機變量X1(ω),X2(ω),…,Xn(ω)是定義在同一個樣本空間Ω上n個隨機變量,則稱向量X1(ω),X2(ω),…,Xn(ω)為Ω上的n維隨機變量,簡記為X1,X2,…,Xn.與一維隨機變量的情形類似,對于二維隨機變量,也通過分布函數(shù)來描述其分布律規(guī)律.二維隨機變量(X,Y)的性質(zhì)不僅與X和Y的性質(zhì)有關(guān),而且還依賴于X和Y之間的相互關(guān)系.因此,僅僅逐個研究X和Y的性質(zhì)是不夠的,必須把(X,Y)作為一個整體來加以研究.70%3.1二維隨機變量及其分布函數(shù)定義2設(shè)(X,Y)是二維隨機變量,對任意實數(shù)x和y,稱二元函數(shù)為二維隨機變量(X,Y)的分布函數(shù),或隨機變量X和Y的聯(lián)合分布函數(shù).類似地,可定義n維隨機變量X1,X2,…,Xn的分布函數(shù).分布函數(shù)F(x,y)表示事件{X≤x}和事件{Y≤y}同時發(fā)生的概率,如果把二維隨機變量(X,Y)看成是平面上隨機點的坐標,那么,分布函數(shù)F(x,y)在(x0,y0)處的函數(shù)值F(x0,y0)就是隨機點(X,Y)落在直線X=x0左側(cè)和直線Y=y0下方無限矩形域內(nèi)的概率,如圖3-1所示.3.1二維隨機變量及其分布函數(shù)分布函數(shù)F(x,y)具有以下基本性質(zhì).(1)F(x,y)是變量x和y的單調(diào)不減函數(shù),即對于任意固定的y,當x2≥x1時,F(xiàn)(x2,y)≥F(x1,y);對于任意固定的x,當y2≥y1時,F(xiàn)(x,y2)≥F(x,y1);(2)由分布函數(shù)的定義得知0≤F(x,y)≤1,-∞<x<+∞,-∞<y<+∞;3.1二維隨機變量及其分布函數(shù)對于上面四個式子,可以從F(x,y)的幾何意義上加以解釋,在圖3-1中將無限矩形右邊界向左無限移動(即令x→-∞),則隨機點(X,Y)落在這個矩形區(qū)域內(nèi)這一事件趨于不可能事件,則概率趨于零,即有F(-∞,y=0);又如當x→+∞,y→+∞時,相當于在圖3-1中將無限矩形擴展到整個平面,則隨機點(X,Y)落在這個矩形區(qū)域內(nèi)這一事件趨于必然事件,則概率趨于1,即有F(+∞,+∞)=1.(4)F(x,y)關(guān)于x右連續(xù),關(guān)于y右連續(xù),即F(x,y)=F(x+0,y),F(xiàn)(x,y)=F(x,y+0).(5)對于任意的(x1,y1),(x2,y2),x1<x2,y1<y2,有F(x2,y2)-F(x2,y1)+F(x1,y1)-F(x1,y2)≥0.與一維隨機變量類似,二維隨機變量有兩種類型:離散型與連續(xù)型,在下面兩節(jié)我們將分別討論.3.2二維離散型隨機變量定義3若二維隨機變量(X,Y)的所有可能取值是有限對或可列無窮多對時,則稱(X,Y)為二維離散型隨機變量.從二維離散型隨機變量的定義易知,二維離散型隨機變量(X,Y)的每一個分量都是離散型隨機變量,形象地講,二維離散型隨機變量(X,Y)即為兩個離散型隨機變量湊在一起構(gòu)成的向量.定義4設(shè)二維離散型隨機變量(X,Y)的一切可能取值為(xi,yj),i,j=1,2,…,且(X,Y)各對可能取值的概率為P(X=xi,Y=yj)=pij,i,j=1,2,….(3-3)稱(3.3)式為(X,Y)的(聯(lián)合)分布律或(聯(lián)合)概率分布.3.2二維離散型隨機變量離散型隨機變量(X,Y)的聯(lián)合分布律可用表3-1表示.由概率的定義可知pij具有如下性質(zhì).(1)非負性:pij≥0,i,j=1,2,…;其中和式是對一切滿足xi≤x,yj≤y的i,j求和.3.3二維連續(xù)型隨機變量3.3.1二維連續(xù)型隨機變量定義5設(shè)二維隨機變量(X,Y)的聯(lián)合分布函數(shù)為F(x,y),如果存在非負函數(shù)f(x,y)使得對任意實數(shù)x,y,總有則稱(X,Y)為二維連續(xù)型隨機變量,f(x,y)為二維連續(xù)型隨機變量(X,Y)的聯(lián)合概率密度函數(shù),簡稱概率密度.概率密度函數(shù)f(x,y)具有以下四條性質(zhì).(1)f(x,y)≥0,-∞<x<+∞,-∞<y<+∞;3.3二維連續(xù)型隨機變量3.3.1二維連續(xù)型隨機變量(4)設(shè)D是平面上的任意區(qū)域,則點(X,Y)落在D內(nèi)的概率3.3二維連續(xù)型隨機變量3.3.2二維均勻分布定義6設(shè)D是平面上的有界區(qū)域,其面積為d,若二維隨機變量(X,Y)的概率密度為則稱(X,Y)在區(qū)域D上服從均勻分布.和一維隨機變量的均勻分布類似,(X,Y)服從D上的均勻分布落在D中某一區(qū)域A內(nèi)的概率P{(X,Y)∈A}與A的面積成正比,而與A的位置和形狀無關(guān),即常用的平面上的有界區(qū)域多為矩形區(qū)域、圓型區(qū)域和三角形區(qū)域等.3.3二維連續(xù)型隨機變量3.3.3二維正態(tài)分布定義7設(shè)二維隨機變量(X,Y)聯(lián)合概率密度函數(shù)為(X,Y)為二維正態(tài)隨機變量.z=f(x,y)在三維空間中的圖形就像是一個橢圓切面的鐘倒扣在xOy平面上,其中心在(μ1,μ2)處,如圖3-3所示.下面證明二維正態(tài)分布聯(lián)合概率密度函數(shù)f(x,y)滿足70%3.3二維連續(xù)型隨機變量3.3.3二維正態(tài)分布3.4邊緣分布3.4.1邊緣分布函數(shù)二維隨機變量(X,Y)作為一個整體,有分布函數(shù)F(x,y),其分量X和Y都是隨機變量,有各自的分布函數(shù),分別記成FX(x)和FY(y),依次稱為X的邊緣分布函數(shù)和Y的邊緣分布函數(shù),而稱F(x,y)為(X,Y)的聯(lián)合分布函數(shù).這里需要注意的是X和Y的邊緣分布函數(shù)其本質(zhì)上就是一維隨機變量X和Y的分布函數(shù),邊緣分布函數(shù)是相對于隨機變量(X,Y)的聯(lián)合分布而言的,同樣,(X,Y)的聯(lián)合分布函數(shù)F(x,y)是相對于(X,Y)的兩個分量X和Y的分布而言的.邊緣分布函數(shù)FX(x)和FY(y)都可以由聯(lián)合分布函數(shù)F(x,y)確定,即3.4邊緣分布3.4.2二維離散型隨機變量的邊緣分布律設(shè)(X,Y)是二維離散型隨機變量,聯(lián)合分布律為3.4邊緣分布3.4.3二維連續(xù)性隨機變量的邊緣概率密度設(shè)(X,Y)是二維連續(xù)型隨機變量,其概率密度函數(shù)為f(x,y),由一維隨機變量分布函數(shù)的定義和二維隨機變量分布函數(shù)的定義可得3.4邊緣分布3.4.3二維連續(xù)性隨機變量的邊緣概率密度分別稱fX(x)和fY(y)為X和Y的邊緣概率概率密度函數(shù),簡稱邊緣概率密度.這表明:X與Y都是服從均勻分布的隨機變量.但對其他非矩形區(qū)域上的均勻分布不一定有上述結(jié)論.3.5條件分布3.5.1條件分布的概念在第一章,我們介紹了條件概率的概念,在事件B發(fā)生的條件下事件A發(fā)生的條件概率為在本節(jié)中,我們將其推廣到隨機變量,設(shè)有兩個隨機變量X和Y,在給定Y取某個值或某些值的條件下,X的分布稱為X的條件分布.類似地,也可以定義Y的條件分布.例如:考慮某大學(xué)的全體學(xué)生,從中隨機抽取一個學(xué)生,以X和Y分別表示其體重和身高,則X和Y都是隨機變量,它們都有一定的分布律.現(xiàn)在限制180cm<Y<190cm,在這個條件下求X的條件分布.這就意味著要從該校的學(xué)生中把身高在180cm到190cm之間的那些人都挑出來,然后在挑出來的學(xué)生中求其體重的分布.顯然這個分布與不加這個條件時的分布會不一樣,在條件分布中體重取大值的概率會顯著地增加.3.5條件分布3.5.1條件分布的概念從上述這個例子可以看出條件分布這個概念的重要性,弄清楚X的條件分布隨Y值而變化的情況,就能了解身高對體重的影響.由于在許多問題中有關(guān)變量往往是相互影響的,這使得條件分布成為研究變量之間相依關(guān)系的一個有力工具,它在概率論與數(shù)理統(tǒng)計的許多分支中有著重要的應(yīng)用.3.5條件分布3.5.2離散型隨機變量的條件分布律這種情況是第一章中條件概率概念在另外一種形式下的運用.設(shè)(X,Y)是二維離散型隨機變量,分布律為3.5條件分布3.5.2離散型隨機變量的條件分布律容易看出,上述條件概率具有分布律的兩條性質(zhì).為在X=xi條件下Y的條件分布律.3.5條件分布3.5.3連續(xù)型隨機變量的條件概率密度設(shè)X,Y是二維連續(xù)型隨機變量,由于對任意x,y,P{X=x}=0,P{Y=y}=0,故不能直接用條件概率公式得到條件分布,這時要使用極限的方法得到條件概率密度.70%3.5條件分布3.5.3連續(xù)型隨機變量的條件概率密度定理1設(shè)隨機變量(X,Y)的聯(lián)合概率密度為f(x,y),Y的邊緣概率密度為fY(y).若f(x,y)在點(x,y)處連續(xù),fY(y)在點y處連續(xù),且fY(y)>0,則70%3.6隨機變量的獨立性第一章中,我們討論了隨機事件的獨立性,對事件A與B,若有P(AB)=P(A)P(B),則稱A與B相互獨立.現(xiàn)在,利用兩個事件相互獨立的概念引出兩個隨機變量相互獨立的概念.定義10設(shè)(X,Y)是二維隨機變量,若對任意實數(shù)x,y,總有則稱X與Y相互獨立.設(shè)(X,Y)的聯(lián)合分布函數(shù)為F(x,y),X和Y邊緣分布函數(shù)分別為FX(x),F(xiàn)Y(y),則用聯(lián)合分布函數(shù)和邊緣分布函數(shù)表示隨機變量獨立性可表示為F(x,y)=FX(x)FY(y).(3-24)因此,隨機變量X與Y相互獨立是指對任意實數(shù)x,y,隨機事件{X≤x}與{Y≤y}相互獨立.隨機變量的相互獨立是概率統(tǒng)計中一個十分重要的概念.設(shè)X,Y是二維離散型隨機變量,則隨機變量X與Y相互獨立等價于對X,Y所有可能取的值xi,yj,i,j=1,2,…,有70%3.6隨機變量的獨立性設(shè)(X,Y)是二維連續(xù)型隨機變量,則隨機變量X與Y相互獨立等價于對任意的實數(shù)x,y,有f(x,y)=fX(x)fY(y).(3-27)下面對(X,Y)的連續(xù)情況加以說明.設(shè)X,Y是二維離散型隨機變量,則隨機變量X與Y相互獨立等價于對(X,Y)所有可能取的值(xi,yj),i,j=1,2,…,有70%3.6隨機變量的獨立性下面對(X,Y)的連續(xù)情況加以說明.若X與Y相互獨立,則對任意的實數(shù)(x,y),有F(x,y)=FX(x)FY(y),兩邊對x,y求導(dǎo)得這表明X與Y相互獨立.本章介紹了二維隨機變量的基本概念,包括聯(lián)合分布函數(shù)及其性質(zhì),二維離散型隨機變量的聯(lián)合分布律及其性質(zhì),二維連續(xù)型隨機變量的聯(lián)合概率密度及其性質(zhì);二維均勻分布、二維正態(tài)分布,二維隨機變量邊緣分布的概念,二維離散型隨機變量邊緣分布律的計算,二維連續(xù)型隨機變量邊緣概率密度的計算;條件分布的概念,離散型隨機變量條件分布律的計算,連續(xù)型隨機變量條件概率密度的計算,給出多個計算例子;最后介紹兩個隨機變量相互獨立的概念,給出各種情況下兩個隨機變量相互獨立的充要條件.本章小結(jié)第三章謝謝觀賞概率論與數(shù)理統(tǒng)計4.2方差4.34.4矩與協(xié)方差矩陣第四章隨機變量的數(shù)字特征協(xié)方差與相關(guān)系數(shù)數(shù)學(xué)期望4.1在上一章我們已經(jīng)討論了隨機變量的分布函數(shù)、概率密度及分布律,它們都能夠完整地描述隨機變量的統(tǒng)計規(guī)律性.然而,在許多理論或?qū)嶋H問題中,并不需要去全面考察隨機變量的全部特征,而只希望能夠描述它們的某些數(shù)字特征即可.比如,某地區(qū)農(nóng)作物產(chǎn)量是隨機變量,我們在考察時,通常只關(guān)心該地區(qū)糧食的平均產(chǎn)量;又如,某城市個人收入是一個隨機變量,在考察時,我們通常只關(guān)心該市的平均收入水平;再如,在評價棉花的質(zhì)量時,既要注意纖維的平均長度,又要注意纖維長度與平均長度之間的偏離程度,平均長度較大,偏離程度較小,則質(zhì)量較好.在以上各例子中,我們并不需要將所有隨機變量的特征都完整地描述出來,我們關(guān)心的只是隨機變量某方面的特征,如均值和方差等,它們能更直接、更簡潔地反映出隨機變量的本質(zhì).本章將討論幾個常用的數(shù)字特征:數(shù)學(xué)期望、方差、協(xié)方差、相關(guān)系數(shù)以及矩.章前導(dǎo)讀第四章隨機變量的數(shù)字特征70%4.1數(shù)學(xué)期望4.1.1離散型隨機變量的數(shù)學(xué)期望在給出數(shù)學(xué)期望的定義之前,我們先看一個例子.引例1某服裝公司生產(chǎn)兩種套裝,一種是大眾裝,每件價格200元,每月生產(chǎn)1萬件;另一種是高檔裝,每件1800元,每月生產(chǎn)100件.現(xiàn)在問該公司生產(chǎn)的套裝平均價格是多少?把每種套裝的價格乘上生產(chǎn)件數(shù),然后相加,得到總價格,最后除以總件數(shù),即該問題中,我們計算了以兩種套裝生產(chǎn)的頻率為權(quán)重的加權(quán)平均數(shù).受此啟發(fā),隨機變量X的所有可能取值的“平均數(shù)”應(yīng)是各可能取值與其頻率的乘積之和,這即所謂的“數(shù)學(xué)期望”.頻率的穩(wěn)定性告訴我們頻率可以作為概率的估計值,故給出以下定義.70%4.1數(shù)學(xué)期望4.1.2連續(xù)型隨機變量的期望下面介紹一些常用連續(xù)型隨機變量的數(shù)學(xué)期望.1.均勻分布若隨機變量X~U[a,b],其概率密度為70%4.1數(shù)學(xué)期望4.1.2連續(xù)型隨機變量的期望下面介紹一些常用連續(xù)型隨機變量的數(shù)學(xué)期望.1.均勻分布若隨機變量X~U[a,b],其概率密度為70%4.1數(shù)學(xué)期望4.1.2連續(xù)型隨機變量的期望70%4.1數(shù)學(xué)期望4.1.3隨機變量函數(shù)的數(shù)學(xué)期望設(shè)隨機變量X的分布律已知,在實際問題中有時需要計算的量并非X的期望,而是關(guān)于X的某個函數(shù)g(X)的期望.那么,如何計算它呢?由于g(X)也是隨機變量,故應(yīng)有分布律,其分布律可以由X的分布律求出.一旦知道了g(X)的分布律,就可以按照期望的定義把E[g(X)]計算出來.但使用該方法必須先求出g(X)的分布律,一般說來,這是比較復(fù)雜的事.那么,可否不求g(X)的分布律,只根據(jù)X的分布律來計算E[g(X)]呢?答案是肯定的,且有如下定理.定理1設(shè)Y=g(X)是x的連續(xù)函數(shù),若X是離散型隨機變量,其分布律為該定理的重要性在于,當我們求E[g(X)]時,不必再求g(X)的分布律,而只需知道X的分布律即可,這對求g(X)的期望帶來了方便.注:由E(XY)=E(X)E(Y)不一定能推出X與Y相互獨立.推廣:若Xi(i=1,2,…)相互獨立且數(shù)學(xué)期望存在時,下面僅對性質(zhì)3進行證明(以連續(xù)型隨機變量為例),其余留給讀者自證.設(shè)二維隨機變量(X,Y)的概率密度為f(x,y),其邊緣概率密度為fX(x)和fY(y),則70%4.1數(shù)學(xué)期望4.1.4期望的性質(zhì)設(shè)隨機變量X和Y的數(shù)學(xué)期望存在,則(1)若c是常數(shù),則E(c)=c;(2)若c是常數(shù),則E(cX)=cE(X);(3)E(X+Y)=E(X)+E(Y);特別地,若c是常數(shù),則E(X+c)=E(X)+c;推廣:若Xi(i=1,2,…)的數(shù)學(xué)期望均存在,則(4)若a,b是常數(shù),則E(aX+b)=aE(X)+b;(5)若X和Y是相互獨立的,則E(XY)=E(X)E(Y).70%4.2方差上一節(jié)介紹了隨機變量的期望,它體現(xiàn)了隨機變量取值的平均水平,是隨機變量的重要數(shù)字特征.但在一些場合,僅僅知道期望是不夠的,還需了解其他數(shù)字特征.引例2要評價甲和乙兩名射擊選手的射擊水平,假設(shè)他們的射擊成績X與Y的分布律分別如表4-6和表4-7所示.由于E(X)=E(Y)=9(環(huán)),即從數(shù)學(xué)期望的角度區(qū)分不出兩名選手誰的技術(shù)更好.這種情況下,通常是考慮二者誰的技術(shù)更加穩(wěn)定,即誰命中的環(huán)數(shù)偏離平均值更小.可見隨機變量取值對數(shù)學(xué)期望的偏離程度也是一個重要的統(tǒng)計數(shù)字特征,這個統(tǒng)計數(shù)字特征就是我們將要介紹的方差.70%4.2方差4.2.1方差的定義定義3設(shè)X是一隨機變量,若期望E{[X-E(X)]2}存在,則稱其為X的方差,記為Var(X),即注:平方是為了保證一切[X-E(X)]不會相互抵消,并都起正的作用,Var(X)也記為D(X).方差刻畫了隨機變量取值對于其數(shù)學(xué)期望的偏離程度.若X的取值比較集中,則方差較??;若X的取值比較分散,則方差較大;若方差Var(X)=0,則X以概率1取常數(shù),并且此常數(shù)即為均值E(X).由定義知,方差是隨機變量X的函數(shù)g(X)=[X-E(X)]2的期望.若X為離散型隨機變量,則70%4.2方差4.2.1方差的定義(1)設(shè)c是常數(shù),則Var(c)=0;(2)若c是常數(shù),則Var(cX)=c2Var(X);(3)若c是常數(shù),則Var(X+c)=Var(X);(4)Var(X1±X2)=Var(X1)+Var(X2)±2E{[X1-E(X1)][X2-E(X2)]};(5)若X1與X2相互獨立,則Var(X1+X2)=Var(X1)+Var(X`)可推廣為:下面僅對性質(zhì)3進行證明(以離散型隨機變量為例),其余留給讀者自證.70%4.2方差4.2.2方差的性質(zhì)70%4.2方差4.2.2方差的性質(zhì)70%4.2方差4.2.3幾種常用隨機變量的方差4.2方差4.2.3幾種常用隨機變量的方差下面僅就兩點分布進行證明,其余留給讀者自證.我們知道兩點分布的分布律為P{X=1}=p,P{X=0}=1-p,則E(X2)=12×p+02×(1-p)=p.再由E(X)=p得Var(X)=E(X2)-[E(X)]2=p-p2=p(1-p).70%4.3協(xié)方差與相關(guān)系數(shù)4.3.1協(xié)方差的定義對于二維隨機變量(X,Y),除了其分量X和Y的期望與方差外,還有一些數(shù)字特征用以刻畫X與Y之間的相關(guān)程度,其中最主要的就是下面要討論的協(xié)方差和相關(guān)系數(shù).70%4.3協(xié)方差與相關(guān)系數(shù)4.3.1協(xié)方差的定義由(4.27)式和(4.28)式看出方差是協(xié)方差的特例.若X,Y為離散型隨機變量,其聯(lián)合分布律為P{X=xi,Y=yj}=pij,i,j=1,2,…,則有70%4.3協(xié)方差與相關(guān)系數(shù)4.3.1協(xié)方差的定義若X取值比較大時(如X>E(X)),Y也取值比較大(Y>E(Y)),這時有[X-E(X)][Y-E(Y)]>0.同時,若X取值比較小時(如X<E(X)),Y也取值比較?。╕<E(Y)),這時也有[X-E(X)][Y-E(Y)]>0于是,協(xié)方差Cov(X,Y)>0.可見正的協(xié)方差表示兩個隨機變量有“同時取較大值”或“同時取較小值”的傾向.反過來,若X取值比較大時(如X>E(X)),Y取值比較小(Y<E(Y)),這時有[X-E(X)][Y-E(Y)]<0.同時,若X取值比較小時(如X<E(X)),Y取值比較大(Y>E(Y)),這時也有[X-E(X)][Y-E(Y)]<0.于是,協(xié)方差Cov(X,Y)<0.可見負的協(xié)方差表示兩個隨機變量有“此小彼大”或者“此大彼小”的傾向.70%4.3協(xié)方差與相關(guān)系數(shù)4.3.2協(xié)方差性質(zhì)70%4.3協(xié)方差與相關(guān)系數(shù)4.3.3相關(guān)系數(shù)的定義為X與Y的相關(guān)系數(shù).在不致引起混淆時,記ρXY為ρ.若隨機變量X與Y的相關(guān)系數(shù)ρ=0,則稱X與Y線性無關(guān),或線性不相關(guān),簡稱不相關(guān).70%4.3協(xié)方差與相關(guān)系數(shù)4.3.4相關(guān)系數(shù)性質(zhì)(1)設(shè)X與Y是兩個任意的隨機變量,則|ρXY|≤1;(2)X與Y獨立時,ρXY=0,即X與Y不相關(guān),但其逆命題不一定為真;(3)|ρXY|=1的充要條件是:存在常數(shù)a≠0和b,使P{Y=aX+b}=1.下面僅根據(jù)下例對性質(zhì)2進行證明,其余留給讀者自證.70%4.4矩與協(xié)方差矩陣4.4.1
矩的定義數(shù)學(xué)期望、方差、協(xié)方差等都是隨機變量最常用的數(shù)字特征,他們都是特殊的矩,矩是最廣泛的數(shù)字特征,也是概率論與數(shù)理統(tǒng)計中最基本、最重要的概念.定義6對隨機變量X,若E(xk)(k=1,2,…)存在,則稱其為X的k階原點矩;若E{[X-E(x)]k}(k=1,2,…)存在,則稱其為X的k階中心矩.顯然,E(X)是X的一階原點矩,Var(X)是X的二階中心矩.定義7對隨機變量(X,Y),若E(XkYm)(k,m=1,2,…)存在,則稱其為X與Y的k+m階混合原點矩;若E{[X-E(X)]k[Y-E(Y)]m}(k,m=1,2,…)存在,則稱其為X與Y的k+m階混合中心矩.顯然,X與Y的協(xié)方差Cov(X,Y)是X與Y的1+1階混合中心矩.70%4.4矩與協(xié)方差矩陣4.4.2協(xié)方差陣70%4.4矩與協(xié)方差矩陣4.4.3協(xié)方差陣中元素的性質(zhì)(1)cii=D(Xi),i=1,2,…,n;(2)cij=cji,i,j=1,2,…,n;(3)c2ij≤cii×cjj.讀者可參照協(xié)方差自行證明.本章介紹了隨機變量期望的概念、性質(zhì)及計算,給出了幾種常用隨機變量的期望,介紹了求隨機變量函數(shù)期望的方法;隨機變量方差的概念\性質(zhì)及計算過程,給出了幾種常用隨機變量的方差;二維隨機變量X,Y的分量X與Y的協(xié)方差及相關(guān)系數(shù)的概念、性質(zhì)和計算過程;然后介紹隨機變量的各種矩(k階原點矩、k階中心矩、k+m階混合原點矩、k+m階混合中心矩),n維隨機變量的協(xié)方差陣的概念、性質(zhì)和計算過程.本章小結(jié)第四章謝謝觀賞概率論與數(shù)理統(tǒng)計5.1大數(shù)定律5.2第五章大數(shù)定律與中心極限定理中心極限定理在上一章我們已經(jīng)討論了隨機變量的分布函數(shù)、概率密度及分布律,它們都能夠完整地描述隨機變量的統(tǒng)計規(guī)律性.然而,在許多理論或?qū)嶋H問題中,并不需要去全面考察隨機變量的全部特征,而只希望能夠描述它們的某些數(shù)字特征即可.比如,某地區(qū)農(nóng)作物產(chǎn)量是隨機變量,我們在考察時,通常只關(guān)心該地區(qū)糧食的平均產(chǎn)量;又如,某城市個人收入是一個隨機變量,在考察時,我們通常只關(guān)心該市的平均收入水平;再如,在評價棉花的質(zhì)量時,既要注意纖維的平均長度,又要注意纖維長度與平均長度之間的偏離程度,平均長度較大,偏離程度較小,則質(zhì)量較好.在以上各例子中,我們并不需要將所有隨機變量的特征都完整地描述出來,我們關(guān)心的只是隨機變量某方面的特征,如均值和方差等,它們能更直接、更簡潔地反映出隨機變量的本質(zhì).本章將討論幾個常用的數(shù)字特征:數(shù)學(xué)期望、方差、協(xié)方差、相關(guān)系數(shù)以及矩.章前導(dǎo)讀第五章大數(shù)定律與中心極限定理70%5.1大數(shù)定律重復(fù)試驗中事件頻率的穩(wěn)定性,是大量隨機現(xiàn)象統(tǒng)計規(guī)律性的典型表現(xiàn).人們在實踐中認識到頻率具有穩(wěn)定性,進而由頻率的穩(wěn)定性預(yù)見概率的存在,由頻率的性質(zhì)推斷概率的性質(zhì),并在實際應(yīng)用中用頻率的值來估計概率的值.其實,在大量隨機現(xiàn)象中,不但事件的頻率具有穩(wěn)定性,而且大量隨機現(xiàn)象的平均結(jié)果一般也具有這種穩(wěn)定性;單個隨機現(xiàn)象對大量隨機現(xiàn)象共同產(chǎn)生的總平均效果幾乎不發(fā)生影響.這就是說,盡管單個隨機現(xiàn)象的具體實現(xiàn)不可避免地引起隨機偏差,然而在大量隨機現(xiàn)象共同作用時,由于這些隨機偏差互相抵消、補償和拉平,致使總的平均結(jié)果趨于穩(wěn)定.例如,一個鉗工在測量一個工件時,由于測量具有隨機誤差,他總是反復(fù)測量多次,然后用多次的平均值來作為測量的結(jié)果.而且經(jīng)驗表明:只要測量的次數(shù)足夠多,總可以達到要求的精度.概率論中,一切關(guān)于大量隨機現(xiàn)象之平均結(jié)果的穩(wěn)定性定理,統(tǒng)稱為大數(shù)定律.下面介紹三個常見的大數(shù)定律,在這之前,先介紹概率論中非常著名的一個不等式——切比雪夫不等式和依概率收斂的概念。70%5.1大數(shù)定律5.1.1切比雪夫(Chebyshev)不等式我們知道,數(shù)學(xué)期望E(X)反映了隨機變量X的平均值,而方差Var(X)刻畫了隨機變量X與數(shù)學(xué)期望E(X)的偏離程度.那么,在已知E(X)和Var(X)的情況下,如何利用方差Var(X)具體估計隨機變量X對數(shù)學(xué)期望E(X)的偏離程度以及近似估計隨機變量X的概率分布呢?切比雪夫不等式解決了這一問題,它是概率統(tǒng)計里一個很重要的不等式,揭示了隨機變量的一個一般性質(zhì).定理1設(shè)隨機變量X具有數(shù)學(xué)期望E(X)=μ,方差Var(X)=σ2,則對于任意正數(shù)ε,不等式成立.在證明定理之前,先解釋這個概率不等式的含義.這個不等式對連續(xù)型和離散型兩類隨機變量均成立.當隨機變量是連續(xù)型時,不等式左端的概率是概率密度曲線f(x)下兩個尾部與X軸圍成的面積(尾部概率)之和,如圖5-1所示.70%5.1大數(shù)定律5.1.1切比雪夫(Chebyshev)不等式這個不等式指出,這兩個尾部概率之和有一個上界,這個上界與方差σ2成正比,而與區(qū)間(μ-ε,μ+ε)的長度的一半的平方成反比,即σ2越小,兩尾部的面積就越小,落入?yún)^(qū)間(μ-ε,μ+ε)的概率就越大,亦即X在μ附近的密集程度越高;反之,σ2越大,兩尾部的面積就越大,落入?yún)^(qū)間(μ-ε,μ+ε)的概率就越小,亦即X在μ附近的密集程度越低.這說明了方差Var(X)完全刻畫了隨機變量X對E(X)的偏離程度.對于離散型隨機變量也可作類似的解釋.證這里僅給出連續(xù)型隨機變量情況下的證明,離散型隨機變量情況亦可類似證明.設(shè)f(x)是連續(xù)型隨機變量X的密度函數(shù),則70%5.1大數(shù)定律5.1.2依概率收斂定義1設(shè){Xn}是一個隨機變量序列,X是一個常數(shù).若對于任意正數(shù)ε,有70%5.1大數(shù)定律5.1.3三個常見大數(shù)定律定理2[伯努利(Bernoulli)大數(shù)定律]設(shè)Xn是n重伯努利試驗中事件A發(fā)生的次數(shù),已知在每次試驗中A發(fā)生的概率為p,則對任意正數(shù)ε,有70%5.2中心極限定理注①當在相同條件下重復(fù)試驗多次時,隨機事件發(fā)生的頻率是趨于穩(wěn)定的,它是在隨機事件A發(fā)生的概率附近擺動,擺動的中心即為A發(fā)生的概率.②小概率事件在一次試驗的結(jié)果中幾乎是不可能出現(xiàn)的,這個規(guī)律也稱為小概率事件原理.③事件A發(fā)生的頻率Xn/n與其概率p有較大偏差(比如大于事先給定的ε)的可能性越來越小,但這并不意味著較大偏差就不再發(fā)生了,只是說小偏差發(fā)生的概率大,而大偏差發(fā)生的概率小,小到可以忽略不計,這就是頻率穩(wěn)定于概率的含義.它與微積分中“序列的極限”是不同的.70%5.2中心極限定理中心極限定理是概率論中最著名的結(jié)果之一.粗略地說,中心極限定理指出,大量的獨立隨機變量之和具有近似于正態(tài)的分布.因此,它不僅提供了計算獨立隨機變量之和的近似概率的簡單方法,而且有助于解釋為什么在客觀世界中許多隨機現(xiàn)象都服從或近似服從正態(tài)分布.下面介紹三個常用的中心極限定理,其中證明過程都將略去.定理5[李雅普諾夫(Liapunov)中心極限定理]設(shè){Xn}是一個相互獨立的隨機變量序列,它們具有數(shù)學(xué)期望和方差:則隨機變量之和的標準化變量為70%5.2中心極限定理也就是為什么正態(tài)隨機變量在概率論中占有重要地位的一個基本原因.而當n較小時,這種近似性質(zhì)不能保證.在概率論中,常把只有在n充分大時才具有的近似性質(zhì)稱為漸近性質(zhì),而在統(tǒng)計中稱為大樣本性質(zhì).70%5.2中心極限定理極限定理的另一種形式.注意,該定理條件要求隨機變量X1,X2,…,Xn相互獨立并同分布,因此,有時也稱為獨立同分布中心極限定理.下面比較切比雪夫大數(shù)定律的推論與林德伯格—列維中心極限定理.70%5.2中心極限定理下面比較切比雪夫大數(shù)定律的推論與林德伯格—列維中心極限定理.切比雪夫大數(shù)定律告訴我們:當n充分大時,獨立同分布隨機變量的算術(shù)平均值70%5.2中心極限定理客觀世界中,人們在長期的實踐中認識到頻率具有穩(wěn)定性,即當試驗次數(shù)很大時,頻率穩(wěn)定在一個數(shù)的附近.這一事實顯示了可以用一個數(shù)來表征事件發(fā)生的可能性的大小.這使人們認識到概率是客觀存在的,進而由頻率性質(zhì)的啟發(fā)和抽象給出了概率的定義,因而頻率的穩(wěn)定性是概率定義的客觀基礎(chǔ).而伯努利大數(shù)定律則以嚴密的數(shù)學(xué)形式論證了頻率的穩(wěn)定性.中心極限定理表明,在相當一般的條件下,當獨立隨機變量個數(shù)很大時,其和的分布趨于正態(tài)分布.這一事實闡明了正態(tài)分布的重要性.中心極限定理也揭示了為什么在實際應(yīng)用中會經(jīng)常遇到正態(tài)分布,也就揭示了產(chǎn)生正態(tài)分布變量的原因.另一方面,它提供了獨立同分布隨機變量之和∑ni=1Xi(其中DXi存在)的近似分布,只要和式中項數(shù)個數(shù)充分大,就可以不必考慮和式中的隨機變量服從什么分布,都可以用正態(tài)分布來近似,這在應(yīng)用上是有效和重要的.本章小結(jié)第五章謝謝觀賞概率論與數(shù)理統(tǒng)計6.1總體和樣本6.26.3正態(tài)總體的抽樣分布第六章樣本及抽樣分布統(tǒng)計量前面五章介紹了概率論的基本內(nèi)容,主要包括隨機變量概率分布的性質(zhì)、特點和規(guī)律等.例如,求隨機變量的數(shù)字特征,討論隨機變量函數(shù)的分布律等.但是在實際問題中,隨機變量所服從的分布律可能完全不知道或部分不知道,那怎樣才能知道一個隨機變量分布律或參數(shù)呢?這就是數(shù)理統(tǒng)計需要解決的問題.數(shù)理統(tǒng)計是以概率論為理論基礎(chǔ)的一個數(shù)學(xué)分支.它從實際的觀測數(shù)據(jù)出發(fā),主要研究隨機現(xiàn)象的規(guī)律性,主要包括:實驗設(shè)計與抽樣調(diào)查設(shè)計,如何有效地收集數(shù)據(jù)與如何整理分析數(shù)據(jù),從而做出統(tǒng)計推斷.在科學(xué)研究中,數(shù)理統(tǒng)計占據(jù)一個十分重要的意義,是多種試驗數(shù)據(jù)處理的理論基礎(chǔ).章前導(dǎo)讀第六章樣本及抽樣分布70%6.1總體和樣本在實際問題中,研究對象的數(shù)量往往很大.例如,我們要了解某廠所生產(chǎn)的一批燈泡的平均壽命.由于燈泡的數(shù)量很多,且測試燈泡的壽命具有破壞性,所以我們只能從這批產(chǎn)品中抽取一部分進行壽命測試,并且根據(jù)這部分產(chǎn)品的壽命數(shù)據(jù)對整批產(chǎn)品的平均壽命做出統(tǒng)計推斷,這就是我們常說的抽樣調(diào)查.在數(shù)理統(tǒng)計中,我們把研究對象的全體稱為總體(或母體),而把組成總體的每個成員稱為個體.總體中所包含個體的個數(shù)稱為總體的容量,容量為有限的稱為有限總體,容量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江西萍鄉(xiāng)2025屆高三上學(xué)期11月期中考試化學(xué)試卷試題及答案解析
- 2025年高速鐵路客車軸承項目建議書
- 第3單元 資產(chǎn)階級民主革命與中華民國的建立(A卷·知識通關(guān)練)(解析版)
- 2025年細胞毒活苗項目發(fā)展計劃
- 旅行社車輛調(diào)度準則
- 建筑供暖單項施工合同
- 外墻綠化施工安全合同
- 零售供應(yīng)鏈資金關(guān)鍵控制政策
- 通信網(wǎng)絡(luò)鋪設(shè)工程合同會簽表
- 保險公司停電客戶服務(wù)方案
- 市場營銷試題(含參考答案)
- 2023年新高考(新課標)全國2卷數(shù)學(xué)試題真題(含答案解析)
- 貝雷片-潮白新河鋼棧橋及鋼平臺計算說明書
- VF程序設(shè)計知識要點
- 燃氣-蒸汽聯(lián)合循環(huán)機組詳介
- 初中信息技術(shù)課程教學(xué)設(shè)計案例
- 計價格[1999]1283號_建設(shè)項目前期工作咨詢收費暫行規(guī)定
- 植物與植物生理課程教學(xué)大綱
- 展廳展館中控系統(tǒng)解決方案
- 兒童福利個人工作總結(jié)報告
- 《夜宿山寺》
評論
0/150
提交評論