第二章基本統(tǒng)計概念_第1頁
第二章基本統(tǒng)計概念_第2頁
第二章基本統(tǒng)計概念_第3頁
第二章基本統(tǒng)計概念_第4頁
第二章基本統(tǒng)計概念_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 基本統(tǒng)計概念的回顧2.1 求和符號通常用希臘字符表示求和,其表達式為:其中 i 為求和指數(shù),等式的左邊代表“把變量X從第一個值(I=1)加到第 n(I=n) 個值”。Xi 代表變量 X 的第 i 個值。完整的求和符號為:通常簡單地記為:求和符號的性質(zhì)性質(zhì)1.若k為常數(shù),則有:性質(zhì)2.若k為常數(shù),則有:性質(zhì)3.對兩個變量的和求和等于對兩個變量分別求和的和。 性質(zhì)4. 其中a,b為常數(shù),利用性質(zhì)1、性質(zhì)2、性質(zhì)3可得。2.2 隨機試驗、樣本空間、樣本點和事件 隨機試驗 (statistical or random experiment)隨機試驗是指至少有兩個可能結(jié)果,但不確定哪一個結(jié)果會出

2、現(xiàn)的過程。例2.1拋一枚硬幣,擲一顆骰子和從一副紙牌中抽取一張。(在這些隨機試驗中,暗含了地必須滿足的條件,例如,假定硬幣和骰子是正規(guī)的,沒有注鉛。)樣本空間或總體隨機試驗所有可能結(jié)果的集合稱為總體或樣本空間(population or sample space)。例2.2拋兩枚同樣的硬幣。H代表正面朝上,T代表正面朝下。則有四種結(jié)果: HH,HT,TH,TT。其中,HH代表第一、二枚硬幣都正面朝上,H T代表第一枚硬幣正面朝上,第二枚硬幣正面朝下,如此類推。全部的結(jié)果,或樣本空間為(HH,HT,TH,TT)沒有其他合乎邏輯的可能的結(jié)果(假設(shè)硬幣不會立起來)。樣本點樣本空間的每一種結(jié)果稱為樣本

3、點(sample point)。在例2.2中,HH,HT,TH,TT均為一樣本點。隨機事件隨機試驗的可能結(jié)果組成的集合稱為事件( events ),它是樣本空間的一個子集。例2.3如果事件A表示拋兩枚硬幣一枚正面朝上,一枚正面朝下。例2.2中,只有HT和TH屬于事件A(HT和TH是樣本空間HH,HT,TH,TT的一個子集)。如果事件B表示兩枚均正面朝上。很明顯,只有H H屬于事件B(HH也是樣本空間HH,HT,TH,TT的一個子集)。2.3 隨機變量雖然試驗的結(jié)果可用文字來描述,比如正面朝上或正面朝下,或是黑桃A等,但是如果將試驗的結(jié)果數(shù)量化,即將試驗結(jié)果和具體數(shù)字對應起來。為什么要將隨機事件

4、轉(zhuǎn)化為隨即變量?在例2.2中,不用HH,HT,TH,TT描述試驗結(jié)果,若“變量”表示了拋兩枚硬幣正面朝上的個數(shù),有如下情況:除“正面朝上次數(shù)”之外,變量還可以表示那些事件?隨機變量可能是連續(xù)的,也可能是離散的。離散型隨機變量(discrete random variable)只能取到有限多個(或是可列有限多個)數(shù)值。連續(xù)型隨機變量(continuous random variable)可以取某一區(qū)間范圍內(nèi)的任意值。例如,人的身高就是一個連續(xù)型隨機變量,它可以取在150200cm范圍內(nèi)的任一值。類似的,體重、降雨量、溫度等都可看做是連續(xù)型隨機變量。2.4 概率首先我們定義事件的概率,然后擴展到隨

5、機變量的概率。事件的概率:古典定義或先驗定義如果一隨機試驗的n個結(jié)果互斥(如果兩個事件不能同時發(fā)生,則兩個事件稱為是互斥的)且每個結(jié)果等可能發(fā)生,并且事件A含有m個基本結(jié)果,則事件A的發(fā)生的概率(probability)即P(A)就是:( 2 - 1 )這個定義有兩個特征:(1) 試驗的結(jié)果必須互斥即它們不能同時發(fā)生。(2) 試驗的每個結(jié)果等可能發(fā)生。例如,擲一顆骰子出現(xiàn)任何一個數(shù)字的機會均等。古典定義又稱為先驗定義(priori definition)。因為這些概率來自于純粹的演繹推理,沒有必要拋一枚硬幣來證明正面朝上的概率為1/2,因為它們是合乎邏輯的僅有的結(jié)果。(男女出生比率,古典定義與

6、經(jīng)驗定義的區(qū)別)但是如果試驗的結(jié)果不是有限的或不是等可能發(fā)生的,又會怎樣呢?例如,次年國民生產(chǎn)總值的概率為多少呢?或次年經(jīng)濟衰退的概率有多大?古典定義無法回答類似這樣的問題(計量經(jīng)濟學的價值和意義)。概率的頻率定義或經(jīng)驗定義例2.4200個學生微觀經(jīng)濟學的考試成績的分布就可以用頻率分布(frequency distribution)來描述。第3列數(shù)字稱為頻數(shù)(absolute frequencies),第4列的數(shù)字稱為頻率(relativefrequencies ),即頻數(shù)除以出現(xiàn)的總數(shù)。能把頻率當作概率嗎?如果觀察次數(shù)足夠多,頻率就很好地測度了(事件發(fā)生的)真實概率,則可以把頻率視為概率。如

7、果在n次試驗(或n個觀察值)中,m次屬于事件A,假定試驗的次數(shù)n足夠多,那么事件A的概率P(A)就簡單地等于m/n (即頻率)。概率的性質(zhì)(1)事件的概率在01之間。因而,事件A的概率滿足:0P(A)1(2 - 2)若P(A)= 0,即事件A不會發(fā)生;若P(A)= 1,則事件A必定發(fā)生。(2) 若事件A,B,C,. 為互斥事件,則事件和的概率等于事件概率之和,用符號表示為:P(A + B + C +.)= P(A)+ P(B)+ P(C)+ .(2 - 3)(3)若事件A,B,C,.為互斥事件,且為一完備事件組,則事件和的概率為1。用符號表示為:P(A + B + C + .)= P(A)+

8、P(B)+ P(C)+ .=1(2 - 4)(4)事件A,B,C,.為相互獨立的事件,則事件積的概率等于事件概率的積,用符號表示:P(A B C.)= P(A)P(B)P(C) .(2 - 5)其中,P(A B C.)表示事件A,B,C,.同時發(fā)生或聯(lián)合發(fā)生,因此, P(A B C.)稱為聯(lián)合概率(joint probability)。與聯(lián)合概率相對應, P(A),P(B),P(C),.稱為非條件概率( unconditional ),或邊緣概率( marginal )。例2.5假設(shè)同時拋兩枚硬幣。那么兩枚均正面朝上的概率是多少?令事件A表示第一枚正面朝上,事件B表示第二枚正面朝上,因此現(xiàn)在要

9、求概率P(A B)。一般地認為第一枚正面朝上的概率獨立于第二枚正面朝上的概率,因而有P(A B)= P(A)P(B)=( 1/2 ) ( 1/2 )=1/4(5)若事件A,B不是互斥事件,則有:P(A + B)= P(A)+ P(B)P(AB)(2 - 6)(A或者B) (A并且B)例2.6從一副撲克中抽取一張,則是紅心或是皇后的概率是多少?抽紅心抽皇后不是互斥事件,因為4張皇后中有一張是紅心。因而有:P(或是紅心或是皇后)= P(紅心) +P(皇后)P(既是紅心又是皇后)= 13/52 + 4/52-1/52= 4/13(6) 條件概率(conditional probability)若有事

10、件A,B,在事件B發(fā)生的情況下,事件A發(fā)生的概率,這種概率稱為在事件B發(fā)生條件下事件A的條件概率,用符號P(A/B)表示(2 - 7)即給定事件B,事件A發(fā)生的條件概率等于事件A、B的聯(lián)合概率與事件B的邊緣概率之比。例2.7會計班有5 0 0個學生,其中男生3 0 0人,女生2 0 0人。在這些學生中,100個男生和6 0個女生計劃主修會計學?,F(xiàn)隨機抽取一人,發(fā)現(xiàn)這個學生計劃主修會計學。那么,這個學生是男生的概率是多少?=0.625這個例子得到一個非常重要的結(jié)論:一般條件概率不等于非條件概率。如果事件A,B相互獨立,情況會如何?由于P(A B)= P(A)P(B),則。即如果兩事件是相互獨立的

11、,則事件A在給定條件B下的條件概率等于其非條件概率。2.5概率密度函數(shù)(PDF)離散型隨機變量的概率密度函數(shù)離散型隨機變量僅可取有限個數(shù)值。例2.7若隨機變量X代表拋兩枚硬幣正面朝上的次數(shù),隨機變量X取3個不同值0,1,2。在四種可能結(jié)果中,X取0值的概率為1/4 (拋兩枚硬幣沒有一枚正面朝上),X取2值的概率為1/4 (拋兩枚硬幣皆正面朝上),X取1值的概率為2/4 =1/2 (即拋兩枚硬幣其中有任一枚正面朝上)(注意:這里用概率的古典定義)用函數(shù)f(X)表示概率分布或概率密度函數(shù)(probability distribution or probability density functio

12、n,PDF),給出了變量X的可能值以及與之相對應的概率值。 (2-8)圖2 - 1給出離散型概率密度函數(shù)的幾何圖形。連續(xù)型隨機變量的概率密度函數(shù)連續(xù)型隨機變量的概率密度函數(shù)指隨機變量在某一特定范圍或區(qū)間內(nèi)的概率。例2.7令X代表某一連續(xù)型隨機變量人的身高,如果求其在某一區(qū)間內(nèi)(比如說6068英寸;1英寸=2.539999918 cm;150172cm)的概率,見圖2.2。中國牧民鮑喜順(身高:2.361米)與最矮的人:肯尼亞的Kiran Shah(身高:1.263米)吉尼斯世界紀錄大全(2006年版)2010年1月14日,土耳其伊斯坦布爾,來自中國的何平平(身高74厘米)和土耳其人科森(Sul

13、tanKosen)(身高2.465米)出席吉尼斯世界紀錄路演。累積分布函數(shù)(cumulative distributionfunction,CDF) (2-9)其中,P(Xx)表示隨機變量X取小于或等于x的概率。P(X2)表示變量X取小于或等于2的概率。例2.8拋幣4次,求隨機變量(正面朝上的次數(shù))的概率密度函數(shù)和累積分布函數(shù)。根據(jù)累積分布函數(shù)的定義,累積分布函數(shù)僅僅是當X的值小于或等于某一給定x時的概率密度函數(shù)的“累積”或簡單求和 (2 - 10)其中,表示對X的值小于或等于給定的x的所有概率密度函數(shù)求和。因此,本例中X取小于2的概率為5/16,X取小于3的概率為11/16,X取小于4的概率

14、為1(完備事件組)。例2.8離散型隨機變量的累積分布函數(shù)連續(xù)型隨機變量的累積分布函數(shù)2.6 多元隨機變量的概率密度函數(shù)最簡單的多元概率密度函數(shù):雙變量概率密度函數(shù)例2.9下表給出了50支債券的等級(X)及收益率(Y)數(shù)據(jù),其中X有三個不同水平:X= 1 ( Bbb ),X=2(Bb), X= 3 ( B )。根據(jù)標準普爾債券等級評定,Bb的信用略高于B,而Bbb又略高于Bb。表2-2:雙變量的頻數(shù)分布:債券等級(X)與債券收益(Y)表2-2提供了兩個變量X和Y的頻數(shù)分布。把表中每一個數(shù)值都除以50,將頻數(shù)轉(zhuǎn)化為頻率,即概率(為了簡單起見,假設(shè)總體或樣本空間僅由50種債券組成)。表2-3提供了一

15、個雙變量或聯(lián)合概率密度函數(shù)(joint PDF)。表中每一值都為聯(lián)合概率(joint probability)即變量X取一給定值(例如取2)與變量Y取一給定值(例如取11.5%)時的概率。通常用f (X,Y)表示聯(lián)合概率密度函數(shù)。表2-3:雙變量概率密度令X、Y是兩個離散型隨機變量,則函數(shù):(2-11)稱為離散型聯(lián)合概率密度函數(shù)。它給出了當X取x,且Y取y的概率。非條件概率密度函數(shù)(邊緣概率密度)當X取一給定值(例如取2)而無論Y取值如何時的概率(0.40)稱為X的非條件概率,其概率密度函數(shù)稱為X的非條件概率密度函數(shù)。同樣,表2-4也給出了Y的非條件概率。單變量的非條件概率密度函數(shù)或邊緣概率密

16、度函數(shù),例如f(X) , f(Y),與雙變量的或聯(lián)合概率密度函數(shù)有什么聯(lián)系嗎?非條件概率密度函數(shù)f(X)或f(Y)的和為多少?表2-4 X與Y的邊緣概率分布條件概率密度函數(shù)(conditional probability density function)在債券等級為1的條件下,收益為8.5%的概率是多少?即在給定X= 1的條件下,Y= 8.5%的概率是多少? (2-12)其中,f(YX)代表Y的條件概率密度函數(shù);它給出了在給定X=x(例如取1)條件下Y取y值(例如,8.5%)的概率。類似地,給出X的條件概率密度函數(shù):(2-13)計算條件概率密度函數(shù)的方法: ( 2 - 1 4 )即在給定另一

17、變量取值條件下某變量的條件概率密度函數(shù)等于這兩個變量的聯(lián)合概率與另一變量的非條件概率密度函數(shù)之比。求f (Y= 8.5X= 1 )0.26/0.300.8667統(tǒng)計獨立性當兩個變量X和Y稱為統(tǒng)計獨立的,當且僅當它們的聯(lián)合概率密度函數(shù)可以表示成為其非條件概率密度函數(shù)之積。f (X,Y) = f (X) f (Y) (2-15)例2.10一個袋子中放著分別寫有1,2,3的三個球?,F(xiàn)從袋子中有放回地隨機抽取兩球(即每次抽取一個,然后放回再抽取一個)。令變量X表示第一次抽取球的數(shù)字,Y代表第二次抽取球的數(shù)字。表2-5給出這兩個變量的聯(lián)合概率密度函數(shù)和邊緣概率密度函數(shù)。表2-5 兩隨機變量的統(tǒng)計獨立性現(xiàn)

18、計算概率f (Y = 1, X = 1 ) , f (Y = 1 ) , f (X = 1 )。由表知概率值分別為1 / 9,1 / 3和1 / 3,其中,第一個為聯(lián)合概率,而剩下的兩個為邊緣概率,則這兩個變量具有統(tǒng)計獨立性( statisticallyindependence )。例2.11債券等級與債券收益是獨立隨機變量嗎?2.7 概率密度的特征期望值:對集中趨勢的度量離散型隨機變量的期望值(expected value)用符號E(X)表示,其定義為:(2 - 16)其中f ( X )是X的概率密度函數(shù),表示對所有X求和。例2.12擲一個骰子若干次。求每個數(shù)字出現(xiàn)的期望值?表2-6 隨機變

19、量(正面朝上數(shù)字)的期望值期望的性質(zhì)(1) 常數(shù)的期望值是其自身。若b為一常數(shù),則有:E(b) = b ( 2 - 1 7 )(2) 兩隨機變量和的期望值等于兩變量期望值之和。給定隨機變量X和Y,有E (X+Y) =E(X) +E(Y) ( 2 - 18 )(3) (4) E(XY) E(X)E(Y) ( 2 - 19 )但是,如果隨機變量X和Y相互獨立,則有:E(XY)= E(X)E(Y) (2-20)(5) 若a為常數(shù),則有:E (a X )= a E(X) ( 2 -2 1 )(6) 若a,b為常數(shù)E (aX+b)=a E(X) +E(b)= a E(X) + b ( 2 -2 2 )方

20、差( variance ):對離散程度的度量期望值簡單地給出了隨機變量密度的中心,但卻沒有表明單個值在均值附近是如何分散或分布的。例如房價、收入(2-23)其中,u表示期望值。式(2-23)表明隨機變量的方差等于該變量與其均值之差的平方的期望值。因而,方差表明了隨機變量X的各取值與其期望值或均值的偏離程度。如果所有X的值恰好都等于E (X ),則方差為零,如果X的值偏離均值幅度很大,則方差也相對較大。圖: 同期望值的連續(xù)型隨機變量的概率密度函數(shù)的正的方根稱為標準差(standard deviation,s.d)。若X是離散型隨機變量,方差計算公式為即需先求出變量X與其期望值之差,然后求其平方,

21、再乘以其相應概率,對變量X的每一取值重復上述過程,最后把所有求得的值累加。例2.13擲一個骰子若干次,求方差。表2-7 隨機變量X (正面朝上的數(shù)字)的方差方差的性質(zhì):(1)常數(shù)的方差為零。根據(jù)常數(shù)定義,一個常數(shù)沒有變異性。(2) 如果X 與Y是兩個相互獨立的隨機變量,那么,var (X + Y) = var ( X ) + var ( Y ) ( 2 - 2 4)var (XY) = var ( X ) + var ( Y )即兩獨立隨機變量的和或差的方差等于兩變量方差的和。(3) 如果b是一常數(shù),那么,var ( X + b ) = var ( X ) ( 2 - 2 5)(4)如果a為一

22、常數(shù),那么,var ( a X ) = a2var ( X ) ( 2 - 26 )即隨機變量常數(shù)倍的方差等于該變量方差的常數(shù)平方倍。(5)如果a, b為常數(shù),那么,var ( aX +b ) = a2var ( X )( 2 -27 )由性質(zhì)( 3 )和性質(zhì)( 4 )得到。(6) 如果X 與Y 相互獨立,a, b為常數(shù),那么,var (a X +b Y ) = a2var ( X ) +b2var ( Y ) ( 2 - 28 )協(xié)方差期望值和方差是描述單變量概率密度函數(shù)最常用的特征前者給出了中心值,后者描述了單個值是圍繞中心分布的程度。但是,一旦超出單變量概率密度函數(shù)的情況,就需要考慮除了

23、期望值和方差之外,多個隨機變量概率分布函數(shù)的數(shù)字特征,如協(xié)方差( covariance ),相關(guān)系數(shù)( correlation )。令隨機變量X 和Y的期望分別為ux,uy,其協(xié)方差為:( 2 - 29 )協(xié)方差是一種特殊形式的期望值,它度量了兩變量同時變動的狀況。如果X與Y是離散型隨機變量,協(xié)方差計算公式為兩隨機變量的協(xié)方差可正可負。如果兩個變量同方向變動,則協(xié)方差為正;如果兩個變量反方向變動,則協(xié)方差為負。例:2.14計算變量X(債券等級)和變量Y(債券收益)的協(xié)方差。首先用原始數(shù)據(jù)計算=(8.5)(1)(0.26)+(8.5)(2)(0.10)+(8.5)(3)(0.00)+(11.5)

24、(1)(0.04)+(11.5)(2)(0.28)+(11.5)(3)(0.04)+(17.5)(1)(0.0)+(17.5)(2)(0.02)+(17.5)(3)(0.26) (見前面的表)=26.54E(X)=ux=2.0,E(Y)=uy=12.10,因而有:cov(X,Y)=26.54(2.0)(12.10)=2.34即債券等級與債券收益的協(xié)方差為正。驗證了我們是如何編制債券等級的:等級3代表了風險最大的債券(也即B級)。因此,風險越高,期望收益就越大。協(xié)方差的性質(zhì)(1)若隨機變量X,Y相互獨立,則其協(xié)方差為零。已證明:如果兩變量是獨立的,則把上式帶到式( 2 - 3 3 )中,得到兩個變量的協(xié)方差為零。(2) cov (a+bX, c+dY) = bd cov (X,Y) (2-30)其中, a , b , c , d 為常數(shù)。(3) cov (X,X) = var ( X ) (2-31)即變量與其自身的協(xié)方差就是變量的方差。相關(guān)系數(shù)協(xié)方差僅僅表明兩個變量的變動方向,并未告訴我們兩變量之間的相關(guān)程度的大小。相關(guān)系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論