CFA考試:投資分析的數(shù)量方法(投資工具)_第1頁
CFA考試:投資分析的數(shù)量方法(投資工具)_第2頁
CFA考試:投資分析的數(shù)量方法(投資工具)_第3頁
CFA考試:投資分析的數(shù)量方法(投資工具)_第4頁
CFA考試:投資分析的數(shù)量方法(投資工具)_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、. 學時 投資分析的數(shù)量方法Quantitative Methods for Investment Analysis 投資工具PAGE :.;PAGE 63第五章:正態(tài)概率分布Chapter Common Probability Distributions本章簡介IntroductionP226本章的內容,是四種概率分布及它們的運用,即: the uniform; the binomial; the normal; the lognormal。本章的其他數(shù)量工具: Hypothesis testing; regression analysis;time-series analysis。不延續(xù)的

2、隨機變量Discrete Random VariablesP227 定義和解釋概率分布Probability Distributions概率分布Probability Distributions,即將隨機變量能夠結果的概率予以特定。每個隨機變量都有描畫它的概率分布,概率分布的方式有兩種: 概率函數(shù)probability functions。 累積分布函數(shù)cumulative distribution functionsdistribution functionscdf 區(qū)別:延續(xù)的隨機變量和不延續(xù)discrete的隨機變量隨機變量,是一個未來結果不確定的數(shù)。隨即變量有兩種類型:不延續(xù)的隨機變量

3、discrete random variable、延續(xù)的隨機變量continuous random variable。變量的結果能予以歷數(shù)個數(shù)有限的隨機變量,為不延續(xù)的隨機變量。 描畫某特定變量能夠結果的集合 定義一個概率函數(shù)Probability function并闡明它的關鍵特征概率函數(shù)的表示方法是:PX x,它表示隨機變量的值為x的概率。不延續(xù)隨機變量的概率函數(shù),可以縮寫為px;延續(xù)隨機變量的概率函數(shù)用fx表示,稱之為概率密度函數(shù)Probability density functionsdensitypdf。概率函數(shù)有兩個關鍵特征: 0px1; 隨機變量X一切值的概率的總和等于1。 定義

4、概率密度函數(shù)Probability density function 定義累積分布函數(shù)cumulative distribution function并根據(jù)累積分布函數(shù)計算隨機變量的概率累積分布函數(shù)cumulative distribution functionsdistribution functionscdf,表示隨機變量的結果位于某一范圍的概率。cdf函數(shù)的功能相當于累積相對頻率。延續(xù)的或不延續(xù)的隨機變量的結果的累積概率分布,可以記作FX PXx,或FX Px1Xx 2,或FXPXx。累積概率函數(shù)cdf函數(shù)的特征: 0Fx1; 隨著x的添加,cdf函數(shù)或添加或堅持不變。不延續(xù)的單項分布T

5、he Discrete Uniform DistributionP228 給定不延續(xù)的單項分布a discrete uniform distribution,定義不延續(xù)的單一隨機變量并計算概率單項分布Uniform Distribution,即隨機變量一切能夠結果的概率都相等。單項分布的運用: 它是為其它概率分布產(chǎn)生隨機數(shù)以作為隨機察看對象random observation的根底; 它可以用來描畫結果概率相等的隨機變量。貝諾里分布The binomial DistributionP230 給定貝諾里概率分布binomial Probability Distributions,定義貝氏隨機變量

6、Bernoulli Random variable并計算概率 貝諾里Binomial分布的功能貝諾里Binomial分布的功能:描畫有兩項能夠結果的隨機變量的每一項結果的概率分布。其模型是:兩項選擇的價錢模型the binomial Option Pricing Model,BOPM,即價錢的上升或價錢的下降。 貝氏隨機變量Bernoulli Random variable貝諾里分布的建構元素是貝氏隨機變量Bernoulli Random variable。假定某個能反復進展的實驗有兩個能夠的結果,每次實驗產(chǎn)生的結果必為其一,這樣的實驗稱為貝諾里實驗Bernoulli trial。在結果為勝利

7、時,那么Y1;在結果為失敗時,那么Y0,那么貝氏隨機變量Y的概率函數(shù)為:p1 pY1 pp0 pY0 1 p 貝諾里隨機變量binomial Random variable對n個貝諾里實驗,有0n個“勝利。假設單個貝諾里實驗的結果是隨機的,那么n個貝諾里實驗的結果為“勝利的總數(shù)也是隨機的。定義貝諾里隨機變量X為n個貝諾里實驗中結果為勝利的總數(shù)。用“Yi表示第i個貝諾里實驗的結果為“1或“0i 1,2,n,那么:X Y 1Y 2 Y n 。貝諾里隨機變量由參數(shù)p和n定義。p即每次實驗結果為“勝利的概率;n貝諾里實驗的次數(shù)。對貝諾里分布,可作有如下假設: 對一切貝諾里實驗,結果為“勝利的概率是一個

8、常數(shù); 貝諾里實驗相互獨立。因此,貝諾里隨機變量X可以完全用兩個參數(shù)描畫,即X Bn,p。貝氏隨機變量Y是n 1的貝諾里隨機變量的值,即:Y B1,p。 貝諾里隨機變量X Bn,p的概率函數(shù)PX = x的表示公式:px PXxnC xp x1 pn x nC x n!x!nx! X是貝諾里隨機變量,表示n個貝諾里實驗中的“勝利的總數(shù);Xx,是這n個貝諾里實驗中勝利的總數(shù)等于x。 px和PX x,表示n個貝諾里實驗中,勝利的總數(shù)等于x的概率。 nC x是在n個貝諾里實驗中有x個勝利的陳列方式的數(shù)目。 p,是單個貝諾里實驗的結果為勝利的概率;1p,是單個貝諾里實驗的結果為不勝利的概率。 p x1

9、pn x,是每一個陳列都具有的概率。 貝諾里隨機變量概率函數(shù)的外形當單個貝諾里實驗的結果為勝利的概率p50%時,貝諾里分布式對稱的。假設p50%,那么貝諾里隨機變量概率函數(shù)的圖像就具有偏向性。 當p 50% 時,概率函數(shù)的會向右偏right-skewed,即圖像的右部有較長的尾巴; 當p 50% 時,概率函數(shù)的會向左偏left-skewed。對同一貝諾里隨機變量有p1、p2,假設p1p2 1,那么它們的圖像呈鏡像對稱。 貝諾里隨機變量bernoulli Random variable的預期值和方差貝諾里隨機變量bernoulli Random variable的預期值和方差Meanweight

10、ed averageVarianceBinomial,B1,ppp1pBinomial,Bn,pnpnp1pBinomial,B5,0.52.5即5p1.25即5p1pBinomial,B5,0.10.5即5p0.45即5p1p延續(xù)的隨機變量分布Continuous Random VariablesP240 給定延續(xù)的單項分布a continuous uniform distribution,定義延續(xù)的單項隨機變量并計算概率延續(xù)的單一分布Continuous Uniform Distribution 延續(xù)的單項隨機變量的概率密度函數(shù)pdf: 1ba axbfx 0 其他值 延續(xù)的單項隨機變量的

11、累積概率函數(shù)cdf: 0 xaFx= xaba a x b 1 xb 計算概率密度函數(shù)fx在定義域axb上的面積即累積概率值的數(shù)學方法是,對函數(shù)fx從a到b積分integral,即:Paxbab fxdx可以用上述等式對,范圍內的恣意兩個實數(shù)求積分。由于延續(xù)隨機變量的值是無限的,所以,延續(xù)隨機變量的值等于任一定點的概率為0。這對計算延續(xù)隨機變量的累積概率函數(shù)cdf有重要意義:對任何延續(xù)的隨機變量X,有Paxb Pa xb Pax b Pa xb。當axb 時,fx1/ba表示的是延續(xù)隨機變量在區(qū)間axb的平均概率。正態(tài)分布The Normal DistributionP243 解釋正態(tài)分布的關

12、鍵特征 描畫正態(tài)分布的兩個參數(shù):平均值Mean和方差 2或規(guī)范差。正態(tài)分布可以表示為:X N , 2。 正態(tài)分布的下述參數(shù)值:偏向性skewness0;峰度kurtosis3,剩余峰度excess kurtosis 0。正態(tài)隨機變量的平均值mean、中值median、眾數(shù)mode都相等。 兩個正態(tài)隨機變量的線性疊加linear combination,還是正態(tài)分布。 區(qū)別:單變量univariance分布和多變量分布multivariance單變量分布univariate distribution,描畫單個的隨機變量;多變量分布multivariate distribution,描畫的是一組隨

13、機變量的概率。當我們有一組資產(chǎn)時,我們可以將每一項資產(chǎn)的收益分布分別模型化,也可以將這些資產(chǎn)作為一組as a group來將它們的收益分布模型化。作為一組,即思索收益系列之間的統(tǒng)計關系,其中經(jīng)常運用的模型就是多變量的正態(tài)分布multivariate normal distribution。n種證券的收益的多變量正態(tài)分布,可以用三個參數(shù)予以定義: 單個證券收益的平均值mean的清單; 證券收益方差的清單; 收益的一切互不一樣的相關系數(shù)correlations的清單,共nn-1/2個。與單變量正態(tài)分布相比較,相關系數(shù)correlations是多變量的正態(tài)分布的區(qū)別特征之一。 解釋相關系數(shù)在多變量正

14、態(tài)分布中的作用 定義規(guī)范正態(tài)分布standards normal distribution并解釋如何使隨機變量規(guī)范化 正態(tài)分布的概率密度函數(shù)pdf的表達式 x :fx exp x 22 2 2 當 0,1 時,該正態(tài)分布稱之為規(guī)范standard正態(tài)分布或單位unit正態(tài)分布。對于正態(tài)分布,規(guī)范差越大,其相對于平均值的分布就越分散。利用規(guī)范差,我們可以對任何正態(tài)分布的結果的分散性作出概率報告: 大約有50%的察看對象,在區(qū)間 23的范圍內; 大約有68%的察看對象,在區(qū)間 的范圍內; 大約有95%的察看對象,在區(qū)間 2的范圍內; 大約有99%的察看對象,在區(qū)間 3的范圍內。 隨機變量的規(guī)范化規(guī)

15、范正態(tài)隨機變量用Z N0 ,1表示。將隨機變量 X N , 2規(guī)范化的公式:Z X 隨機變量Xx 0 對應的規(guī)范正態(tài)隨機變量Z z0 x 0 / 。其意義是:對X N , 2,隨機變量的值小于或等于x 0的概率,正好等于規(guī)范正態(tài)分布Z N0 ,1中隨機變量的值小于或等于z0的概率z0 x 0 。即:對X N , 2有PXx 0;對Z N0 ,1有NZz0。當z0 x 0 時,那么PXx 0NZz0。 呈正態(tài)分布的隨機變量的信置區(qū)間confidence intervals 正態(tài)隨機變量X確實切信置區(qū)間confidence intervals: P x1.645s X x1.645s 90%;x也

16、記作為樣本平均值;s也記作為樣本的規(guī)范差。 x和s是店測算point estimates。 P x1.96s X x1.96s 95%; P x2.58 s X x2.58s 99%; 運用規(guī)范正態(tài)分布standards normal distribution計算概率 規(guī)范正態(tài)隨機變量累積分布函數(shù)表Nx的運用。比如查找PZ0.24的值即變量Z的值小于或等于0.24的概率,其步驟:在表的第一縱欄找到0.20,在表的第一橫欄找到0.04,兩者對應的值即為要找的概率?!纠?PZ 1.282 90% ,它表示有10%的值在圖像的右邊尾部,并且,P x1.282s X x1. 282s 80%。 PZ

17、1.645 95%,它表示有5 %的值在圖像的右尾部,或有10 %的值在90%的自信心區(qū)間之外即左右兩邊尾部各有5 %的值在90%的自信心區(qū)間之外。 了解以下關系,有助于我們運用累積分布函數(shù)Nx表: 當x0時,x右邊的分布概率PZx1.0 Nx; 對負數(shù)x,有:Nx= 1.0 Nx。由于:x右邊的分布概率和面積,等于x左邊的分布概率和面積,即:PZx Nx或PZx。正態(tài)分布的運用Application of the Normal Distribution 平均值方差分析法 平均值方差分析法mean-variance analysis平均值方差分析法,將整體的收益分布概括為平均值和方均差,進而對

18、投資決策進展評價。 將新資產(chǎn)參與到投資組合中,為了實現(xiàn)獲利須滿足: ER newR f new CorrR new,R p ER pR f p即:新資產(chǎn)的“夏普比,要大于投資組合p的“夏普比與新資產(chǎn)和投資組合P的相關系數(shù)的乘積。 馬克維茨決策規(guī)那么Markowitz decision rule。對于資產(chǎn)A和B,投資者選擇A而不選擇B,其決策根據(jù)是: A的平均收益等于或大于B的平均收益,而A的收益的規(guī)范差更小; A的平均收益大于B的平均收益,而A與B收益的規(guī)范差相等。 定義虧空風險shortfall risk虧空風險shortfall risk,即在某段時間投資組合的價值會下降到可以接受的最低程

19、度以下。如:某個曾經(jīng)界定收益方案的資產(chǎn)的價值下降到方案的債務之下,即為虧空風險shortfall risk。 計算平安首位比率safety-first ratio并利用羅伊的平安首位規(guī)范選擇最正確投資組合平安首位規(guī)那么Safety-first Rules,作為評價價值下滑風險downside risk的方法,關注的是虧空風險shortfall risk。假定R L 是投資者能接受的最低收益程度。按照Roy的平安首位規(guī)范:最優(yōu)化的投資組合,就是可以使該組合的收益R p下降到臨界程度R L以下的概率最小化的投資組合,即:PR p R L為最小值。當投資組合收益是正態(tài)分布的,我們運用規(guī)范方差能計算出

20、PR p R L。投資組合的期望收益為ER p,那么單位規(guī)范差的ER pR L最大時,投資組合的PR p R L最小。ER pR L是平均收益mean return到虧空規(guī)范的間隔 。用SFRatio表示平安首位比率safety-first ratio,那么:SFRatio = ER p-R L/ p運用Roy規(guī)范,對投資組合進展選擇的步驟: 計算投資組合的SFRatio。 根據(jù)計算所得的SFRatio值評價規(guī)范正態(tài)累積分布函數(shù)cdf。收益值小于R L的概率就是NSFRatio,即:PR p R LNSFRatio=1NSFRatio。 選擇上一步中概率最小的投資組合。SFRatio與“夏普比

21、率的差別在于R L和R f無風險收益。平安首位規(guī)那么為“夏普比率提供了一個新的角度:在運用夏普比例評價投資組合時,假定投資組合收益是正態(tài)分布的,那么夏普比率高的投資組合,是使投資組合收益小于無風險收益的概率最小的投資組合。 對數(shù)正態(tài)分布lognormal distribution和正態(tài)分布的關系 對數(shù)正態(tài)分布的概述對隨機變量Y,假設它的自然對數(shù)Y為正態(tài)分布,那么Y為對數(shù)正態(tài)分布;反之亦然。對對數(shù)正態(tài)分布,有兩點值得留意: 它的下界由0界定; 它偏向右邊即它的右邊由一個長的尾巴。假定Y是對數(shù)正態(tài)分布的,那么對數(shù)正態(tài)分布的兩個參數(shù)是:Y的平均值和方差或規(guī)范差。這樣就有兩套平均值和規(guī)范差或方差:正態(tài)

22、分布的平均值和規(guī)范差或方差;對數(shù)正態(tài)分布本身的平均值和規(guī)范差或方差。 求對數(shù)正態(tài)分布本身的平均值和規(guī)范差或方差假定正態(tài)隨機變量X有預期值 和方均差 2。定義:YexpXe x,Y是取對數(shù)的逆運算,即YX。X是正態(tài)隨機變量,而Y是對數(shù)正態(tài)變量。那么: Y的預期值是exp 0.5 2,即EY exp0.5 2。其緣由:對數(shù)正態(tài)分布擴展了,它能向上擴展但是不能向下擴展超越零,因此,分布的中心向右邊挪動,即添加了平均值。 對數(shù)正態(tài)分布本身的平均值L和方均差L2的計算公式:L exp 0.5 2L2 exp2 2exp 21 21區(qū)別:收益的延續(xù)復利和不延續(xù)復利 股票收益分布和股票價錢的關系假設股票的延

23、續(xù)復利收益率continuously compounded return是正態(tài)分布的,那么未來的股票價錢必定是對數(shù)正態(tài)分布的。同樣重要地,即使股票的延續(xù)復利收益不是正態(tài)分布的,由于中心限制實際central limit theorem的作用,股票的價錢也可用對數(shù)正態(tài)分布來描畫。 延續(xù)復利收益率與持有期報答率holding period return的關系假定股票價錢的一系列察看對象S0,S1,S2,ST ,是等間距的。如今的股票價錢S0是一個確定的數(shù)不是隨機變量,而股票的未來價錢卻是一個隨機變量。價錢比St+1 S t,等于1加上持有期報答率,即:S t+1S t 1R t+1,t 。延續(xù)復利

24、收益率,是與持有期報答率R t+1,t相伴隨的一個重要概念。延續(xù)復利收益用r t+1,t表示,那么根據(jù)EAR e rs 1可得EAR effective annual rate即R t+1,t,在期間t到t+1內,兩者的關系是:r t+1,t St+1 S t1R t+1,t在期間0到T內T-horizon,延續(xù)復利收益率與持有期報答率HPR的關系是:r0, T S T S 0 rT,T1 rT1, T2 r0,1因此,S T S 0 expr 0, T。 獨立的同一分布IID,independently and identically獨立的同一分布含義。 獨立,指投資者不能根據(jù)過去的收益預測

25、未來的收益; 同一就是假定靜止。假定單個期間的延續(xù)復利收益率rT,T 1,是平均值為、方差為 2的IID隨機變量,那么在0到T期間內延續(xù)復利收益率r0, T的期望值為:Er0, T ErT,T 1 ErT 1, T-2Er0,1 T 2r0, T 2T 比較S T S 0 expr0, T和Y expX,我們可以將未來股票價錢S T的模型作為對數(shù)正態(tài)隨機變量。由于,r0, T至少應該是近似的正態(tài)隨機變量。22給定持有期報答率HPR,計算收益的延續(xù)復利23解釋蒙特卡洛模擬和歷史模擬,并闡明它們的運用和局限性 蒙特卡洛模擬的簡介蒙特卡洛模擬的要旨,在爬梯之前要做的最后一件事,就是搖動梯子。就像搖動

26、梯子讓我們接近爬梯的風險一樣,蒙特卡洛模擬讓我們在實施一項政策前,對其進展實驗。其目的,就是發(fā)現(xiàn)對復雜的金融問題的近似處理方法。作為蒙特卡洛模擬整體的一部分,就是經(jīng)過各種各樣的假定,從概率分布中產(chǎn)生大量的隨機樣本,以模擬各種能夠的風險。蒙特卡洛模擬的運用: 在實施一項政策或投資決策前,對其進展實驗;評價處于風險中的價值Value at Risk; 對復雜的證券估價; 研討院用以測試他們的模型和投資工具。 蒙特卡洛模擬的步驟。 根據(jù)根底變量,明確規(guī)定感興趣的問題的數(shù)量Specify the quantities of interest in terms of underlying variabl

27、e。 明確規(guī)定時間坐標Specify a time grid。 對產(chǎn)生前在變量的風險要素,明確規(guī)定其分布假說Specify distributional assumptions for the risk factors that drive the underlying variables。 運用計算機程序或空白表格spreadsheet函數(shù),產(chǎn)生每一個風險要素的隨機值。 運用上一步產(chǎn)生的隨機察看對象,計算根底變量。 計算感興趣的問題的數(shù)量。 前往到第4步重新操作,直到實驗的詳盡數(shù)據(jù)完成。 蒙特卡洛模擬,是分析方法的補充。它只提供統(tǒng)計數(shù)據(jù),而不能提供準確的結果,而分析方法提供了更深化的因果關系

28、。 歷史模擬historic simulation,or back simulation,從歷史紀錄中取樣來模擬一個過程。第六章:取樣和評價Chapter Sampling and Estimation本章簡介Introduction本章的主題:是如何取樣?以及如何利用樣本信息估算群體參數(shù)?取樣的中心是中心限制實際和估算central limit theorem and estimation。取樣Sampling 定義樣本隨機取樣simple random sampling樣本simple隨機取樣,即群體中的一切元素入選的概率都相等。兩種隨機取樣的方法:簡單的隨機取樣simple random

29、 sampling和分層次的隨機取樣stratified random sampling。兩類數(shù)據(jù):橫截數(shù)據(jù)cross-sectional date和時間系列數(shù)據(jù)time-series date。 定義并解釋取樣誤差sampling error取樣誤差,即統(tǒng)計察看到的值和統(tǒng)計要估算的量之間的差。 定義取樣分布sampling distribution一個統(tǒng)計的取樣分布sampling distribution,是我們從同一群體中隨機抽取規(guī)模一樣的樣本、并對樣本進展統(tǒng)計計算,而得出的一切相互區(qū)別的能夠值的分布。 區(qū)別:簡單的隨機取樣和分層的隨機取樣stratified random sampli

30、ng簡單的隨機取樣simple random sampling,即樣本的獲得是恣意的,群體中的每一個元素,都有同等的時機被選中。分層次的隨機取樣stratified random sampling,即根據(jù)一個或多個分類規(guī)范,將群體進一步分為亞群體sub populationstrata。然后按每一層亞群體的相對規(guī)模,按比例地抽取簡單的隨機樣本,并將這些樣本集中起來。 時間系列time-series數(shù)據(jù)和橫向cross-sectional數(shù)據(jù) 時間系列數(shù)據(jù),是時間間隔相等地、不延續(xù)地搜集到的一系列數(shù)據(jù)。橫截數(shù)據(jù),是在某一時間點上的個體、團體、地域或公司的特征的數(shù)據(jù)。樣本平均值的分布Distrib

31、ution of the sample mean 闡明中心極限定律central limit theorem并闡明它的重要性假定任一概率分布描畫的群體有平均值 和限定的方差2,當我們從群體中抽取規(guī)模為n的樣本以計算樣本平均值x時,假設n足夠大n 30,那么可得: 樣本平均值x的取樣分布是近似的正態(tài)分布; 該取樣分布的樣本平均值x ,方差2x 2n 。中心極限實際: 能估計群體的平均值; 樣本統(tǒng)計的規(guī)范差,就是統(tǒng)計的規(guī)范誤差Standard Error of Statistic; 可以建構自信心區(qū)間和測試假定。 計算和解釋樣本平均值的規(guī)范差standards error樣本平均值的規(guī)范差s xS

32、tandard Error of Statistic的定義。樣本統(tǒng)計的規(guī)范差Standard deviation,就是統(tǒng)計的規(guī)范差Standard Error。因此,樣本平均值x的規(guī)范差Standard Error的計算公式有二:x n ;或s x s n 。 ns2 x i x2 n1 i1群體平均值的點估算和區(qū)間估算Point and Interval Estimates of the Population Mean 鑒別和描畫估算公式的必要特性the desirable properties估算公式Estimatorsestimation formulas和估算值estimate。估算值

33、是我們運用估算公式對樣本察看對象進展計算所得出的特定值。估算值和估算公式的區(qū)別:從群體中抽取不同的樣本進展反復的抽樣統(tǒng)計時,估算公式會產(chǎn)生不同的結果即估算值。 公正性unbiasedness。一個公正的估算公式,就是它的預期值即取樣分布的平均值正好等于它要評價的參數(shù)。 有效性efficiency。假設某個公正的估算公式是有效的,那么除了該公式外,再沒有另外一個公正的估算公式,就同樣的參數(shù)得出具有更小方差的取樣分布。 一致性consistency。假設估算公式具有一致性,那么隨著取樣規(guī)模的增大,準確的估算值接近群體參數(shù)值的估算值的概率也會添加。即隨著取樣規(guī)模無限擴展,估算值的取樣分布越來越集中于

34、我們要估算的參數(shù)的值。這三個特征,也是選擇估算公式的三個規(guī)范。 區(qū)別群體參數(shù)的點估算a point estimate和信置區(qū)間估算a confidence interval estimate對平均值或其他參數(shù)的關注,集中于兩個問題: 假定測試。它針對的問題是“參數(shù)值是等于某個特定值嗎? 估算estimation。它針對的問題是“參數(shù)的值是什么?估算包括:點估算a Point Estimates和信置區(qū)間估算。 點估算a Point Estimates按照樣本平均值計算而得的群體參數(shù)的單個估算值,稱之為平均值的點估算。 群體平均值的自信心區(qū)間Confidence Intervals for th

35、e Population Mean 信置區(qū)間的定義信置區(qū)間,即我們可以以給定的概率1信置度一定該區(qū)間包括了它要測算的參數(shù)。這個區(qū)間稱為該參數(shù)的1 信置區(qū)間。信置區(qū)間對參數(shù)給出概率解釋或實際解釋。 按照概率解釋,例如群體平均值95%的信置區(qū)間表示,在反復取樣中,在長久上,有95%的這樣信置區(qū)間將包括群體平均值。 按實際解釋,我們有95%的自信心一定單個該區(qū)間95%的信置區(qū)間即可以包括群體平均值。 信置區(qū)間的建構Construction of Confidence Intervals參數(shù)的1% 信置區(qū)間的構造:點估算值 信任要素 規(guī)范誤差Point estimate Reliability fac

36、tor Standard error。點估算值Point estimate,即一個樣本統(tǒng)計的值;信任要素Reliability factor,是以點估算值的假定分布和信置度1為根據(jù)的一個數(shù)據(jù);規(guī)范誤差Standard error,是提供點估算值的樣本統(tǒng)計的規(guī)范誤差。 描畫t- 分布的特征Students t- distribution t分布t -Distribution,是由單一參數(shù)即自在度dfdegrees of freedom定義的一個對稱的概率分布。 t分布與正態(tài)分布的比較。假定我們從一個正態(tài)分布中取樣,那么比率zx n,是一個規(guī)范的正態(tài)分布平均值為0,規(guī)范差為1;比率t xsn,那么

37、是t分布平均值為0,自在度為n1。這個用t表示的比率,不是正態(tài)分布,由于它是兩個隨機變量樣本的平均值和規(guī)范差的比,而規(guī)范正態(tài)分布的定義只需一個隨機變量x。然而,隨著自在度的添加,t分布接近于規(guī)范正態(tài)分布分布越鋒利、尾巴越瘦。 計算和解釋自在度degrees of freedom自在度的概念。對P40計算樣本規(guī)范差s的公式,分母上的項n1就是運用該等式估算群體規(guī)范差的自在度數(shù)字。運用“自在度術語其緣由為:在隨機樣本中,我們假定察看對象的選取是互不依賴的。假定計算有n個互不依賴的察看對象的樣本的平均值,那么只需n1個察看對象是可以獨立地選擇的。n1也經(jīng)常被作為根據(jù)t分布tDistribution確

38、定信任要素的自在度。 對群體方差知或未知的正態(tài)分布,計算和解釋群體平均值的信置區(qū)間 方差知的呈正態(tài)分布的群體的平均值的信置區(qū)間從方差為2的正態(tài)群體分布中取樣,那么群體平均值的1% 信置區(qū)間為:x z / 2 n規(guī)范正態(tài)分布Z0,1信置區(qū)間的信任要素Reliability Factors信置區(qū)間z / 2= 0.190%的信置區(qū)間Z 0. 05 = 1.645= 0.0595%的信置區(qū)間Z 0. 025= 1.96= 0.0199%的信置區(qū)間Z 0. 005 =2.575隨著信置度的添加,信置區(qū)間越來越寬,對我們要估算的數(shù)據(jù)能給出的信息就越不準確。 方差未知的群體的平均值的信置區(qū)間的求解 方法一

39、:z交換法the zAlternative從方差未知的任何分布的群體中取樣,當取樣規(guī)模較大時,那么群體平均值的1% 自信心區(qū)間為:x z / 2 S n 方法二:t分布法tDistribution假設從一個方差未知的群體中取樣,并且滿足以下兩個條件中的任一條件的,即: 樣本較大; 樣本較小但是群體呈正態(tài)分布或近似的正態(tài)分布。那么群體平均值的自信心區(qū)間可以表示為:x t/ 2 S n計算信任要素Reliability Factors的根據(jù)取樣的群體樣本規(guī)模較小的統(tǒng)計樣本規(guī)模較大的統(tǒng)計方差知的正態(tài)分布zz方差未知的正態(tài)分布tt或z方差知的非正態(tài)分布Not availablez方差未知的非正態(tài)分布N

40、ot availablet或z 從任何類型的分布中抽取大量的樣本,在群體方差未知時,計算和解釋群體平均值的信置區(qū)間 對選擇適當樣本規(guī)模的問題進展討論 討論數(shù)據(jù)發(fā)掘偏見date-mining bias數(shù)據(jù)窺探偏見Date-snooping,即以刺探他人閱歷性結果來引導本人的分析而得出推論所產(chǎn)生的偏見。防止方法:檢驗新數(shù)據(jù),以防止過分依托過去的研討,來解釋發(fā)現(xiàn)和得出結論。數(shù)據(jù)發(fā)掘偏見Date-mining bias,指反復的研討同一數(shù)據(jù),直至有所發(fā)現(xiàn)。數(shù)據(jù)發(fā)掘偏見的四點跡象:對數(shù)據(jù)發(fā)掘太多而又缺乏自信心Too much diggingToo little confidence;沒有過去也沒有未來N

41、o story No future。防止的方法是在樣本數(shù)據(jù)之外測試買賣規(guī)那么。 討論樣本選取偏見、現(xiàn)存關系偏見、超前偏見、時間期間偏見。 樣本選擇偏見Sample selection bias,即由于數(shù)據(jù)可獲得性的緣由,而將某項資產(chǎn)排除在分析之外,由此產(chǎn)生的問題為樣本選擇偏見。 現(xiàn)存關系偏見survivorship bias。假設測試設計沒有思索到曾經(jīng)封鎖、被兼并或因其他緣由分開了數(shù)據(jù)庫的公司的賬戶,那么屬于現(xiàn)存關系偏見。 超前偏見look-ahead bias。假設一項測試設計在測試數(shù)據(jù)上運用了不能獲得的信息,那么會產(chǎn)生超前偏見。 時間期間偏見time-period bias。假設作為測試設

42、計根據(jù)的時間期間,使結果在時間期間上特定化,屬于時間期間偏見。要留意對取樣期間長度的選擇。第七章:假定測試Chapter Hypothesis Testing假定測試Hypothesis Testing 定義假定并描畫假定測試的步驟假定,即對群體的闡明。假定測試的步驟Steps in the Hypothesis Testing: 提出假定stating the hypothesis; 確定測試統(tǒng)計和它的概率分布Identifying the test statistic and its probability distribution; 有效度的特定化Specifying the signi

43、ficance level; 聲明決議規(guī)那么Stating the decision rule; 搜集數(shù)據(jù)和進展計算Collecting the date and calculating the test statistic; 做出統(tǒng)計結論make statistical decision; 做出經(jīng)濟或投資結論make the economic investment decision。上述第、步是假定測試的傳統(tǒng)方法,可以用p值pvalue方法來替代這些步驟。 定義和解釋零假定null hypothesis和替代假定alternative hypothesis假定的類型有兩種: 零假定the n

44、ull hypotheses,用H 0表示; 替代假定the alternative hypotheses,用H a表示。零假定:除非用以進展假定測試的樣本有證聽闡明零假定是錯誤的,否那么該假定就被以為是正確。假設有證聽闡明零假定是錯誤的,那么將導致替代假定。替代假定,即零假定不成立時的假定。 單邊one-tailed假定測試和雙邊two-tailed假定測試 假定公式。假定某一群體有參數(shù)為,0 為該參數(shù)的一個值,對于兩者的關系可以經(jīng)過以下三種方式構成零假定和替代假定: H 0 :0 對 H a :0 不等于替代假定 H 0 :0 對 H a :0 大于替代假定 H 0 :0 對 H a :0

45、 小于替代假定 公式是雙邊two-sidetwo-tailed假定測試;公式與,是單邊one-sideone-tailed假定測試。 討論零假定和替代假定的選擇最常用的是“不等于not equal to替代假定,即公式。假設有證聽闡明參數(shù)能夠大于0或小于0,那么我們可以否認零假定。然而,我們有時要為我們“疑心的suspected或“希望的hoped for情形尋覓支持證據(jù)。在此情形,我們可以將替代假定定義為“該情形是真的,而將零假定定義為“情形的非真。假設證據(jù)支持對零假定的否認并接受替代假定,那么我們在統(tǒng)計上可以一定地以為我們的想法是正確的。留意:“大于和“小于替代測試,比“不等于替代測試更劇

46、烈地反映了研討者確實信。為了強調態(tài)度的中立性,在有些時候即使單邊的替代測試試合理的,研討者也會選擇“不等于替代測試。 定義和解釋測試統(tǒng)計a test statistic測試統(tǒng)計Test Statistic的定義,是根據(jù)樣本計算得出的數(shù)據(jù),它的值是決議支持或反對零假定的根據(jù)。普通地,測試假定有如下公式:測試統(tǒng)計 0s x為樣本統(tǒng)計;0為H 0下群體參數(shù)的值0;s x為樣本統(tǒng)計的規(guī)范誤差standard error。對公式的闡明:其他條件不變時,s x 越小,那么測試統(tǒng)計越大,否認零假定的概率就越大。而且,取樣規(guī)模n越大,那么s x 越小。測試零假定的測試統(tǒng)計,遵照的概率分布有四種類型: t分布對

47、t測試; z分布,即規(guī)范正態(tài)分布對z測試; 卡方分布,即the chi-squarex2distribution對卡方的測試; F分布對F測試。 定義和解釋誤差類別及誤差類別type error 解釋有效度a significance level并闡明有效度在假定測試中的運用測試統(tǒng)計計算出來后,有兩種能夠的行為,即:否認或不否認零假定。我們行為的根據(jù)是將計算出來的測試統(tǒng)計和特定的能夠值進展比較。我們選擇的比較值,是以選取的有效度the level of significance為根據(jù)的。有效度相當于證明規(guī)范,它反映了為反對零假定所必要的樣本證據(jù)。測試零假定時,存在四種能夠的結果: 否認錯誤的零

48、假定,這是正確行為; 否認正確的零假定,這屬于類型錯誤; 不否認錯誤的零假定,這屬于類型錯誤; 不否認正確的零假定,這是正確行為。否認H 0,只能犯類型的錯誤;不否認H 0,只能犯類型的錯誤。我們用表示犯類型I的錯誤的概率,這個概率就是有效度the level of significance;用犯類型II的錯誤的概率??刂苾煞N類型錯誤的概率涉及到此消彼長trade-off。假定其他量不變,減小那么會添加;減小那么會添加。同時減小兩種類型錯誤的概率的獨一方法,就是添加樣本的規(guī)模。在實際中,通常不能對兩種類型的錯誤的此消彼出息展定量的分析,由于,類型II錯誤的概率很難定量化。通常,我們只能將特定化

49、。 定義測試才干the power of a test假設測試的有效度是不正確地否認零假定的概率,那么測試才干the power of a test,就是正確地否認零假定的概率,即正確地否認錯誤的零假定的概率。某些情況,不止一個測試統(tǒng)計可以適用于假定測試。假設我們知道這些測試統(tǒng)計的相對測試才干,那么在決議運用的測試統(tǒng)計時應選擇測試才干最強的統(tǒng)計。為了保證測試的公正性,我們應該在計算測試統(tǒng)計之前確定有效度。在進展假定測試時,通常有三個有效度,即: 0.10、 0.05、 0.10。越小,證明零假定是錯誤的證據(jù)就越強。 定義和解釋結論規(guī)那么a decision rule通常的原那么可以簡述為:在測

50、試零假定時,對于由特定的有效度所決議的給定值,我們將計算所得的測試統(tǒng)計的值與之進展比較,假設我們發(fā)現(xiàn)兩者同樣極端,或者后者比前者更極端,那么我們應該否認零假定。假設結果能否認零假定,那么可以說該結果在統(tǒng)計上有效;否那么,我們只能說該結果在統(tǒng)計上無效。否認點或臨界值rejection pointscritical values的定義。測試統(tǒng)計的否認點,就是為了決議否認或不否認零假定,而與計算所得的測試統(tǒng)計值相對比的值。對于單邊測試,反對點的表示方法是,測試統(tǒng)計的符號如z、t、F等和闡明錯誤類型I的特定概率的下標如反對點Z;對于雙邊測試,反對點的表示方法是Z/2。【例】 否認點的運用以z測試為例,

51、選取0.05為有效度 對于測試H 0 :0 versus H a :0 該測試為有效度是0.05的雙邊測試,每一個尾巴的零假定測試統(tǒng)計分布,應為0.025的概率。該測試存在正負兩個反對點,即:z 0。0 2 5 1.96和-z 0。0 2 5 1.96。假設z表示計算所得的測試統(tǒng)計值,那么當z -1.96或z1.96時,那么應該否認零假定。 對于測試H 0 :0 versus H a :0,反對點是z 0。0 5 1.645。假設z1.645,那么應該否認零假定。 對于測試H 0 :0 versus H a :0,反對點是z 0。0 5 = 1.645。假設z1.645,那么應該反對零假定。

52、解釋自信心區(qū)間和假定測試的關系兩者的關系:對于測試H 0 :0 versus H a :0,零假定條件下,當群體參數(shù)的假定值在相應的自信心區(qū)間之外時,那么零假定就應該被否認。如:對 0.05的z測試兩邊測試,當01.96s x或01.96s x時Z2 1.96,那么零假定就應該被否認。平均值為的群體的95%的自信心區(qū)間是x1.96s x 。 區(qū)分:統(tǒng)計結論statistical decision和經(jīng)濟結論economic decision我們應該留意假定值的統(tǒng)計上有效與經(jīng)濟上有效區(qū)別:在統(tǒng)計上有效,不一定在經(jīng)濟上有效。由于要思索到買賣本錢、稅收和風險。經(jīng)濟結論不僅要思索統(tǒng)計結論,還要思索到一切

53、有關的經(jīng)濟問題。P值p-value的定義,就是指否認零假定的最低有效度。假設P值小于特定的有效度,零假定就應該遭到否認;否那么,零假定就不應該遭到否認。P值越小,否認零假定和有利于替代假定的證據(jù)就越劇烈。與反對點方法相比,P值提供了更準確的有關證據(jù)強度的信息。有關平均值的測試Hypothesis Tests Concerning the Mean內容:第一部分,是有關單個群體的平均值能否與假定值相等的測試;第二、三部分針對的問題是:兩個樣本平均值之間的差分別針對相互獨立的樣本和不相互獨立的樣本。 對于方差知或未知的正態(tài)分布群體,進展群體平均值的假定測試時,能確定適當?shù)臏y試統(tǒng)計并能解釋其結果單個

54、平均值的測試 t測試有關潛在underlying或群體平均值的假定測試,普通運用t測試。t測試,即假定測試運用的統(tǒng)計分布遵守t分布。t分布是由一個參數(shù)即自在度df定義的分布。t分布與規(guī)范正態(tài)分布的關系。 一樣點:對稱分布;平均值為0。 不同點:規(guī)范差大于1;遠離平均值的結果的概率更大。 方差未知的群體平均值假定測試的測試統(tǒng)計方差未知的取樣群體,假設滿足兩個條件之一的,那么測試單個群體平均值的假定測試的測試統(tǒng)計為:t n1 x0 s n這兩個條件是: 樣本的規(guī)模較大; 樣本的規(guī)模較小,但是取樣群體是正態(tài)分布或近似正態(tài)分布的。t n1為有n1個自在度的t統(tǒng)計n為取樣規(guī)模;x為樣本平均值;0為群體平

55、均值的假定值;s為樣本的規(guī)范差。 方差未知的正態(tài)分布群體平均值假定測試的測試統(tǒng)計方差未知的正態(tài)分布群體,假設樣本規(guī)模為n,那么群體平均值1001%的自信心區(qū)間為:xt/2sx, xt/2sx。t/2 是自在度為n1時2的概率堅持在右邊尾部之內的t的值;t/2 是自在度為n1時2的概率堅持在左邊尾部之內的t的值。假設樣本規(guī)模較大,我們也可以運用z測試。 z測試the z-Test Alternative 果取樣群體的方差為2,并且是正態(tài)分布,那么對單個群體平均值的假定測試的測試統(tǒng)計為:z x0n 果取樣群體的方差未知,并且取樣的規(guī)模較大,那么根據(jù)中心限制定律,有一個替代的測試統(tǒng)計:z x0s n

56、 z測試的否認點Rejection Point of a z-TestLEVEL ()hypothesisrejection pointrejection interval= 0.10H 0 :=0 vs. H a :01.645z-1.645或z1.645H 0 :0 vs. H a :01.28z1.28H 0 :0 vs. H a :0-1.28z-1.28= 0.05H 0 :=0 vs. H a :01.96z-1.96或z1.96H 0 :0 vs. H a :01.645z1.645H 0 :0 vs. H a :0-1.645z-1.645= 0.10H 0 :=0 vs. H

57、 a :02.575z-2.575或z2.575H 0 :0 vs. H a :02.33z2.33H 0 :0 vs. H a :0-2.33z-2.33 有關群體平均值的測試群體方差未知取樣的群體樣本規(guī)模較小樣本規(guī)模較大正態(tài)分布的群體t測試t測試或z測試非正態(tài)分布的群體Not availablet測試或z測試有關平均值的差的測試Test Concerning Differences between Means 據(jù)相互獨立的隨機樣本,對兩個正態(tài)分布的群體的平均值能否相等進展假定測試時,在兩個樣本的方差相等或不相等的情況下,能確定適當?shù)臏y試統(tǒng)計并能解釋其結果內容簡介。前提:取樣群體起碼是近似的

58、正態(tài)分布,并且樣本相互獨立。內容:討論測試兩個群體平均值的差的兩個t測試。兩種情形:群體的方差未知但是相等;方均差不相等但可以近似地看作t測試。 假定的構成。用1,2表示兩個群體的平均值。那么假定可寫成如下方式: H 0 :12 0 對 H a :12 0 ; H 0 :12 0 對 H a :120; H 0 :12 0 對 H a :120 。也可寫成其他方式的假定,如:H 0 :122 對 H a :12 2,等。 測試兩個群體的平均值之差的測試統(tǒng)計正態(tài)分布的兩個群體,其方差未知但相等,測試樣本為相互獨立的隨機樣本,那么t測試為:tx1 x 212s p2 n1s p2 n 212計算共

59、同方差s p2common variance的結合估算公式Pooled estimator是:s p2 n 1 1s1 2 +n 2 1s2 2 n 1n 22。自在度的數(shù)字為n 1n 22。 測試兩個群體的平均值之差的測試統(tǒng)計正態(tài)分布的兩個群體,其方差不等且未知,測試樣本為相互獨立的隨機樣本,那么近似的t測試為:t x1 x 212s12 n1s22n 212在運用t分布表時,“修正modified的自在度用下述公式計算:df s12n1s22n 2 2s12 n12 n1s22n 22n 2 關于差的平均值的測試Test Concerning Mean Differences 兩個正態(tài)分布

60、的群體的差的平均值進展假定測試時即成對比較測試paired comparisons,能確定適當?shù)臏y試統(tǒng)計并能解釋其結果本部分的t測試的根底是,成對的察看對象paired observations組成的數(shù)據(jù)。測試本身也可以稱為成對比較的測試paired comparisons test。假定有察看對象A、B,且樣本相互關聯(lián)。察看對象是成對的,用d ix Ai xBi 表示兩個成對的察看對象的差,x Ai和xBi 是第i個成對察看對象。用d 表示群體差的平均值。d0 是群體差的平均值的假定值。那么三種方式的假定為: H 0 :d d0 對 H a :d d0 ;實際中,常令d0 0 H 0 :d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論