統(tǒng)計量與假設(shè)檢驗_第1頁
統(tǒng)計量與假設(shè)檢驗_第2頁
統(tǒng)計量與假設(shè)檢驗_第3頁
統(tǒng)計量與假設(shè)檢驗_第4頁
統(tǒng)計量與假設(shè)檢驗_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章統(tǒng)計量與假設(shè)檢驗 案例 1 序列的描述性統(tǒng)計量用 Eviews 軟件對工作文件htwtl.wfl中序列 X(身高)的完成以下任務(wù):1、計算描述性統(tǒng)計量;2、繪制直方圖;3、在顯著性水平 0.05 下,判斷是否服從正態(tài)分布。 分析1、相關(guān)概念與公式直方圖顯示了序列中數(shù)據(jù)的頻數(shù)分布, 它將序列的范圍 (最大值與最小值之間的距離)按相等的組距進行劃分,并顯示落入每一組距中的觀測值的個數(shù)。常用的描述性統(tǒng)計量主要包括:均值、中位數(shù)、最大值、最小值、標(biāo)準(zhǔn)差、偏度與峰度。 均值( Mean)x1 x2xnxn 中位數(shù)( Median)當(dāng)把序列按從小到大的順序排列時, 序列的中間值 (當(dāng)序列有奇數(shù)項時)

2、 或兩個中間值的平均數(shù)(當(dāng)序列有偶數(shù)項時)為該序列的中位數(shù)。 最大值( Maximum)與最小值 (Minimum) 標(biāo)準(zhǔn)差( Std.Dev. )1ns( xi x)2n1 i 1這里 s 為樣本標(biāo)準(zhǔn)差( sample standard deviation ),是變量(總體)標(biāo)準(zhǔn)差的無偏估計,函數(shù)命令為 stdev(x,s) 。 偏度(Skewness) 衡量序列分布圍繞其均值的非對稱性。S1 n( xix ) 3n i 1s (n 1) n , 是 變 量 標(biāo) 準(zhǔn) 差 的 有 偏 估 計 , 函 數(shù) 命 令 為這 里 ,stdevp(x,s)(population standard dev

3、iation)。如果序列的分布是對稱的, S 值為 0。正的 S 值意味著序列分布有長的右拖尾,負(fù)的S 值意味著序列分布有長的左拖尾。 峰度( Kurtosis ) 度量序列分布的凸起或平坦程度,計算公式如下K1n( xix) 4n i1正態(tài)分布的 K 值為 3。如果 K 值大于 3,分布的凸起程度大于正態(tài)分布;如果 K 值小于 3,序列分布相對于正態(tài)分布是平坦的。 JB 統(tǒng)計量用來檢驗序列是否服從正態(tài)分布,統(tǒng)計量的計算由下式給出:JBn k S21(K 3)2 2 (2)64對于一個正常的序列, k 值取零;如果該序列是某一回歸方程的殘差序列,則 k 是解釋變量的個數(shù)。在原假設(shè)( 該序列服從

4、正態(tài)分布 )成立的條件下, JB 統(tǒng)計量服從自由度為 2 的卡方分布。2、Eviews 的相關(guān)操作 打開工作文件 htwtl.wfl,打開序列 X; 在序列 X 窗口的工具欄中選擇 View/Descriptive Statistics & Tests/ Histogram and Stats, 將生成如下圖形:圖 2.1序列的直方圖與描述性統(tǒng)計量從圖 2.1 可以看出, JB 統(tǒng)計量的值為 0.292922 ,概率值為 0.863759 ,兩者之間的關(guān)系可通過下述命令解釋 ( 見第一章表 1.2)scalar p=chisq(0.292922,2)則在Eviews窗口左下角的狀態(tài)欄顯示sca

5、lar p=0.863759。上述概率值 0.863759 表示自由度為2 的卡方統(tǒng)計量大于0.292922值。因為 0.863759 0.05 (單側(cè)檢驗),所以不能拒絕原假設(shè),即認(rèn)為序列的概率x 服從正態(tài)分布。 案例 2 組的描述性統(tǒng)計量用 Eviews 軟件對工作文件htwtl.wfl中組 GROUP01完成以下任務(wù):1、計算序列 X, Y 的描述性統(tǒng)計量;2、求序列 X,Y 的方差、協(xié)方差和相關(guān)系數(shù)。 分析用 x , y , xy2 分別表示 X,Y 的標(biāo)準(zhǔn)差和協(xié)方差, r 表示 X,Y 的皮爾遜相關(guān)系數(shù),則x( x x) 2ny1( yy) 2nr2xy2xyxy1x)( yy)(

6、xn( x x)( yy)( xx)2( y y)21、計算序列 X, Y 的描述性統(tǒng)計量 打開工作文件 htwtl.wfl,建立包含序列X,Y 的組對象 GROUP01; 打開組對象 GROUP01,在組窗口的工具欄中選擇 View/Descriptive Stats/ commonsample, 則出現(xiàn)以下圖 2.2 窗口,圖中顯示了序列 X,Y 的描述性統(tǒng)計量。圖 2.2組對象的描述性統(tǒng)計量2、求序列 X,Y 的方差、協(xié)方差和相關(guān)系數(shù)在組窗口的工具欄中選擇View/CovarianceAnalysis,在隨后出現(xiàn)的對話框中選擇 Covariance 和 correlation,點擊 OK

7、,則出現(xiàn)圖 2.3 窗口。圖 2.3 序列間的協(xié)方差和相關(guān)系數(shù)圖 2.3 中的對角線是 X,Y 的方差,左下角是 X,Y 的協(xié)方差和相關(guān)系數(shù)。從圖 2.3 可知 X,Y 之間的相關(guān)系數(shù)為 0.862045 0.8 ,屬于高度相關(guān)。這一點也可通過散點圖獲得, 如圖 2.4 所示,散點圖在觀察兩個變量相關(guān)性方面具有直觀的優(yōu)點,但無法從數(shù)量上把握兩個變量之間的線性相關(guān)程度。210200190180Y17016015014013046810121416X圖 2.4 x與 y 之間的散點圖 案例 3單總體假設(shè)檢驗1、單總體均值的假設(shè)檢驗?zāi)程菑S用自動打包機裝糖,每包糖的重量均服從正態(tài)分布,其標(biāo)準(zhǔn)重量為10

8、0 千克 , 某日開工后測得9 包重量如下 :93.3, 98.7, 100.5, 101.2, 98.3, 99.7, 99.5, 102.1, 100.5 當(dāng)顯著性水平0.05時, 判斷該日打包機工作是否正常? 求平均每包糖重量置信系數(shù)為0.95 的置信區(qū)間,該區(qū)間是否包括100?你能由此得出什么結(jié)論? 分析 假設(shè)檢驗建立假設(shè)H0:0 ,H1:0構(gòu)造小樣本統(tǒng)計量TXH 01)0 t (ns.d.n在顯著性水平為時,接受域為t 2 (n1), t2 ( n1) , 從而拒絕域為, t2 ( n1 )t2 ( n 1 ),對本例而言 , 已知樣本容量n=9 為小樣本,樣本均值 x =99.31

9、11 ,樣本標(biāo)準(zhǔn)差s.d.=2.546784,99.31111100t9=-0.81148 -2.31=- t0.025 (8) , 落入接受域內(nèi),2.546784接受原假設(shè),認(rèn)為當(dāng)顯著性水平0.05 時, 該日打包機工作正常。Eviews 的操作步驟建立工作文件 test.wfl,文件頁為 case3-1,建立序列 X;打開序列 X,在序列 X 窗口的工具欄中選擇 View/Descriptive Statistics &Tests/Simple HypothesisTests , 出現(xiàn)圖 2.5, 在 mean后填入 100,點擊 OK,則出現(xiàn)圖 2.6 。圖 2.5單總體均值的假設(shè)檢驗設(shè)

10、定窗口圖 2.6單總體均值假設(shè)的T 檢驗結(jié)果從圖 2.6 可知 t 統(tǒng)計量的值為 -0.811481 ,與上面分析中的計算結(jié)果一致;可以用兩種方法判斷原假設(shè)是否成立方法一, scalar s1=qtdist(0.025,obs(x)-1)=-2.31 , -0.811481 大于 -2.31 ,t 統(tǒng)計量落入接受域內(nèi),故原假設(shè)成立?;蛘?scalars1=qtdist(0.975,obs(x)-1)=?方法二, scalar s2=tdist(-0.811481, obs(x)-1)=0.4406,0.4406大于0.025 ,故不能否定原假設(shè)。注:若總體標(biāo)準(zhǔn)差已知,則把樣本標(biāo)準(zhǔn)差s.d. 換

11、成,相應(yīng)的 T 統(tǒng)計量成為 Z 統(tǒng)計量, Z 服從標(biāo)準(zhǔn)正態(tài)分布。比如,對于本例若已知總體標(biāo)準(zhǔn)差=2.3 ,則在圖 2.5 選項“ Enter s.d. if knowm”中填入 2.3 ,其它操作不變,點擊 OK,則出現(xiàn)圖 2.7 ,從圖 2.7 得出與圖 2.6 相同的結(jié)論,即不能否定原假設(shè)。圖 2.7 單總體均值假設(shè)的Z 檢驗結(jié)果 為求置信區(qū)間,構(gòu)造變量X t (n1)s.d .nXt2 (n 1) 1,或者所以, P( t 2 ( n 1)s.d . /nP( Xt2 (n1)s.d .Xt 2 (n1)s.d.) 1nn所以,的置信系數(shù)為 1的置信區(qū)間為 Xt2 (n1)s.d. ,

12、X t 2 ( n 1) s.d. nnEviews 的操作步驟打開工作文件test.wfl的文件頁 case3-1 ;計算置信區(qū)間的上界,在命令窗口輸入scalar CI_X_HIGH=mean(x)+qtdist(0.975,obs(x)-1)*(stdev(x)/(obs(x).5),并回車,雙擊工作文件窗口中的圖標(biāo)CI_X_HIGH ,可以看到在屏幕左下角的狀態(tài)欄出現(xiàn) scalar CI_X_HIGH=101.268742947 。計算置信區(qū)間的下界,在命令窗口輸入scalar CI_X_LOW=mean(x)-qtdist(0.975,obs(x)-1)*(stdev(x)/(obs

13、(x).5),并回車,雙擊工作文件窗口中的圖標(biāo) CI_X_LOW,可以看到在屏幕左下角的狀態(tài)欄出現(xiàn) scalar CI_X_LOW =97.3534792752 。所以,平均每包糖重量置信系數(shù)為0.95 的置信區(qū)間為 97.3534792752 ,101.268742947 ,該區(qū)間包含 100。由此可見 0.95 的置信區(qū)間就是顯著性水平為 0.05 的接受域, 100 落入了接受域內(nèi),故不能否定原假設(shè)。2、單總體方差的假設(shè)檢驗?zāi)耻囬g生產(chǎn)鋼絲, 生產(chǎn)過程一向比較穩(wěn)定, 今從產(chǎn)品中隨機抽取10 根,測得折斷力數(shù)據(jù)如下:578,572 ,570 ,568 ,572, 570, 570,572,

14、596, 584已知折斷力X 服從正態(tài)分布,問折斷力方差2=64 是否可信(取顯著性水平0.05 ) 分析根據(jù)已知,樣本容量n=10, 樣本方差 S2 =75.7建立假設(shè): H:264,H :264012( n1) S2H0構(gòu)造統(tǒng)計量:2( n1)2在顯著性水平為時,接受域為212 (n1),22 ( n 1) , 從而拒絕域為0, 212 (n1)22 (n 1),對本例而言,20.975 (9)2.70, 20.025 (9)19.02(101)75.710.65(2.70,19.0) ,即落入接受域內(nèi),認(rèn)為折斷力總體的方差64與 64 無顯著性差異??ǚ綑z驗的 Eviews 操作如下打開

15、工作文件 test.wfl, 新建文件頁為 case3-2, 建立序列 Y;打開序列 Y,在序列 Y 窗口的工具欄中選擇 View/Descriptive Statistics &Tests/Simple Hypothesis Tests , 出現(xiàn)圖 2.7, 在 Variance 后填入 64,點擊 OK,則出現(xiàn)圖 2.8 。圖 2.7單總體方差的假設(shè)檢驗設(shè)定窗口圖 2.8單總體方差的假設(shè)檢驗結(jié)果從圖 2.8 可知卡方統(tǒng)計量的值為 10.65 ,與上面分析中的計算結(jié)果一致;概率值為 0.3005 大于 0.025 ,故不能否定原假設(shè)。 案例 4 兩總體均值差異的顯著性檢驗國家統(tǒng)計調(diào)查隊在兩個

16、地區(qū)分別調(diào)查了 10 個家庭的收入(單位:人民幣元),數(shù)據(jù)見工作文件。 根據(jù)歷史資料知兩地區(qū)家庭收入的方差相同。 給定顯著性水平0.05 ,檢驗該兩地區(qū)家庭的平均收入有無顯著性差異? 分析建立假設(shè): H:120,H:12001構(gòu)造統(tǒng)計量:因為本例數(shù)據(jù)屬于小樣本,且總體方差未知,所以應(yīng)該使用t統(tǒng)計量:( XY )(12 )H 0T t ( n1 n 2 2)( n1 1) S121)S22( n22( 11 )n1n 2n1n2在顯著性水平為時,接受域為t2 (n1 n2 1),t2 (n1n2 1) , 從而拒絕域為, t 2(n1 n2 1)t 2 (n1 n2 1),對于本例 x 1514

17、4.09, y 16820 .91, s14401.44 ,s25437.44t15144 .0916820 .910.75801)( 4401.44) 21)( 5437 .44 ) 2(10(10( 11 )101021010t=-0.7580 -2.10=-t0.025 (18),所以接受原假設(shè),即認(rèn)為兩地區(qū)家庭收入的均值沒有顯著性差異。Eviews 的操作步驟打開工作文件test.wfl,新建文件頁為 case4, 建立序列對象 X,Y,建立包含序列 X,Y 的組對象GROUP01,并輸入數(shù)據(jù);打開組對象GROUP01,在組窗口的工具欄中選擇View/Tests of Equality

18、,出現(xiàn)圖 2.9 窗口;在圖 2.9 窗口選擇 mean,點擊 OK,出現(xiàn) 2.10 窗口。圖 2.9兩總體均值的假設(shè)檢驗設(shè)定窗口圖 2.10兩總體均值的假設(shè)檢驗結(jié)果從圖 2.10 方法( Method)一欄中,可以看出 t 統(tǒng)計量的值為 -0.757987 ,概率值為 0.4583 大于 0.025 ,故接受原假設(shè)。注意,因為兩總體均值差異的顯著性檢驗就是單因素多水平均值方差分析退化成兩個水平情形,所以輸出結(jié)果的中間部分也給出了方差分析( Analysis of Variance )的結(jié)果。 案例 5單因素方差分析某飲料公司生產(chǎn)出一種新型飲料,該飲料瓶的包裝顏色共有紅、橙、黃、綠四種,各種瓶

19、中裝的是同一飲料,其他因素都相同。現(xiàn)隨機從規(guī)模大致相同的5家超市收集了前一期的銷售資料,如下表所示, 運用方差分析的理論, 說明飲料的顏色對銷售量有沒有顯著影響。 (取顯著性水平0.05 )表 2.1某種飲料在5 家超市的銷售量資料表單位:箱超市序號紅色橙色黃色綠色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8 分析在研究中如果同時有多個子總體時, 應(yīng)用 t 檢驗需要兩兩加以比較, 顯得十分繁瑣,并且信息沒有得到充分利用。 因此,我們往往應(yīng)用綜合性更強的方差分析( Ana

20、lysis of Variances, 簡略表示為 ANOVA)方法取而代之。方差分析的思路為, 將來自各子總體抽樣樣本匯合在一起, 先假設(shè)它們來自一個總體(即假設(shè)無差異),然后將這個匯合樣本的總變動 (用離差平方和表示)分解為兩部分,一部分是組內(nèi)變動( within ),代表本組內(nèi)各案例值關(guān)于組平均值的分布離散程度。 另一部分是組間變動 (between),代表各組平均值關(guān)于總平均值的分布離散程度。 將這兩部分變動各自除以它們對應(yīng)的自由度, 即得到均方差。組間變動均方差除以組內(nèi)變動均方差以后的統(tǒng)計量服從 F 分布。于是我們可以根據(jù)統(tǒng)計值對應(yīng)的顯著性水平?jīng)Q定接受或拒絕無差異的原假設(shè)。對于本案例

21、,首先建立假設(shè)0yellow1,orange,yellow,green 不全相等H: redorangegreen , H:redEviews 的操作步驟打開工作文件test.wfl,新建文件頁為ANOVA,建立序列對象RED,ORANGE,YELLOW,GREEN,建立包含序列 RED,ORANGE,YELLOW,GREEN的組對象 GROUP01,并輸入數(shù)據(jù);打開組對象GROUP01,在組窗口的工具欄中選擇View/Tests of Equality,出現(xiàn)和圖 2.9 相同的窗口;在出現(xiàn)的窗口中選擇mean,點擊OK,出現(xiàn)2.11 窗口。圖 2.11單因素方差分析從圖 2.11 得知, A

22、NOVA F-test 的值為 10.48620 ,相應(yīng)的概率值為 0.0005 小于 0.05 ,故拒絕原假設(shè),認(rèn)為飲料顏色對銷售量有高度顯著的影響。 作業(yè) 用 Eviews 軟件解決以下問題1、某種沐浴用肥皂制造程序的設(shè)計規(guī)格中要求每批平均生產(chǎn)120 塊肥皂,高于或低于該數(shù)量標(biāo)準(zhǔn)則被認(rèn)為是不合理的?,F(xiàn)由 10 批產(chǎn)品所組成的一個樣本中,每批肥皂的產(chǎn)量如下:108, 118, 120,122,119, 113,124,122,120, 123在 0.05 的顯著性水平下,檢驗該樣本結(jié)果能否說明制造過程運行良好?2、某大學(xué)管理學(xué)院考慮專業(yè)設(shè)置情況,現(xiàn)已知會計專業(yè)與財務(wù)專業(yè)皆為市場所需求,但似乎

23、會計專業(yè)的畢業(yè)生年薪高于財務(wù)專業(yè)。現(xiàn)在某地區(qū)隨機抽取會計與財務(wù)專業(yè)的畢業(yè)生各11 名調(diào)查其參加工作第一年的年薪情況,數(shù)據(jù)見表2.2 ,試在 0.05 的顯著性水平下,判斷會計專業(yè)畢業(yè)生的年薪是否與財務(wù)專業(yè)畢業(yè)生年薪下相同?表 2.2某大學(xué)對某地區(qū)會計與財務(wù)專業(yè)的畢業(yè)生第一年年薪情況調(diào)查表單位萬元會計財務(wù)5.645.065.245.585.405.245.624.945.045.845.945.264.725.004.605.584.905.805.484.705.385.243、某調(diào)查公司調(diào)查了市場專業(yè)人員的公司倫理價值觀,調(diào)查結(jié)果間表2.3 ,高分值表示倫理價值觀念程度高。表 2.3某公司市

24、場專業(yè)人員公司倫理價值觀調(diào)查資料市場專業(yè)人員市場管理人員市場研究人員廣告人員656分值557446545656446在 0.05 的顯著性水平下,檢驗 3 個專業(yè)人員群體之間的倫理價值觀念有無顯著差異。4、已知班同學(xué)身高與體重的數(shù)據(jù)如表2.4 所示。表 2.4班同學(xué)身高與體重序身高體重號( Height )( Weight )1169502170603168544170665163526172507162488165559175521017575111705512162551317560141645815172601617555171807018170851916048201625121169482215745

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論