統(tǒng)計學(xué)高教第三版課后習(xí)題答案_第1頁
統(tǒng)計學(xué)高教第三版課后習(xí)題答案_第2頁
統(tǒng)計學(xué)高教第三版課后習(xí)題答案_第3頁
統(tǒng)計學(xué)高教第三版課后習(xí)題答案_第4頁
統(tǒng)計學(xué)高教第三版課后習(xí)題答案_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章

1.什么是統(tǒng)計學(xué)?怎樣理解統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)的關(guān)系?

答:統(tǒng)計學(xué)是一門收集、整理、顯示和分析統(tǒng)計數(shù)據(jù)的科學(xué)。統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)

存在密切關(guān)系,統(tǒng)計學(xué)闡述的統(tǒng)計方法來源于對統(tǒng)計數(shù)據(jù)的研究,目的也在于對

統(tǒng)計數(shù)據(jù)的研究,離開了統(tǒng)計數(shù)據(jù),統(tǒng)計方法以致于統(tǒng)計學(xué)就失去了其存在意義。

2.簡要說明統(tǒng)計數(shù)據(jù)的來源

答:統(tǒng)計數(shù)據(jù)來源于兩個方面:直接的數(shù)據(jù):源于直接組織的調(diào)查、觀察和科學(xué)

實驗,在社會經(jīng)濟(jì)管理領(lǐng)域,主要通過統(tǒng)計調(diào)查方式來獲得,如普查和抽樣調(diào)查。

間接的數(shù)據(jù):從報紙、圖書雜志、統(tǒng)計年鑒、網(wǎng)絡(luò)等渠道獲得。

3.簡要說明抽樣誤差和非抽樣誤差

答:統(tǒng)計調(diào)查誤差可分為非抽樣誤差和抽樣誤差。非抽樣誤差是由于調(diào)查過程中

各環(huán)節(jié)工作失誤造成的,從理論上看,這類誤差是可以避免的。抽樣誤差是利用

樣本推斷總體時所產(chǎn)生的誤差,它是不可避免的,但可以控制的。

4.答(1)有兩個總體:A品牌所有產(chǎn)品、B品牌所有產(chǎn)品

(2)變量:口味(如可用10分制表示)

(3)匹配樣本:從兩品牌產(chǎn)品中各抽取1000瓶,由1000名消費(fèi)者分別打

分,形成匹配樣本。

(4)從匹配樣本的觀察值中推斷兩品牌口味的相對好壞。

第二章、統(tǒng)計數(shù)據(jù)的描述

思考題

1描述次數(shù)分配表的編制過程

答:分二個步驟:

(1)按照統(tǒng)計研究的目的,將數(shù)據(jù)按分組標(biāo)志進(jìn)行分組。

按品質(zhì)標(biāo)志進(jìn)行分組時,可將其每個具體的表現(xiàn)作為一個組,或者幾個表現(xiàn)合并

成一個組,這取決于分組的粗細(xì)。

按數(shù)量標(biāo)志進(jìn)行分組,可分為單項式分組與組距式分組

單項式分組將每個變量值作為一個組;組距式分組將變量的取值范圍(區(qū)間)作

為一個組。

統(tǒng)計分組應(yīng)遵循“不重不漏”原則

(2)將數(shù)據(jù)分配到各個組,統(tǒng)計各組的次數(shù),編制次數(shù)分配表。

2.解釋洛倫茲曲線及其用途

答:洛倫茲曲線是20世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計學(xué)家洛倫茲根據(jù)意大利經(jīng)濟(jì)學(xué)

家帕累托提出的收入分配公式繪制成的描述收入和財富分配性質(zhì)的曲線。洛倫茲

曲線可以觀察、分析國家和地區(qū)收入分配的平均程度。

3.一組數(shù)據(jù)的分布特征可以從哪幾個方面進(jìn)行測度?

答:數(shù)據(jù)分布特征一般可從集中趨勢、離散程度、偏態(tài)和峰度幾方面來測度。常

用的指標(biāo)有均值、中位數(shù)、眾數(shù)、極差、方差、標(biāo)準(zhǔn)差、離散系數(shù)、偏態(tài)系數(shù)和

峰度系數(shù)。

4怎樣理解均值在統(tǒng)計中的地位?

答:均值是對所有數(shù)據(jù)平均后計算的一般水平的代表值,數(shù)據(jù)信息提取得最充分,

具有良好的數(shù)學(xué)性質(zhì),是數(shù)據(jù)誤差相互抵消后的客觀事物必然性數(shù)量特征的一種

反映,在統(tǒng)計推斷中顯示出優(yōu)良特性,由此均值在統(tǒng)計中起到非常重要的基礎(chǔ)地

位。受極端數(shù)值的影響是其使用時存在的問題。

5對比率數(shù)據(jù)的平均,為什么采用幾何平均?

答:比率數(shù)據(jù)往往表現(xiàn)出連乘積為總比率的特征,不同于一般數(shù)據(jù)的和為總量的

性質(zhì),由此需采用幾何平均。

6.簡述眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合。

答:眾數(shù)、中位數(shù)和均值是分布集中趨勢的三個主要測度,眾數(shù)和中位數(shù)是從數(shù)

據(jù)分布形狀及位置角度來考慮的,而均值是對所有數(shù)據(jù)計算后得到的。眾數(shù)容易

計算,但不是總是存在,應(yīng)用場合較少;中位數(shù)直觀,不受極端數(shù)據(jù)的影響,但

數(shù)據(jù)信息利用不夠充分;均值數(shù)據(jù)提取的信息最充分,但受極端數(shù)據(jù)的影響。

7為什么要計算離散系數(shù)?

答:在比較二組數(shù)據(jù)的差異程度時,由于方差和標(biāo)準(zhǔn)差受變量值水平和計量單位

的影響不能直接比較,由此需計算離散系數(shù)作為比較的指標(biāo)。

練習(xí)題:

1.頻數(shù)分布表如下:

服務(wù)質(zhì)量等級評價的頻數(shù)分布

服務(wù)質(zhì)量等級家庭數(shù)(頻率)頻率%

A1414

B2121

C3232

D1818

E1515

合計100100

條形圖(略)

2(1)采用等距分組:

n=40全£巨=152-88=64取組£巨為10

組數(shù)為64/10=6.4取6組

頻數(shù)分布表如下:

40個企業(yè)按產(chǎn)品銷售收入分組表

按銷售收入分組企業(yè)數(shù)頻率向上累積向下累積

(萬元)(個)(%)企業(yè)數(shù)頻率企業(yè)數(shù)頻率

100以下512.5512.540100.0

100-110922.51435.03587.5

110-1201230.02665.02665.0

120-130717.53382.51435.0

130?140410.03792.5717.5

140以上37.540100.037.5

合計40100.0一一一一

(2)某管理局下屬40個企分組表

按銷售收入分組(萬元)企業(yè)數(shù)(個)頻率(%)

先進(jìn)企業(yè)1127.5

良好企業(yè)1127.5

一般企業(yè)922.5

落后企業(yè)922.5

合計40100.0

3采用等距分組

全總巨=49-25=24

n=40取組距為5,則組數(shù)為24/5=4.8取5組

頻數(shù)分布表:

按銷售額分組(萬元)頻數(shù)(天數(shù))

25-304

30-356

35-4015

40-459

45-506

合計40

15

io.

9

A

uo

n

b

66

u:

4

o

253035404550

sales

4..(1)排序略。

(2)頻數(shù)分布表如下:

100只燈泡使用壽命非頻數(shù)分布

按使用壽命分組(小時)燈泡個數(shù)(只)頻率(%)

650-66022

660-67055

670-68066

680-6901414

690-7002626

700~7101818

710-7201313

720-7301010

730-74033

740-75033

合計100100

直方圖(略)。

(3)莖葉圖如下:

6518

6614568

67134679

6811233345558899

6900111122233445566677888899

70001122345666778889

710022335677889

720122567899

73356

74147

5等距分組

n=65全距=9-(-25)=34取組距為5,組數(shù)=34/5=6.8,取7組

頻數(shù)分布表:

按氣溫分組天數(shù)

-25--208

-20--158

-15--1010

-10--514

-5—014

0—54

5—107

合計65

44

O

A

O

U88

n

b7

U:

4

-20-10010

tempture

7(1)莖葉圖如下:

A班B班

樹莖

數(shù)據(jù)個數(shù)樹葉樹葉數(shù)據(jù)個數(shù)

03592

14404484

297512245667778912

119766533211060112346889

23988777665555544433321007001134498

7665520081233456

663222090114566

0100003

(3)A班考試成績的分布比較集中,且平均分?jǐn)?shù)較高;B班考試成績的分布比A班分散,

且平均成績較A班低

8.箱線圖如下:(特征請讀者自己分析)

9.(1)工=274.1(萬元);Me=272.5;Q=260.25;Qu=291.25。

(2)s=21.17(萬元)。

%3,

10.甲企業(yè)平均成本一=19.41(元),

笠X

/=1\i

乙企業(yè)平均成本月-=18.29(元);

X

i=l2i

原因:盡管兩個企業(yè)的單位成本相同,但單位成本較低的產(chǎn)品在乙企業(yè)的產(chǎn)量中所占

比重較大,因此拉低了總平均成本。

11.——426.67(萬元);

Ez

/=1

za-元『力

s=上y--------=116.48(萬元)

[Zz-i

13(1)離散系數(shù),因為它消除了不同組數(shù)據(jù)水平高低的影響。

4.2

v=------=0.024

(2)成年組身高的離散系數(shù):172.1;

23

叭=—=0.032

幼兒組身高的離散系數(shù):'71.3;

由于幼兒組身高的離散系數(shù)大于成年組身高的離散系數(shù),說明幼兒組身高

的離散程度相對較大。

14.表給出了一些主要描述統(tǒng)計量

方法A方法B方法C

平均165.6平均128.73平均125.53

中位數(shù)165中位數(shù)129中位數(shù)126

眾數(shù)164眾數(shù)128眾數(shù)126

標(biāo)準(zhǔn)偏差2.13標(biāo)準(zhǔn)偏差1.75標(biāo)準(zhǔn)偏差2.77

極差8極差7極差12

最小值162最小值125最小值116

最大值170最大值132最大值128

先考慮平均指標(biāo),在平均指標(biāo)相近時考慮離散程度指標(biāo)。

應(yīng)選擇方法A,其均值遠(yuǎn)高于其他兩種方法,同時離散程度與其他兩組相近。

15.(1)風(fēng)險的度量是一個不斷發(fā)展的問題,在古典金融理論中,主要采用標(biāo)準(zhǔn)

差這個統(tǒng)計測度來反映,現(xiàn)代金融中,采用在險值(valueatrisk)?

(2)無論采用何種風(fēng)險度量,商業(yè)類股票較小

(3)個人對股票的選擇,與其風(fēng)險偏好等因素有關(guān)。

第四章

1.總體分布指某個變量在總體中各個個體上的取值所形成的分布,它是未知的,

是統(tǒng)計推斷的對象。從總體中隨機(jī)抽取容量為n的樣本…,天),它的分布

稱為樣本分布。由樣本的某個函數(shù)所形成的統(tǒng)計量/(…,工2,…,%),它的分布稱

為抽樣分布(如樣本均值、樣本方差的分布)

2.重復(fù)抽樣和不重復(fù)抽樣下,樣本均值的標(biāo)準(zhǔn)差分別為:

因此不重復(fù)抽樣下的標(biāo)準(zhǔn)差小于重復(fù)抽樣下的標(biāo)準(zhǔn)差,兩者相差一個調(diào)整系數(shù)

3.解釋中心極限定理的含義

答:在抽樣推斷中,中心極限定理指出,不論總體服從何種分布,只要其數(shù)學(xué)期

望和方差存在,對總體進(jìn)行重復(fù)抽樣時,當(dāng)樣本容量充分大,樣本均值趨近于正

態(tài)分布。中心極限定理為均值的抽樣推斷奠定了理論基礎(chǔ)。

第四章、參數(shù)估計

1.簡述評價估計量好壞的標(biāo)準(zhǔn)

答:評價估計量好壞的標(biāo)準(zhǔn)主要有:無偏性、有效性和相合性。設(shè)總體參數(shù)。的

估計量有a和a,如果£何)=e,稱a是無偏估計量;如果@和苗是無偏估計

量,且。闖小于。倒2),則自比。更有效;如果當(dāng)樣本容量8,自f8,

則自是相合估計量。

2.說明區(qū)間估計的基本原理

答:總體參數(shù)的區(qū)間估計是在一定的置信水平下,根據(jù)樣本統(tǒng)計量的抽樣分布計

算出用樣本統(tǒng)計量加減抽樣誤差表示的估計區(qū)間,使該區(qū)間包含總體參數(shù)的概率

為置信水平。置信水平反映估計的可信度,而區(qū)間的長度反映估計的精確度。

3.解釋置信水平為95%的置信區(qū)間的含義

答:總體參數(shù)是固定的,未知的,置信區(qū)間是一個隨機(jī)區(qū)間。置信水平為95%

的置信區(qū)間的含義是指,在相同條件下多次抽樣下,在所有構(gòu)造的置信區(qū)間里大

約有95%包含總體參數(shù)的真值。

4.簡述樣本容量與置信水平、總體方差、允許誤差的關(guān)系

答:以估計總體均值時樣本容量的確定公式為例:"

E2

樣本容量與置信水平成正比、與總體方差成正比、與允許誤差成反比。

練習(xí)題:

2.解:由題意:樣本容量為〃=49

若g5G囁=篇=2.143

(1)

cr

(2)a=0.05,ES忑1.96*2.143=4.20028

若x=]20,(x-z/~^,x+Ci

a2(120-4.20028,120+4.20028)

(3)

=(115.7997,124.20028)

2.解:由題可得:n=36,x=3.317,5=1.609

盡管采用不重復(fù)抽樣,但因為樣本比例很?。ú坏?.5%),其抽樣誤差與重

復(fù)抽樣下近似相同,采用重復(fù)抽樣的抽樣誤差公式來計算。

〃=36為大樣本,則在a的顯著性水平下的置信區(qū)間為:

x-zi—f=,x+z

a27nal2

當(dāng)a=01,%/2=L64,置信區(qū)間為(2.88,3.76)

當(dāng)a=0.05,1/2=L96,置信區(qū)間為(2.80,3.84)

當(dāng)a=0.01,q/2=2.56,置信區(qū)間為(2.63,4.01)

5解:假設(shè)距離服從正態(tài)分布,〃=16,4=9.375,s=4.113

平均距離的95%的置信區(qū)間為X-^0.025,X+10,025(1

(7.18,11.57)

32

7解:由題意:n=50,p=—=64%o

因為均超過5,大樣本

(1)總體中贊成比率的顯著性水平為a的置信區(qū)間為

P)

P-Z,P+j/2

P0—P)=].96*

當(dāng)a=0.05時,E-z年"%

al2n

置信區(qū)間為(50.區(qū),77.3%)

(2)如果要求允許誤差不超過10%,置信水平為95%,則應(yīng)抽取的戶數(shù):

(1/2)2萬(1-1)_L96?*0.8*02

n=x62

E20.12

8.此題需先檢驗兩總體的方差是否相等:

TT22TT,

:a}=g,Hi:cr~0(y\

在5%的顯著性水平下,F(xiàn)=s;/$=96.8/102.0=0.949

線025(13,6)=5.37,砧(13,6)=1/^025(6,13)=1/3.6=0.28,不拒絕原假設(shè)

認(rèn)為兩總體方差是相同的。

(1)

\-a90%,(用-弓)±抬5。9)9.8±1.729798.44*0.21=9.8±1.729*4.55

即(1.93,17.669)

(2)

=9.8±2.093198.44*921

l-a=95%,(x,-x!)±?0025(19)=9.812.093*4.55

即(0.27,19.32)

11.大樣本的情況(〃「%)±7口2.為止0+區(qū)止?

VI~巧

(1)90%置信度下\

/……',/…,40%*60%30%*70%

(40%-30%)±1.645*.----------+-----------=10%±6.979%(3.021%,16.979)

、7VI~250----:-----250

(2)95配置信度下V

,?上40%*60%30%*70%

(40%-30%)±1.96*.----------+-----------=10%±8.316%(1.684%,18.316%)

12.解:由題可計算s;=0.2422,s;=0.0762

兩個總體方差比8在95%的置信區(qū)間為:

W;")五"U=(4。6s)

14.解:由題意:(r=120,Za/2=L96,E=20

則必須抽取的顧客數(shù)為:〃==]39

("2b2

E20

第五章、假設(shè)檢驗

思考題

1.1.理解原假設(shè)與備擇假設(shè)的含義,并歸納常見的幾種建立原假設(shè)與備擇假設(shè)

的原則.

答:原假設(shè)通常是研究者想收集證據(jù)予以反對的假設(shè);而備擇假設(shè)通常是研究者

想收集證據(jù)予以支持的假設(shè)。建立兩個假設(shè)的原則有:

(1)原假設(shè)和備擇假設(shè)是一個完備事件組。(2)一般先確定備擇假設(shè)。再確定

原假設(shè)。(3)等號“=”總是放在原假設(shè)上。(4)假設(shè)的確定帶有一定的主觀色

彩(5)假設(shè)檢驗的目的主要是收集證據(jù)來拒絕原假設(shè)。

2.第一類錯誤和第二類錯誤分別是指什么?它們發(fā)生的概率大小之間存在怎樣

的關(guān)系?

答:第I類錯誤指,當(dāng)原假設(shè)為真時,作出拒絕原假設(shè)所犯的錯誤,其概率為a。

第H類錯誤指當(dāng)原假設(shè)為假時;作出接受原假設(shè)所犯的錯誤,其概率為尸。在

其他條件不變時,a增大,£減小;,增大,a減小。

3.什么是顯著性水平?它對于假設(shè)檢驗決策的意義是什么?

答:假設(shè)檢驗中犯第一類錯誤的概率被稱為顯著性水平。顯著性水平通常是人們

事先給出的一個值,用于檢驗結(jié)果的可靠性度量,但確定了顯著性水平等于控制

了犯第一錯誤的概率,但犯第二類錯誤的概率卻是不確定的,因此作出“拒絕原

假設(shè)”的結(jié)論,其可靠性是確定的,但作出“不拒絕原假設(shè)”的結(jié)論,其可靠性

是難以控制的。

4.什么是p值?p值檢驗和統(tǒng)計量檢驗有什么不同?

答:P值是當(dāng)原假設(shè)為真時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算

得到的檢驗統(tǒng)計量值的概率。P值常常作為觀察到的數(shù)據(jù)與原假設(shè)不一致程度的

度量。統(tǒng)計量檢驗采用事先確定顯著性水平。,來控制犯第一類錯誤的上限,p

值可以有效地補(bǔ)充。提供地關(guān)于檢驗可靠性的有限信息?!ㄖ禉z驗的優(yōu)點在于,

它提供了更多的信息,讓人們可以選擇一定的水平來評估結(jié)果是否具有統(tǒng)計上的

顯著性。

5.什么是統(tǒng)計上的顯著性?

答:一項檢驗在統(tǒng)計上是顯著的(拒絕原假設(shè)),是指這樣的(樣本)結(jié)果不是

偶然得到的,或者說,不是靠機(jī)遇能夠得到的。顯著性的意義在于“非偶然的

練習(xí)題

3.解(1)第一類錯誤是,供應(yīng)商提供的炸土豆片的平均重量不低于60克,但

店方拒收并投訴。

(2)第二類錯誤是,供應(yīng)商提供的炸土豆片的平均重量低于60克,但店

方?jīng)]有拒收。

(3)顧客會認(rèn)為第二類錯誤很嚴(yán)重,而供應(yīng)商會將第一類錯誤看得較嚴(yán)重。

4.解:提出假設(shè)“0:〃K6,42:〃>6

已知=1.19,〃=100,a=0.05

(1)檢驗統(tǒng)計量為Z=T"N(O,1)

y/~n

(2)拒絕規(guī)則是:若Z〉%,拒絕H0;否則,不拒絕“。

(3)由亍=6.35得:Z=G*6=2.94>ZO.O5=L64,HQ,認(rèn)為改進(jìn)工

Vioo

藝能提高其平均強(qiáng)度。

5解:設(shè)〃為如今每個家庭每天收看電視的平均時間(小時)

需檢驗的假設(shè)為:6.70,吊:〃>6.70

調(diào)查的樣本為:”=200,元=7.25,$=2.5

卜存士大心?必?代4旦+亍-6.707.25-6.700.55*14.14

大樣本下檢驗統(tǒng)計量為:z=-----=-----7—=----------=3.11

s/&2.5/V2002.5

在0.01的顯著性水平下,右側(cè)檢驗的臨界值為玄創(chuàng)=2.33

因為z>2.33,拒絕"o,可認(rèn)為如今每個家庭每天收看電視的平均口寸間增加了

6.解:提出假設(shè)%:吟4o■葭=0.752,H]:謚>0.752

已知:n=30,s2=2,a=0.05

檢驗統(tǒng)計量/=空=黑|=103>忌(29)=42.557

0VCR。.75

拒絕“0,可判定電視使用壽命的方差顯著大于VCR

7.解:提出假設(shè):”0:〃]一生=5,"1:〃1一以2

£=0.02,々=100,〃2=50,獨立大樣本,則檢驗統(tǒng)計量為:

z二十2里辿37.1458

—+㈣

\n,n2V10050

而Zo.oi=2.33因為|z|>Za〃,摑色H0,平均裝配時間之差不等于5分鐘

8.解:匹配小樣本提出假設(shè):"o>從,

由計算得:d=0.625,=1.302,n=S,a=0.05,檢驗統(tǒng)計量為

0.625

d-01.3577<f(7)=1.8946,不拒絕4。,不能認(rèn)為廣告提高

1.302/血005

了潛在購買力的平均得分。

9.解:提出假設(shè):H。:兀[N兀2,HJ.兀i〈兀2

107301

已知:

n1,=288,P1i=----=0.684,%2=367,=----=0.82,=0.1

288?367

大樣本,則檢驗統(tǒng)計量為:

L5288*0.684+367*0.82八%

p=—---=------------=0.76

〃1+%288+367

0.684—0.82

z=口p,~p?2==-4.0476

1+±|JO.76*O.24|-

yu〃JV1288367J

而Z0,=L29,因為z<-z0「拒絕”°,可認(rèn)為信息追求者消極度假的比率顯著

小于非信息追求者。

10.解:提出假設(shè):“0:b;=靖,/7]:力2工蟾

由題計算得:.=25,.=0.221,%=22,”=0。77

2八°。?2

檢驗統(tǒng)計量為:尸=力==二y=8.2376,而《025(24,21)=2.37

0.077

尸>笈/2(勺-1,〃2-1),所以拒絕"°,認(rèn)為兩種機(jī)器的方差存在顯著差異。

相關(guān)與回歸分析

思考題

1.相關(guān)分析與回歸分析的區(qū)別與聯(lián)系是什么?

答:相關(guān)與回歸分析是研究變量之間不確定性統(tǒng)計關(guān)系的重要方法,相關(guān)分析主

要是判斷兩個或兩個以上變量之間是否存在相關(guān)關(guān)系,并分析變量間相關(guān)關(guān)系的

形態(tài)和程度?;貧w分析主要是對存在相關(guān)關(guān)系的現(xiàn)象間數(shù)量變化的規(guī)律性作出測

度。但它們在研究目的和對變量的處理上有明顯區(qū)別。它們均是統(tǒng)計方法,不能

揭示現(xiàn)象之間的本質(zhì)關(guān)系。

3.什么是總體回歸函數(shù)和樣本回歸函數(shù)?它們之間的區(qū)別是什么?

答:以簡單線性回歸模型為例,總體回歸函數(shù)是總體因變量的條件期望表現(xiàn)為自

變量的函數(shù):E(y|xJ=/(Xj=a+/7Xj,或匕+總體回歸函數(shù)是

確定的和未知的,是回歸分析所估計的對象。樣本回歸函數(shù)是根據(jù)樣本數(shù)據(jù)所估

計出的因變量與自變量之間的函數(shù)關(guān)系:R=益+/七或y=0+/玉+《.?;貧w分

析的目的是用樣本回歸函數(shù)來估計總體回歸函數(shù)。它們的區(qū)別在于,總體回歸函

數(shù)是未知但是確定的,而樣本回歸函數(shù)是隨樣本波動而變化;總體回歸函數(shù)的參

數(shù)風(fēng),是確定的,而樣本回歸函數(shù)的系數(shù)是隨機(jī)變量;總體回歸函數(shù)中的

誤差項外不可觀察的,而樣本回歸函數(shù)中的殘差項e,是可以觀察的。

4.什么是隨機(jī)誤差項和殘差?它們之間的區(qū)別是什么?

答:隨機(jī)誤差項〃,表示自變量之外其他變量的對因變量產(chǎn)生的影響,是不可觀察

的,通常要對其給出一定的假設(shè)。殘差項e:指因變量實際觀察值與樣本回歸函數(shù)

計算的估計值之間的偏差,是可以觀測的。它們的區(qū)別在于,反映的含義是不同

且可觀察性也不同,它們的聯(lián)系可有下式:

ei=y,滁,)=(a+/3x:+0x)=(a-a)+(/7—/?)七+/

5.為什么在對參數(shù)進(jìn)行最小二乘估計時,要對模型提出一些基本的假定?

答:最小二乘法只是尋找估計量的一種方法,其尋找到的估計量是否具有良好的

性質(zhì)則依賴模型的一些基本的假定。只有在一系列的經(jīng)典假定下,最小二乘估計

量才是BLUE。

15..為什么在多元回歸中要對可決系數(shù)進(jìn)行修正?

答:在樣本容量一定下,隨著模型中自變量個數(shù)的增加,可決系數(shù)N會隨之增

加,模型的擬合程度上升,但自由度會損失,從而降低推斷的精度,因此需要用

自由度來修正可決系數(shù),用修正的可決系數(shù)來判斷增加自變量的合適性。

16.在多元線性回歸中,對參數(shù)作了t檢驗后為什么還要作方差分析和F檢驗?

答:t檢驗僅是對單個系數(shù)的顯著性進(jìn)行檢驗,由于自變量之間存在著較為復(fù)雜

的關(guān)系,因此有必要對回歸系數(shù)進(jìn)行整體檢驗,方差分析和F檢驗就是對回歸方

程的整體統(tǒng)計顯著性進(jìn)行的檢驗方法。

練習(xí)題

1.解:設(shè)簡單線性回歸方程為:y=/3\S+£

⑴采用。LS估計:員=六遣])=蠹翁。,

我=虧一障=549.8-0.786*647.88=40.566

回歸系數(shù)經(jīng)濟(jì)意義:銷售收入每增加1萬元,銷售成本會增加0.786萬元。

[za一萬)(另一份了334229.09

(2)可決系數(shù)為:R0.9998

七一可22(必_9)2-425053.73*262855.25

JR2)Z(—)20.0002*262855.25

回歸標(biāo)準(zhǔn)誤:&

10

(3)檢驗統(tǒng)計量為:t=223.76

(A)-6/泛(門丫-2.29/V425053.73

所以凡是顯著不為零I---------廠

(4)預(yù)測:%=,+P2x}=40.566+0.786*800=669.366

95%的預(yù)測區(qū)間為

06t

芥±1.96*O-J1+-+—2=669.366±1.96*2.29,11+—+^°~

/N〃Z(x,-可V124250f

即(664.579,674.153)

2.

00-

CM-■

1

6570758085

X

(2)負(fù)相關(guān)關(guān)系

(3)

SourcessdfMSNumberofobs=9

F(1,7)=24,67

Model.6381186861.638118686Prob>F=0.0016

Residual,1810369067.025862415R-squared=0.7790

AdjR-squared=0.7474

Total,8101555928.102394449RootMSE=.16082

yCoef.Std.Err.tp>ltl|95%Conf.Interval]

X..0704144,0141757-4.970.002-.1039346-.0368941

.cons6.0178311.052265.720.0013.5296328.50603

(4)估計的斜率系數(shù)為-7.0414,表示航班的正點率每提高1%,百萬名乘客

的投訴次數(shù)會下降:7.0414*0.01=0.070414次。

(5)如果牛=0.8,則為=6.0178—7.0414*0.8=0.38468次

3.

Resultsofmultipleregressionfory

Summarymeasures

MultipleR0.9521

R-Square0.9065

AdjR-Square0.8910

StErrofEst3.3313

ANOVATable

SourcedfSSMSFp-value

Explained31937.7485645.916258.20480.0000

Unexplained18199.751511.0973

Regressioncoefficients

CoefficientStdErrt-valuep-valueLowerlimit

Constant32.99313.138610.51210.000026.3991

xl0.07160.01484.85390.00010.0406

x216.87273.99564.22280.00058.4782

x317.90424.88693.66370.00187.6372

4.

SourceSSdfMSNumberofobs=29

Mode12.9873e+1012.9873e+10Prob>F=0.0000

Residual265831846279845623.91R-squared=0.9912

Tota13.0139e+10281.0764e+09RootMSE=3137.8

consumpCoef.Std.Err.tP>lt1[95%Conf.Interval]

gnp.5459054.009910655.080.000.5255705.5662403

_cons2426.563809.87893.000.006764.8294088.298

SourceSSdfMSNumberofobs=29

F(1,27)=3034.13

bbdel2.9873e+1012.9873計1。Prob>F=0.0000

Residual265331769279845621.08R-$quared=0.9912

AdjR-squared=0.9909

Total3,339*1。28l.0764e+09RootMSE=3137.8

consumpCoef.Std.Err.1p>ltl|95%Conf.Inlerval]

gnpf,5459054,009910655.080.000,5255705.5662403

.cons131260.21869.52870.210.000127424.3135096.2

5.

SourceSSdfMSNumberofobs=28

F(2,26)=12845.95

Mode16.2442e+1023.1221e+10Prob>F=0.0000

Residual63190678.2262430410.7R-squared=0.9990

AdjR-squared=0.9989

Tota16.2505e+10282.2323e+09RootMSE=1559

consumpCoef.Std.Err.tP>lt1[95%Conf.Interval]

gnp.1325853.03981543.330.003.0507435.2144272

consump_1ag.8546615.078106910.940.000.69411051.015213

SourceSSdfMSNumberofobs=28

F(2,25)=8120.05

Model2.9088e+1021.4544e+10Prob>F=0.0000

Residual44777396.2251791095.85R-squared=0.9985

AdjR-squared=0.9983

Tolal2.9132e+10271.0790e+09RootMSE=1338.3

consumpCoef.Sid.Err.tP>l11[95%Conf.Interval]

gnp.1603467.03525954.550.000.0877283.2329651

consump_1ag,7797504.071005410.980.000.633512.9259889

_cons1211.364377.80583.210.004433.25881989.47

SourceSSdfMSNumberofobs=29

c/1o7\_inaQ7

Mode1.0435950091.043595009Prob>F=0.0000

Residual.00949510927.000351671R-squared=0.8212

Tota1.05309011828.001896076RootMSE=.01875

consump_ra-oCoef.Std.Err.tP>lt1[95%Conf.Interval]

gnp-6.59e-075.92e-08-11.130.000-7.81e-07-5.38e-07

_cons,6662515.0048402137.650.000.6563202.6761829

7.解

(1)樣本容量:it=dfrss+1=15

(2)RSS=TSS-ESS=66042-65965=77

(3)dfRSS=n-k=15-3=n,dfESS=k-\=2

(4)R2=竺==0.9988,A?=1—(1-R2)£zl=1-(1-0.9988)—=0.9986

TSS66042'>n-k'y12

ESS/(k-l)霽=5"小式2』2)=3.89

(5)用F檢驗:

RSS/(n-k)

X2,%3整體對y有顯著影響,但不能確定單個對y的貢獻(xiàn)。

?1.某汽車制造廠2003年產(chǎn)量為30萬輛。

(1)若規(guī)定2004—2006年年遞增率不低于6%,其后年遞增率不低于5%,2008年該廠汽車

產(chǎn)量將達(dá)到多少?

(2)若規(guī)定2013年汽車產(chǎn)量在2003年的基礎(chǔ)上翻一番,而2004年的增長速度可望達(dá)到

7.8%,問以后9年應(yīng)以怎樣的速度增長才能達(dá)到預(yù)定目標(biāo)?

(3)若規(guī)定2013年汽車產(chǎn)量在2003年的基礎(chǔ)上翻一番,并要求每年保持7.4%的增長速度,

問能提前多少時間達(dá)到預(yù)定目標(biāo)?

解:設(shè),年的環(huán)比發(fā)展水平為X”則由已知得:X2003=30,

(1)又知:&2叱無"血弊"KG%3,左且叫“K5%2,求必四

彳2003x2004》2005-^2006-^2007

由上得』=正『2(1+6%)3(1+5%)2

尤2003”2003尤2007

即為^oo8.>l.O63l.O52,從而2008年該廠汽車產(chǎn)量將達(dá)到

30

得X2OO823OX1.063X1.052=30X63131=39.393(萬輛)

從而按假定計算,2008年該廠汽車產(chǎn)量將達(dá)到39.393萬輛以上。

(2)規(guī)定2=2,殳”=1+7.8%,求

工2003元2003

由上得9a13=9/X2OI3,X2(X>4

V工2004V*2003次2003

==31.078=107.11%

可知,2004年以后9年應(yīng)以7.11%的速度增長,才能達(dá)到2013年汽車產(chǎn)量在2003

年的基礎(chǔ)上翻一番的目標(biāo)。

(3)設(shè):按每年7.4%的增長速度"年可翻一番,

則有1.074"=以=2

。2003

log2_O.3O1O3

所以?=1°g|.O742=9.70939(年)

logl.074-0.031004

可知,按每年保持7.4%的增長速度,約9.71年汽車產(chǎn)量可達(dá)到在2003年基礎(chǔ)上翻

一番的預(yù)定目標(biāo)。

原規(guī)定翻一番的時間從2003年到2013年為10年,故按每年保持7.4%的增長速度,

能提前0.29年即3個月另14天達(dá)到翻一番的預(yù)定目標(biāo)。

?2.某地區(qū)社會商品零售額1988—1992年期間(1987年為基期)每年平均增長10%,1993

—1997年期間每年平均增長8.2%,1998—2003年期間每年平均增長6.8%,向2003年與1987

年相比該地區(qū)社會商品零售額共增長多少?年平均增長速度是多少?若

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論