統(tǒng)計(jì)學(xué)全套課件_第1頁(yè)
統(tǒng)計(jì)學(xué)全套課件_第2頁(yè)
統(tǒng)計(jì)學(xué)全套課件_第3頁(yè)
統(tǒng)計(jì)學(xué)全套課件_第4頁(yè)
統(tǒng)計(jì)學(xué)全套課件_第5頁(yè)
已閱讀5頁(yè),還剩174頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章總論第一節(jié)統(tǒng)計(jì)的基本問(wèn)題一、統(tǒng)計(jì)的涵義:統(tǒng)計(jì)工作、統(tǒng)計(jì)資料、統(tǒng)計(jì)學(xué)1、統(tǒng)計(jì)工作:A統(tǒng)計(jì)簡(jiǎn)史:B統(tǒng)計(jì)工作階段:統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理、統(tǒng)計(jì)分析;2、統(tǒng)計(jì)學(xué):A海門爾.康令:《國(guó)勢(shì)學(xué)》;威廉.配第和他的《政治算術(shù)》;梅爾及《社會(huì)統(tǒng)計(jì)學(xué)》;前蘇聯(lián)建立的〈社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)〉;

**B阿道夫.凱特洛開(kāi)創(chuàng)的〈〈數(shù)理統(tǒng)計(jì)學(xué)〉〉;C中國(guó)的主流——〈〈統(tǒng)計(jì)學(xué)〉〉;3.統(tǒng)計(jì)資料:二.統(tǒng)計(jì)對(duì)象:大量社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量方面。三.統(tǒng)計(jì)方法:1.大量觀察法:A方法:B效果:通過(guò)平均處理,抵消偶然因素影響,展現(xiàn)事物內(nèi)在聯(lián)繫。2.統(tǒng)計(jì)分組法:A方法:B意義:

3、綜合指標(biāo)法**第二節(jié)幾個(gè)統(tǒng)計(jì)範(fàn)疇1、總體:大量具有某種共同屬性的單位構(gòu)成的集體。一.統(tǒng)計(jì)總體與單位2、單位:3、兩者之間的轉(zhuǎn)化關(guān)係:隨研究目的的改變,總體可以轉(zhuǎn)化為單位,反之亦然。二.統(tǒng)計(jì)標(biāo)誌:1、概念:?jiǎn)挝坏奶蒯绲拿Q。2、分類:品質(zhì)標(biāo)誌、數(shù)量標(biāo)誌**3、變數(shù):可變的數(shù)量標(biāo)誌。變數(shù)的類型:連續(xù)性變數(shù)、離散變數(shù)。三.統(tǒng)計(jì)指標(biāo)與指標(biāo)體系:1、指標(biāo)的概念:反映大量社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量方面。

1)指標(biāo)與標(biāo)誌的區(qū)別與聯(lián)繫:

A聯(lián)繫:相同名稱、匯總、轉(zhuǎn)化關(guān)係

B區(qū)別:對(duì)象、表現(xiàn)2)指標(biāo)的分類:內(nèi)容:數(shù)量、品質(zhì)指標(biāo)表現(xiàn)形式:總量、相對(duì)、平均指標(biāo)。2、指標(biāo)體系**第二章統(tǒng)計(jì)調(diào)查

第一節(jié)意義和種類一、意義:要求:準(zhǔn)確、及時(shí)、全面。二、種類:1、按資料登記是否連續(xù):經(jīng)常性調(diào)查和一次性調(diào)查。2、按包含單位是否全面:全面和非全面調(diào)查。第二節(jié)統(tǒng)計(jì)調(diào)查方案一、調(diào)查目的:**2、調(diào)查對(duì)象:調(diào)查事物的全體。調(diào)查單位:調(diào)查資料的承擔(dān)者。報(bào)告單位:填寫和上報(bào)資料的單位。二者關(guān)係:可一致可不一致。3、調(diào)查時(shí)間:調(diào)查資料所屬的時(shí)間。時(shí)期現(xiàn)象的調(diào)查時(shí)間是一段時(shí)間;時(shí)點(diǎn)現(xiàn)象的調(diào)查時(shí)間是一點(diǎn)。調(diào)查時(shí)限:調(diào)查工作的時(shí)間。4、調(diào)查專案:調(diào)查的內(nèi)容。5、調(diào)查表:?jiǎn)我槐砗鸵挥[表。6、其他:**

第二節(jié)統(tǒng)計(jì)調(diào)查方法1、普查:為了瞭解社會(huì)經(jīng)濟(jì)現(xiàn)象在某一時(shí)點(diǎn)的狀況,專門組織的一次全面的調(diào)查方法。注:規(guī)定統(tǒng)一時(shí)間——標(biāo)準(zhǔn)時(shí)間;調(diào)查同時(shí)進(jìn)行。2、重點(diǎn)調(diào)查:通過(guò)對(duì)總體的重點(diǎn)單位調(diào)查以瞭解總體大致情況的方法。重點(diǎn)單位:其標(biāo)誌量占總體研究標(biāo)誌總量比重大的單位。3、典型調(diào)查:在初步分析的基礎(chǔ)上,在**總體中調(diào)查典型單位,以達(dá)到對(duì)事物本質(zhì)認(rèn)識(shí)的調(diào)查方法。解剖麻雀式:可以數(shù)值與實(shí)際相聯(lián)系說(shuō)明問(wèn)題。劃類選典:可以對(duì)總體數(shù)值進(jìn)行估計(jì)。4、抽樣調(diào)查:第三節(jié)調(diào)查誤差一、概念:調(diào)查資料與實(shí)際情況的差別。機(jī)械誤差:由於工作的失誤而產(chǎn)生的誤差。**代表性誤差:非全面調(diào)查特有的誤差。二、檢查的方法:邏輯檢查法:計(jì)算檢查法:**第三章統(tǒng)計(jì)整理

第一節(jié)整理的意義和內(nèi)容一、意義:去粗取精、去偽存真、由此及彼、由表及裏。二內(nèi)容:分類、匯總。第二節(jié)統(tǒng)計(jì)分組法一、分組法:根據(jù)研究目的和事物內(nèi)在聯(lián)繫,按某種標(biāo)誌將總體劃分為若干部分的方法。關(guān)鍵:分組標(biāo)誌的選擇,選擇的依據(jù)就是兩個(gè)根據(jù)。**效果:對(duì)總體而言:對(duì)單位而言:二、統(tǒng)計(jì)分組的類型和作用:1、將總體分為不同的性質(zhì)組:如按所有制分組、行業(yè)分組等;2、將總體分成若干部分:3、相關(guān)分析的分組:第三節(jié)分配數(shù)列1、意義:概念:各組分組標(biāo)誌的具體表現(xiàn)及相應(yīng)的次數(shù)或頻率。種類:品質(zhì)數(shù)列、變數(shù)數(shù)列**2、變數(shù)數(shù)列的編制:1)單項(xiàng)數(shù)列:2)組距式數(shù)列:步驟:將總體各單位標(biāo)誌值排序;分組(分多少組?)組距=上限-下限;等距分組與不等組距分組;等距分組:組距=全距/組數(shù)。處理:上限不在內(nèi)原則;組中值:反映組水準(zhǔn)計(jì)算組中值的三種情況及公式**3、統(tǒng)計(jì)表1)表式:標(biāo)題

賓詞主詞指標(biāo)單位或部分?jǐn)?shù)據(jù)區(qū)**2)種類:簡(jiǎn)單表、分組表、複合表。4、次數(shù)分佈圖:1)圖形形成:直方圖

折線圖

曲線圖;

2)曲線類型:

A、J型圖B、正態(tài)曲線:特徵:以X為中心對(duì)稱分佈;中間大、兩頭小**2024-2-1215第四章綜合指標(biāo)

第一節(jié)總量指標(biāo)一、概念:意義:∑X二、種類:標(biāo)誌總量-符號(hào){1、按內(nèi)容不同分{∑XF

N

單位總量-符號(hào){

∑F2、按反映時(shí)間狀況不同分為:2024-2-1216A、時(shí)期指標(biāo):反映社會(huì)經(jīng)濟(jì)現(xiàn)象一段時(shí)間達(dá)到的規(guī)?;蛩疁?zhǔn);B、時(shí)點(diǎn)指標(biāo):反映社會(huì)經(jīng)濟(jì)現(xiàn)象在某一時(shí)點(diǎn)的狀況;C、二者的區(qū)別:①統(tǒng)計(jì)方式:前者連續(xù)統(tǒng)計(jì),後者間斷統(tǒng)計(jì);②統(tǒng)計(jì)特徵:前者具有可加性,後者無(wú);③與時(shí)間關(guān)係:前者與時(shí)間長(zhǎng)短有關(guān),後者與時(shí)間間隔大小無(wú)必然聯(lián)繫。3、按計(jì)量單位不同分為:實(shí)物量指標(biāo)(注:標(biāo)準(zhǔn)實(shí)物量指標(biāo))、價(jià)值量指標(biāo)、勞動(dòng)量指標(biāo)。三、總量指標(biāo)的形成:匯總、估算、推斷。2024-2-1217第二節(jié)相對(duì)指標(biāo)一、意義:1、概念:兩個(gè)有某種聯(lián)繫的指標(biāo)對(duì)比而成的數(shù)。2、作用:反映事物品質(zhì)狀況;可用以直接比較兩個(gè)總體的差別。3、表現(xiàn)形式:A、無(wú)名數(shù):倍數(shù)、係數(shù)、成數(shù)、百分?jǐn)?shù)、千分?jǐn)?shù);B、有名數(shù):複名數(shù)。二、計(jì)算:1、結(jié)構(gòu)相對(duì)數(shù)=某部分的數(shù)值/總體的總值;2024-2-1218注:結(jié)構(gòu)相對(duì)數(shù)的應(yīng)用以統(tǒng)計(jì)分組為前提;分子與分母不能對(duì)換;表現(xiàn)為百分?jǐn)?shù)。2、比較相對(duì)數(shù)=乙總體相同指標(biāo)值/甲總體某項(xiàng)指標(biāo)值;注:分子、分母是同一期的數(shù)值;分子、分母可以對(duì)換;基數(shù)的選擇很重要。3、強(qiáng)度相對(duì)數(shù)=某個(gè)有聯(lián)繫的總量指標(biāo)值/某個(gè)總量指標(biāo)值;注:兩個(gè)有某種聯(lián)繫的總量指標(biāo);有平攤的意思,但是,不是平均指標(biāo);計(jì)算方法不同,可形成正、逆指標(biāo);一般表現(xiàn)為複名數(shù),有時(shí)也表現(xiàn)為無(wú)名數(shù)。4、計(jì)畫完成相對(duì)數(shù)=實(shí)際完成數(shù)/計(jì)畫數(shù)。2024-2-1219注:①分子、分母不可對(duì)換;一般表現(xiàn)為百分?jǐn)?shù);②各種資料狀況及計(jì)算:A、資料為總量指標(biāo)時(shí):有以上公式計(jì)算B、資料為增減百分?jǐn)?shù)時(shí):差率法:實(shí)際增長(zhǎng)率-計(jì)畫增長(zhǎng)率;比率法:計(jì)畫完成率=1?實(shí)際完成增減率

1?計(jì)畫增減率C、中長(zhǎng)期計(jì)畫完成的檢查方法:累計(jì)法:計(jì)畫完成程度=5年期實(shí)際完成數(shù)

5年期計(jì)畫數(shù)提前完成時(shí)間=5年-累計(jì)完成5年計(jì)畫數(shù)的時(shí)間;2024-2-1220水準(zhǔn)法:計(jì)畫完成程度=計(jì)畫末期實(shí)際達(dá)到水準(zhǔn)計(jì)畫末期計(jì)畫達(dá)到水準(zhǔn)提前完成時(shí)間=5年期終點(diǎn)-連續(xù)一年完成時(shí)間的終點(diǎn)。5、動(dòng)態(tài)相對(duì)數(shù)=a?/a?三、計(jì)算和運(yùn)用相對(duì)指標(biāo)應(yīng)注意的問(wèn)題1、正確選擇對(duì)比的基礎(chǔ);2、指標(biāo)對(duì)比要有可比性;3、相對(duì)指標(biāo)與總量指標(biāo)、各類相對(duì)指標(biāo)的結(jié)合使用。2024-2-1221第三節(jié)平均指標(biāo)一、意義1、概念:同質(zhì)總體的某種數(shù)量標(biāo)誌值的一般水準(zhǔn)。2、特點(diǎn):差異的抽象化;代表值。3、作用:用於對(duì)比不同規(guī)摸的水準(zhǔn)高低;反映事物發(fā)展趨勢(shì);反映現(xiàn)象間的依存關(guān)係。二、平均指標(biāo)的種類及計(jì)算1、算術(shù)平均數(shù):A、基本公式:X=同一總體標(biāo)誌總量總體單位數(shù)總量2024-2-1222B、種類:簡(jiǎn)單算術(shù)平均數(shù):X=∑X/N加權(quán)算術(shù)平均數(shù):X=∑XF/X=∑X*(F/∑F)注:資料為相對(duì)指標(biāo)時(shí)對(duì)公式的運(yùn)用。2、調(diào)和平均數(shù):簡(jiǎn)單:X=N/∑(1/X)加權(quán):X=∑M/∑(M/X)注:何時(shí)用算術(shù)平均數(shù)?何時(shí)用調(diào)和平均數(shù)?3、幾何平均數(shù):簡(jiǎn)單:X=(∏X)1/n加權(quán):X=(∏XF)1/∑F4、中位數(shù)2024-2-1223

A、概念:將總體單位標(biāo)誌按某種順序排隊(duì),處在中間位置的標(biāo)誌值。B、計(jì)算:①原始資料:N為奇:中位數(shù)=在N+1/2的標(biāo)誌值;N為偶:中位數(shù)=中間兩個(gè)標(biāo)誌值的一半。②單項(xiàng)數(shù)列:第一步:計(jì)算累計(jì)次數(shù)或累計(jì)頻率第二步:根據(jù)累計(jì)次數(shù)與中位數(shù)的定義確定中位數(shù)③組距式數(shù)列:第一步:計(jì)算累計(jì)次數(shù)或累計(jì)頻率第二步:根據(jù)累計(jì)次數(shù)與中位數(shù)的定義確定中位數(shù)在哪一組?2024-2-1224第三步:根據(jù)公式算中位數(shù)上限公式:Me=U-(∑F)/2-Sm+1*DFm下限公式:Me=L+(∑F)/2-Sm-1*DFmL:中位數(shù)所在組的下限;U:中位數(shù)所在組上限;Sm-1:中位數(shù)所在組的前一組的向上累計(jì)次數(shù);Sm+1:中位數(shù)所在組的後一組的向下累計(jì)次數(shù);D:中位數(shù)所在組的組距。5、眾數(shù):A、總體中次數(shù)出現(xiàn)最多的標(biāo)誌值;B、計(jì)算:①單項(xiàng)數(shù)列:②組距數(shù)列:第一步:根據(jù)次數(shù)或頻率確定眾數(shù)在哪一組第二步:根據(jù)公式計(jì)算眾數(shù)。

2024-2-1225M0=L+(Fm-Fm-1)*D

(Fm-Fm-1)+(Fm-Fm+1)例工人按完成生產(chǎn)定額百分比分組(%)各組工人數(shù)(人)向上累計(jì)次數(shù)80——90606090——100132192100——110168360110——120324684120——130240924130——1401681092140——1501081200合計(jì)12002024-2-1226Me=110+(600-360)*10=117.4%324M0=110+(324-168)*10=116.5%

(324-168)+(324-240)第四節(jié)變異指標(biāo)一、概念和作用:1、概念:2、作用:反映平均指標(biāo)代表性高低——其值越小,平均指標(biāo)代表性越高;反之,越低。二、計(jì)算:1、全距=Xmax-Xmin2、平均差簡(jiǎn)單:A.D=∑

|X-?|/N2024-2-1227加權(quán):A.D=∑

|X-?|F

F3、標(biāo)準(zhǔn)差(方差)簡(jiǎn)單:σ2=∑

(X-?

)2/N加權(quán):σ2=∑

(X-?

)2*F/∑F注:資料為組距式數(shù)列時(shí),應(yīng)先算各組的組中值。4、變異係數(shù):全距係數(shù)=R/?平均差係數(shù)=A.D/?

;標(biāo)準(zhǔn)差係數(shù)=σ/?。作用:可用於直接對(duì)比兩個(gè)同類平均指標(biāo)代表性高低;也可直接比較不同種類平均指標(biāo)代表性高低。

2024-2-1228

第五節(jié)應(yīng)用平均指標(biāo)應(yīng)注意的問(wèn)題一、要注意總體的同質(zhì)性二、總體平均指標(biāo)與統(tǒng)計(jì)分組的結(jié)合使用三、平均指標(biāo)與變異指標(biāo)的結(jié)合使用。第五章動(dòng)態(tài)分析法第一節(jié)時(shí)間數(shù)列一、意義二、種類:總量、相對(duì)、平均數(shù)列三、編制時(shí)間數(shù)列的原則:1、指標(biāo)所屬的時(shí)間的可比性;2、總體範(fàn)圍的前後一致;3、計(jì)算的口徑方法的可比性;4、經(jīng)濟(jì)內(nèi)容的可比性。第二節(jié)指標(biāo)分析法一、動(dòng)態(tài)水準(zhǔn)法:1、發(fā)展水準(zhǔn):在一定時(shí)間社會(huì)經(jīng)濟(jì)現(xiàn)象發(fā)展達(dá)到的水準(zhǔn)。注:可以是總量、相對(duì)、平均水準(zhǔn);表達(dá):a0a1a2a3。。。。。。an;在對(duì)比中:a0a1a2a3。。an-1----基期水準(zhǔn)

a1a2a3。。an-1an----報(bào)告期水準(zhǔn)2、平均發(fā)展水準(zhǔn):①總量數(shù)列:A、時(shí)期數(shù)列:a1a2a3。。。。。。an

ā=∑ai/nB、時(shí)點(diǎn)數(shù)列:簡(jiǎn)單:ā=∑ai/n

連續(xù)時(shí)點(diǎn)數(shù)列:{加權(quán):ā=∑aifi/

∑fi間斷時(shí)點(diǎn)數(shù)列(等間隔):

a1a2a3。。。。。。anā=?a1+a2+………?an/n-1②相對(duì)數(shù)列(平均數(shù)列):c=a/b?=ā/bˉA、子、母項(xiàng)都為時(shí)期指標(biāo):

?=∑ai/∑biB、子、母項(xiàng)分別為時(shí)期、時(shí)點(diǎn)指標(biāo):如?=∑ai/n?b1+b2…..+?bm/m-1C、子母項(xiàng)都為時(shí)點(diǎn)指標(biāo):

?a1+a2…..+?an/n-1

?=

?b1+b2…..+?bn/n-1月份1234商品銷售額(萬(wàn)元)a120143289---月初商品庫(kù)存額(萬(wàn)元)b507060110商品流轉(zhuǎn)次數(shù)

c22.23.4---?=∑ai/n?b1+b2…..+?bm/m-1

=120+143+289/3

?50+70+60+?110/4-1=2.633、增減量和平均增減量水準(zhǔn)1)增減量=a報(bào)-

a基

逐期增減量=ai-

ai-1i=1,2,……n累計(jì)增長(zhǎng)量=ai-

a0i=1,2,……n

關(guān)係:ai-

a0=∑

(ai-

ai-1

)2)平均增減量=∑

(ai-

ai-1

)/n二、速度分析:1、發(fā)展速度=a報(bào)/

a基

環(huán)比發(fā)展速度=ai/

ai-1i=1,2,……n定基發(fā)展速度=ai/

a0i=1,2,……n二者關(guān)係:ai/

a0=∏ai/

ai-1=R2、增減速度=發(fā)展速度-100%環(huán)比增減速度=ai/

ai-1–1定基增減速度=ai/

a0-13、平均速度:1)平均發(fā)展速度:A、水準(zhǔn)法X=(ai/

a0)1/n

=(∏ai/

ai-1)1/n

=R1/n

B、方程式法a1+a2…..+an=∑ai→X+X1+X2……+Xn=∑ai/n2)平均增長(zhǎng)速度4、應(yīng)用平均速度應(yīng)注意的問(wèn)題A、平均速度要和環(huán)比速度結(jié)合分析;B、總平均速度要和段平均速度結(jié)合分析C、平均速度要聯(lián)繫基期水準(zhǔn)進(jìn)行分析。第三節(jié)成分分析法一、時(shí)間數(shù)列的成分與組合:1、成分:T、C、S、I2、模型:加法模型:Y=T+C+S+I;乘法模型:Y=T*C*S*I;混合模型:Y=T*C+S*I等。二、長(zhǎng)期趨勢(shì)的測(cè)定和分析:1、移動(dòng)平均法:A、方法過(guò)程:1)n為奇:以n=3為例;2)n為偶:以n=4為例。

an=3n=4移正a1----

a2a1+a2+a3/3--a1+a2+a3+a4/4a3a2+a3+a4/3}一半a2+a3+a4+

a5/4a4a3+a4+a5/3a5--B、注意事項(xiàng):1)移動(dòng)平均數(shù)可以反映事物發(fā)展的趨勢(shì);2)移動(dòng)項(xiàng)數(shù)n和週期長(zhǎng)度一致,可以消除週期波動(dòng)的影響;3)修勻數(shù)列損失項(xiàng)數(shù):n為奇,首尾共損失n-1項(xiàng)數(shù)據(jù);n為偶,首尾共損失n項(xiàng)數(shù)據(jù);4)修勻數(shù)列用於預(yù)測(cè),將第一個(gè)修勻數(shù)放在n+1處,依次類推;5)n越大,修勻數(shù)列越平緩。2、趨勢(shì)方程擬合法:A、確定趨勢(shì)函數(shù)形式的方法:*定性分析;*繪製散點(diǎn)圖;*數(shù)學(xué)指導(dǎo)下的數(shù)據(jù)處理辦法:①時(shí)間數(shù)列的一次差大致相等,應(yīng)給該數(shù)列配合線性趨勢(shì)方程;說(shuō)明:Yc=a+bt則dYc=bdt則⊿Y=b⊿t

⊿t=1→Yt-Yt-1=常數(shù)②時(shí)間數(shù)列的二次差大致相等,應(yīng)給該數(shù)列配合二次曲線趨勢(shì)方程;③時(shí)間數(shù)列的環(huán)比速度大致相等,應(yīng)給該數(shù)列配合指數(shù)曲線趨勢(shì)方程;說(shuō)明:Yc=abt則dYc=abt

lnadt

則dYc/Yc=lnadt=常數(shù)即:Yt-Yt-1/Yt-1=常數(shù)。B、最小平方法(線性方程為例)線性方程:Yc=a+bt標(biāo)準(zhǔn):Q=∑(Y-Yc)2=min圖形解釋:參數(shù)估計(jì):?∑(Y-a-bt)2/?a=0{?∑(Y-a-bt)2/?b=02∑(Y-a-bt)(-1)=02∑(Y-a-bt)(-t)=0∑Y=na+b∑t{正規(guī)方程∑Yt=a∑t+b∑t2

a=∑Y/n-b^

∑t/nb^=n∑Yt-∑t∑Y/n∑t2-(∑t)2簡(jiǎn)捷法:若使∑t=0

a=∑Y/nb^=∑Yt/∑t2例t12345678Y7.78.49.3111312.21417三、季節(jié)變動(dòng)的測(cè)定1、原資料平均法MODEL:Y=a*S*IPROCESS:FIRST:求各年同期平均數(shù)——YiSECOND:求全部數(shù)據(jù)的平均數(shù)——YTHIRD:求季節(jié)比率—Si=Yi/YNOTE:∑Si=L(L是季節(jié)週期長(zhǎng)度)FORCAST:Yt=a*St-LK2、趨勢(shì)(趨勢(shì)-迴圈)剔除法:MOD:Y=TSIORY=TCSL①求T值ORT*C值(用移動(dòng)平均法最好)②求Y/TORY/T*C③求各年同期的Y/TORY/T*C的平均數(shù)

→Si*④調(diào)整:Si**L/∑Si*=Si四、迴圈變動(dòng)的測(cè)定1、分解法(剩餘法):TCSI/S=TCI→TCI/T=CI→對(duì)“CI”求平均→C2、直接法:各年各月與上年同期增長(zhǎng)部分/前一年對(duì)應(yīng)月份的值主講教師:劉澤仁製作:劉澤仁第七章:抽樣推斷

統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn),即通過(guò)樣本統(tǒng)計(jì)量來(lái)估計(jì)和檢驗(yàn)總體的參數(shù)。統(tǒng)計(jì)推斷的目的在於認(rèn)識(shí)未知的總體參數(shù)及其分佈特徵。第七章抽樣推斷§1.點(diǎn)估計(jì)一、點(diǎn)估計(jì)

點(diǎn)估計(jì)是通過(guò)計(jì)算一個(gè)統(tǒng)計(jì)量(樣本元素的函數(shù)),將它作為未知參數(shù)的估計(jì)。X1,…,Xn未知參數(shù)樣本統(tǒng)計(jì)量對(duì)一次具體的抽樣參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)。=d(X1,…,Xn)

二、估計(jì)量1.估計(jì)量是用來(lái)估計(jì)參數(shù)的統(tǒng)計(jì)量用來(lái)估計(jì)參數(shù)

的估計(jì)量記為2.點(diǎn)估計(jì)量的構(gòu)造方法常用的有:矩法和極大似然法(略)例:從平均值為

,標(biāo)準(zhǔn)差為

的總體中抽出樣本X1,…,Xn3.點(diǎn)估計(jì)量?jī)?yōu)劣的判別標(biāo)準(zhǔn)衡量一個(gè)估計(jì)量好壞的標(biāo)準(zhǔn)通常有以下3個(gè):(1)無(wú)偏性:如果一個(gè)估計(jì)量的數(shù)學(xué)期望值等於被估計(jì)參數(shù),則這個(gè)估計(jì)量稱為被估參數(shù)的無(wú)偏估計(jì)量。也就是說(shuō):故s2是

的無(wú)偏估計(jì)量。(2)一致性

若隨著樣本容量n的增大,估計(jì)量的值越來(lái)越接近於被估計(jì)的參數(shù),則該估計(jì)量稱為一致估計(jì)量。n3

n2

n1n1n2n3(3)有效性

設(shè)是參數(shù)

的兩個(gè)無(wú)偏估計(jì)量,若的方差比的方差小,則稱比有效。<4.幾種總體參數(shù)的點(diǎn)估計(jì)量例:某公司考慮購(gòu)買一批減價(jià)商品,這批商品共2000件,其中有些是次品,但不知次品量或次品率是多少。公司得知每件次品的修復(fù)成本為0.25元,並認(rèn)為若總的修復(fù)成本低於50元,購(gòu)買這批商品是有利可圖的。在決定前,公司抽取100件商品進(jìn)行調(diào)查,發(fā)現(xiàn)12件次品。問(wèn)你估計(jì)這批商品的次品率為多少?你認(rèn)為公司是否可購(gòu)買這一批商品?解:設(shè)樣本次品率為p,則總體中的次品量為NP,即計(jì)算結(jié)果表明:該批商品估計(jì)的次品率為12%,次品量為240件,所以該品商品的修復(fù)成本為:2400.25=60(元)。由此可見(jiàn),公司不能購(gòu)買這批商品?!?.區(qū)間估計(jì)一、置信區(qū)間與置信度(0

)則稱1

為置信度(或置信水準(zhǔn));只有一個(gè)下限值或只有一個(gè)限值的置信區(qū)間是單側(cè)置信區(qū)間:或1

置信度與置信區(qū)間的關(guān)係:

置信度越大,則置信區(qū)間越長(zhǎng),反之亦然。若要同時(shí)使置信度盡可能的大和置信區(qū)間盡可能的小,只有提高樣本容量n。n'nn'>n二、正態(tài)總體參數(shù)的區(qū)間估計(jì)1.參數(shù)

的置信區(qū)間(1)

已知時(shí),

的置信區(qū)間給定置信度1

,要求

式的等式左邊的括弧內(nèi)的不等式

式轉(zhuǎn)化為由於等於,所以等於式中的z1,z2是根據(jù)1

的大小確定的。

見(jiàn)下圖:1

z'2z1zz'1z21

z/2zz/2z1=

z/2,z2=z/2因而,

的雙側(cè)置信區(qū)間的上、下限公式為:同理可得

的單側(cè)置信區(qū)間的上限公式或下限公式:1

zz

或另一種情形:1

z

z

(2)

未知時(shí),

的置信區(qū)間(小樣本)1

同(1)類似地,可得或例:設(shè)在某證券交易所上市的工業(yè)類股票的日收盤價(jià)格是下態(tài)分佈隨機(jī)變數(shù),隨機(jī)抽取其中20種股票收盤價(jià)得知樣本的平均收盤價(jià)為30元,方差為6.32。求該市場(chǎng)工業(yè)類股票的平均收盤價(jià)格的置信區(qū)間(=2%)。解:已知n=20,s2=6.32,

未知。查表得=(28.57,31.43)

根據(jù)以上計(jì)算結(jié)果,我們可以說(shuō),按此區(qū)間估計(jì)方法,將有98%這樣的置信區(qū)間包括工業(yè)類的股票平均收盤平均收盤價(jià)格。或者說(shuō),我們有98%的把握說(shuō)工業(yè)類的股票收盤價(jià)格界於28.57元至31.43元之間。2.參數(shù)

2

的置信區(qū)間

1

或三、兩個(gè)總體平均數(shù)之差

1-

2的區(qū)間估計(jì)對(duì)於給定的1

,使得:要求LCL,UCLP(LCL<

1

2<UCL)=1

同理可得:

1

2的雙側(cè)置信區(qū)間(LCL,UCL)

1

2的單側(cè)置信區(qū)間或?qū)督o定的1

,使得:要求LCL,UCLP(LCL<

1

2<UCL)=1

同理可得:

1

2的雙側(cè)置信區(qū)間(LCL,UCL)

1-

2的單側(cè)置信區(qū)間或四、兩個(gè)總體方差之比的區(qū)間估計(jì)要求LCL,UCL1

F或五、總體比例P的區(qū)間估計(jì)假定n

30,且np5,n(1p)5,可近似地把p(1p)替代P(1P)或六、兩個(gè)總體比例之差P1

P2的區(qū)間估計(jì)P1

P2的雙側(cè)置信區(qū)間LCL,UCLP1

P2的單側(cè)置信區(qū)間或§3假設(shè)檢驗(yàn)的一般方法一、假設(shè)檢驗(yàn)的基本思想例:根據(jù)過(guò)去的測(cè)試知某種電子元件的使用壽命服從N(

0,

2),經(jīng)過(guò)該產(chǎn)品技術(shù)改進(jìn)後,隨機(jī)抽取了n個(gè)產(chǎn)品進(jìn)行使用壽命測(cè)試結(jié)果為:X1,X2,…,Xn,得到平均壽命根據(jù)以上資料,可以進(jìn)行兩類統(tǒng)計(jì)推斷:如果要對(duì)技術(shù)改進(jìn)後的產(chǎn)品使用壽命

進(jìn)行統(tǒng)計(jì)推斷,則可在給定1

置信度時(shí)對(duì)總體平均值

作區(qū)間估計(jì),即:第一種:第二種:

如果要問(wèn)改進(jìn)後的平均使用壽命

是否與改進(jìn)前的

0有明顯的差別,則可在給定顯著性水準(zhǔn)

時(shí)對(duì)

進(jìn)行假設(shè)檢驗(yàn)。(表明技術(shù)改進(jìn)前後的平均使用壽命沒(méi)有明顯差別)(表明技術(shù)改進(jìn)前後的平均使用壽命有明顯差別)建立原假設(shè):備擇假設(shè):H0:

=0H1:

0通過(guò)置信區(qū)間構(gòu)造一個(gè)水準(zhǔn)

的檢驗(yàn):當(dāng)且僅當(dāng)

0落在區(qū)間之內(nèi),就接受H0。

/21

z/2z/2

/2f(Z)z拒絕域接受域拒絕域1

z

也有單側(cè)情形:H0:

0H1:

>

0或H0:

0H1:

<

01

z

假設(shè)檢驗(yàn)的基本思想:

經(jīng)過(guò)抽樣獲取一組數(shù)據(jù),即一個(gè)來(lái)自總體的(隨機(jī))樣本,如果根據(jù)樣本計(jì)算的某個(gè)統(tǒng)計(jì)量表明在假設(shè)成立的條件下幾乎是不可能發(fā)生的,就拒絕或否定這個(gè)假設(shè),如果不然,則接受這個(gè)假設(shè)。二、兩類錯(cuò)誤第I類錯(cuò)誤:原假設(shè)H0成立,但檢驗(yàn)結(jié)果是拒絕H0

,這類錯(cuò)誤常稱為“棄真”,P(I)=

第II類錯(cuò)誤:原假設(shè)H0不成立,但檢驗(yàn)結(jié)果是接受H0

,這類錯(cuò)誤常稱為“納偽”,P(II)=

0

1

0

1

是可以選擇的,而

一般是不能計(jì)算的。因?yàn)楫?dāng)H0不成立時(shí)

的真值與

0的偏離可能大也可能小,若偏差大,則

較小,而當(dāng)

很接近

0時(shí),

有可能很大。

一個(gè)好的檢驗(yàn)應(yīng)使犯兩類錯(cuò)誤的概率都很小,但要做到這點(diǎn),除非所取的樣本很大,當(dāng)樣本大小n固定時(shí),

通常就不能兼顧,通常我們主要考慮控制

,在選定

水準(zhǔn)後,使

盡可能小。

在假設(shè)檢驗(yàn)中,稱

為檢驗(yàn)數(shù)水準(zhǔn),也稱顯著性水準(zhǔn)。三、假設(shè)檢驗(yàn)的步驟(一)提出假設(shè)H0和H1是兩個(gè)相反的假設(shè),包括原假設(shè)H0和備擇假設(shè)H1。其所有可能的結(jié)果都應(yīng)包含在這兩個(gè)假設(shè)的範(fàn)圍內(nèi),它們的提出確定了所要檢驗(yàn)的對(duì)象。(二)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,確定

(顯著性水準(zhǔn))下的拒絕域

構(gòu)造一個(gè)檢驗(yàn)統(tǒng)計(jì)量,要求這個(gè)統(tǒng)計(jì)量包含著待檢驗(yàn)的參數(shù),除此之外,其餘的參數(shù)(檢驗(yàn)統(tǒng)計(jì)量所包含的參數(shù))必須是已知的,我們可以通過(guò)檢驗(yàn)統(tǒng)計(jì)量的分佈在指定的

下來(lái)確定拒絕域。(三)作出決策(結(jié)論)並加以解釋

在決定是否拒絕H0時(shí),我們自然希望作出的決策是正確的,儘量減少犯錯(cuò)誤的概率,但在n不變的情況下,要減少

,必然會(huì)增加

,而同時(shí)減少

是不可能的。因此,通常我們主要考慮控制

,在選定

水準(zhǔn)後,如果檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域內(nèi),我們就拒絕原假設(shè),即因?yàn)镠0不成立,否則就不拒絕H0

。必須指出,若H0在一次檢驗(yàn)後沒(méi)有被拒絕,我們並不能肯定H0一定成立,我們只能說(shuō)不拒絕,習(xí)慣上稱為“接受”H0

?!?參數(shù)的假設(shè)檢驗(yàn)一、總體均值

的假設(shè)檢驗(yàn)(一)提出假設(shè)H0:

=

0H1:

0(三)作出結(jié)論若|z|<z/2,則“接受”

H0若|z|

z/2,則拒絕H0(二)檢驗(yàn)統(tǒng)計(jì)量(若

已知)例:設(shè)總體服從標(biāo)準(zhǔn)差為50的正態(tài)分佈,從該總體抽出某容量為25的隨機(jī)樣本,得出樣本平均值為70,試以=0.05的顯著水準(zhǔn)檢驗(yàn)原假設(shè)0=90。解:由題意,已知n=25,=50,

0=90H0:

=90H1:

90檢驗(yàn)統(tǒng)計(jì)量:計(jì)算查表得拒絕域?yàn)椋?/p>

計(jì)算結(jié)果為:

拒絕H0,也就是說(shuō)有95%的把握否定原假定。>=1.962z=關(guān)於參數(shù)

的假設(shè)檢驗(yàn)表原假設(shè)H0備擇假設(shè)H1已知條件檢驗(yàn)統(tǒng)計(jì)量拒絕域

=

0

0

0

=

0

>

0

<

0

已知|z|z/2zz

z–z

=

0

0

0

0

>

0

<

0

未知小樣本|t|

t/2(n–1)t

t

(n–1)t–t

(n–1)大樣本1

z/2z/2

z1

右側(cè)檢驗(yàn)1

z左側(cè)檢驗(yàn)

二、總體方差

2的假設(shè)檢驗(yàn)原假設(shè)H0備擇假設(shè)H1檢驗(yàn)統(tǒng)計(jì)量拒絕域

2=

20

2

20

2

20

2

20

2>

20

2<

201

1

1

三、兩個(gè)總體均值之差

原假設(shè)H0備擇假設(shè)H1已知條件檢驗(yàn)統(tǒng)計(jì)量拒絕域

1=

2

1

2

1

2

1

2

1>

2

1<

2|z|

z/2z

z/2z–z/2|t|

t/2(n1+n2–2)t

t

(n1+n2–2)t–t

(n1+n2–2)

1=

2

1

2

1

2

1

2

1>

2

1<

2已知未知小樣本大樣本時(shí):t

z四、兩個(gè)總體的方差比的假設(shè)檢驗(yàn)原假設(shè)H0備擇假設(shè)H1檢驗(yàn)統(tǒng)計(jì)量拒絕域五、成數(shù)p的假設(shè)檢驗(yàn)原假設(shè)H0備擇假設(shè)H1檢驗(yàn)統(tǒng)計(jì)量拒絕域P=P0P

P0P

P0P

P0P>P0P<P0|z|

z/2z

z

z–z

六、兩總體成數(shù)之差的假設(shè)檢驗(yàn)

原假設(shè)H0備擇假設(shè)H1檢驗(yàn)統(tǒng)計(jì)量拒絕域P1

=P2P1

P2P1

P2P1

P2P1

>P2P1

<P2|z|z/2zz

z–z

(分別用p1,p2近似代替P1,P2)例:某製造廠生產(chǎn)某裝置的平均工作溫度是190C。今從一個(gè)由16臺(tái)裝置構(gòu)成的隨機(jī)樣本求得的工作溫度的平均數(shù)和標(biāo)準(zhǔn)差分別是194C和8C,能否說(shuō)明平均工作溫度比製造廠規(guī)定的要高呢?設(shè)=0.05,並假定工作溫度服從正態(tài)分佈。解:已知n=16,

0=190H0:

190H1:

>190s=8,計(jì)算檢驗(yàn)統(tǒng)計(jì)量查表得拒絕域?yàn)椋?/p>

計(jì)算結(jié)果為:

拒絕H0,也就是說(shuō),樣本數(shù)據(jù)說(shuō)明了平均工作溫度比製造廠規(guī)定的要高。>=1.7532t=主講教師:劉澤仁製作:劉澤仁第八章:相關(guān)與回歸分析第八章§1.相關(guān)關(guān)係相關(guān)與回歸分析一、相關(guān)關(guān)係的概念現(xiàn)象之間的數(shù)量關(guān)係存在著兩種不同的類型:一種是函數(shù)關(guān)係,另一種是相關(guān)關(guān)係。函數(shù)關(guān)係指的是變數(shù)之間存在著的嚴(yán)格的依存關(guān)係,它們之間的關(guān)係值是固定的,對(duì)於某一變數(shù)的每一個(gè)值,都有另一個(gè)變數(shù)的完全確定的值與之相對(duì)應(yīng)。例如,圓的面積等於圓周率乘以半徑的平方。相關(guān)關(guān)係是指變數(shù)之間確實(shí)存在的但關(guān)係值不固定的相互依存關(guān)係。在這種關(guān)係中,當(dāng)一個(gè)(或幾個(gè))變數(shù)的值確定以後,另一個(gè)變數(shù)的值雖與它(或它們)有關(guān),但卻不能完全確定。這是一種非確定性的關(guān)係。例如,電視機(jī)的擁有率與人均收入水準(zhǔn)有關(guān),但對(duì)於人均收入水準(zhǔn)相同的地區(qū),其電視機(jī)的擁有率可能不盡相同。在客觀事物中,尤其是在經(jīng)濟(jì)現(xiàn)象中,相關(guān)關(guān)係普遍存在。統(tǒng)計(jì)很有必要對(duì)這種關(guān)係進(jìn)行研究。在相關(guān)關(guān)係中,通常,在相互聯(lián)繫的現(xiàn)象之間存在著一定的因果關(guān)係,這時(shí)就把其中的起著影響作用的現(xiàn)象具體化,通過(guò)一定的變數(shù)反映出來(lái),這樣的變數(shù)稱為引數(shù)。由於受到引數(shù)變動(dòng)的影響而發(fā)生變動(dòng)的變數(shù)稱為因變數(shù)。在相關(guān)關(guān)係中,有時(shí)兩個(gè)變數(shù)之間只存在相互聯(lián)繫而並不存在明顯的因果關(guān)係。確定哪一個(gè)是引數(shù),哪一個(gè)是因變數(shù),主要決定於研究的目的。例如,在糧食畝產(chǎn)量與施肥量之間,施肥量這一變數(shù)是引數(shù),畝產(chǎn)量這一變數(shù)是因變數(shù)。當(dāng)研究的是兩個(gè)變數(shù)之間的關(guān)係時(shí),通常以符號(hào)X表示引數(shù),以符號(hào)Y表示因變數(shù)。二、相關(guān)關(guān)係的種類相關(guān)關(guān)係從不同的角度可以劃分成不同的類型。(一)正相關(guān)與負(fù)相關(guān)從相關(guān)的方向看,相關(guān)關(guān)係可以分為正相關(guān)和負(fù)相關(guān)。負(fù)相關(guān)是指相關(guān)變數(shù)之間的變化趨勢(shì)相反,即當(dāng)引數(shù)的值增加,因變數(shù)的值隨之減少;當(dāng)引數(shù)的值減少,因變數(shù)的值隨之增加。例如,產(chǎn)品產(chǎn)量與單位產(chǎn)品成本之間的關(guān)係。正相關(guān)是指相關(guān)變數(shù)之間的變化趨勢(shì)相同,即當(dāng)引數(shù)的值增加,因變數(shù)的值也隨之增加;當(dāng)引數(shù)的值減少,因變數(shù)的值也隨之減少。例如,汽車的使用年限與汽車的修理費(fèi)用之間的關(guān)係。(二)線性相關(guān)與非線性相關(guān)從相關(guān)的形式上來(lái)看,相關(guān)關(guān)係可分為線性相關(guān)和非線性相關(guān)。線性相關(guān)也稱直線相關(guān),是指相關(guān)的兩個(gè)變數(shù)之間變化的趨勢(shì)呈線性或近似於線性。即引數(shù)發(fā)生變動(dòng),因變數(shù)隨之發(fā)生變動(dòng),其增加或減少量是大致均等的,從圖形上看,其觀察點(diǎn)的分佈近似表現(xiàn)為直線形式。非線性相關(guān)也稱曲線相關(guān),是指相關(guān)的兩個(gè)變數(shù)之間變化的趨勢(shì)呈非線性。即引數(shù)發(fā)生變動(dòng),因變數(shù)隨之發(fā)生變動(dòng),但其增加或減少量不是均等的,從圖形上看,其觀察點(diǎn)的分佈表現(xiàn)為各種曲線形式。(三)單相關(guān)和複相關(guān)從相關(guān)變數(shù)的個(gè)數(shù)來(lái)看,相關(guān)關(guān)係可分為單相關(guān)和複相關(guān)。單相關(guān)是指兩個(gè)變數(shù)之間的相關(guān)關(guān)係。複相關(guān)是三個(gè)或三個(gè)以上變數(shù)之間的相關(guān)關(guān)係。例如,僅僅考慮施肥量對(duì)產(chǎn)量的影響,這就是一種單相關(guān);如果除了施肥量之外,再考慮降雨量及深耕程度對(duì)產(chǎn)量的影響,則這種相關(guān)關(guān)係就是一種複相關(guān)。三、回歸與相關(guān)分析的概念在對(duì)變數(shù)之間存在的相關(guān)關(guān)係進(jìn)行分析研究時(shí),最常用的方法就是回歸分析和相關(guān)分析?;貧w分析和相關(guān)分析是相互聯(lián)繫的,它們從不同方面研究變數(shù)之間相關(guān)關(guān)係的本質(zhì)?;貧w分析是用來(lái)研究變數(shù)之間關(guān)係的可能形式的統(tǒng)計(jì)方法。它把兩個(gè)或兩個(gè)以上變數(shù)之間的變動(dòng)關(guān)係加以模型化,用數(shù)學(xué)函數(shù)表達(dá)變數(shù)之間的關(guān)係。運(yùn)用這種方法時(shí),最終的目的通常在於預(yù)測(cè)或估計(jì)與某一個(gè)或某幾個(gè)變數(shù)的給定值相對(duì)應(yīng)的另一變數(shù)的數(shù)值。相關(guān)分析是研究如何計(jì)量變數(shù)之間關(guān)係強(qiáng)度的統(tǒng)計(jì)方法。它能確定變數(shù)之間相關(guān)的程度,即變數(shù)之間某種關(guān)係的確切程度有多大?;貧w分析和相關(guān)分析既有聯(lián)繫,又有區(qū)別。就其研究對(duì)象來(lái)說(shuō),兩者都是研究變數(shù)之間的相關(guān)關(guān)係。但就彼此研究變數(shù)之間關(guān)係的性質(zhì)來(lái)看,兩者存在明顯的區(qū)別?;貧w分析中,必須將相關(guān)變數(shù)區(qū)分為引數(shù)和因變數(shù),以確定其關(guān)係的可能形式,所研究變數(shù)屬於非對(duì)等關(guān)係。相關(guān)分析中,計(jì)量變數(shù)之間關(guān)係的強(qiáng)度,不必區(qū)分引數(shù)與因變數(shù),所研究變數(shù)屬於對(duì)等的關(guān)係。四、相關(guān)圖表對(duì)現(xiàn)象變數(shù)之間是否存在相關(guān)關(guān)係以及存在怎樣的相關(guān)關(guān)係進(jìn)行分析、作出判斷,這是進(jìn)行回歸和相關(guān)分析的前提。通過(guò)編制相關(guān)表和相關(guān)圖,可以直觀地、大致地判斷現(xiàn)象變數(shù)之間是否存在相關(guān)關(guān)係以及關(guān)係的類型。(一)相關(guān)表相關(guān)表是表現(xiàn)現(xiàn)象變數(shù)之間相關(guān)關(guān)係的表格。例如,為研究商店人均月銷售額和利潤(rùn)率的關(guān)係,調(diào)查10家商店取得10對(duì)數(shù)據(jù),以人均銷售額為引數(shù),利潤(rùn)率為因變數(shù),編制簡(jiǎn)單相關(guān)表如下表。人均銷售額與和利潤(rùn)率相關(guān)表編號(hào)人均月銷售額(千元)利潤(rùn)率(%)1234567891013345667783.06.26.68.110.412.612.316.316.818.5(二)相關(guān)圖所謂相關(guān)圖,是把相關(guān)的兩個(gè)變數(shù)之間的關(guān)係在平面直角坐標(biāo)(第一象限)中反映出來(lái)。通常將引數(shù)(x)置於橫軸上,因變數(shù)(y)置於縱軸上,而將兩個(gè)變數(shù)相對(duì)應(yīng)的變數(shù)值用座標(biāo)點(diǎn)形式描繪出來(lái)。相關(guān)圖就是用相關(guān)點(diǎn)的分佈狀況來(lái)描述相關(guān)關(guān)係的,所以又稱為散點(diǎn)圖。根據(jù)相關(guān)圖,可以直觀地看出變數(shù)之間相關(guān)關(guān)係的模式。例如,前述人均月銷售額與利潤(rùn)率的關(guān)係,可用相關(guān)圖表示如下:利潤(rùn)率(%)人均銷售額(千元)1

20人均銷售額與利潤(rùn)率相關(guān)圖51015

2

3

84

567

從圖中,我們可以清楚地看出,這兩個(gè)變數(shù)之間相關(guān)的方向(即正相關(guān))以及相關(guān)的具體形式(直線相關(guān))(a)直線關(guān)係(b)反直線關(guān)係(c)正曲線關(guān)係(e)較分散的

反直線關(guān)係(d)反曲線關(guān)係(f)沒(méi)有關(guān)係x與y的一些可能關(guān)係的散點(diǎn)圖上圖說(shuō)明瞭相關(guān)圖中的一些可能關(guān)係。圖(a)和(b)表示的是正的和反的直線關(guān)係,即正線性相關(guān)和負(fù)線性相關(guān)。圖(c)和(d)分別表示的是正的和反的曲線關(guān)係,即正非線性相關(guān)和負(fù)非線性相關(guān)。圖(e)中是散佈域很寬的反直線關(guān)係。散佈域越寬,則表明變數(shù)之間的聯(lián)繫程度越差。圖(f)中的圖象表明兩個(gè)變數(shù)之間沒(méi)有什麼關(guān)係?!?.簡(jiǎn)單線性回歸一、回歸直線的確定如果變數(shù)x和y相關(guān),並且從相關(guān)圖表中可以看出它們之間大致形成一種直線關(guān)係,我們就可在相關(guān)圖上求出一條與各點(diǎn)最相配合的直線。由於這些點(diǎn)所代表的若干對(duì)數(shù)據(jù)——觀察值,只是相互有一定關(guān)係的變數(shù)x、y的總體中的一個(gè)樣本,故這樣求出的直線是總體回歸直線的估計(jì)線。在估計(jì)線上的點(diǎn)的縱坐標(biāo)是相應(yīng)於x的y的估計(jì)值。y=a+bx

如果這個(gè)y的估計(jì)值用y表示,則估計(jì)線的方程可寫為

這叫做樣本回歸直線。它是y對(duì)x的回歸線,表明y對(duì)x的平均關(guān)係。式中x為受控制的引數(shù),通常由研究者事先選定數(shù)值。a為樣本回歸直線y的截距,它是樣本回歸直線通過(guò)縱軸的點(diǎn)的y座標(biāo);b為樣本回歸直線的斜率,它表示當(dāng)x增加一個(gè)單位時(shí)y的平均增加數(shù)量,b又稱回歸係數(shù)。如何確定回歸直線方程呢?也就是說(shuō)怎樣確定方程中的參數(shù)a、b呢?若用(xi,yi)(i=1,2,…n)表示n組觀察值,則對(duì)任意給定的xi

,可得y的估計(jì)值為這些數(shù)值同實(shí)際值yi之間存在著誤差;yi=a+bxi

i=yi

yi=

yi

a

bxi

Q(a,b)=

2=(y

a

bx)2為最小。這樣便把尋找適當(dāng)直線問(wèn)題轉(zhuǎn)化為使Q(a,b)達(dá)到最小條件下求出a、b的問(wèn)題。在回歸分析中,人們普遍採(cǎi)用的是最小二乘法原則。根據(jù)最小二乘法的原則,欲使所求回歸直線y=a+bx最適合於實(shí)際資料,必須使每個(gè)xi對(duì)應(yīng)的指標(biāo)實(shí)測(cè)值yi與回歸直線確定的估計(jì)值yi的離差平方之和為最小,即必須使

因?yàn)镼(a,b)是a、b的非負(fù)二元函數(shù),所以其最小值無(wú)疑是存在的。根據(jù)數(shù)學(xué)中的極值原理,令:滿足上述條件的a、b即為所求的未知參數(shù)。由化簡(jiǎn)得(y

a

bx)=0(y

a

bx)x=0即:

y=na+b

x

xy=a

x+b

x2上述方程組稱為標(biāo)準(zhǔn)方程組。解之,得:a=y

bx因此即可確定回歸方程式為:y=a+bx

這個(gè)方程稱為在給定樣本條件下的一元線性回歸方程,對(duì)應(yīng)的直線稱為樣本回歸直線。顯然,回歸方程對(duì)於不同的樣本是有差別的,因而,它具有經(jīng)驗(yàn)的特徵,所以在實(shí)用上,也將它叫做經(jīng)驗(yàn)公式。為了簡(jiǎn)化上述回歸係數(shù)b的表達(dá)形式,引入如下離差乘積的和式:Lxy=(x

x)(y

y)Lxx=(x

x)2於是,回歸係數(shù)可簡(jiǎn)化為為了相關(guān)性檢驗(yàn)的需要,順便引入關(guān)於y的離差平方和:Lyy=(y

y)2求回歸方程式的係數(shù)往往是通過(guò)列表進(jìn)行的。這裏,我們以下表資料為倒,通過(guò)求某鋼鐵廠煉鋼精煉時(shí)間對(duì)含碳量的回歸方程,說(shuō)明回歸方程的確定。10.9100爐次含碳量(%)

(x)精煉時(shí)間(分)

(y)某鋼鐵廠十個(gè)爐次鋼液含碳量和精煉時(shí)間10234567892.01.01.21.41.51.61.71.81.9105235130145170175190190220可以看出,x與y之間的關(guān)係近似為直線關(guān)係。我們可以對(duì)其配合一條回歸直線。為計(jì)算回歸方程的係數(shù)a、b,我們先對(duì)原始數(shù)據(jù)進(jìn)行加工。yx2y2xy1001051301451701751901902202350.811.001.441.962.252.562.893.243.614.001000011025169002102528900306253610036100484005522590105156203255280323342418470166023.762943002642爐次x12345678910

0.91.01.21.41.51.61.71.81.92.015.0原始數(shù)據(jù)加工表於是:所以:故精煉時(shí)間關(guān)於含碳量的回歸方程為:y=

14.9525+120.635x

計(jì)算結(jié)果表明,這個(gè)方程顯示著鋼水溶液的含碳量每增加0.1%,則精煉時(shí)間平均來(lái)說(shuō)大約要延長(zhǎng)12.06分。根據(jù)回歸方程,可以給出引數(shù)的任一數(shù)值估計(jì)或預(yù)測(cè)因變數(shù)的平均可能值。y=

14.9525+120.6352.2=150.4445(分)

例如,求含碳量2.2%所需的精煉時(shí)間:二、估計(jì)平均誤差回歸方程的一個(gè)重要作用在於根據(jù)引數(shù)的已知值估計(jì)因變數(shù)的可能值。這個(gè)估計(jì)值和真正的實(shí)際值可能一致,也可能不一致。例如,當(dāng)含碳量為1.8%時(shí),推算的煉鋼時(shí)間為202.19分鐘,而實(shí)際為190分鐘,相差12.19分鐘。這就產(chǎn)生了估計(jì)公式即回歸方程的可靠性問(wèn)題,也就是說(shuō),根據(jù)回歸方程計(jì)算的估計(jì)值,其代表性如何?為了度量估計(jì)公式即回歸方程的可靠性,通常計(jì)算估計(jì)平均誤差。估計(jì)平均誤差度量觀察值回繞著回歸直線的變化程度或分散程度。通常用Sy代表估計(jì)平均誤差,其計(jì)算公式為:

注意,公式中根號(hào)內(nèi)的分母是n

2,而不是n。這是由於Q=(y

y)2有兩個(gè)線性關(guān)係的約束,一是,一是,因而,Q=(y

y)2的自由度為n2。

當(dāng)實(shí)際觀測(cè)值很多,而且數(shù)值較大時(shí),根據(jù)上述公式計(jì)算估計(jì)平均誤差十分麻煩。借助下列公式,可以簡(jiǎn)化計(jì)算步驟,所得計(jì)算結(jié)果也相一致。估計(jì)平均誤差是一個(gè)衡量回歸方程代表性大小的分析指標(biāo)。估計(jì)平均誤差愈大,則數(shù)據(jù)點(diǎn)圍繞回歸直線的分散程度就愈大,回歸方程的代表性愈小。估計(jì)平均誤差愈小,則數(shù)據(jù)點(diǎn)圍繞回歸直線的分散程度愈小,回歸方程的代表愈大,其可靠性愈高?!?.相關(guān)係數(shù)相關(guān)分析是用以說(shuō)明變數(shù)之間相關(guān)程度的統(tǒng)計(jì)工具。相關(guān)分析常常與回歸分析聯(lián)合使用,以衡量回歸方程所表示的因變數(shù)變化的精確度如何。相關(guān)分析也可單獨(dú)用於衡量變數(shù)之間的聯(lián)繫程度。本節(jié)我們討論兩個(gè)變數(shù)之間線性相關(guān)程度問(wèn)題。兩個(gè)變數(shù)之間線性相關(guān)程度的描述通常採(cǎi)用相關(guān)係數(shù)。一、相關(guān)係數(shù)的意義我們回過(guò)頭來(lái)考察一下線性回歸中指標(biāo)y的值yi與回歸估計(jì)值yi

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論