數(shù)據(jù)分析方法及軟件應用_第1頁
數(shù)據(jù)分析方法及軟件應用_第2頁
數(shù)據(jù)分析方法及軟件應用_第3頁
數(shù)據(jù)分析方法及軟件應用_第4頁
數(shù)據(jù)分析方法及軟件應用_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

數(shù)據(jù)分析方法及軟件應用

(作業(yè))

題目:4、8、13、16題

指導教師:

學院:交通運輸學院

姓名:

學號:

4、在某化工生產(chǎn)中為了提高收率,選了三種不同濃度,四種不同溫度做試臉。在同

一濃度與溫度組合下各做兩次試驗,其收率數(shù)據(jù)如下面計算表所列。試在a=0.05顯

著性水平下分析

(1)給出SPSS數(shù)據(jù)集的格式(列舉前3個樣本即可);

(2)分析濃度對收率有無顯著影響;

(3)分析濃度、溫度以及它們間的交互作用對收率有無顯著影響。

解答:(1)分別定義分組變量濃度、溫度、收率,在變量視圖與數(shù)據(jù)視圖中輸入

表格數(shù)據(jù),具體如下圖。

名稱類型寬度標簽值缺失列n

1濃度數(shù)值80無無8

2溫度數(shù)值80無無8

3收率數(shù)值80無無8

(2)思路:本問是研究一個控制變量即濃度的不同水平是否對觀測變量收率產(chǎn)生

了顯著影響,因而應用單因素方差分析。假設:濃度對收率無顯著影響。

步驟:【分析-比較均值-單因素】,將收率選入到因變量列表中,將濃度選入到因

子框中,確定。

輸出:

愛躡分析

收率

平方和dfF均值平方F^著性

群組之39.083219.5&25.074.016

在群組內(nèi)80.875213.851

黜十119.9582,

顯著性水平Q為。.05,由于概率p值小于顯著性水平Q,則應拒絕原假設,認為

濃度對收率有顯著影響。

(3)思路:本問首先是研究兩個控制變量濃度及溫度的不同水平對觀測變量收

率的獨立影響,然后分析兩個這控制變量的交互作用能否對收率產(chǎn)生顯著影響,因而

應該采用多因素方差分析。假設,Hoi:濃度對收率無顯著影響;Ho2:溫度對收率無

顯著影響;H03:濃度與溫度的交互作用對收率無顯著影響。

步驟:【分析-一般線性模型-單變量工把收率制定到因變量中,把濃度與溫度制

定到固定因子框中,確定。

輸出:

主旨冏效果檢定

因燮數(shù):收率

第(II^平方

來源和df平均值平方F^著性

修正的模型70.4581116.4051.553.230

截距2667.04212667.042646.556.000

濃度39.083219.5424.737.030

溫度13.79234.5971.114.382

濃度*溫度17.58362.931.710.648

的49.500124.125

獺十2787.00024

校正119.95823

a.R平方=.587(飄整的R平方=.209)

第一列是對觀測變量總變差分解的說明;第二列是觀測變量變差分解的結(jié)果;

第三列是自由度;第四列是均方;第五列是F檢驗統(tǒng)計量的觀測值;第六列是檢驗統(tǒng)

計量的概率P值??梢钥吹接^測變量收率的總變差為119.958,由濃度不同引起的變

差是39.083,由溫度不同引起的變差為13.792,由濃度和溫度的交互作用引起的變差

為17.583,由隨機因素引起的變差為49.500。濃度,溫度和濃度*溫度的概率p值分別

為0.030,0.382和0.648o

濃度:顯著性<0.05說明拒絕原假設(濃度對收率無顯著影響),證明濃度對收率

有顯著影響;溫度:顯著性>0.05說明不拒絕原假設(溫度對收率無顯著影響),證

明溫度對收率無顯著影響;濃度與溫度:顯著性>0.05說明不拒絕原假設(濃度與溫

度的交互作用對收率無顯著影響),證明溫濃度與溫度的交互作用對收率無顯著影響。

8、以高校科研研究數(shù)據(jù)為例:以課題總數(shù)X5為被解釋變量,解釋變量為投入人年數(shù)

X2、投入科研事業(yè)費X4、專著數(shù)X6、獲獎數(shù)X8;建立多元線性回歸模型,分析它們之

間的關(guān)系。解釋變量采用逐步篩選策略,并做多重共線性、方差齊性和殘差的自相關(guān)

性檢驗。

解答:

思路:根據(jù)要求采用逐步篩選的解釋變量篩選策略,利用回歸分析方法建立多元

線性回歸模型,分析它任之間的關(guān)系,并且要求做多重共線性、方差齊性和殘差的自

相關(guān)性檢驗。

(1)步驟:【分析-回歸-線性】,X5選入因變量,X2、X4、X6、X8選入自變量,

方法選擇【逐步】?!窘y(tǒng)計量】勾選【估計】、【模型擬合度】、【共線性診斷】與

[Durbin-Waston(U)]o[繪制(T)按鈕工將*ZRESID添加到Y(jié)(Y)框中,將*ZPRED添

加到X2(X)框中,勾選【正態(tài)概率圖】,【保存(S)]按鈕。在預測值與殘差中勾選

【標準化】選項。選擇菜單【分析一相關(guān)一雙變量】將標準化預測值和標準化殘差選

入【變量】框,在相關(guān)系數(shù)中選擇Spearman,各項完成后點擊【確定】。

輸出:

燮數(shù)已輸入/已移除‘

模型燮數(shù)已輸入燮數(shù)已移除方法

1逐步(TOJ:

F-to-enter的

投入人年數(shù)?微率<=,050>

F-to-remove的

微率>=.100)

a.鷹燮歌課題總數(shù)

模型摘

模型RR▼方^整接R千方襟型偏斜度^Durbin-Watson

1.959'.919.917241.95821.747

a.^測值:(常數(shù)),投入人年數(shù)

b.鷹燮數(shù):課題總數(shù)

表中變量為投入人年數(shù),參考調(diào)整的判定系數(shù),由于調(diào)整的判定系數(shù)(0.917)較

接近于1,因此認為擬合優(yōu)度較高,被解釋變量可以被模型解釋的部分較多,未能被

解釋的部分較少。方程DW檢驗值為1.747,殘差存在一定的正自相關(guān)。

建昇敷分析'

模型平方和df平均值平方F掾i著性

150^19379040.047119379040.047331.018.oooh

殘差1697769.9532958543.791

繳十21076810.00030

a.鷹燮數(shù):課題總數(shù)

b.恥值:(常數(shù)),投入人年數(shù)

被解釋變量的總離差平方和為21076810.00,回歸平方和及均方分別為

19379040.047和19379040.047,剩余平方和及均方分別為1697769.953和58543.791,

產(chǎn)檢驗統(tǒng)計量的觀測值為331.018,對應的概率p值近似為0。依據(jù)該表可進行回歸方

程的顯著性檢驗。如果顯著性水平a為0.05,由于概率p值小于顯著性水平a,應拒

絕回歸方程顯著性檢驗的零假設,認為回歸系數(shù)不為0,被解釋變量與解釋變量的線

性關(guān)系是顯著的,可建立線性模型。

保酸

非檄型化保數(shù)襟型化保教共綠性^■資半

模型BBetaT^著性允差VIF

1(常數(shù))-94.52472.442-1.305.202

投入人年數(shù).492.027.95918.194.0001.0001.000

a.鷹燮數(shù)上課題總數(shù)

依據(jù)該表可以進行回歸系數(shù)顯著性檢驗,寫出回歸方程和檢測多重共線性。可以

看到,如果顯著性水平竊為0.05,投入人年數(shù)變量的回歸系數(shù)顯著性t檢驗的概率p值

小于顯著性水平d因此拒絕零假設,認為其偏回歸系數(shù)與0有顯著差異,與被解釋變

量與解釋變量的線性關(guān)系是顯著的,應保留在方程中。同時從容忍度和方差膨脹因子

看,解釋變量與投入人年數(shù)多重共線性很弱,可以建立模型。最終回歸方程為,課題

總數(shù)二-94.524+0.492投入人年數(shù)。

排除的爨數(shù)”

共縹性統(tǒng)三十資料

模型Beta人T偏相R同允差VIF允差下限

1投入科研事業(yè)費(百元).152b1.528,138.278.2673.748.267

專著數(shù).023b.182.857.034.1885.308.188

獲獎數(shù).030b.411.684.077.5421.846.542

a.鷹等數(shù):課題M數(shù)

b.模型中的頸測值:(常數(shù))?投入人年數(shù)

該表展示回歸方程的剔除變量,可以看到,如果顯著性水平]為0.05,表中三個

變量的回歸系數(shù)顯著性t檢驗的概率p值大于顯著性水平出因此不拒絕零假設,認為

其偏回歸系數(shù)與0無顯著差異,與被解釋變量與解釋變量的線性關(guān)系是不顯著的,不

應保留在方程中。同時從容忍度和方差膨脹因子看,解釋變量與三個解釋變量多重共

線性嚴重,在建立模型的時候應當被剔除。

共^性漸療

燮累數(shù)比例

模型雉度特徵值修件指數(shù)(常數(shù))投入人年數(shù)

111.8001.000.10.10

2.2003.001.90.90

a.鷹燮數(shù):課題總數(shù)

依據(jù)該表可進行多重共線性檢測,從方差比例上看第二個變量可解釋常量的

90%,也可解釋投入人年數(shù)的90%,一次認為這些變量存在多重共線性。條件指數(shù)都

小于10,說明存在共線性較弱,低個變量特征值小于0.7,說明線性相關(guān)關(guān)系較弱。

殘差統(tǒng)資料’

最小值最大值平均數(shù)梯型偏差N

-57.6423246.986960.000803.721331

殘差-466.2850509.6787.0000237.891431

-1.2662.845.0001.00031

襟舉殘差-1.9272.106.000,98331

a.鷹燮數(shù):課題總數(shù)

汨蠅枳津化2分的金住P-PM

數(shù)據(jù)點圍繞基準線還存在一定的規(guī)律性,但標準化殘差的非參數(shù)檢驗結(jié)果表明標

準化殘差與標準正態(tài)分右不存在顯著差異,可以認為殘差滿足了線性模型的前提要

求。

熱號攻:課JB總數(shù)

驚卑化珀;W值

隨著標準化預測值的變化,殘差點在0線周圍隨機分布,但殘差的等方差性并不

完全滿足,方差似乎有增大的趨勢。但計算殘差與預測值的Spearman等級相關(guān)系數(shù)

為-0.176,且檢驗并不顯著,因此認為異方差現(xiàn)象并不明顯。

相^

StandardizedStandardized

PredictedVa1ueResidual

Spearman的rhoStandardizedPredicted相防)保數(shù)1.000-.176

Value^著性(矍尾)?.344

N3131

StandardizedResidual相居月保數(shù)-.1761.000

^著性(曼尼).344?

N3131

依據(jù)該表可以對標準化殘差和標準化預測值的Spearman等級進行分析,可以看

到,計算殘差與預測值的相關(guān)性弱,認為異方差現(xiàn)象不明顯。

13、利用1950年?1990年的天津食品消費數(shù)據(jù),分析這段時間內(nèi)的人均生活費用年

收入的變化情況。要求:數(shù)據(jù)進行對數(shù)變換后,運用Holt線性趨勢平滑模型分析。

(1)輸出均方根誤差和參數(shù)估計結(jié)果;

(2)輸出ACF和PACF圖形并對其特征進行分析,是否滿足白噪聲序列的條件;

(3)給出199L1992的預測值,并輸出擬合圖。

解答:

思路:根據(jù)題意,先不進行序列圖和自相關(guān)、偏自相關(guān)的觀察和檢驗階段處理。

直接利用指數(shù)平滑模型中的Holt線性趨勢模型對數(shù)據(jù)進行分析,同時輸出均方根誤差

和參數(shù)估計誤差,ACF和PACF圖像判斷是否滿足白噪音序列的條件;最后然后對數(shù)據(jù)

進行1991年、1992年做出預測,并用模型進行擬合。

步驟:【分析?預測?創(chuàng)建模型工將人均生活費總收入選入【因變量】中,將【方

法】選為【指數(shù)平滑法】;點擊【條件】,在【因變量轉(zhuǎn)換】中選【自然對數(shù)]在【模

型類型】中【Holt線性趨勢】,【繼續(xù)】。

【統(tǒng)計量工在【擬合度量】中選擇【平穩(wěn)的R方、均方根誤差工在【個別模型

的統(tǒng)計量】中選中【參數(shù)估計】,在【比較模型的統(tǒng)計量】中選中【擬合優(yōu)度工選中

【顯示預測值】,【確定】

【圖表】,在【單個模型圖】中選擇【序列、殘差自相關(guān)函數(shù)、殘差部分自相關(guān)

函數(shù)]在【每張圖顯示的內(nèi)容】中現(xiàn)則【觀察值、預測值、擬合值】。

【選項】,在【預測階段】選擇第二個,在【E期】的【年】框中填入【1992】。

輸出:

模型道合度

遹合度統(tǒng)百分位數(shù)

京演料平均數(shù)SE最小值最大值5102550759095

平穰R平

.221.221.221.221.221.221.221.221.221.221

R平方.994.994.994.994.994.994.994.994.994.994

RMSE28.17928.17928.17928.17928.17928.17928.17928.17928.17928.179

MAPE3.5173.5173.5173.5173.5173.5173.5173.5173.5173.517

MaxAPE12.49512.49512.49512.49512.49512.49512.49512.49512.49512.495

MAE17.14617.14617.14617.14617.14617.14617.14617.14617.14617.146

MaxAE82.91182.91182.91182.91182.91182.91182.91182.91182.91182.911

襟型化

6.858?6.8586.8586.8586.8586.8586.8586.8586.8586.858

BIC

模型而弼

模型通合度^?資料Ljung-BoxQ(8)

平穩(wěn)R平St群值數(shù)

模型目方RMSE統(tǒng)資料DF^著性目

人均生活費年收入-模

0.22128.17916.36016.4280

型」

均方根誤差為28.179,誤差較小。

指數(shù)平滑化模型'

模型估^SE’「^著性

人均生活費年收入-模型」自然差攫攵Alpha(水型)1.000.1576.381.000

Gamma(超要j),400.1782.244.031

模型的兩個參數(shù)分別為:1.0和0.4,則具體模型為fi+m=l.0+0.4m,

殘差ACF殘差PACF

[=]

□□

□口

D1

□□

0

D

D

I匕

0

1

□□

0

-1

D

鈣I0

-l'o-OSOJO0510-050001510

Residual

雖然殘差自相關(guān)函數(shù)和偏自相關(guān)函數(shù)絕大多數(shù)處于置信區(qū)間內(nèi),但兩函數(shù)都具有

明顯減少趨勢,且具有一定的季節(jié)性,因此不屬于白噪音序列。

模型:9911992

人均生活費年收入-模型」fg測1708.821920.58

UCL1887.022274.43

LCL1543.631609.99

斜封每一(周模型,棺湖I是在所要求的估料期涉箍冏內(nèi)的前次非覆

漏^始,加在其所有值測值的非超漏值可用的前次期IU1,或是在

所要求的測期^的留吉束日期多吉束,取較早的畤^。

一烹I整

200000-一西洌

1500.00-

8」

q

E

n

N100000-

500,00-

-a「「-▲A「1--A-21■-

.00111111

9,L99999*9999998999

5w55666677777886

26802468024660246患善篦

日期

1991、1992年的預測值與1990年的觀測值有較大的增長趨勢。從整個數(shù)據(jù)來看,

19so年至1980年這段時期較為平穩(wěn)的增長,但是1980年之后迅速上升,最后預測值

上升較為明顯,這與實際趨勢基本一致。且1991、1992年預測值分別為1708.82、

1920.58o

16、結(jié)合自己的研究方向、參與項目等,舉出一個說明SPSS在交通運輸中應用的例子。

例子需包含問題說明、教據(jù)來源、統(tǒng)計方法、統(tǒng)計結(jié)果及其主要結(jié)論。

解答:

問題說明;利用1950年?2013年美國么歷年定期航班旅客周轉(zhuǎn)量(單位:“臺億

客公里)歷年數(shù)據(jù)數(shù)據(jù),建立幾種指數(shù)平滑模型,預測2016年美國定期航班旅客周轉(zhuǎn)

量。

數(shù)據(jù)來源:《從統(tǒng)計看民航(2014)》中國民航出版社,2014年11月第一扳。

年份19501951195219531954195519561957195819$9

定期航班做客周轉(zhuǎn)

164.4211.8250.3292.1331.6391.8444.5503506.958&3

依,‘億客公里

年份19601961196219631961196s倒6196719681969

定期航班旅客周轉(zhuǎn)

625.4540.9704.2810.4941.31105.21285.71605.81830.72017.3

證/億客公里

年份197019711972197319741975197619771978即9

定期航班旅客周轉(zhuǎn)

2131.32155.9145326062621262028823110364040S0

此,‘億客公里

年份198019811982198319811985198619871988[瞰

定期骯班旅客周轉(zhuǎn)

3930395041001160472052795800617067436918

量億客公里

年份1990199119921993199419951996199719981999

定期航班旅客周耕

731471H3心1?4“39KWl.b92H.K州》79X4/1M4K.(

員/億客公里

年份2000200120022003200420052006200720082009

定期航班族客周轉(zhuǎn)

11109.5IM14.810218.410389.611813.7121-16.912753.813120.51279012570

H/億客公里

年份2010201120122013

定期航班旅今周轉(zhuǎn)

12998.7B105.413247.513525.2

員/億客公里

解題思路:首先首先繪制和觀察彩電出口量的序列圖,通過圖形觀察和檢驗尋找

規(guī)律,然后通過指數(shù)平滑模型一簡單、HOIT線性趨勢、Brown線性趨勢三個模型進行

分析預測,比較選擇最佳模型預測2016年億客公里數(shù)。

統(tǒng)計結(jié)果:

美國億客公里時間序列圖如下:

15COCOCOOO-

10COCOCOOO-

5C0C0C0C0-

-5COCOCOOO-

-10COCOCOOO-

-15COCOCOOO-

JII-△△I4

SM200M0

8S880081

O0246?02

年6

幢盤:difference(16)

該序列圖為平穩(wěn)序列則可以直接進行建模分析。

(1)簡單指數(shù)平滑模型

型^^明

模型^型

模型ID億客公里模型」

模型財弼

模型逾合度統(tǒng)rt?資料Ljung-BoxQ(18)

模型值測建數(shù)數(shù)目平穩(wěn)R平方RAISE統(tǒng)舒?資料DF雕群值數(shù)目

億客公里-模型」0-.417367.91812.51117.0460

指數(shù)平滑化模型參數(shù)

模型估三十SET^著性

億客公里?模型」自然封數(shù)Alpha(水型)1.030.1228.175.000

犍差ACF殘短PACF

o

24n

23-—

22

21葉

19—

18”

16□挈

15□

14簾

1—

13什

11□

109□

8□

7□

6□

sO

4D

3O

a

2-1n

n

一現(xiàn)房值

一諷鱉

一用湖

1-,「「-A,--,「

1111

999999s-9L99999

666777888999

258147o369258

模型201420152016

億客公里?模型」13638.2113752.1613867.06

UCL17502.4819474.7921137.62

LCL10451.729393.228654.28

至I?封每一值1饃型,^測是在所要求的估M?期^^凰內(nèi)的前次非遺漏

始,加在其所有洌值的非迨漏值可用的前次期^?或是在所要求的^

測期^的結(jié)束日期結(jié)束'取較早的^^。

(2)HOIT線性趨勢指數(shù)平滑模型

型^^明

模型^型

模型ID億客公里模型」Holt

模型統(tǒng)料資料

模型通合度統(tǒng):十資料Ljung-BoxQ(18)

模型覆;,即燮數(shù)數(shù)目平穩(wěn)R平方RMSE統(tǒng)割■資料DF覆箸性雄群值數(shù)目

億客公里-模型」0.610417.99015.33616.0500

指數(shù)平滑化模型參數(shù)

模型估^SET「著性

億客公里-模型」自然封數(shù)Alpha(水型).694.1185.893.000

Gamma(超劈).117.0621.895.063

然并ACF耀邦PACF

一□

口1

?!?/p>

一0

O1

一□

o0

□1

□0

□□

一0

口□

口1

口1

口1

C口[

?!?/p>

”0

0

-05000510-10-050005

Residual

模型201420152016

億客公里-模型」測13940.7814300.6314680.08

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論