中央財經(jīng)大學統(tǒng)計學作業(yè)2.doc_第1頁
中央財經(jīng)大學統(tǒng)計學作業(yè)2.doc_第2頁
中央財經(jīng)大學統(tǒng)計學作業(yè)2.doc_第3頁
中央財經(jīng)大學統(tǒng)計學作業(yè)2.doc_第4頁
中央財經(jīng)大學統(tǒng)計學作業(yè)2.doc_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

中央財經(jīng)大學實 驗 報 告實驗項目名稱 方差分析、回歸分析、時間序列分析所屬課程名稱 統(tǒng)計學 實 驗 類 型 設計型、綜合型實驗 實 驗 日 期 2011年5月 班 級 任課教師 王會娟 學 號 姓 名 學 號 姓 名 學 號 姓 名 成 績 實 驗 報 告1、方差分析。(1)使用單因素方差分析的方法檢驗:能否認為不同學科的上月平均工資相等。如果不能認為全相等,請做多重比較。不同學科上月工資的描述統(tǒng)計上月工資N均值標準差標準誤均值的 95% 置信區(qū)間極小值極大值下限上限1462326.09511.83175.4652174.092478.08130035002422304.76514.64079.4112144.392465.14110033003552274.55476.18064.2082145.822403.2714003400總數(shù)1432300.00496.18341.4932217.982382.0211003500表1-1 不同學科上月工資的描述統(tǒng)計學科與工資研究的方差分析表 上月工資平方和df均方F顯著性組間67893.092233946.546.136.873組內(nèi)34892106.908140249229.335總數(shù)34960000.000142表1-2 學科與工資研究的方差分析表方差齊性檢驗上月工資Levene 統(tǒng)計量df1df2顯著性.0972140.908表1-3 學科與工資研究的方差齊性檢驗圖1-1 學科與工資研究方差分析基本假設的檢驗1、關于正態(tài)性的分析。使用spss軟件得出的分組直方圖如圖1-1所示,該圖表明,在各個水平下上月工資都呈對稱分布,沒有極端值出現(xiàn),因此可以認為不違背正態(tài)性假設。根據(jù)表1-3的Levene檢驗的結(jié)果,由于表中的p值等于0.908,是個非常大的值,因此也不能拒絕等方差的原假設。2、方差齊性檢驗。表1-1表明,各組標準差差異不大,最大值與最小值之比等于1.081,明顯小于2,因此可以認為是等方差的。3、方差分析的結(jié)果分析。檢驗中零假設和備擇假設為:H0:1=2=3H1:1、2、3不全相等表1-2中給出的p值等于0.873,大于我們通常要求的=0.05,因此我們不能拒絕原假設,不能得出學科對上月工資有顯著影響的結(jié)論,也就是說我們可能認為三個學科的上月工資相等。(2)在方差分析中同時考慮學科和性別因素,用雙因素方差分析模型分析學科和性別對上月平均工資的影響。圖1-2 學科和性別與工資研究方差分析基本假設的檢驗學科、性別與工資的無交互作用的雙因素方差分析表因變量:上月工資源III 型平方和df均方FSig.校正模型6540680.489a32180226.83010.664.000截距7.434E817.434E83635.933.000性別6472787.39616472787.39631.659.000學科244202.9942122101.497.597.552誤差28419319.511139204455.536總計7.914E8143校正的總計34960000.000142a. R 方 = .187(調(diào)整 R 方 = .170)表1-4 學科、性別與工資的無交互作用的雙因素方差分析表學科、性別與工資的有交互作用的雙因素方差分析表因變量:上月工資源III 型平方和df均方FSig.校正模型6775774.725a51355154.9456.587.000截距7.277E817.277E83537.387.000性別6185326.72316185326.72330.066.000學科228658.8652114329.433.556.575性別 * 學科235094.2372117547.118.571.566誤差28184225.275137205724.272總計7.914E8143校正的總計34960000.000142a. R 方 = .194(調(diào)整 R 方 = .164)表1-5 學科、性別與工資的有交互作用的雙因素方差分析表1、關于正態(tài)性的分析。使用spss軟件得出的分組直方圖如圖1-2所示,該圖表明,在各個水平各個性別下上月工資都呈對稱分布,沒有極端值出現(xiàn),因此可以認為不違背正態(tài)性假設。2、方差分析的結(jié)果分析檢驗中零假設和備擇假設為:H0:1=2=3=0(學科)H0:1=2=0H1:1、2、3不全為零H1:1、2不全為零由表1-4學科一欄的p值等于0.552,說明在考慮了性別因素后,我們?nèi)匀徊荒芫芙^原假設、認為不同學科之間的工資差異是顯著的。從性別對上月工資的影響來看,該變量對應的p值等于0.000,小于通常使用的值,說明性別對于月工資的影響是顯著的。又由表1-5,我們發(fā)現(xiàn)其交互作用的p值等于0.566,大于通常的,因此我們認為其交互作用對于工資的影響是顯著的。2、非參數(shù)檢驗。(1)用非參數(shù)檢驗方法檢驗能否認為男生和女生上月工資的中位數(shù)相等。Wilcoxon秩和檢驗中秩和的計算結(jié)果性別N秩均值秩和上月工資07388.516461.0017054.793835.00總數(shù)143表2-1 Wilcoxon秩和檢驗中秩和的計算結(jié)果Wilcoxon秩和檢驗的檢驗統(tǒng)計量和p值上月工資Mann-Whitney U1350.000Wilcoxon W3835.000Z-4.877漸近顯著性(雙側(cè)).000精確顯著性(雙側(cè)).000精確顯著性(單側(cè)).000點概率.000a. 分組變量: 性別表2-2 Wilcoxon秩和檢驗的檢驗統(tǒng)計量和p值1、我們用Wilcoxon秩和檢驗來比較中位數(shù)。檢驗的零假設和備擇假設如下所示:零假設:女生上月工資和男生上月工資的中位數(shù)相等。備擇假設:女生上月工資和男生上月工資的中位數(shù)不相等。2、兩個獨立樣本秩和檢驗結(jié)果分析根據(jù)表2-1,男生工資的平均秩為88.51,女生工資的平均秩為54.79,說明從樣本看男生的收入中位數(shù)要高于女生的收入中位數(shù)。從表2-2看,Wilcoxon W統(tǒng)計量為3835,用正態(tài)分布近似計算時的Z值為-4.877。表中顯示用正態(tài)分布計算時的p值(雙側(cè)檢驗)為0.000,與精確計算的p值0.000沒有顯著差異。我們應該拒絕原假設,結(jié)論為男生和女生的工資中位數(shù)并不相等。(2)用非參數(shù)檢驗方法檢驗學生上月工資和去年同月工資的中位數(shù)是否有顯著變化。Wilcoxon符號秩檢驗的p值去年同月工資 - 上月工資Z-1.336a漸近顯著性(雙側(cè)).181精確顯著性(雙側(cè)).183精確顯著性(單側(cè)).092點概率.001a. 基于正秩。b. Wilcoxon 帶符號秩檢驗表2-3 Wilcoxon符號秩檢驗的p值差值序列中的正數(shù)和負數(shù)的個數(shù)匯總表N去年同月工資 - 上月工資負差分a69正差分b54結(jié)c20總數(shù)143a. 去年同月工資 上月工資c. 去年同月工資 = 上月工資表2-4 差值序列中的正數(shù)和負數(shù)的個數(shù)匯總表匹配樣本符號檢驗的檢驗結(jié)果去年同月工資 - 上月工資Z-1.262漸近顯著性(雙側(cè)).207精確顯著性(雙側(cè)).207精確顯著性(單側(cè)).103點概率.029a. 符號檢驗表2-5 匹配樣本符號檢驗的檢驗結(jié)果1、根據(jù)題目,我們采取Wilcoxon符號秩檢驗的方法進行分析,確定原假設和備擇假設為:H0:差值總體的中位數(shù)=0H1:差值總體的中位數(shù)02、分析Wilcoxon符號秩檢驗的結(jié)果如下:由表2-3可知,精確檢驗的p值等于0.183,遠大于我們通常采用的=0.05,故不能拒絕原假設,也就是說沒有明顯證據(jù)表明去年同月工資和今年工資有顯著性的差異。表2-4和表2-5是符號檢驗的結(jié)果。表2-4表明差值序列中有69個負數(shù),54個正數(shù),表2-5表明采用精確檢驗(二項分布)計算的雙側(cè)檢驗值為0.207,也不能夠拒絕原假設。(3)用非參數(shù)檢驗方法不同學科學生平均學分績點的中位數(shù)是否相等。Kruskal-Wallis檢驗中計算的各組平均秩學科N秩均值平均學分績點14676.9624267.6035571.22總數(shù)143表2-6 Kruskal-Wallis檢驗中計算的各組平均秩Kruskal-Wallis檢驗的檢驗統(tǒng)計量和p值a,b,c平均學分績點卡方1.153df2漸近顯著性.562a. Kruskal Wallis 檢驗b. 分組變量: 學科c. 由于沒有足夠內(nèi)存,無法計算某些或所有精確顯著性。表2-7 Kruskal-Wallis檢驗的檢驗統(tǒng)計量和p值1、選擇多個獨立樣本的Kruskal-Wallis檢驗進行分析。根據(jù)題目我們的原假設和備擇假設為:H0:M1=M2=M3H1:M1、M2、M3不完全相等2、由表2-6,各組的平均秩處于67.6-76.96之間。表2-7表明,Kruskal-Wallis檢驗中使用卡方分布進行近似計算時的卡方統(tǒng)計量為1.153,自由度為2,相應的p值為0.562。由于p值遠大于,所以沒有足夠證據(jù)證明原假設不成立,因此我們可能認為幾個學科的平均績點的中位數(shù)是相等的。(4)檢驗學生的上月工資是否服從正態(tài)分布。單樣本 Kolmogorov-Smirnov 檢驗上月工資N143正態(tài)參數(shù)a,b均值2300.00標準差496.183最極端差別絕對值.083正.083負-.045Kolmogorov-Smirnov Z.997漸近顯著性(雙側(cè)).273精確顯著性(雙側(cè)).259點概率.000a. 檢驗分布為正態(tài)分布。b. 根據(jù)數(shù)據(jù)計算得到。表2-8 單樣本K-S檢驗的計算結(jié)果和相應的p值1、我們采取單樣本K-S檢驗進行分析,根據(jù)題目,我們的原假設和備擇假設為:H0:學生的上月工資服從正態(tài)分布H1:學生的上月工資不服從正態(tài)分布2、由表2-8,計算出的Dmax統(tǒng)計量的值為0.997,相對應的p值為0.273,遠大于我們通常選取的值,因此我們沒有足夠理由拒絕原假設,也就是說根據(jù)樣本數(shù)據(jù)我們不能認為總體是非正態(tài)的。(5)檢驗學生對專業(yè)的滿意程度是否為離散的均勻分布。對專業(yè)的滿意度觀察數(shù)期望數(shù)殘差14101.2-97.2232101.2-69.23138101.236.84212101.2110.85120101.218.8總數(shù)506表2-9 各組的頻數(shù)和期望頻數(shù)檢驗統(tǒng)計量對專業(yè)的滿意度卡方278.862adf4漸近顯著性.000精確顯著性.000點概率.000a. 0 個單元 (.0%) 具有小于 5 的期望頻率。單元最小期望頻率為 101.2。表2-10 統(tǒng)計量計算結(jié)果和相應的p值1、根據(jù)題意,我們采取卡方擬合優(yōu)度檢驗進行分析;我們的原假設和備擇假設是:H0:學生對專業(yè)的滿意程度是離散的均勻分布H1:學生對專業(yè)的滿意程度不是離散的均勻分布2、表2-9中是各組的頻數(shù)和期望頻數(shù),表2-10是統(tǒng)計量的計算結(jié)果和相應的p值。根據(jù)表2-10,卡方等于278.962,自由度為4,對應的p值為0.000,遠小于我們通常采用的值,因此我們可以拒絕原假設,即認為學生對專業(yè)的滿意程度不是離散的均勻分布。3、回歸分析。(1)計算上月工資與平均學分績點的相關系數(shù)并作假設檢驗。相關性上月工資平均學分績點上月工資Pearson 相關性1.762*顯著性(雙側(cè)).000N506506平均學分績點Pearson 相關性.762*1顯著性(雙側(cè)).000N506506 *. 在 .01 水平(雙側(cè))上顯著相關。表3-1 相關系數(shù)的輸出結(jié)果如表3-1所示,上月工資和平均學分績點的相關系數(shù)為0.762,與此同時,其p值為0.000,遠小于我們通常選用的值,通過了顯著性檢驗。(2)以上月工資為因變量,平均學分績點為自變量做回歸分析,分析模型的擬合效果和假設檢驗的結(jié)果。系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版1(常量)-1034.007126.581-8.169.000平均學分績點1075.26040.706.76226.415.000a. 因變量: 上月工資表3-2 輸出的回歸系數(shù)Anovab模型平方和df均方FSig.1回歸78519984.584178519984.584697.759.000a殘差56715924.507504112531.596總計1.352E8505a. 預測變量: (常量), 平均學分績點。b. 因變量: 上月工資表3-3 方差分析表模型匯總模型RR 方調(diào)整 R 方標準 估計的誤差1.762a.581.580335.457表3-4 輸出的擬合優(yōu)度原假設H0:兩個變量之間的相關性并不顯著備擇假設H1:兩個變量之間的相關性顯著1、SPSS輸出的回歸系數(shù)及t統(tǒng)計量值,有表3-2中的數(shù)據(jù)可知一元線性回歸方程:Yt=-1034.007+1075.26Xtt統(tǒng)計量為26.415,如果顯著性水平為0.05,自由度為504,相應的t/2臨界值在1.96-1.972之間。由于t的絕對值大于t/2,則能夠拒絕原假設,表明自變量X對因變量Y的影響是顯著的,二者之間存在顯著的線性關系。sig.即為雙側(cè)檢驗的P值,其0.000的取值同樣說明有相當大的把握拒絕原假設,表明自變量對因變量的影響是顯著的。2、F檢驗結(jié)果,如表3-3得到的F統(tǒng)計量為697.759,如果顯著性水平=0.05,分子自由度為1,分母自由度為504時,F(xiàn)的臨界值在3.84-3.92之間。由于F大于F,可以拒絕原假設F檢驗的邊際概率為0.000,同樣表明方程整體線性關系顯著。3、擬合優(yōu)度檢驗,由表3-4可知表中R為R的平方的正根,由于r的絕對值等于0.762,所以工資Y和績點X的相關系數(shù)為0.762判定系數(shù)R的平方為0.581,其統(tǒng)計含義為:在工資的離差中,有58.1%可以由工資與績點之間的線性關系解釋。擬合程度一般。估計標準誤等于335.475,其統(tǒng)計含義:根據(jù)績點對工資進行估計時,平均的估計誤差為335.475元。(3)以上月工資為因變量,平均學分績點和性別為自變量做回歸分析,分析模型的擬合效果和假設檢驗的結(jié)果。系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版1(常量)-977.68681.945-11.931.000平均學分績點1138.77326.452.80743.050.000性別-513.00919.384-.496-26.465.000a. 因變量: 上月工資表3-5 回歸系數(shù)及t統(tǒng)計量Anovab模型平方和df均方FSig.1回歸1.115E8255764862.6331183.224.000a殘差23706183.82550347129.590總計1.352E8505a. 預測變量: (常量), 性別, 平均學分績點。b. 因變量: 上月工資表3-6 方差分析表擬合優(yōu)度數(shù)據(jù)模型RR 方調(diào)整 R 方標準 估計的誤差1.908a.825.824217.094表3-7 輸出的擬合優(yōu)度原假設H0:學分績點與工資之間的相關性并不顯著備擇假設H1:學分績點與工資之間的相關性顯著原假設H0:性別與工資之間的相關性并不顯著備擇假設H1:性別與工資之間的相關性顯著1、SPSS輸出的回歸系數(shù)及t統(tǒng)計量值,有表3-5中的數(shù)據(jù)可知二元線性回歸方程:Yt=-977.686+1138.773X-513.009S變量X的回歸系數(shù)為1138.773,其統(tǒng)計含義為在性別一致的情況下,績點每高1,月均工資升高1138.773:變量S的回歸系數(shù)為513.009,其統(tǒng)計含義為在績點一致的情況下,女生工資會比男生低513.009變量X的t統(tǒng)計量為43.050,必然大于相應的t臨界值,可拒絕原假設,認為自變量X與因變量Y顯著相關。變量S的t統(tǒng)計量的絕對值為26.465,必然大于相應的t臨界值,可拒絕原假設,認為自變量S與因變量Y顯著相關。2、F檢驗結(jié)果,如表3-3得到的F統(tǒng)計量為1183.224,如果顯著性水平=0.05,分子自由度為2,分母自由度為503時,F(xiàn)的臨界值在3.84-3.92之間。由于F大于F,可以拒絕原假設F檢驗的邊際概率為0.000,同樣表明方程整體線性關系顯著。3、擬合優(yōu)度檢驗,由表3-4可知表中R為R的平方的正根,由于r的絕對值等于0.908,所以工資Y和績點X以及性別S有著很強的相關性。判定系數(shù)R的平方為0.825,其統(tǒng)計含義為:在工資的離差中,有82.5%可以由績點和性別的二元線性回歸方程所解釋。擬合程度較好。估計標準誤等于217.094,其統(tǒng)計含義:根據(jù)績點和性別對工資進行估計時,平均的估計誤差為217.094元。(4)、(2)和(3)中的模型你會選擇哪一個模型用于預測?為什么?假設一名男生的平均學分績點為3.5,試預測他的上月工資的點估計值和區(qū)間估計?!?區(qū)間估計為選做】答:我會選擇3的模型進行預測,因為3的擬合程度要好于2。點估計:Y=3008.0195區(qū)間估計:取置信度為95%,樣本容量為143,區(qū)間估計結(jié)果為(2972.4395,3043.5995)4、時間序列分析。使用1998年-2007年我國的月度社會商品零售額(sale.xls)。要求使用前9年的數(shù)據(jù)建立模型預測2007年的月度數(shù)值,并根據(jù)2007年的實際值和預測值分析預測效果。要求:5、時間序列分析(1)該時間序列的季節(jié)指數(shù)表5-1期間季節(jié)性因素 (%)1108.82101.0394.9492.3594.5694.4792.3892.4999.510104.311105.212120.5(2)使用時間序列的分解模型進行預測在SPSS中,對季節(jié)性分解后得到的STC項的數(shù)據(jù)對t建立合適的趨勢模型。表5-2方程模型匯總R 方Fdf1df2Sig.線性.9141125.27711

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論