回歸分析實驗課實驗8_第1頁
回歸分析實驗課實驗8_第2頁
回歸分析實驗課實驗8_第3頁
回歸分析實驗課實驗8_第4頁
回歸分析實驗課實驗8_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.實驗報告八實驗課程 :回歸分析實驗課專業(yè):統(tǒng)計學年級:姓名:學號:指導教師 :完成時間 :得分:.專業(yè)學習資料.教師評語 :學生收獲與思考 :.專業(yè)學習資料.實驗八含定性變量的回歸模型(4學時)一、實驗目的1 掌握含定性變量的回歸模型的建模步驟3 運用 SAS 計算含定性變量的各種回歸模型的各參數(shù)估計及相關檢驗統(tǒng)計量二、實驗理論與方法在實際問題的研究中,經常會遇到一些非數(shù)量型的變量。如品質變量 ;性別 ;戰(zhàn)爭與和平 。我們把這些品質變量也稱為定性變量,在建立回歸模型的時候我們需要考慮到這些定性變量。定性變量的回歸模型分為自變量含定性變量的回歸模型和因變量是定性變量的回歸模型。自變量含有定性變

2、量的時候,我們一般引進虛擬變量,將這些定性變量數(shù)量化。例如研究糧食產量問題 , y為糧食產量 , x為施肥量 ,另外考慮氣候問題,分為正常年份和干旱年份兩種情況,這個問題數(shù)量化方法就是引入一個0-1 型變量 D,令 Di=1表示正常年份 , Di=0 表示干旱年份,糧食產量的回歸模型為 : yi =0+ 1xi +2Di+ i。因變量是定性變量時,一般用 logistic 回歸模型 (分組數(shù)據(jù)的 logistic 回歸模型 ,未分組數(shù)據(jù)的logistic 回歸模型 ,多類別的 logistic 回歸模型 ), probit 回歸模型等 。.專業(yè)學習資料.三 . 實驗內容1用 DATA步建立一個

3、永久SAS數(shù)據(jù)集 ,數(shù)據(jù)集名為 xt103, 數(shù)據(jù)見表 21;對數(shù)據(jù)集 xt103, 建立 y對公司規(guī)模和公司類型的回歸,并對所得到的模型進行解釋 。2研制一種新型玻璃 ,對其做耐沖實驗 。用一個小球從不同的高度 h 對玻璃做自由落體撞擊,玻璃破碎記為 y=1 ,玻璃未破碎記 y=0. 數(shù)據(jù)見表 22.是對表中數(shù)據(jù)建立玻璃耐沖性對高度h的logistic 回歸 ,并解釋回歸方程的含義 。3某學校對本科畢業(yè)生的去向做了一個調查,分析影響畢業(yè)去向的相關因素,結果見表 23.其中畢業(yè)去向 “1”= 工作 ,“2”= 讀研 ,“3”= 出國留學 。 性別 “1”= 男生 ,“0”= 女生 。 用多類別

4、的Logisitic 回歸分析影響畢業(yè)去向的因素。四 實驗儀器計算機和SAS 軟件五 . 實驗步驟和結果分析1 用 DATA步建立一個永久SAS數(shù)據(jù)集 ,數(shù)據(jù)集名為 xt103, 數(shù)據(jù)見表 21;對數(shù)據(jù)集 xt103, 建立 y對公司規(guī)模和公司類型的回歸,并對所得到的模型進行解釋。.專業(yè)學習資料.R 檢驗中 R 方為 0.8951 ,可以認為回歸擬合效果較好?;貧w方程通過F 檢驗,說明模型是顯著成立的。由參數(shù)估計表 ,可以看出 ,全部變量都是顯著的,回歸方程為 :y33.870.102x18.06 x2其中 ,x2 是虛擬變量 ,當公司類型為“互助 ”時,x2 為 0,為“股份 ”時, x2

5、為 1。由方程可知 , x2 為 1,即股份制公司的保險革新措施速度y 會更大 。 股份制公司采取保險革新措施的積極性比互助型公司高,股份制公司建立在共同承擔風險上,更愿意革新 。公司規(guī)模越大,采取保險革新措施的傾向越大:大規(guī)模公司保險制度的更新對公司的影響程度比小規(guī)模公司大 。SAS 程序:data xt103;input y x1 x2 ;/* 引入虛擬變量,將公司類型的互助設為0,股份設為1*/cards ;17 151 026 92 0.專業(yè)學習資料.21175 03031022 104 00 277 012 210 019 120 04 290 016 238 028 164 115

6、 272 111 295 1386813185121 224 120 166 113 305 130 124 114 246 1;run ;procregdata =xt103;.專業(yè)學習資料.modely=x1 x2;run ;2 研制一種新型玻璃,對其做耐沖實驗。用一個小球從不同的高度h 對玻璃做自由落體撞擊,玻璃破碎記為 y=1 ,玻璃未破碎記y=0. 數(shù)據(jù)見表 22. 是對表中數(shù)據(jù)建立玻璃耐沖性對高度h 的 logistic 回歸,并解釋回歸方程的含義。模型信息 :模型解出的是 y=0 的概率 。.專業(yè)學習資料.由三個檢驗中 ,統(tǒng)計量的 P值都小于 0.05 ,可以認為模型是顯著的。由

7、 Wald 檢驗的顯著性概率及其P 值,可以看出 , h 變量對方程的影響是顯著的。由極大似然估計,各個參數(shù)系數(shù)也通過檢驗。因此模型有效。二元 logit模型為exp( 14.597.98h)p( y 0)7.98h)1 exp( 14.59模型意義為 ,小球掉落高度為h,則玻璃未破碎的概率為p,而 y=0 表示玻璃未破碎。也就是說 ,該種新型的玻璃,用小球對其撞擊,當小球的掉落高度為h 時,玻璃未破碎的概率就是.專業(yè)學習資料.exp( 14.597.98h)p( y 0)7.98h)1 exp( 14.59,那么 ,玻璃會破碎的概率就為1-p(y=0) ,這也可以看成是一種比例 ,就是大量實

8、驗中,同個高度h ,玻璃會被擊破的比例。SAS 程序:data wjz;input h y ; /* 引入虛擬變量,將公司類型的互助設為0,股份設為1*/cards ;1.50 01.52 01.54 01.56 01.58 11.60 01.62 01.64 01.66 01.68 11.70 01.72 01.74 01.76 11.78 0.專業(yè)學習資料.1.80 11.82 01.84 01.86 11.88 11.90 01.92 11.94 01.96 11.98 12.00 1;run ;proclogisticdata =wjz;modely=h;run ;proclogist

9、icdata =wjz;class h;modely=h/ link =glogitaggregatescale =none;run ;.專業(yè)學習資料.3 某學校對本科畢業(yè)生的去向做了一個調查,分析影響畢業(yè)去向的相關因素,結果見表 23.其中畢業(yè)去向 “1”= 工作 ,“2 ”= 讀研,“3 ”= 出國留學 。 性別 “1”= 男生,“0 ”= 女生 。 用多類別的 Logisitic 回歸分析影響畢業(yè)去向的因素。專業(yè)課 x1英語 x2性別 x3月生活費 x4畢業(yè)去向 y兩個統(tǒng)計量的P 值均大于 0.05 ,說明模型擬合的較好。.專業(yè)學習資料.檢驗全局零假設: BETA=0 無效假設檢驗結果(

10、似然比 ,評分)的結果 P 值均小于0.01 ,具有顯著統(tǒng)計學意義 。三個變量中 ,有兩個是不顯著的變量, x3,x2, 剔除 x3:兩個統(tǒng)計量的P 值均大于 0.05 ,說明模型擬合的較好。.專業(yè)學習資料.檢驗全局零假設: BETA=0 無效假設檢驗結果(似然比 ,評分 ,wald )的結果 P 值均小于0.01 ,具有顯著統(tǒng)計學意義 。三個變量都是顯著的。以 x4= “1”,即參加工作 ,為參照 。由模型可以看出:.專業(yè)學習資料.exp( -19.116 0.17 x10.038x2 0.004x4 )p( y 2)exp( -18.01 0.012x1 0.122x2 0.0101x4

11、)1 exp( -19.116 0.17x1 0.038x2 0.004 x4 )exp( -18.010.012x10.122 x2 0.0101x4 )p( y 3)0.004x4 )exp( -18.01 0.012x1 0.122x2 0.0101x4 )1 exp( -19.116 0.17x1 0.038x2從參數(shù)估計表中,與參加工作的同學相比,讀研的 ( y=2 )的同學相比 ,讀研的同學其專業(yè)課成績更好 (x1 的 P 值 =0.003 ), 而外語成績 ( x2 的 p 值 =0.356 )和經濟狀況 ( x4 的 P 值 =0.184 )沒有顯著差異 ;出國留學的 ( y=

12、3 )學生其專業(yè)課成績和參加工作的沒有顯著差異,外語成績和經濟狀況則更好 。Sas 程序:dataa;inputx1 x2 x3 x4 y;cards ;9565.01600 26362.00850 18253.00700 26088.00850 37265.01750 18585.00100039595.0012002.專業(yè)學習資料.9292.01950 26363.00850 17875.01900 19078.00500 18283.01750 28065.01850 38375.00600 26090.00650 37590.01800 26383.01700 18575.00750

13、27386.00950 28666.01150039363.00130027372.00850 18660.01950 27663.00110019686.00750 27175.01100016372.01850 26088.00650 16795.01500 1.專業(yè)學習資料.8693.0 0550 16376.0 0650 18686.0 0750 27685.0 1650 18292.0 1950 37360.0 0800 18285.0 1750 27575.0 0750 17263.0 1650 18188.0 0850 39296.0 1950 2;run ;procprint

14、;run ;proclogistic;class x3;modely( ref = '3' )=x1 x2 x3 x4/ link =glogitaggregatescale =none ;run ;proclogistic;class x3;modely( ref = '3' )=x1 x2x4/ link =glogitaggregatescale =none ;.專業(yè)學習資料.run ;proclogistic;class x3;modely( ref = '1' )=x1 x2x4/ link =glogitaggregatescale

15、=none ;run ;六 收獲與思考七. 思考題當自變量是定性變量的時候,我們需要引進虛擬變量進行數(shù)量化,當定性變量有n 個水平的時候,我們該引進多少的虛擬變量,否則會怎樣 ?不妨試試在sas 中試試會出現(xiàn)什么問題。答:當定性變量有n 個水平時應該引進n-1 個虛擬變量 。否則最后一個虛擬變量無法用最小二乘估計計算出來 。例: X1-X3 為虛擬變量 。Data a;input x1 x2 x3 x y;cards ;.專業(yè)學習資料.procregdata =a;modely=x1-x3 x;run ;X3 沒有參數(shù)估計結果。因為 x1 x2 x3出現(xiàn)完全共線性, x1 x2 均為 0 時即

16、代表了x3 為 1.表 21iyx1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表 22.專業(yè)學習資料.序號hy序號hy(m(m)11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061.600191.86171.620201.

17、88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001表 23序號專業(yè)課 x1英語 x2性別 x3月生活費 x4畢業(yè)去向 y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.01950296363.008501.專業(yè)學習資料.107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論