版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)三:統(tǒng)計回歸模型Matlab求解一.實(shí)驗(yàn)通過范例學(xué)習(xí)建立統(tǒng)計回歸的數(shù)學(xué)模型以及求解全過程;熟悉MATLAB求解統(tǒng)計回歸模型的過程。二實(shí)驗(yàn)原理問題:一家技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度 等因素之間的關(guān)系,要建立一個數(shù)學(xué)模型,以便分析公司人事策略的合理性,并作為新聘用 人員薪金的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于 是調(diào)查來46名軟件開發(fā)人員的檔案資料,如表4,其中資歷一列指從事專業(yè)工作的年數(shù), 管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué) 程度,3表示更高程度(研究生)編號薪金資歷管
2、理教育編號薪金資歷管理教育01138761112422884612021160810325169787110318701113261480380204112831022717404811051176710328221848130620872212291354880107117722023014467100108105352013115942100209121952033223174101310123133023323780101211149753113425410111212213713123514861110113198003133616882120214114174013724170121
3、3152026341338159901301161323140339263301312171288440240179491402181324550241256851513191367750342278371612201596551143188381602211236660144174831601222135261345192071702231383960246193642001分析與假設(shè) 按照常識,薪金自然隨著資歷的增長而增加,管理人員的薪金應(yīng)高于非管 理人員,教育程度越高薪金也越高。薪金記作y,資歷記作x1,為了表示是否管理人員, 定義:X _1,管理人員虧“0,非管理人員.為了表示3種教育
4、程度,定義:1,中學(xué)1,大學(xué)X3 0,其它氣,其它這樣,中學(xué)用x3=1, x4=0表示,大學(xué)用x3=0,x4=1表示,研究生則用x3=0 , x4=0表示。假定資歷對薪金的作用是線性的,即資歷每加一年,薪金的增長是常數(shù);管理責(zé)任、教育程 度、資歷諸因素之間沒有交互作用,建立線性回歸模型?;灸P?薪金y與資歷x1,管理責(zé)任x2,教育程度x3,x4之間的多元線性回歸模 型為y = a + a x + a x + a x + a x +e (1)01 12 23 34 4其中a , a,a是待估計的回歸系數(shù),是隨機(jī)誤差。 014MATLAB的統(tǒng)計工具箱基本函數(shù)regress:b,bint,r,ri
5、nt,stats=regress(y,x,alpha)輸入:y: n維數(shù)據(jù)向量x:似5數(shù)據(jù)矩陣,第1列為全1向量alpha:置值水平,0.05輸出:b:參數(shù)估計值bint: b的信區(qū)間r :殘差向量y-xbrint:r的置值區(qū)間stats:第一個數(shù)為殘差平方即回歸方程之決定系數(shù)R2(R為相關(guān)系數(shù))越接近1,回 歸方程顯著;第二個數(shù)為統(tǒng)計量F檢驗(yàn)的值,越大回歸方程越顯著;第三個數(shù)為F 對應(yīng)概率P,越接近零越好;第四個數(shù)是誤差項(xiàng)的方差估計值在MATLAB命令窗口輸入代碼:y=13876;11608;18701;11283;11767;20872;11772;10535;12195;12313;14
6、975;21371 ;19800;11417;20263;13231;12884;13245;13677;15965;12366;21352;13839;22884;16 978;14803;17404;22184;13548;14467;15942;23174;23780;25410;14861;16882;2417 0;15990;26330;17949;25685;27837;18838;17483;19207;19346;x1 = 1;1;1;1;1;2;2;2;2;3;3;3;3;4;4;4;4;5;5;5;6;6;6;6;7;8;8;8;8;10;10;10;10;11;11;12
7、;12;13;1 3;14;15;16;16;16;17;20;x2 = 1;0;1;0;0;1;0;0;0;0;1;1;1;0;1;0;0;0;0;1;0;1;0;1;1;0;1;1;0;0;0;1;1;1;0;0;1;0;1;0;1;1;0;0;0;0;x3 = 1;0;0;0;0;0;0;1;0;0;1;0;0;1;0;0;0;0;0;1;1;0;0;0;1;0;1;0;1;1;0;0;0;0;1;0;0;1;0;0;0;0;0;1;0;1;x4 = 0;0;0;1;0;1;1;0;0;1;0;1;0;0;0;0;1;1;0;0;0;0;1;1;0;1;0;0;0;0;1;0;1;1;0
8、;1;0;0;1;1;0;1;1;0;1;0;xb5=ones(46,1),x1,x2,x3,x4;b,bint,r,rint,stats=regress(y,xb5)可以得到回歸系數(shù)及其置信區(qū)間(置信水平a=0.05 X檢驗(yàn)統(tǒng)計量R2,F(xiàn),p結(jié)果,參數(shù)參數(shù)估計值置信區(qū)間11U321025B11807 J54bI 4S460S6B831. 62487517 1-251;-3棚-出2 j148-6:橋931 氏=。.知F = 326;| U結(jié)果分析:R2=0.957,即因變量(薪金)的95.7%可由模型確定,F(xiàn)值遠(yuǎn)遠(yuǎn)超過F檢 驗(yàn)的臨界值,p遠(yuǎn)小于a,因而模型(1)從整體來看是可用的。比如,利用模
9、型可以估計 (或預(yù)測)一個大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為寧=a + a *2 + a *0 + a *0 + a *1 = 1227301234模型中各個回歸系數(shù)的含義可初步解釋如下:x1的系數(shù)為546,說明資歷每增加1年, 薪金增長546 ; x2的系數(shù)為6883,說明管理人員的薪金比非管理人員多6883 ; x3的系數(shù) 為-2994,說明中學(xué)程度的薪金比研究生少2994 ; x4的系數(shù)為148,說明大學(xué)程度的薪金 比研究生多148,但是應(yīng)該注意到a4的置信區(qū)間包含零點(diǎn),所以這個系數(shù)的解釋是不可靠 的。4需要指出,以上理解是就平均值來說,并且,一個因素改變引起的因變量的變化量,都 是
10、在其它因素需不變的條件下才成立的。進(jìn)一步的討論a4的置信區(qū)間包含零點(diǎn),說明基本模型(1)存在缺點(diǎn)。為尋找改進(jìn)的方 向,常用殘差分析法(殘差指薪金的實(shí)際值y與用模型估計的薪金y之差,是模型(1) 中隨機(jī)誤差的估計值,這里用了同一個符號)為了對殘差進(jìn)行分析,作圖給出與資歷x1的關(guān)系(圖1),%圖1yj = 11032 + 546*x1 + 6883*x2 + (-2994*x3) + 148*x4;eb=y-yj;plot(x1,eb,r+)2000-IQOf)-2000t+*11+1 I !+ 十1+ 士十+ !W 1520圖1:e與資歷x1的關(guān)系從圖1中看出,殘差大概分成3個水平,這是由于6種
11、管理-教育組合混在一起,在模 型中未被正確反映的結(jié)果我們將影響因素分成資歷與管理教育組合兩類,管理教育組合的定義如下表蛆登123J-56管理Q1n10112233把組合標(biāo)號1,2,3,4,5,6作為變量X5,則由原數(shù)據(jù)可得x5=2;5;6;3;5;4;3;1;5;3;2;4;6;1;6;5;3;3;5;2;1;6;3;4;2;3;2;6;1;1;3;6;4;4;1;3;6;1;4;3;6;4;3;1;3;1;作圖給出 與管理x2教育x3,x4組合間的關(guān)系(圖2)。%圖2x5 = 2;5;6;3;5;4;3;1;5;3;2;4;6;1;6;5;3;3;5;2;1;6;3;4;2;3;2;6;1;
12、1;3;6;4;4;1;3;6;1;4;3;6;4;3;1;3;1;plot(x5,eb,r+)2000 It+ i H-1000 -b-200D ij102345圖2: e與管理一教育組合的關(guān)系從圖2看,對于前4個管理教育組合,殘差或者全為正,或者全為負(fù),也表明一 一教育組合在模型中處理不當(dāng)。在模型(1)中管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交互作用, 如大學(xué)程度的管理人員的薪金會比二者分別得薪金之和高一點(diǎn)。以上分析提示我們,應(yīng)在基本模型(1)中增加管理x2與教育x3,x4的交互項(xiàng),建立 新的回歸模型。更好的模型 增加x2與x3,x4的交互項(xiàng)后,模型記作y = a + a
13、x + a x + a x + a x + a x x + a x x +s01 12 2334 45 2 36 2 4利用MATLAB的統(tǒng)計工具箱xb7=ones(46,1),x1,x2,x3,x4,x2.*x3,x2.*x4;b,bint,r,rint,stats二regress(y,xb7)得到的結(jié)果:葬散卷數(shù)益詩值置信區(qū)間%1121)411 044 1 1563;4975OBJ704S6841 7255:L - 151-1-348一-5 - 1我-1U7IL - 3S72 - 2769:1571 6101.邱 F-即4 o-O可知,模型(2)的R 2和F值都比模型(1)中的有所改進(jìn),并
14、且所有回歸系數(shù)的置信 區(qū)間都不含零點(diǎn),表明模型(2)是完全可用的。與模型(1)類似,做模型(2)的兩個殘差分析圖(圖11,圖12),可以看出,已經(jīng) 消除了圖1和圖2中的不正?,F(xiàn)象,這也說明了模型(2)的適用性。%圖11yj = 11204+497*x1+7048*x2-1727*x3-348*x4-3071*x2.*x3 + 1836*x2.*x4;eb=y-yj;plot(x1,eb,r+)%圖12x5=2;5;6;3;5;4;3;1;5;3;2;4;6;1;6;5;3;3;5;2;1;6;3;4;2;3;2;6;1;1;3;6;4;4;1;3;6;1;4;3;6;4;3;1;3;1;plo
15、t(x5,eb,r+)圖n 模型以傳與罰的關(guān)系圖12模型撰區(qū)與尊一工;,互組合的關(guān)系從圖11、圖12還可以發(fā)現(xiàn)一個異常點(diǎn):具有10年策略、大學(xué)程度的管理人員(從表4可以查出是33號),他的實(shí)際薪金明顯低于模型的估計值,也明顯低于他有類似經(jīng)歷的其 他人的薪金。這可能是由于我們未知的原因造成的。為了是個別的數(shù)據(jù)不致影響整個模型, 應(yīng)該將這個異常數(shù)據(jù)去掉,對模型(2)重新估計回歸系數(shù),得到的結(jié)果如表8,殘差分析 圖見圖13,圖14??梢钥闯?,去掉異常數(shù)據(jù)結(jié)果又有改善。%表8y=13876;11608;18701;11283;11767;20872;11772;10535;12195;12313;14
16、975;21371;19800;11417;20263;13231;12884;13245;13677;15965;12366;21352;13839;22884;16978;14803;17404;22184;13548;14467;15942;23174;25410;14861;16882;24170;15990;26330;17949;25685;27837;18838;17483;19207;19346;x1 = 1;1;1;1;1;2;2;2;2;3;3;3;3;4;4;4;4;5;5;5;6;6;6;6;7;8;8;8;8;10;10;10;11;11;12;12;13;13;14
17、;15;16;16;16;17;20;x2 = 1;0;1;0;0;1;0;0;0;0;1;1;1;0;1;0;0;0;0;1;0;1;0;1;1;0;1;1;0;0;0;1;1;0;0;1;0;1;0;1;1;0;0;0;0;x3 = 1;0;0;0;0;0;0;1;0;0;1;0;0;1;0;0;0;0;0;1;1;0;0;0;1;0;1;0;1;1;0;0;0;1;0;0;1;0;0;0;0;0;1;0;1;x4 = 0;0;0;1;0;1;1;0;0;1;0;1;0;0;0;0;1;1;0;0;0;0;1;1;0;1;0;0;0;0;1;0;1;0;1;0;0;1;1;0;1;1;0;
18、1;0;x5 = 2;5;6;3;5;4;3;1;5;3;2;4;6;1;6;5;3;3;5;2;1;6;3;4;2;3;2;6;1;1;3;6;4;1;3;6;1;4;3;6;4;3;1;3;1;xb8=ones(45,1),x1,x2,x3,x4,x2.*x3,x2.*x4;b,bint,r,rint,stats二regress(y,xb8)%圖13yj = 11200+498*x1+7041*x2-1737*x3-356*x4-3056*x2.*x3 + 1997*x2.*x4;eb=y-yj;plot(x1,eb,r+)%圖14plot(x5,eb,r+)囹13模型3)五為典常數(shù)據(jù)扃
19、唁心的關(guān)系陛U 模棗迂)夫槨耳常數(shù)據(jù)后占與七玦,堂“組合的關(guān)系壑?jǐn)?shù)瑟散彷計值置信區(qū)間J120011139H251J*450?;7U4L696271204-1737-1S18T住-3i-431-2S1 j-3056-3171-29421叫TJS942W0jK:=367(11 p 三實(shí)驗(yàn)內(nèi)容(1)解答實(shí)驗(yàn)原理中的問題:一家技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度 等因素之間的關(guān)系,要建立一個數(shù)學(xué)模型,以便分析公司人事策略的合理性,并作為新聘用 人員薪金的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于 是調(diào)查來46名軟件開發(fā)人員的檔案資料,如表
20、4,其中資歷一列指從事專業(yè)工作的年數(shù), 管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué) 程度,3表示更高程度(研究生)編號薪金資歷管理教育編號薪金資歷管理教育011387611124228846120211608103251697871103187011132614803802041128310227174048110511767103282218481306208722122913548801071177220230144671001081053520131159421002091219520332231741013101231302332378101230
21、111497531134254101112122137131235148611101131980031336168821202141141740137241701213152026341338159901301161323140339263301312171288440240179491402181324550241256851513191367750342278371612201596551143188381602211236660144174831601222135261345192071702231383960246193642001(2)某大型牙膏制造企業(yè)為了更好地拓展產(chǎn)品市場,有效地
22、管理庫存,公司董事會要 求銷售部門根據(jù)市場調(diào)查找出公司生產(chǎn)的牙膏銷售量與銷售價格、廣告投入等之間的關(guān)系, 從而預(yù)測出在不同價格和廣告費(fèi)用下的銷售量。為此,銷售部的研究人員收集了過去30個 銷售周期(每個銷售周期為4周)公司生產(chǎn)的牙膏的銷售量、銷售價格、投入的廣告費(fèi)用, 以及同期其它廠家生產(chǎn)的同類牙膏的市場平均銷售價格,見表1(其中價格差指其它廠家 平均價格與公司銷售價格之差試根據(jù)這些數(shù)據(jù)建立一個數(shù)學(xué)模型,分析牙膏銷售量與其它因素的關(guān)系,為制訂價格策略和廣告投入策略提供數(shù)量依據(jù)。表1牙膏銷售量與銷售價格、廣告費(fèi)用等數(shù)據(jù)銷售 周期公司銷售價 格 (元)其他廠家平 均價格(元)價格差 (元)廣告費(fèi)用
23、(白萬元)銷售量(百萬支)13.853.80-0.055.57.3823.754.000.256.758.5133.704.300.607.259.5243.603.700.005.507.5053.603.850.257.009.3363.63.800.206.508.2873.63.750.156.758.7583.83.850.055.257.8793.83.65-0.155.257.10103.854.000.156.008.00113.904.100.206.507.89123.904.000.106.258.15133.704.100.407.009.10143.754.200.456.908.86153.754.100.356.808.90163.804.100.306.808.87173.704.200.507.109.26183.804.300
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 下半造價師工程計價知識點(diǎn)缺陷責(zé)任期考試試題
- 公開課英語單詞快速記憶
- 高中語文第3單元古思今賞第8課寡人之于國也課件新人教版必修
- 窗簾布藝:團(tuán)隊卓越之旅-項(xiàng)目管理能力與團(tuán)隊合作精進(jìn)之路
- 獨(dú)樹一幟的中國畫 課件 2024-2025學(xué)年人教版初中美術(shù)九年級上冊
- 高中語文10蜀道難登高課件蘇教版必修
- 2024至2030年中國控天線彈簧數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國引線式石英晶體振蕩器行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國差速器十字軸行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國大小鼠灌胃針行業(yè)投資前景及策略咨詢研究報告
- 地理信息科學(xué)專業(yè)職業(yè)生涯規(guī)劃書
- 2023年全球瘧疾報告
- 企業(yè)家案例分析課件
- 15D500-15D505 防雷與接地圖集(合訂本)
- 職業(yè)生涯規(guī)劃-醫(yī)生職業(yè)說明
- 江蘇省徐州市2023-2024學(xué)年部編版八年級上學(xué)期期中歷史試題
- 檔案移交目錄表
- 醫(yī)院關(guān)于成立死因監(jiān)測領(lǐng)導(dǎo)小組的通知匯編三篇
- 年會晚會主持人串詞
- 教育科學(xué)研究方法的教案
- 輸精管吻合術(shù)后護(hù)理查房
評論
0/150
提交評論