數(shù)學(xué)建模課程論文-關(guān)于該公司同工同酬模型的探討-畢業(yè)論文_第1頁
數(shù)學(xué)建模課程論文-關(guān)于該公司同工同酬模型的探討-畢業(yè)論文_第2頁
數(shù)學(xué)建模課程論文-關(guān)于該公司同工同酬模型的探討-畢業(yè)論文_第3頁
數(shù)學(xué)建模課程論文-關(guān)于該公司同工同酬模型的探討-畢業(yè)論文_第4頁
數(shù)學(xué)建模課程論文-關(guān)于該公司同工同酬模型的探討-畢業(yè)論文_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于該公司同工同酬模型的探討摘要本文在“統(tǒng)計回歸”的基礎(chǔ)上,給出了兩種模型,通過對已有的90組數(shù)據(jù)測試檢驗,實現(xiàn)了對該公司的工資計算,并將計算方法應(yīng)用到8組數(shù)據(jù)中去,得到了非常準(zhǔn)確的結(jié)果。考慮到運(yùn)算量的大小,我們采用了較為科學(xué)的逐步分析法,提取了對結(jié)果影響較大的兩個因素,分別是學(xué)歷和工齡,再次使用BP神經(jīng)網(wǎng)絡(luò)重新建立模型四,達(dá)到了很高的識別率。在模型檢驗方面,對于“多元線性回歸方法”以及“多元非線性回歸方法”,本文采用了“

F檢驗法”和“相關(guān)系數(shù)檢驗法”進(jìn)行檢驗,最終確定診斷值與檢測結(jié)果是非線性關(guān)系。對于“BP神經(jīng)網(wǎng)絡(luò)”,本文選取90組已知數(shù)據(jù)中的60組數(shù)據(jù)作為訓(xùn)練樣本,以此建立BP神經(jīng)網(wǎng)絡(luò),之后,依次選取不同的30組數(shù)據(jù)重復(fù)上述過程,準(zhǔn)確率非常高,極好的證明了模型的科學(xué)合理性。通過比較可知,采用BP神經(jīng)網(wǎng)絡(luò)的模型識別率較高,但相應(yīng)處理時間較長。多元線性回歸模型思想清晰,雖然可以通過優(yōu)化得到最小二范數(shù),但其數(shù)據(jù)之間的關(guān)系只停留在線性階層,與含有隱層的神經(jīng)網(wǎng)絡(luò)模型相比,對事物的抽象和預(yù)測不夠準(zhǔn)確。關(guān)鍵詞:多元線性回歸多元非線性回歸BP神經(jīng)網(wǎng)絡(luò)逐步分析法F檢驗問題重述:1.1問題描述:職工工資可以說是人們最為關(guān)切、議論最多的部分,因此也常常是最受重視的部分。一般說來,現(xiàn)代企業(yè)的工資具有補(bǔ)償職能、激勵職能、調(diào)節(jié)職能、效益職能??茖W(xué)合理的工資制度,是激勵職工的勞動積極性,提高勞動效率的重要手段,正確運(yùn)用工資的杠桿作用在調(diào)動員工積極性方面會起到事半功倍的效果。此外,對于企業(yè)中的各種不同的“特殊職務(wù)族”,是否要制定和執(zhí)行專門的傾斜與優(yōu)惠政策,如對管理干部、高級專家、女工等,也是需要重點(diǎn)考慮的問題。1.2問題提出如表所示,隨機(jī)抽取了某企業(yè)若干職工的相關(guān)數(shù)據(jù)。請建立適當(dāng)?shù)臄?shù)學(xué)模型研究下列問題:(1)分析平均日工資與其他因素之間的關(guān)系,尤其需要說明與哪些因素關(guān)系密切;(2)考察女工是否受到不公正待遇,以及她們的婚姻狀況是否影響其收入;(3)繼續(xù)改進(jìn)你的模型,并給出模型誤差分析。問題分析:題目要求根據(jù)所提供確定平均日工資與其他因素之間的關(guān)系,并且分析出哪些因素影響較大。這就需要把表中的數(shù)據(jù)轉(zhuǎn)化為一種數(shù)學(xué)關(guān)系。首先我們分析平均日工資與其他因素之間成什么關(guān)系,是否是多元線性關(guān)系,或是多元非線性,或是呈網(wǎng)絡(luò)關(guān)系,并對結(jié)果進(jìn)行分析比較;其次,作者在分析數(shù)據(jù)中發(fā)現(xiàn)存在個別工資屬于模型中的奇異點(diǎn),會在很大程度上影響模型的準(zhǔn)確性,應(yīng)在建立模型中把它刪除以提高模型的擬合度;最后分析是否每一個因素都會在影響很大程度上影響診斷工資額,刪去影響小的測量指標(biāo),保留特征值,以減少計算工資時的運(yùn)算量,本文采用逐步判別法解決此問題。最后本文應(yīng)用F檢驗與相關(guān)系數(shù)檢驗等方法來檢驗?zāi)P停耘袆e模型優(yōu)劣。模型假設(shè)本題所給的數(shù)據(jù)具有代表性,能確實反映該公司的工資構(gòu)成;所給的數(shù)據(jù)認(rèn)為是準(zhǔn)確可靠的,給的工資具有顯著的統(tǒng)計特征;計算工資的全部標(biāo)準(zhǔn)都已被題目所給的幾個參量所包含;認(rèn)為樣本容量足夠大,可認(rèn)為判別準(zhǔn)則有較高的可靠性和準(zhǔn)確性;男性和女性的工資數(shù)據(jù)都是在同等條件下獲得的;在沒有足夠經(jīng)驗的情況下,我們假定女性和男性在同等條件下工資額是一樣的。符號說明::平均日工資:工齡(日)(一線工作)=(培訓(xùn))=(崗位)=(性別)=(婚姻)=表示學(xué)歷為本科表示學(xué)歷為碩士表示為博士表示為博士后模式的建立與問題求解對于問題1的第一小問,本文將在模型一、二中一起給予求解;對于問題1的第二小問以及問題2,本文在模型三中給予解答;對于問題3,本文在模型四中給予解答。5.1模型一:多元線性回歸模型5.1.1模型假設(shè):平均日工資與其他因素都是服從多元線性可分關(guān)系的。假設(shè)非表中因素可忽略不計。根據(jù)數(shù)據(jù)表,假設(shè)工齡增長一個月,月工資增長可認(rèn)為是常數(shù)。對于擬合多項式,對自變量為負(fù)的部分也是正確的。其他因素相互之間無影響。5.1.2模型建立及算法平均日工資是一個正態(tài)隨機(jī)變量,即Y服從正態(tài)分布,故本文假設(shè)的模型形式為:~是待估計回歸系數(shù),是隨機(jī)誤差。記Y=,x=,=,=,使用MATLAB軟件代入數(shù)據(jù),可得到的參數(shù)估計和置信區(qū)間見表5.1.3模型結(jié)果:變量參數(shù)估量置信區(qū)間37.2894[32.6269,41.9520]0.0881[0.0747,0.1015]-0.3000[-4.7744,4.1743]-5.0121[-18.1137,8.0894]0.3306[-3.6418,4.3030]1.8996[-3.3284,7.0816]1.1707[-4.1646,6.5090]17.6054[4.2835,31.0074]25.0976[13.5342,36.6609]所得的擬合表達(dá)式:5.1.4模型分析:在該模型中,本文建立了多元線性回歸模型,利用最小二乘法算出待定回歸系數(shù),而后簡單的確定了平均日工資與其他因素之間的關(guān)系。由后面的模型檢驗部分看出,~的置信區(qū)間均過零點(diǎn),故不可靠,同時擬合度不高,只有0.7929。故而對該模型進(jìn)行改進(jìn),增加交互項,即非線性回歸模型。5.2模型二:非線性回歸模型5.2.1模型假設(shè):假設(shè)非表中因素可忽略不計。對于擬合多項式,對自變量為負(fù)的部分也是正確的。5.2.2模型建立及算法根據(jù)數(shù)據(jù)表,假設(shè)工齡增長到一定數(shù)值后,月工資不再增長。設(shè)平均日工資與其他因素之間滿足~是待估計回歸系數(shù),是隨機(jī)誤差。算法同模型一,可得到的參數(shù)估計見表5.2.3模型結(jié)果變量參數(shù)估量29.8230.22777-2.414-2.49430.615411.57880.5149617.57419.281-0.00033287所得參數(shù)表達(dá)式:5.2.4模型分析:在該模型中,本文建立了多元非線性回歸模型。算法同模型一,得出平均日工資與其他因素之間的函數(shù)關(guān)系。由后面的模型檢驗部分看出,擬合度提高到0.87774。說明平均日工資與其他因素之間呈非線性關(guān)系。5.3模型三:待檢驗參數(shù)經(jīng)過篩選的多元線性回歸模型我們知道影響平均日工資的因素越多,平均日工資的構(gòu)成就越復(fù)雜,計算工資就會相當(dāng)耗費(fèi)資源,同時某些因素也會對計算結(jié)果造成一些負(fù)面影響。因此我們需要找到一種只用一部分因素又能有很高精度的模型,在模型三中,本文通過逐步判別法,得出工齡及學(xué)歷是影響平均日工資的關(guān)鍵或主要因素,這樣可以大大減少計算工資所花費(fèi)的時間,修改后的模型更具有實際意義和應(yīng)用價值。5.3.1逐步判別法來篩選特征因素這里本文使用逐步判別法來篩選特征因素。逐步判別法的主要思想是:在建立多元回歸方程的過程中,按偏相關(guān)系數(shù)的大小次序?qū)⒆宰兞恐饌€引入方程,對引入方程中的每個自變量偏相關(guān)系數(shù)進(jìn)行統(tǒng)計檢驗,效應(yīng)顯著的自變量留在回歸方程內(nèi),循此繼續(xù)遴選下一個自變量。如果效應(yīng)不顯著,停止引入新自變量。由于新自變量的引入,原已引入方程中的自變量由于變量之間的相互作用其效應(yīng)有可能變得不顯著者,經(jīng)統(tǒng)計檢驗確證后要隨時從方程中剔除,只保留效應(yīng)顯著的自變量。直至不再引入和剔除自變量為止,從而得到最優(yōu)的回歸方程。5.3.2逐步判別法的建立及算法:Step1.確定F檢驗值確定F檢驗水平,以作為引人或剔除變量的標(biāo)準(zhǔn)。Step2.逐步計算(a)計算全部自變量的偏回歸平方和V’。(b)在已引入的自變量中,檢查是否有需要剔除的不顯著變量。在已引入的變量中選取具有最小V’值的一個并計算其F值,如果F<F2,表示該變量不顯著,應(yīng)將其從回歸方程中剔除,計算轉(zhuǎn)至(c)。如F>F2則不需要剔除變量,這時則考慮從未引入的變量中選出具有最大值的一個并計算F值,如果F>F2,則表示該變量顯著,應(yīng)將其引人回歸方程,計算轉(zhuǎn)至(c)。如果F<F2,表示已無變量可選入方程,則逐步計算階段結(jié)束,計算轉(zhuǎn)入(c)。(c)剔除或引人一個變量后,相關(guān)系數(shù)矩陣進(jìn)行消去變換,第t+1步計算結(jié)束。其后重復(fù)(a)~(c)再進(jìn)行下步計算。Step3.其他計算計算回歸方程入選變量的系數(shù)、復(fù)相關(guān)系數(shù)及殘差等統(tǒng)計量。分析后得具體篩選過程如下:準(zhǔn)備工作計算總體的組內(nèi)離差陣和組間離差陣,確定引入變量和剔除變量的臨界值和,雖然臨界值是隨著引入變量和剔除變量的個數(shù)的變化而變化的,但當(dāng)樣本容量有一定大小后,他們的變化甚微,本文取。逐步計算本題已經(jīng)引入了8個變量,本文設(shè)為,則計算內(nèi)容如下i)計算全部變量的“判別能力”對未選入變量計算。對已選入的變量,計算對已入選的變量中考慮剔除可能存在的最不顯著變量,取最大的(即最小的)。ii)假設(shè),這里表示屬于已入選的變量。做F檢驗,剔除變量是統(tǒng)計量為:若,則剔除,然后對E和T作消去變換。若,則從未入選變量中選出最顯著的變量,即要找出最小的(即最大的),假設(shè),這里表示屬于未入選變量,做F檢驗,引入變量是統(tǒng)計量為:若,則引入,然后對E和T作消去變換。重復(fù)上面操作i),ii),直至不能剔除又不能引入新的變量時,逐步計算結(jié)束。5.3.3模型結(jié)果1.方差分析如下:Anovaf模型平方和df均方FSig.1回歸13244.961113244.961114.092.000a殘差10215.93988116.090總計23460.900892回歸17277.51328638.757121.547.000b殘差6183.3878771.073總計23460.900893回歸18197.02536065.67599.100.000c殘差5263.8758661.208總計23460.900894回歸18610.13144652.53381.526.000d殘差4850.7698557.068總計23460.900895回歸18588.01436196.005109.351.000e殘差4872.8868656.661總計23460.90089a.計算變量:(常量),x1。b.計算變量:(常量),x1,x3。c.計算變量:(常量),x1,x3,x8。d.計算變量:(常量),x1,x3,x8,x7。e.計算變量:(常量),x1,x8,x7。f.因變量:y2.殘差分析表如下: 殘差統(tǒng)計量a極小值極大值均值標(biāo)準(zhǔn)偏差N計算值39.0192.6957.6314.45290殘差-25.68519.888.0007.39990標(biāo)準(zhǔn)計算值-1.2882.425.0001.00090標(biāo)準(zhǔn)殘差-3.4122.642.000.98390因變量:y基于此模型,工齡和學(xué)歷逐步被判別是與平均日工資關(guān)系密切的因素。由方差分析表可以看到,性別以及女性婚姻情況在計算model1至model5均被剔除,對因變量影響并不大,可近似認(rèn)為,在該公司女性并沒有受到不公平待遇,且她們的婚姻狀況對她們的工資影響不大。5.3.4根據(jù)篩選結(jié)果利用多元線性回歸模型判斷影響密切我們知道影響平均日工資的因素越多,平均日工資的構(gòu)成就越復(fù)雜,同時某些因素也會對計算結(jié)果造成一些負(fù)面影響。因此我們需要找到一種只用一部分其他因素又能有很高精度的模型,在該模型中,本文通過逐步判別法,得出工齡及學(xué)歷是影響平均日工資的關(guān)鍵或主要因素,這樣可以大大減少計算工資構(gòu)成所花費(fèi)的資源,修改后的模型更具有實際意義和應(yīng)用價值。根據(jù)以上兩項因素,重復(fù)之前的多元線性回歸模型,可以得到新的回歸方程為:其中:表示工齡,和聯(lián)合表示學(xué)歷。測試90組數(shù)據(jù),置信度為95%,擬合度是0.79,平均誤差比模型一小,我們認(rèn)為該方法是正確可行的。選取一組數(shù)據(jù),相近,代表性別婚姻的取不同值,檢驗輸出值,與期望值的誤差在可接受范圍內(nèi)。比較可知,性別對工資影響小,可以認(rèn)為女性并未受到不公平待遇。而女性的婚姻對工資雖有一定的影響,但在誤差允許范圍內(nèi),可以忽略不計。X1X2X3X4X5X6X7X83738000010041.75653741000100042.0223842000010042.11054242001100042.11053842000100042.11053842001010042.11054030000000041.04855.3.5模型分析:在模型三中,本文采用了逐步判別法來篩選主要因素。并再次使用多元線性回歸測試了建模效果。應(yīng)當(dāng)指出,這種給予逐步判別法的選取關(guān)系密切因素的方法,雖然會導(dǎo)致結(jié)果的準(zhǔn)確性下降,但是在實際應(yīng)用中,特別是當(dāng)計算的工資個數(shù)非常多,耗費(fèi)資源較多時,有著很大的實際意義。5.4模型四:基于BP算法的神經(jīng)網(wǎng)絡(luò)在模型一、二中,本文采用了回歸分析法建立模型,但是由結(jié)果可以看出,輸出結(jié)果和期望值還是存在很大的誤差,因此本文采用模型四,即BP神經(jīng)網(wǎng)絡(luò)模型。BP神經(jīng)網(wǎng)絡(luò)是一種進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先提供的一批相互對應(yīng)的輸入-輸出數(shù)據(jù),分析掌握兩者之間潛在的規(guī)律,最終根據(jù)這些規(guī)律,用新的輸入數(shù)據(jù)來推算輸出結(jié)果,這種學(xué)習(xí)分析的過程被稱為“訓(xùn)練”。自學(xué)習(xí)過程是一個反復(fù)迭代的過程,首先給網(wǎng)絡(luò)一個初始權(quán)值,然后輸入一個樣本計算并輸出,通過實際輸出與期望輸出之間的差值來修改網(wǎng)絡(luò)的權(quán)值以達(dá)到減少這個網(wǎng)絡(luò)差值的目的。反復(fù)執(zhí)行該過程直到這個差值小于預(yù)定值為止。對足夠樣本進(jìn)行這樣訓(xùn)練后,網(wǎng)絡(luò)所得的那組權(quán)值便是網(wǎng)絡(luò)通過自學(xué)習(xí)得到的正確的內(nèi)部表示。因為本題選用多層網(wǎng)絡(luò)(MSP)。5.4.1前饋神經(jīng)網(wǎng)絡(luò)本文采用前饋神經(jīng)網(wǎng)絡(luò)。既是構(gòu)成網(wǎng)絡(luò)的神經(jīng)元只接受前一層的輸入,只輸出給后一層的神經(jīng)元,無反饋網(wǎng)絡(luò),因此可用一單向無環(huán)網(wǎng)絡(luò)來描述。在網(wǎng)絡(luò)中結(jié)點(diǎn)可以分為兩類,既是輸入輸出結(jié)點(diǎn)與計算結(jié)點(diǎn)。輸入輸出接點(diǎn)直接與外界相聯(lián),直接受外界影響,因此為可見層,而其他結(jié)點(diǎn)所在的中間層為隱藏層。若一個神經(jīng)網(wǎng)絡(luò)有多層,則第k層的輸出與第k+1層的輸入相連。輸出可耦合到任意多個輸入。5.4.2三層前饋神經(jīng)網(wǎng)絡(luò)本文構(gòu)建一個三層前饋神經(jīng)網(wǎng)絡(luò),如下圖所示:基于實際問題的分析,可知網(wǎng)絡(luò)只有一個輸出y,既員工的日工資。而有輸入變量有8個,分別為。以此確定了輸入層與輸出層的節(jié)點(diǎn)數(shù)分別為7個和1個。另外,而中間隱藏層節(jié)點(diǎn)數(shù)的選取我們采用動態(tài)構(gòu)造法:即輸入輸出節(jié)點(diǎn)數(shù)不變,而隱層節(jié)點(diǎn)數(shù)可變,初始時放入足夠多的隱藏層節(jié)點(diǎn),然后逐漸刪掉那些不起作用的節(jié)點(diǎn),直到節(jié)點(diǎn)不可收縮為止。使用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行迭代,為使結(jié)果更加直觀,收斂速度加快,不妨將y和規(guī)格化,即按照公式(其中和分別為對應(yīng)變量的最小值和最大值),使y和都落在區(qū)間[0,1]之內(nèi)。最終得網(wǎng)絡(luò)模型的最佳隱藏層節(jié)點(diǎn)數(shù)為5。據(jù)此可知,基于BP神經(jīng)網(wǎng)絡(luò)分類模型的最佳網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為:7×5×1。5.4.3反向傳播網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))下面本文將給出計算出各層權(quán)值和偏執(zhí)量的方法。其主要思想是從后向前逐步傳播輸出層的誤差,以間接的算出隱藏層的誤差,進(jìn)而得到各層權(quán)值和偏執(zhí)量。定義其中為第組數(shù)據(jù)輸入時,網(wǎng)絡(luò)的實際輸出。當(dāng)?shù)诮M數(shù)據(jù)顯示患病時=1反之=0,即為我們的理想輸出,訓(xùn)練的目標(biāo)就是使上式盡量的小。因此,訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)就可以看成一個求函數(shù)最小值的過程,最方便的辦法就是最速下降法,求得公式如下:對于隱藏層的第j個神經(jīng)元到輸出層的第i個神經(jīng)元的權(quán)的修正量為:其中和分別表示第組樣本輸入時,輸出層第i個神經(jīng)元的狀態(tài)和隱藏層第j個神經(jīng)元的輸出。輸出層的第i個神經(jīng)元的閥值的修正量為:對于輸入層的第L個神經(jīng)元的隱藏層的第k個神經(jīng)元的權(quán)的修正量為5.4.4BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建與訓(xùn)練本文將采用MATLAB工具箱中的神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。自學(xué)習(xí)的過程是一個反復(fù)迭代的過程,首先給網(wǎng)絡(luò)一個初始權(quán)值,然后輸入一個樣本計算并輸出,通過實際輸出與期望輸出之間的差值來修改網(wǎng)絡(luò)的權(quán)值以達(dá)到減少這個網(wǎng)絡(luò)差值的目的。反復(fù)執(zhí)行該過程直到這個差值小于預(yù)定值為止。對足夠樣本進(jìn)行這樣訓(xùn)練后,網(wǎng)絡(luò)所得的那組權(quán)值便是網(wǎng)絡(luò)通過自學(xué)習(xí)得到的正確的內(nèi)部表示。網(wǎng)絡(luò)建立:在MATLAB中調(diào)用下列函數(shù):net=newff(PR,[5,1],{'tansig','purelin'},'trainscg','learngdm');各項參數(shù)的意義與選取根據(jù):(1)PR是一個由每個輸入向量的最大最小值構(gòu)成的2×R的矩陣;R為輸入神經(jīng)元數(shù)目;(2)[5,1]是隱層網(wǎng)絡(luò)的神經(jīng)元個數(shù)和輸出層的神經(jīng)元個數(shù);(3){'tansig','purelin'},選取每一層的變換函數(shù)。根據(jù)本文所使用數(shù)據(jù)的類型特點(diǎn),在隱藏層采用雙曲線正切S型變換函數(shù)“tansig”;在輸出層采用線性變換函數(shù)“purelin”;(4)'trainscg'是BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法函數(shù)。(5)'learngdm'是學(xué)習(xí)函數(shù)。設(shè)置訓(xùn)練參數(shù)設(shè)置每50次迭代顯示一次,學(xué)習(xí)速率設(shè)置為0.05,迭代上限設(shè)為2000次,訓(xùn)練目標(biāo)設(shè)為0.0012。net.trainParam.show=50;net.trainParam.lr=0.05;net.trainParam.mc=0.9;net.trainParam.epochs=3000;net.trainParam.goal=0.002;調(diào)用trainscg訓(xùn)練BP網(wǎng)絡(luò),調(diào)用下列函數(shù),其中P為輸入矩陣,T為輸出矩陣。[net,tr]=train(net,P,T);得到下列訓(xùn)練圖形網(wǎng)絡(luò)仿真通過函數(shù)sim(net,q)函數(shù)實現(xiàn),其中參數(shù)net為該神經(jīng)網(wǎng)絡(luò),q為待檢測的輸入矩陣。網(wǎng)絡(luò)訓(xùn)練完成以后,使用該函數(shù)根據(jù)已訓(xùn)練好的網(wǎng)絡(luò),對測試數(shù)據(jù)進(jìn)行仿真計算。同時也可以進(jìn)行模型的檢驗。模型分析:在模型四中,本為采用了BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了建模。雖然模型的建立較為復(fù)雜,但是可以從測試數(shù)據(jù)的輸出值與原期望值的比較中得出,該模型能很好的計算出員工的工資。剔除異常數(shù)據(jù)后,所得的輸出值與原期望值非常接近。而且可以肯定,如果學(xué)習(xí)的數(shù)據(jù)不只是60組,而是更大的數(shù)據(jù)量,則所得到的神經(jīng)網(wǎng)絡(luò)將更加準(zhǔn)確。因此模型四適用于大量數(shù)據(jù),大量計算問題的處理。模型檢驗6.1檢驗?zāi)P鸵唬憾嘣€性回歸模型的檢驗回歸模型的檢驗,回歸模型是否為線性函數(shù)形式,條件可化為F檢驗法:有平方和分解公式:簡記為:

其中被稱為殘差平方和,被稱為回歸平方和。通過F檢驗法容易得到:統(tǒng)計量值F=38.7600。統(tǒng)計量對應(yīng)的概率p=0。可以觀察到p<F2、相關(guān)系數(shù)檢驗法:在概率中,復(fù)相關(guān)系數(shù)的計算公式:它是反映X與Y成線性度的一個度量指標(biāo),r的取值范圍為(0,1),r越接近1,X與Y的線性度就越高。由相關(guān)系數(shù)檢驗法計算得:R=0.7929可見R不夠接近1,線性相關(guān)度不理想,不滿足線性關(guān)系。6.2檢驗?zāi)P投憾嘣蔷€性回歸模型的檢驗檢驗方法同模型一。F檢驗法:通過F檢驗法容易得到:統(tǒng)計量值F=63.816。統(tǒng)計量對應(yīng)的概率p=0??梢杂^察到p<F2、相關(guān)系數(shù)檢驗法:由相關(guān)系數(shù)檢驗法計算得:R=0.87774可以觀察到R接近1,非線性相關(guān)度良好,滿足非線性關(guān)系。6.3檢驗?zāi)P退模夯贐P算法的神經(jīng)網(wǎng)絡(luò)模型檢驗為了檢驗神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度,本文隨機(jī)選取了60組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),而對30組數(shù)據(jù)作檢驗,得到下表:x1x10x2x3x4x5x6x7x8yy0y'y0'520.0984682710100010490.23880648.580850.232553370.7221006560000100680.522388161.893750.431252270.4814004380010100620.432835859.52530.3959300.0503282280001000430.149253737.8600460.0725381140.2341356670111001650.477611969.445990.543972600.5536105030000100680.522388161.123920.419761110.2275711160011000480.223880651.495350.276052570.5470459521000100620.432835863.67930.45792530.5382932170011000770.656716475.927570.64071540.1028446390010100470.208955243.171940.15182540.1028446390000100390.089552239.868170.102511990.4201312910000000570.35820958.668370.383111670.3501094090011000600.402985164.717130.473392450.5207877460111001870.805970177.247470.66041420.0765864330011000420.134328439.1741840.0921521030.2100656460001000480.223880649.661560.24868750.1487964990000000500.253731347.313210.213631720.3610503281000100560.343283657.777270.36981190.0262582060000100340.014925434.46060.02183190.6827133480010100650.477611961.728260.428783260.6980306350011000650.477611978.765690.683071540.321663021110110750.626865774.692760.622284060.8730853390011000650.477611979.433010.69303180.0240700220011000340.014925437.1728940.0622822090.4420131290010001720.582089672.071720.583163080.6586433260111010870.805970199.051950.985851620.339168490000000570.35820956.531070.351211580.3304157551101001730.597014972.989620.596862130.4507658640011000700.552238872.217110.585332220.4704595190001000740.611940372.412080.58824其中,將仿真輸出結(jié)果按逆規(guī)格化公式還原,并與期望值比較。數(shù)據(jù)結(jié)果顯示,用所構(gòu)建的神經(jīng)網(wǎng)絡(luò)算法,檢測剩余的30組數(shù)據(jù),得到了與預(yù)期相近的結(jié)果。因此,上述檢驗驗證了所建的BP神經(jīng)網(wǎng)絡(luò)的正確性。誤差分析7.1靈敏度分析:對模型二進(jìn)行靈敏度分析:選取一組數(shù)據(jù)(,)=(27,1,0,0,0,1,0,0,34),用上述多元非線性模型可得,y=33.591088,與期望值相當(dāng)接近。每次只改變一個變量值,輸出結(jié)果如下表:X1X2X3X4X5X6X7X8YoY’2710001003433.59108828100010033.8005527000010036.00508827110010031.09678827101010034.20649827100110035.16988827100000033.07612827100011051.16508827100010152.87208827100011170.446088的改變對的影響不大,說明該模型穩(wěn)定性好?!?-1值改變對的影響不大,而、的改變對的影響,這與模型三相吻合,進(jìn)一步說明了該模型的準(zhǔn)確性。7.2各模型誤差分析各模型的誤差如表:模型平均誤差模型一7.74模型二5.99模型三7.52模型四0.41我們利用逐步求解的方法求出了對預(yù)測結(jié)果影響相對較大的因素。舍棄對平均日工資影響較弱的因素,以達(dá)到減少計算量的目的。根據(jù)模型三,只需考慮工齡和學(xué)歷即可。測試結(jié)果如前所示,對比用非線性回歸方法測試的結(jié)果,其平均誤差為5.99,而神經(jīng)網(wǎng)絡(luò)的平均誤差為0.41。這說明神經(jīng)網(wǎng)絡(luò)受參數(shù)的影響比非線性回歸方法小。這點(diǎn)差別是兩種模型的本質(zhì)所決定。神經(jīng)網(wǎng)絡(luò)通過大量數(shù)據(jù)的學(xué)習(xí)訓(xùn)練并且反饋而確定其內(nèi)部參數(shù)權(quán)值。大大增加了模型的準(zhǔn)確性。非線性模型是多項式,系數(shù)較大的參數(shù)對結(jié)果的影響較大,所以參數(shù)改變會引起較大誤差。當(dāng)然,我們應(yīng)該看到,由于減少運(yùn)算量和耗時所造成的正面影響對比其準(zhǔn)確率稍微下降的負(fù)面影響。這是相當(dāng)積極的。模型優(yōu)缺點(diǎn)分析本文就問題分別建立了多元線性回歸模型、多元非線性回歸模型和神經(jīng)網(wǎng)絡(luò)模型。多元線性回歸模型思想清晰,計算簡便,易于實現(xiàn)。針對問題而言,線性模型的擬合度不如非線性模型高;而且其數(shù)據(jù)之間的關(guān)系只停留在線性階層,與含有隱層的神經(jīng)網(wǎng)絡(luò)模型相比,對事物的抽象和計算不夠準(zhǔn)確。從上面的計算結(jié)果也可以反映出這一點(diǎn),兩種模型的計算存在偏差。其本質(zhì)是因為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練準(zhǔn)則是使誤差達(dá)到最小或者使誤差在可接受的范圍內(nèi),而回歸分析的結(jié)果并不一定是誤差最小。需要指出的是,神經(jīng)網(wǎng)絡(luò)由于加入了隱層,其權(quán)重系數(shù)的意義有待進(jìn)一步研究。模型的推廣本模型可推廣到各類工資的計算,分析個人因素對工資的影響。但由于本模型是根據(jù)7個指標(biāo)以及已知的90個數(shù)據(jù)來計算工資值,具有一定的局限性,但將上述方法與實際情況起來,一定會有更廣闊的應(yīng)用價值。參考文獻(xiàn)[1]董霖MATLAB使用詳解北京科學(xué)出版社2008年8月[2]FredricM.HamIvicaKostanic著葉世偉等譯神經(jīng)計算原理北京機(jī)械工業(yè)出版社2007年5月[3]曹振華隨機(jī)數(shù)學(xué)基礎(chǔ)北京高等教育出版社2009年8月[4]姜啟源數(shù)學(xué)模型北京高等教育出版社2001年2月[5]袁慰平等計算方法與實習(xí)南京東南大學(xué)出版社2006年10月[6]巨軍讓,卓戎BP神經(jīng)網(wǎng)絡(luò)在MATLAB上的方便實現(xiàn)[J]新疆石油學(xué)院報1999,(2):42-45.[7]羅成漢.基于MATLAB神經(jīng)網(wǎng)絡(luò)工具箱的BP網(wǎng)絡(luò)實現(xiàn)[J]計算機(jī)仿真2004,21(5):109-111.附錄:程序代碼:學(xué)習(xí)算法:privatevoidtrain_network(double[]outputs){//getmomentumvalues(deltavaluesfromlastpass)double[]delta_hidden=newdouble[_nn.NumberOfHidden+1];double[]delta_outputs=newdouble[_nn.NumberOfOutputs];//Getthedeltavaluefortheoutputlayerfor(inti=0;i<_nn.NumberOfOutputs;i++){delta_outputs[i]=_nn.Outputs[i]*(1.0-_nn.Outputs[i])*(outputs[i]-_nn.Outputs[i]);}//Getthedeltavalueforthehiddenlayerfor(inti=0;i<_nn.NumberOfHidden+1;i++){doubleerror=0.0;for(intj=0;j<_nn.NumberOfOutputs;j++){error+=_nn.HiddenToOutputWeights[i,j]*delta_outputs[j];}delta_hidden[i]=_nn.Hidden[i]*(1.0-_nn.Hidden[i])*error;}//Nowupdatetheweightsbetweenhidden&outputlayerfor(inti=0;i<_nn.NumberOfOutputs;i++){for(intj=0;j<_nn.NumberOfHidden+1;j++){//usemomentum(deltavaluesfromlastpass),//toensuremovedincorrectdirection_nn.HiddenToOutputWeights[j,i]+=_nn.LearningRate*delta_outputs[i]*_nn.Hidden[j];}}//Nowupdatetheweightsbetweeninput&hiddenlayerfor(inti=0;i<_nn.NumberOfHidden;i++){for(intj=0;j<_nn.NumberOfInputs+1;j++){//usemomentum(deltavaluesfromlastpass),//toensuremovedincorrectdirection_nn.InputToHiddenWeights[j,i]+=_nn.LearningRate*delta_hidden[i]*_nn.Inputs[j];}}}工號日平均工資(元/天)性別工齡(月)女性婚姻狀況受教育狀況工作部門性質(zhì)一線工作情況培訓(xùn)情況133女7已婚女性本科技術(shù)崗位00234男14男性本科技術(shù)崗位00334男18男性本科管理崗位00442男19未婚女性本科技術(shù)崗位00534女19未婚女性本科管理崗位00634女19已婚女性本科技術(shù)崗位00734女27已婚女性本科技術(shù)崗位10836女30已婚女性本科技術(shù)崗位00943男30男性本科技術(shù)崗位001040女30未婚女性本科技術(shù)崗位001145女31未婚女性碩士技術(shù)崗位011240女31已婚女性本科管理崗位001337女38已婚女性本科技術(shù)崗位001437男41未婚女性本科技術(shù)崗位001538女42已婚女性本科技術(shù)崗位001642男42未婚女性本科管理崗位001738男42男性本科技術(shù)崗位001838女42已婚女性本科管理崗位001937女47已婚女性本科技術(shù)崗位102037女52已婚女性本科技術(shù)崗位102149女52未婚女性碩士技術(shù)崗位012239男54男性本科技術(shù)崗位002347女54已婚女性本科管理崗位002439女54已婚女性本科技術(shù)崗位002553男55男性碩士管理崗位012649女66已婚女性本科管理崗位002741男67男性本科管理崗位002841女67男性本科管理崗位002950女75未婚女性本科技術(shù)崗位003047男78未婚女性本科管理崗位003147女79未婚女性本科技術(shù)崗位003245男91未婚女性本科管理崗位003345女92已婚女性本科技術(shù)崗位103444女94已婚女性本科管理崗位003560女103已婚女性碩士管理崗位013651女103已婚女性本科技術(shù)崗位003748男103未婚女性本科技術(shù)崗位003848男111未婚女性本科管理崗位003965男114男性博士管理崗位014074男114未婚女性博士管理崗位014161男114未婚女性博士管理崗位114247女117已婚女性本科技術(shù)崗位104368男139男性本科管理崗位004470女140已婚女性碩士管理崗位114575女154已婚女性碩士管理崗位114673男158未婚女性博士技術(shù)崗位1147100男159男性博士后管理崗位114857女162男性本科技術(shù)崗位004960男167未婚女性本科管理崗位005056女172已婚女性本科技術(shù)崗位105161女174已婚女性本科技術(shù)崗位105287男175男性碩士管理崗位015357女199未婚女性本科技術(shù)崗位005457女209已婚女性本科技術(shù)崗位005572女209未婚女性博士管理崗位005662女210男性本科技術(shù)崗位005770男213未婚女性本科管理崗位005862女220已婚女性本科技術(shù)崗位105962女222已婚女性本科技術(shù)崗位006074男222未婚女性本科技術(shù)崗位006176女223未婚女性本科技術(shù)崗位006268男223男性本科技術(shù)崗位006362女227已婚女性本科管理崗位006462女232已婚女性本科技術(shù)崗位106567女235已婚女性本科技術(shù)崗位106687男245男性博士管理崗位016777男253男性本科管理崗位006862女257男性本科技術(shù)崗位106968女260已婚女性本科技術(shù)崗位007087男284未婚女性博士管理崗位017165男287未婚女性本科技術(shù)崗位007257女290未婚女性本科技術(shù)崗位007387男308男性碩士管理崗位017462男309未婚女性本科管理崗位107565女319已婚女性本科管理崗位007668男325男性本科技術(shù)崗位007765男326未婚女性本科管理崗位007857男329未婚女性本科管理崗位007968女337已婚女性本科技術(shù)崗位008078男346男性碩士管理崗位118157女355已婚女性本科技術(shù)崗位108265男357男性本科技術(shù)崗位008371男380男性碩士管理崗位118491男387男性碩士管理崗位118591男403未婚女性碩士管理崗位118665男406未婚女性本科管理崗位008776女437未婚女性本科技術(shù)崗位008881女453男性本科技術(shù)崗位008969女458未婚女性本科技術(shù)崗位009067男464未婚女性碩士管理崗位01注:1.關(guān)于培訓(xùn),1表示受過培訓(xùn),0表示未受培訓(xùn)。2.關(guān)于一線工作情況,0表示兩年內(nèi)沒有一線工作經(jīng)歷,1表示其他。企業(yè)同工同酬案例分析09012320茅光健09012326楊俊09012333桂滕華摘要: 資制度的合理性與科學(xué)性是激勵職工的勞動積極性,提高勞動效率的重要因素。因而通過建立數(shù)學(xué)模型,分析影響企業(yè)員工工資的因素,對于了解以及完善企業(yè)工資制度具有建設(shè)性意義。 我們根據(jù)附表所給出的被解釋變量平均日工資,以及解釋變量性別、工齡等七個因素,進(jìn)行合理的模型假設(shè),并按照多元線性回歸的方法建模。首先用Matlab軟件擬合出平均日工資隨工齡的變化曲線,根據(jù)圖形的變化趨勢,選取函數(shù)進(jìn)行第一次建模。通過在交互式畫面中對因素的逐條檢驗,判定工齡和受教育狀況為顯著性影響因素,并且利用Matlab統(tǒng)計功能工具箱中的rcoplot(r,rint)命令剔除數(shù)據(jù)中的異常點(diǎn),修正模型。最終得到平均日工資隨工齡和受教育狀況變化的關(guān)系式。 現(xiàn)代社會,女性的社會地位隨著自我價值的實現(xiàn)而日益提高。在企業(yè)層面上,女性的自我價值是否得到與男性的同等評價仍是眾多學(xué)者研究的論題。我們在分析了總體的工資模型后,又將數(shù)據(jù)按性別分為男、女兩類,分別按照上述方法進(jìn)行建模,通過對比進(jìn)行分析了解是否存在“區(qū)別待遇”。以同樣的方法再次對已婚與未婚女性進(jìn)行建模分析,了解婚姻狀況對平均日工資的影響,探討差異存在是否合理。 我們在第一次模型的基礎(chǔ)上進(jìn)行第二次修正,即通過剔除異常值,減少非相關(guān)因素,對線性回歸相關(guān)系數(shù)進(jìn)行進(jìn)一步的修正,使得R向1趨近,使模型更加完善。最后,我們回歸實際,從實際情況中分析模型的合理性,對模型進(jìn)行第三次修正,即重新分配了受教育情況對工資影響的權(quán)重,使得模型更加精確更加符合實際。相信通過我們的研究分析,此次數(shù)學(xué)建模對于企業(yè)的工資制度具有參考性意義?!娟P(guān)鍵詞】:多元線性回歸分類建模Matlab統(tǒng)計工具箱一.問題重述 職工工資可以說是人們最為關(guān)切、議論最多的部分,因此也常常是最受重視的部分。一般說來,現(xiàn)代企業(yè)的工資具有補(bǔ)償職能、激勵職能、調(diào)節(jié)職能、效益職能??茖W(xué)合理的工資制度,是激勵職工的勞動積極性,提高勞動效率的重要手段,正確運(yùn)用工資的杠桿作用在調(diào)動員工積極性方面會起到事半功倍的效果。此外,對于企業(yè)中的各種不同的“特殊職務(wù)族”,是否要制定和執(zhí)行專門的傾斜與優(yōu)惠政策,如對管理干部、高級專家、女工等,也是需要重點(diǎn)考慮的問題。 附件(Adata.xls)隨機(jī)抽取了某企業(yè)若干職工的相關(guān)數(shù)據(jù)。請建立適當(dāng)?shù)臄?shù)學(xué)模型研究下列問題: 1.分析平均日工資與其他因素之間的關(guān)系,尤其需要說明與哪些因素關(guān)系密切; 2.考察女工是否受到不公正待遇,以及她們的婚姻狀況是否影響其收入; 3.繼續(xù)改進(jìn)你的模型,并給出模型誤差分析。二.問題分析 本問題是關(guān)于企業(yè)職工同工同酬問題的研究分析 問題一、我們以日平均工資為被解釋變量,以員工性別、工齡、女性婚姻狀況、員工受教育狀況、工作部門性質(zhì)、一線工作情況以及培訓(xùn)情況這些因素為解釋變量,分析研究出相應(yīng)的數(shù)據(jù)模型。從數(shù)據(jù)模型中觀察平均日工資與哪些因素關(guān)系密切。 問題二、把總體數(shù)據(jù)分為男女兩個類別,根據(jù)兩個類別的數(shù)據(jù)分別研究出相應(yīng)的數(shù)據(jù)模型,根據(jù)兩個模型的差異分析,判斷女工是否受到不公正待遇。然后把女性類別的數(shù)據(jù)按照已婚和未婚分為兩類,分別研究出兩個數(shù)據(jù)模型,根據(jù)它們的差異分析,判斷女性婚姻狀況是否影響其收入。 問題三、通過觀察由預(yù)測值和實際值得出的殘差值,不斷修正數(shù)據(jù)模型,使得相關(guān)系數(shù)趨向于1。在已完善的數(shù)據(jù)模型的基礎(chǔ)上,研究討論誤差因素,比如:異常值、無相關(guān)變量,從而進(jìn)行誤差分析。三.模型假設(shè) 1.在實際情況中,企業(yè)計算工資公式應(yīng)該對于每位職工都一樣,本模型就是為了求解這個計算工資公式。 2.在實際情況中,企業(yè)職工的工資應(yīng)該與他的工齡成正比,即工齡越大,其相應(yīng)的工資越多,而且可以確定工齡就是工資的主要影響因素。 3.對于受教育程度的影響,按照實際經(jīng)驗,在其他同等的條件下,本科,碩士,博士,博士后享有的工資呈遞增趨勢。 4.以上兩個變量(工齡,受教育程度)可以看成模擬連續(xù)變量,而對于性別(男或女)、工作部門(管理或技術(shù))、一線工作情況(有或沒有)、培訓(xùn)(有或沒有)這些因素來說,它們不能隨機(jī)取值,因此可以用bool值0、1來處理。 5.根據(jù)實際情況,工資計算公式應(yīng)該是各個變量因素的多項式的線性相加的結(jié)果,具體模型公式見下面變量符號說明。四.變量符號說明1.性別變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。2.工齡變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。3.婚姻狀況變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。4.受教育狀況變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。5.工作部門變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。6.一線工作情況變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資7.培訓(xùn)情況變量用表示,其對應(yīng)的表示該變量產(chǎn)生的工資。則職工工資,其計算公式可以表示為:五.模型的建立 1.首先用Matlab軟件擬合出平均日工資隨工齡的變化曲線,如圖所示:觀察上圖,選取函數(shù)進(jìn)行建模(令,從而轉(zhuǎn)化為關(guān)于的線性運(yùn)算,為方便起見,以下均用表示工齡變量);由于其他幾個自變量非隨機(jī)連續(xù)變量,先假設(shè)符合線性關(guān)系,建立模型,分析并進(jìn)行修正。而對于這一修正也符合實際,因為將之后,可以判斷出方程的斜率越來越小,既滿足上圖,又符合實際,因為在實際中,隨著工齡的增長,不可能工資永遠(yuǎn)持續(xù)增長下去,而且當(dāng)工齡小的時候它的斜率反而大說明剛剛進(jìn)入單位的年輕人的工資增長很快,這樣就能充分調(diào)動年輕人的工作熱情,為企業(yè)注入活力,這樣的很符合實際,因此很有必要地做這樣的模型修正。六.?dāng)?shù)據(jù)處理[1]表示性別,男性用“0”表示,女性用“1”表示;[2]表示工齡變量;[3]表示婚姻狀況,男性用“0”表示,已婚女性用“1”表示,未婚 女性用“2”表示;[4]表示受教育狀況,本科用“0”表示,碩士用“1”,博士用“2” 表示,博士后用“3”表示;[5]表示工作部門,技術(shù)崗位用“0”表示,管理崗位用“1”表示;[6]表示一線工作情況,“0”表示沒有參加,“1”表示參加;[7]表示培訓(xùn)情況,“0”表示未受培訓(xùn),“1”表示經(jīng)受培訓(xùn)。[8]實驗數(shù)據(jù)組數(shù)n=90;七.模型求解利用Matlab統(tǒng)計工具箱,在工作區(qū)間中導(dǎo)入矩陣X和Y,輸入命令:[b,bint,r,rint,stats]=regress(Y,X,0.05)其中,0.05為alpha,輸出b為的估計值,bint為b的置信區(qū)間,r為殘差向量,rint為r的置信區(qū)間,stats為回歸模型的檢驗統(tǒng)計量。stats有三個值:回歸方程的決定系數(shù)(是相關(guān)系數(shù));統(tǒng)計量值;與統(tǒng)計量值相關(guān)的概率;按照上述步驟得到結(jié)果:b=bint=26.090319.468432.71220.2844-6.68867.25732.3447-5.48473.6484-0.91815.195513.50089.3482-3.22663.55760.1655-4.94662.7665-1.0901-4.09069.35162.6305-4.12546.9823stats=統(tǒng)計量值0.842862.78120bbint386.8777178344.5566879429.19874772.979612886-77.2875927883.246818560.8870732960.7542177921.0199288-8.385908617-60.8947945444.1229773107.931012360.04799244155.81403227.438329231-31.5015540146.37821247-0.201107965-44.2996389343.8974237.812507558-69.6452523985.27026751stats=F統(tǒng)計量P0.792444.702202.為了檢測7個變量是否對工資有顯著性影響,我們用stepwise函數(shù),在Matlab工作空間中輸入命令:stepwise(X,Y,8,0.05)其中8表示矩陣X的列數(shù),0.05為顯著性水平alpha值;得到交互式畫面:其中藍(lán)色表示較顯著性因子,其他表示次要因子,在修正模型時可忽略。上圖中的即為表示工齡變量,即為受教育情況變量,而且可以從數(shù)據(jù)中觀察出,完全隨著的變化而變化,為0則也為0,為非0則也為1,可見帶來的影響完全可以用來替代表示,因此在修正模型時只考慮這兩個變量,則有現(xiàn)在令則可以得到3.在Matlab中利用rcoplot函數(shù)查找數(shù)據(jù)之中的異常點(diǎn),輸入命令:rcoplot(r,rint)得到異常值分布圖,如下所示:其中紅色表示異常值點(diǎn),即第43、47、52、60、61、67、90組數(shù)據(jù),故在進(jìn)一步修正時可以忽略。將剩余83組數(shù)據(jù)重新帶入,進(jìn)行計算,在Matlab中輸入命令:[b,bint,r,rint,stats]=regress(Y,X,0.05)則得到該回歸方程的線性回歸系數(shù):b=bint=370.2719349.6862390.85760.92840.83211.0246111.144091.2196131.0683Stats=F統(tǒng)計量P0.9000270.20000可以看出,修正后回歸方程的決定系數(shù)為0.9000,相關(guān)系數(shù)值為0.9487,比修正前模型更準(zhǔn)確??梢哉f明這樣的修正是符合實際的,進(jìn)而得到修正后回歸方程為:4.下面研究其他次要因素的影響:①為分析性別對工資的影響,將數(shù)據(jù)按性別分為男、女兩類,分別按照上述方法進(jìn)行建模,通過對比進(jìn)行分析。通過Matlab計算,得到男性工資方程回歸系數(shù):b=bint=404.2430350.3553458.13060.81320.58911.0373116.668981.3618151.9760stats=F統(tǒng)計量P0.700056.80000.0000因此回歸方程為:對于女性,用同樣的方法得到工資方程的回歸系數(shù):b=bint=360.0593332.0956388.02301.03600.89141.180671.710014.7956128.6244stats=統(tǒng)計量值0.800076.60000.0000因此回歸方程為:根據(jù)男女兩類的線性回歸方程,女性:男性:比較可知男性和女性平均日工資關(guān)于三個主要變量的影響因素相差很小,只是存在著細(xì)微差別,例如最工齡變量的回歸系數(shù),男性為0.8132,女性為1.0360,男性略占優(yōu)勢;受教育情況變量的回歸系數(shù),男性為116.6689,女性為71.7100,女性略占優(yōu)勢。二者稍微有些差別,并不存在男女工資待遇不平等現(xiàn)象。②為研究婚姻狀況對于女性工資的影響:將女性數(shù)據(jù)按照婚姻狀況分為已婚和未婚兩類,依次建立模型,比較分析婚姻狀況對平均日工資的影響。 得出已婚的工資方程的回歸系數(shù):b=bint=355.2128327.5318382.89381.03520.88881.1816191.1308133.0786249.1829stats=統(tǒng)計量值0.9000122.90000.0000該回歸方程為:未婚女性的工資方程的回歸系數(shù)為:b=bint=357.8057322.1234393.48801.21600.93371.498456.589924.636388.5434stats=統(tǒng)計量值0.943466.66510.0000該回歸方程為:對比這兩條回歸方程:已婚:未婚:可見未婚女性的工資的第一部分,要比已婚女性的高出2.38,而第二部分的斜率系數(shù)要低于已婚女性0.17,可見只要當(dāng)工齡大于118月,就出現(xiàn)未婚比已婚的低收入了,而未婚女碩士及未婚女博士的收入明顯要低于同等條件的已婚女性。聯(lián)系實際,該企業(yè)可能對工齡相對較小的未婚女性給予一定的補(bǔ)償措施,畢竟她們還未成家,只有自己一個人的經(jīng)濟(jì)收入,這符合實際情況。但是對工齡相對較大的未婚女性,在工齡及受教育情況相同時,與已婚女性相競爭明顯處于劣勢。在實際情況中,某些企業(yè)因考慮未婚女性將來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論