




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、理學(xué)沈統(tǒng)計(jì)系課程實(shí)驗(yàn)論文基于回歸分析的人口數(shù)量預(yù)測(cè)學(xué)號(hào):2014962005姓名:李洋年級(jí):2014級(jí)專業(yè):統(tǒng)計(jì)學(xué)課程:回歸分析2016年6月19日指導(dǎo)教師:姜喜春完成日期:摘要I.刖H1第1章一元線性回歸21.1 指標(biāo)的選擇21.2 樣本確定21.3 一元回歸分析31.3.1 繪制總?cè)丝谂c糧食產(chǎn)量的散點(diǎn)圖31.3.2 設(shè)定理論模型41.3.3 回歸診斷4第2章多元線性回歸51.1.1 數(shù)據(jù)中心化標(biāo)準(zhǔn)化51.2.1 多元回歸模型建立51.3.1 逐步回歸法61.4.1 多重共線性72.3.1多重共線性檢測(cè)82.4主成分分析92.4.1主成分分析模型建立9第3章非線性模型11曲線回歸11曲線擬合
2、11Logistic模型13結(jié)論15參考文獻(xiàn)16摘要回歸分析法是在掌握大量觀察數(shù)據(jù)的基礎(chǔ)上,利用數(shù)理統(tǒng)計(jì)方法建立因變量與自變量之間的回歸關(guān)系函數(shù)表達(dá)式(稱回歸方程式)。同時(shí)依據(jù)事物發(fā)展變化的因果關(guān)系來(lái)預(yù)測(cè)事物未來(lái)的發(fā)展走勢(shì),它是研究變量間相互關(guān)系的一種定量預(yù)測(cè)方法,又稱回歸模型預(yù)測(cè)法或因果法,應(yīng)用于經(jīng)濟(jì)預(yù)測(cè)、科技預(yù)測(cè)和企業(yè)人力資源的預(yù)測(cè)等?;貧w分析可以說(shuō)是統(tǒng)計(jì)學(xué)中內(nèi)容最豐富、應(yīng)用最廣泛的分支。這一點(diǎn)幾乎不帶夸張。包括最簡(jiǎn)單的t檢驗(yàn)、方差分析也都可以歸到線性回歸的類別。而卡方檢驗(yàn)也完全可以用logistic回歸代替。眾多回歸的名稱張口即來(lái)的就有一大片,線性回歸、logistic回歸、cox回歸、
3、poission回歸、probit回歸等等。關(guān)鍵詞:線性回歸;非線性回歸;logistic回歸、兒刖百最早的形式回歸的方法是最小二乘法,這是在1805年出版的勒讓德,和高斯在1809年。勒讓德和高斯都采用的方法確定的問(wèn)題,從天文觀測(cè),有關(guān)Sun的機(jī)構(gòu)(主要是彗星,但后來(lái)也新發(fā)現(xiàn)的小行星)的軌道。1821年,高斯發(fā)表最小二乘法理論的進(jìn)一步發(fā)展,在包括高斯-馬爾可夫定理的一個(gè)版本。弗朗西斯高爾頓在十九世紀(jì)的“回歸”是杜撰來(lái)描述一種生物現(xiàn)象。這種現(xiàn)象是高度高大的祖先的后代往往倒退下來(lái),對(duì)一個(gè)正常的平均水平(這種現(xiàn)象也被稱為向均值回歸)。對(duì)高爾頓,回歸只有這個(gè)生物意義,Udny圣誕節(jié)和皮爾遜但他的工作
4、,后來(lái)擴(kuò)展到更一般的統(tǒng)計(jì)范圍內(nèi)。在圣誕節(jié)和Pearson工作的響應(yīng)和解釋變量的聯(lián)合分布被假定為高斯。這個(gè)假設(shè)RA費(fèi)舍爾在1922年和1925年,他的作品被削弱。費(fèi)舍爾認(rèn)為的響應(yīng)變量的條件分布為高斯分布,但聯(lián)合分布不一定要。在這方面,費(fèi)舍爾的假設(shè)是高斯1821年制定的。在20世紀(jì)50年代和20世紀(jì)60年代,經(jīng)濟(jì)學(xué)家舊機(jī)電臺(tái)計(jì)算器,計(jì)算回歸。1970年以前,有時(shí)長(zhǎng)達(dá)24小時(shí)接收從一個(gè)回歸的結(jié)果?;貧w方法繼續(xù)是一個(gè)活躍的研究領(lǐng)域。在最近的幾十年中,新的方法已經(jīng)制定了穩(wěn)健回歸,回歸涉及的相關(guān)反應(yīng),如時(shí)間序列曲線和增長(zhǎng)曲線,回歸的預(yù)測(cè)或響應(yīng)變量的曲線,圖片,圖表或其他復(fù)雜的數(shù)據(jù)對(duì)象,容納不同的回歸方法丟
5、失的數(shù)據(jù),非參數(shù)回歸,貝葉斯方法進(jìn)行回歸,回歸的預(yù)測(cè)變量的測(cè)量誤差,預(yù)測(cè)變量的觀測(cè)回歸,回歸和因果關(guān)系的推論與類型。第1章一元線性回歸指標(biāo)的選擇影響人口增長(zhǎng)的主要因素經(jīng)濟(jì)因素,經(jīng)濟(jì)因素對(duì)人口自然增長(zhǎng)的作用主要表現(xiàn)在它決定了人口的增殖條件和生存條件,通過(guò)改變?nèi)丝诘某錾屎退劳雎蕘?lái)影響人口的自然增率。一般情況下,當(dāng)人口數(shù)量不能滿足經(jīng)濟(jì)發(fā)展對(duì)勞動(dòng)力的需求時(shí),人口自身的再生產(chǎn)必將會(huì)刺激;當(dāng)人口數(shù)量超越了經(jīng)濟(jì)發(fā)展所能提供的消費(fèi)總數(shù)后,人口自身的再生產(chǎn)必將受到遏制。在現(xiàn)代生產(chǎn)力水平下,人口的自然增長(zhǎng)率往往隨著經(jīng)濟(jì)水平的提高而下降。經(jīng)濟(jì)因素對(duì)人口機(jī)械增長(zhǎng)也有重要影響。通常情況下,經(jīng)濟(jì)發(fā)達(dá)或發(fā)展速度較快的地區(qū)
6、,對(duì)人口具有一種吸引力和凝聚力,人口機(jī)械增長(zhǎng)為正值;相反,經(jīng)濟(jì)落后或經(jīng)濟(jì)發(fā)展速度緩慢的地區(qū),對(duì)人口會(huì)產(chǎn)生一種排斥力和離散力,人口機(jī)械增長(zhǎng)一般為負(fù)值。與此同時(shí)糧食產(chǎn)量、出生率、死亡率,也是影響人口增長(zhǎng)的因素。符號(hào)說(shuō)明:用Xi、X2、X3、X4表示糧食產(chǎn)量、GDP出生率、死亡率。y表示總?cè)丝?。樣本確定通過(guò)查閱中國(guó)政府網(wǎng),得到了1980年至I2014年各因素的數(shù)據(jù)。表1-1樣本數(shù)據(jù)年份糧食產(chǎn)量(萬(wàn)噸)GDP(億元)出生率(%)死亡率(%)總?cè)丝冢ㄈf(wàn)人)201460702.61635910.212.377.16P136782201360193.84588018.812.087.161360722012
7、58957.9753412312.17.15P135404201157120.85484123.511.937.14134735201054647.7140890311.97.11134091200953082.08345629.211.957.08133450200852870.92316751.712.147.06132802200750160.28268019.412.16.93P132129200649804.23217656.612.096.81131448200548402.19185895.812.46.51P130756200446946.95160714.412.296.42
8、129988200343069.53136564.612.416.4129227200245705.7512100212.866.41128453200145263.67110270.413.386.43127627200046217.5299776.314.036.45P126743199950838.5890187.714.646.46125786199851229.5384883.715.646.5P124761199749417.179429.516.576.51123626199650453.571572.316.986.56122389199546661.861129.817.12
9、6.57121121199444510.148459.617.76.49119850199345648.835524.318.096.64118517199244265.827068.318.246.64117171199143529.321895.519.686.7P115823199044624.318774.321.066.67114333198940754.917090.321.586.54112704198839408.115101.122.376.64111026198740297.712102.223.336.72109300198639151.210308.822.436.86
10、107507198537910.89039.921.046.78105851198440730.57226.319.96.82P104357198338727.55975.620.196.9103008198235450533322.286.6P1016541981325024898.120.916.36100072198032055.54551.618.216.3498705一元回歸分析定義1.1回歸分析(regressionanalysis)1確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。如果在回歸分析中,只包括一個(gè)自變量和一個(gè)因變量,且二者的關(guān)系可用一條直線近似表示,這種
11、回歸分析稱為一元線性回歸分析。繪制總?cè)丝谂c糧食產(chǎn)量的散點(diǎn)圖140000.00-130000M-1人口(萬(wàn)人)izoDootxr11000000-10000000-9000000-T3000084000000500000060000.00雙擊以方活DDO.OO圖1-1糧食產(chǎn)量與總?cè)丝谏Ⅻc(diǎn)圖設(shè)定理論模型根據(jù)圖1-1隨著糧食產(chǎn)量的增加,總?cè)丝诘臄?shù)量增加,且各樣本點(diǎn)大致落在一條直線附近,故可以采用公式:y=?oX;(1-1)一元線性回歸理論模型,對(duì)數(shù)據(jù)進(jìn)行一元回歸分析。回歸診斷表1-1模型摘要模型RR平方整彳爰R平方襟型偏斜度1.909a.826.8214985.99669a.值:(常數(shù)),糧食產(chǎn)量(
12、萬(wàn)噸)根據(jù)表1-1模型摘要表可以看到,r=0.909,說(shuō)明以糧食產(chǎn)量為唯一因變量與總?cè)丝诘臄M合程度很高。表1-2系數(shù)模型非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性BBeta1(常酚53054.4045500.0139.646.000糧食產(chǎn)量(萬(wàn)噸)1.468.117.90912.513.000a.鷹燮數(shù):人口(萬(wàn)人)根據(jù)表1-2系數(shù)表,將系數(shù)帶入公式(1-1)可得出回歸模型公式:y=53054.4041.468x用一元回歸模型對(duì)2014年的總?cè)丝谶M(jìn)行預(yù)測(cè),的到的預(yù)測(cè)值夕=142165.8355第2章多元線性回歸定義2.1在回歸分析中,如果有兩個(gè)或兩個(gè)以上的自變量,就稱為多元回歸事實(shí)上,一種現(xiàn)象常常是
13、與多個(gè)因素相聯(lián)系的,由多個(gè)自變量的最優(yōu)組合共同來(lái)預(yù)測(cè)或估計(jì)因變量,比只用一個(gè)自變量進(jìn)行預(yù)測(cè)或估計(jì)更有效,更符合實(shí)際。數(shù)據(jù)中心化標(biāo)準(zhǔn)化數(shù)據(jù)中心化和標(biāo)準(zhǔn)化在回歸分析中的意義是取消由于量綱不同、自身變異或者數(shù)值相差較大所引起的誤差。Zx1|IZx2|Zx3|Zx4-,23311-714811.16627-J1643-76404-724001.29641-,61155-.94884-734851.49411-.23069-.82678-751201.73436.07400-.98409760991.50913.60719115429-767911.16127.30251-.76739-77780875
14、97.46485*104223-.78462.94855.75954*149194-.788131.47159-.33303*1.89644*790601.12873-1.2970919577179239.45304137326圖2-1標(biāo)準(zhǔn)化結(jié)果多元回歸模型建立多元回歸模型公式:yuB0x,:2乂2,.,:pXp;對(duì)數(shù)據(jù)進(jìn)行多元回歸分析,結(jié)果如圖2.2表2-1模型摘要模型RR平方整彳爰R平方襟型偏斜度i.972a.944.9362967.56830a.值:(常數(shù)),死亡率(%,出生率(%,糧食產(chǎn)量(萬(wàn)噸)GDP(億元)表2-2燮昊敷分析模型平方和df平均值平方F骸著9
15、8441112212310.996126.295.000b殘差264193847.616308806461.5874713043091.60034a.鷹燮數(shù):人口(萬(wàn)人)b.道剛值:(常數(shù)),死亡率(%,出生率(%,糧食產(chǎn)量(萬(wàn)噸),GDP(億元)表2-3保數(shù)a模型1(常旭糧食產(chǎn)量(萬(wàn)噸)GDP(億元)出生率(%死亡率(%非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性BBeta124574.66721501.7295.794.0001.045.152.6476.893.000-.005.008-.078-.635.531-1460.798262.207-.496-5.571.000-4060.27236
16、49.700-.091-1.112.275a.鷹燮數(shù):人口(萬(wàn)人)根據(jù)表2-1可知R=0.972,擬合度高,所以能用該模型進(jìn)行預(yù)測(cè),同時(shí)模型的檢驗(yàn)P值sig0.05,說(shuō)明該模型顯著可信;根據(jù)表2-3得到多遠(yuǎn)線性回歸方程:夕=124574.6671.045x10.005x21.460.798x34060.272x4同時(shí),根據(jù)方程得到14年總?cè)丝陬A(yù)測(cè)值夕=138182.2403,與真實(shí)值相差e=1400.25403.逐步回歸法定義2.2逐步回歸法:逐步回歸的基本思想是有進(jìn)有出。具體做法是將變量一個(gè)一個(gè)的引入,每引入一個(gè)變量后,對(duì)已引入變量進(jìn)行逐個(gè)檢驗(yàn),當(dāng)原引入變量因后引入變量變得不顯著時(shí),對(duì)其進(jìn)行
17、剔除,保證最后所得的回歸子集是最優(yōu)回歸子集。根據(jù)圖2.2可知,變量GDP與死亡率未通過(guò)顯著性檢驗(yàn),因此采用逐步回歸的方法對(duì)方程進(jìn)行優(yōu)化。表2-4逐步回歸保數(shù)模型非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性BBeta1(常/出生率(%165146.388-2687.9493543.313210.086-.91246.608-12.794.000.0002(常/108407.8058355.07212.975.000出生率(為-1534.270211.155-.521-7.266.000糧食產(chǎn)量(萬(wàn)噸).816.116.5057.052.0003(常/134678.87814308.5429.412.00
18、0出生率(%-1366.202213.615-.464-6.396.000糧食產(chǎn)量(萬(wàn)噸)1.012.141.6267.184.000死亡率(%-5681.5572580.897-.127-2.201.035a.鷹燮數(shù):人口(萬(wàn)人)根據(jù)圖表2-4,經(jīng)過(guò)逐步回歸,剔除了GDP這一變量得到一個(gè)擬合度更好的方程:?=134678.8781012x1-1366.202x3-5681.55次4同時(shí)得到2014年總?cè)丝诘念A(yù)測(cè)值?=138506.21662與真實(shí)值相差e=172.21662對(duì)比一般多元回歸方法的出的模型預(yù)測(cè)值與運(yùn)用了逐步回歸后的預(yù)測(cè)值,發(fā)現(xiàn)不用逐步回歸的預(yù)測(cè)值更接近真實(shí)值;其原因主要有三方面
19、:.我國(guó)的人口普查為10年一次,其數(shù)據(jù)主要也是通過(guò)預(yù)測(cè)的出,所以數(shù)據(jù)本身存在較大的誤差;.在實(shí)際問(wèn)題中,自變量之間通常存在相關(guān)性,當(dāng)相關(guān)程度嚴(yán)重時(shí)稱為多重共線性。自變量之間的多重共線性會(huì)對(duì)回歸產(chǎn)生極大的影響;.人口預(yù)測(cè)不適合采用線性多元回歸的方法進(jìn)行預(yù)測(cè)。2.4多重共線性定義2.3多重共線性(Multicollinearity)是指線性回歸模型中的解釋變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計(jì)失真或難以估計(jì)準(zhǔn)確。多重共線性產(chǎn)生原因:(1)經(jīng)濟(jì)變量相關(guān)的共同趨勢(shì);(2)滯后變量的引入;(3)樣本資料的限制。影響:(1)完全共線性下參數(shù)估計(jì)量不存在;(2)近似共線性下OLS估計(jì)量非有效
20、,多重共線性使參數(shù)估計(jì)值的方差增大,1/(1-r2)為方差膨脹因子(VarianceInflationFactor,VIF)如果方差膨脹因子值越大,說(shuō)明共線性越強(qiáng)。相反因?yàn)?,容許度是方差膨脹因子的倒數(shù),所以,容許度越小,共線性越強(qiáng)。可以這樣記憶:容許度代表容許,也就是許可,如果,值越小,代表在數(shù)值上越不容許,就是越小,越不要。而共線性是一個(gè)負(fù)面指標(biāo),在分析中都是不希望它出現(xiàn),將共線性和容許度聯(lián)系在一起,容許度越小,越不要,實(shí)際情況越不好,共線性這個(gè)“壞蛋”越強(qiáng)。進(jìn)一步,方差膨脹因子因?yàn)槭侨菰S度倒數(shù),所以反過(guò)來(lái);(3)參數(shù)估計(jì)量經(jīng)濟(jì)含義不合理;(4)變量的顯著性檢驗(yàn)失去意義,可能將重要的解釋變量
21、排除在模型之外;(5)模型的預(yù)測(cè)功能失效。變大的方差容易使區(qū)間預(yù)測(cè)的“區(qū)間”變大,使預(yù)測(cè)失去意義。多重共線性檢測(cè)用SPSS22.0對(duì)數(shù)據(jù)進(jìn)行多重共線性檢測(cè)表2-5共性模型雉度特徵值修件指數(shù)燮累敷比例(常/出生率(為糧食產(chǎn)量(萬(wàn)噸)死亡率(%111.9721.000.01.012.0288.447.99.99212.9291.000.00.00.002.0686.557.00.18.063.00333.7981.00.81.94313.9271.000.00.00.00.002.0707.506.00.17.03.003.00336.436.15.79.74.034.00186.828.85.0
22、4.24.97a.鷹建數(shù):人口(萬(wàn)人)檢測(cè)結(jié)果表2-5顯示:(1)特征值有3個(gè)接近0,表明存在多重共線性;(2)條件指數(shù)有3個(gè)10,表明可能存在多重共線性;(3)在相關(guān)系數(shù)矩陣中,死亡率數(shù)值接近1可能存在多重共線性;表2-6排除共線性變量后的保數(shù)模型非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性共性統(tǒng)言十資料BBeta允差VIF1(常酚165146.3883543.31346.608.000出生率(%-2687.949210.086-.912-12.794.0001.0001.0002(常酚108407.8058355.07212.975.000出生率(%-1534.270211.155-.521-7.
23、266.000.4002.502糧食產(chǎn)量(萬(wàn)噸).816.116.5057.052.000.4002.5023(常酚134678.87814308.5429.412.000出生率(%-1366.202213.615-.464-6.396.000.3492.868糧食產(chǎn)量(萬(wàn)噸)1.012.141.6267.184.000.2414.146死亡率(%-5681.5572580.897-.127-2.201.035.5531.808a.鷹燮數(shù):人口(萬(wàn)人)根據(jù)表2-6,剔除GDP這一變量后,其余變量的VIF全部小于10,排除變量問(wèn)存在多重共線性的原因,不需要再次剔除變量。得到剔除共線性后的多元線性
24、回歸方程:134678.8781.012x1-1366.202x3-5681.557x42.4主成分分析定義2.4主成分分析(PrincipalComponentAnalysis,PCA),是一種統(tǒng)計(jì)方法。通過(guò)正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量叫主成分。在實(shí)際課題中,為了全面分析問(wèn)題,往往提出很多與此有關(guān)的變量(或因素),因?yàn)槊總€(gè)變量都在不同程度上反映這個(gè)課題的某些信息。主成分分析首先是由K.皮爾森對(duì)非隨機(jī)變量引入的,爾后H.霍特林將此方法推廣到隨機(jī)向量的情形。信息的大小通常用離差平方和或方差來(lái)衡量。主成分分析的主要原理是尋找一個(gè)適當(dāng)?shù)木€性變換:(1
25、)將彼此相關(guān)的變量轉(zhuǎn)變?yōu)楸舜霜?dú)立的新變量;(2)方差較大的幾個(gè)新變量就能綜合反應(yīng)原多個(gè)變量所包含的主要信息;(3)新變量各自帶有獨(dú)特的專業(yè)含義。住成分分析的作用是:(1)減少指標(biāo)變量的個(gè)數(shù);(2)決多重相關(guān)性問(wèn)題2.4.1主成分分析模型建立運(yùn)用SPSS22.0對(duì)數(shù)據(jù)進(jìn)行主成分分析表2-7各變量所占權(quán)重元件起始特徵值攝取平方和載入燮昊的%累加%燮昊的%累加%13.04076.00476.0043.04076.00476.0042.72718.17694.1793.1523.79397.9724.0812.028100.000擷取方法:主元件分析。根據(jù)主成分分析結(jié)果可以看出前兩個(gè)變量所占比重最多,
26、二者的和所占比例為948%,所以可以采用前兩個(gè)變量建立回歸模型。表2-8回歸保數(shù)模型非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性BBeta1(常酚53075.7119733.1915.453.000糧食產(chǎn)量(萬(wàn)噸)1.468.235.9086.252.000GDP(億元)2.494E-5.009.000.003.998a.鷹燮數(shù):人口(萬(wàn)人)根據(jù)表2-8,得到回歸方程:?-53075.7111.468x12.494*10Jx2根據(jù)回歸方程預(yù)測(cè)出2014年人口p=142180.52727萬(wàn)人。因?yàn)椋?主成分分析中,我們首先應(yīng)保證所提取的前幾個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的水平(即變量降維后的信息量須保
27、持在一個(gè)較高水平上),其次對(duì)這些被提取的主成分必須都能夠給出符合實(shí)際背景和意義的解釋(否則主成分將空有信息量而無(wú)實(shí)際含義)。.主成分的解釋其含義一般多少帶有點(diǎn)模糊性,不像原始變量的含義那么清楚、確切,這是變量降維過(guò)程中不得不付出的代價(jià)。因此,提取的主成分個(gè)數(shù)m通常應(yīng)明顯小于原始變量個(gè)數(shù)p(除非p本身較?。?,否則維數(shù)降低的利”可能抵不過(guò)主成分含義不如原始變量清楚的弊”。所以預(yù)測(cè)的結(jié)果出現(xiàn)了更大的誤差130000.00-1ZOOM.OCTIIOOOOOG-iQOWOOC-*0000.00-第3章非線性模型3.1曲線回歸定義3.1非線性回歸是在掌握大量觀察數(shù)據(jù)的基礎(chǔ)上,利用數(shù)理統(tǒng)計(jì)方法建立因變量與自
28、變量之間的回歸關(guān)系函數(shù)表達(dá)式(稱回歸方程式)。回歸分析中,當(dāng)研究的因果關(guān)系只涉及因變量和一個(gè)自變量時(shí),叫做一元回歸分析;當(dāng)研究的因果關(guān)系涉及因變量和兩個(gè)或兩個(gè)以上自變量時(shí),叫做多元回歸分析。確定兩個(gè)變數(shù)間數(shù)量變化的某種特定的規(guī)則或規(guī)律;估計(jì)表示該種曲線關(guān)系特點(diǎn)的一些重要參數(shù),如回歸參數(shù)、極大值、極小值和漸近值等;為生產(chǎn)預(yù)測(cè)或試驗(yàn)控制進(jìn)行內(nèi)插,或在論據(jù)充足時(shí)作出理論上的外推。3.1.1曲線擬合對(duì)國(guó)內(nèi)總?cè)丝诘臄M合,選取總?cè)丝谥笜?biāo)為因變量,單位為萬(wàn)人,擬合總?cè)丝陉P(guān)于時(shí)間t的趨勢(shì)曲線。以1980年為基準(zhǔn)年,取值為t=1,2014年t=35。繪制總?cè)丝谂c變量t的散點(diǎn)圖,如圖3-1所示。14000000-
29、圖3-1總?cè)丝趯?duì)t的散點(diǎn)圖從散點(diǎn)圖可以看到,總?cè)丝诖笾路先魏瘮?shù)形式,當(dāng)人口的增長(zhǎng)速度大致相同時(shí),其趨勢(shì)線就是三次函數(shù)形式。:反Mhmift,修口型通過(guò)觀察圖3-2,發(fā)現(xiàn)三次曲線模型擬合度最好,其次為線性和復(fù)合模型,故根據(jù)公式:y=b0btb2t233建立三次曲線模型。表3-1模型摘要RR平方整彳爰R平方襟型偏斜度1.000.999.999365.498自燮時(shí)間表3-2燮昊數(shù)分析平方和df平均值平方F骸著性帚4708901835.39031569633945.13011749.732.000殘差4141256.21031133588.9104713043091.60034自燮時(shí)間表3-3三次
30、曲線系數(shù)非襟型化彳系數(shù)襟型化彳系數(shù)TMI著性BBeta時(shí)間1849.09465.5011.60928.230.000時(shí)間*2-17.6834.196-.571-4.214.000時(shí)間*3-.070.077-.076-.908.371(常知96103.588276.157348.004.000根據(jù)圖表3-1,得到三次函數(shù)模型的R=1.000,說(shuō)明擬合程度非常好;同時(shí)根據(jù)表3-2可知,方程整體都通過(guò)了顯著性檢驗(yàn);根據(jù)表3-3可知,不但方程整體通過(guò)了顯著性檢驗(yàn),每個(gè)不同次幕的t也經(jīng)過(guò)了顯著性檢驗(yàn),所以建立的三次方程式完全符合實(shí)際情況的。根據(jù)第三個(gè)表建立出三次函數(shù)方程:1849.094-17.683t
31、2-0.077t3同時(shí)得出2014年預(yù)測(cè)值?=136174.94841萬(wàn)人,預(yù)測(cè)值與真實(shí)值相差e=607.0516萬(wàn)人。預(yù)測(cè)值與真實(shí)值相差程度遠(yuǎn)小于運(yùn)用線性多元回歸方法、逐步回歸法和主成分分析后的預(yù)測(cè)值與真實(shí)值之間的差異,進(jìn)一步證明建立的三次函數(shù)模型符合實(shí)際情況。3.2Logistic模型Logistic模型增長(zhǎng)公式為:Pt=Pm.1(1eabt)其中Pt為時(shí)刻的人口總數(shù),Pm為人口極限規(guī)模,e為自然對(duì)數(shù)的底,t為時(shí)刻長(zhǎng)度,a、b為待定參數(shù)。Logistic模型考慮到人口總數(shù)增長(zhǎng)的有限性,提出了人口總數(shù)增長(zhǎng)的規(guī)律即隨著人口總數(shù)的增長(zhǎng),人口增長(zhǎng)率逐漸下降,但對(duì)于在短期內(nèi)如30-50年內(nèi)人口增長(zhǎng)可
32、能呈上升趨勢(shì)如人口生育率上升、死亡率下降等原因而導(dǎo)致人口呈上升趨勢(shì)。Logistic模型在應(yīng)用中對(duì)時(shí)間長(zhǎng),人口數(shù)據(jù)變化大,因此誤差較大且不穩(wěn)定。而小城鎮(zhèn)人口的變化就存在人口數(shù)據(jù)變化較大的特點(diǎn),所以Logistic模型對(duì)小城鎮(zhèn)人口的預(yù)測(cè)并不適合。用對(duì)人口進(jìn)行Logistic曲線擬合,運(yùn)用命令:x=20142013201220112010200920082007200620052004200320022001200019991998199719961995199419931992199119901989198819871986198519841983198219811980y=1367821360
33、7213540413473513409113345013280213212913144813075612998812922712845312762712674312578612476112362612238912112111985011851711717111582311433311270411102610930010750710585110435710300810165410007298705x=x;y=y;st_=20001276271;(在x,y內(nèi)任意取的數(shù))ft_=fittype(a/(1+b*exp(-k*(x-1980),.dependent,y,independent,x,.co
34、efficients,a,b,k);cf_=fit(x,y,ft_,Startpoint,st_)最后運(yùn)行出的結(jié)果:cf_=Generalmodel:cf_(x)=a/(1+b*exp(-k*(x-1980)Coefficients(with95%confidencebounds):a=1.217e+005(1.144e+005,1.29e+005)b=1.176e+005(-4.741e+009,4.742e+009)k=13.21(-4.032e+004,4.035e+004)根據(jù)運(yùn)行結(jié)果,得到Logistic擬合方程:o1.217e005?二11.176e005*exp(-13.21*(x-1980)其中a為人口上線的估計(jì)值,因?yàn)樵?995年人口的實(shí)際值就已經(jīng)超過(guò)了預(yù)測(cè)上限,所以該模型不是和用于預(yù)測(cè)未來(lái)的人口。造成模型不準(zhǔn)確的原因主要是數(shù)據(jù)過(guò)少,且人口數(shù)據(jù)多數(shù)來(lái)自抽樣調(diào)查,數(shù)據(jù)本身存在一定誤差。結(jié)論通過(guò)不同的模型建立方法對(duì)獲得的人口數(shù)據(jù)建立了多個(gè)不同的預(yù)測(cè)模型;經(jīng)過(guò)對(duì)比發(fā)現(xiàn)三次曲線模型是最符合實(shí)際運(yùn)用的;導(dǎo)致其他模型不適用的原因主要為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年小學(xué)學(xué)校校外實(shí)踐活動(dòng)計(jì)劃
- 2025年公務(wù)員考試時(shí)事政治模擬試題附參考答案詳解【能力提升】
- 2025部編二年級(jí)語(yǔ)文下冊(cè)課件制作計(jì)劃
- 2025年公務(wù)員考試時(shí)事政治模考模擬試題含完整答案詳解(各地真題)
- 阿壩職業(yè)學(xué)院《中國(guó)畫現(xiàn)代材料技法研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年公務(wù)員考試時(shí)事政治每日一練試卷含答案詳解(a卷)
- 海南工商職業(yè)學(xué)院《護(hù)理研究與醫(yī)學(xué)文獻(xiàn)檢索》2023-2024學(xué)年第一學(xué)期期末試卷
- 博物館展覽空間優(yōu)化施工計(jì)劃
- 水源涵養(yǎng)草牧場(chǎng)承包合作合同范本
- 六年級(jí)三班中隊(duì)課外輔導(dǎo)計(jì)劃
- 消防水鶴安裝工程施工方案及主要技術(shù)措施
- 《高校教師師德修養(yǎng)》課件
- 2024年深圳市房屋租賃合同(3篇)
- 學(xué)校食品安全投訴舉報(bào)制度及流程
- 人教部編版七年級(jí)語(yǔ)文上冊(cè)《秋天的懷念》示范課教學(xué)課件
- 2024年保育員(初級(jí))考試題及答案
- 廣西壯族賀州市2024年小升初考試數(shù)學(xué)試卷含解析
- “非遺”之首-昆曲經(jīng)典藝術(shù)欣賞智慧樹知到期末考試答案章節(jié)答案2024年北京大學(xué)
- SMP-04-013-00 藥品受托企業(yè)審計(jì)評(píng)估管理規(guī)程
- 店鋪代運(yùn)營(yíng)合同范本
- 兒童樂(lè)園安全管理制度
評(píng)論
0/150
提交評(píng)論