版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文題目 全國(guó)近20年來(lái)人口增長(zhǎng)原因分析數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文摘 要的增長(zhǎng)產(chǎn)生顯著影響。R軟件是一種開(kāi)源的免費(fèi)數(shù)據(jù)分析軟件,功能強(qiáng)大,是數(shù)據(jù)分析工作者的首選軟件之一。關(guān)鍵詞:R語(yǔ)言;多元線性回歸分析;方差分析。目 錄引言 1選題的背景和意義 1研究方法與思路 1正文 2前言 2數(shù)據(jù)分析 2數(shù)據(jù)預(yù)處理 2回歸分析 4方差分析 8結(jié)論 13參考文獻(xiàn) 13數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文II引言選題的背景和意義二孩政策,是中國(guó)實(shí)行的一種計(jì)劃生育政策,規(guī)定符合條件的夫婦允許生育“二胎”。因?yàn)槭嵌⒄?,故第一胎為多孩時(shí),不可生第二胎。201111;20131210在經(jīng)歷了迅速?gòu)母呱实降蜕实霓D(zhuǎn)變之后,我國(guó)人口的主要矛盾已經(jīng)不再是增長(zhǎng)過(guò)快,而是人口紅利消失、臨近超低生育率水平、人口老齡化、出生性別比失調(diào)等問(wèn)題。國(guó)內(nèi)20多位頂尖人口學(xué)者歷經(jīng)兩年的研究指出,我國(guó)的人口政策亟待轉(zhuǎn)向,尤其是生育政策應(yīng)該調(diào)整。研究方法與思路人數(shù)和醫(yī)療發(fā)展程度有關(guān)。方差分析是從觀測(cè)變量的方差入手,研究諸多控制變量中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量。所以可以采用方差分析,得到所有因素中影響程度最大的那一個(gè)。正文前言2015-2014(萬(wàn)人(萬(wàn)對(duì)(萬(wàn)元(萬(wàn)人醫(yī)院數(shù)(個(gè))R數(shù)據(jù)處理年份人口總數(shù) 年份人口總數(shù) 婚姻登記居民消費(fèi)水平參加生育保險(xiǎn)醫(yī)院數(shù)(個(gè))(萬(wàn)人)(萬(wàn)對(duì))(元)人數(shù)(萬(wàn)人)1995年121121934.123301500.2156631996年122389938.727652015.6158331997年123626914.129782485.9159441998年124761891.731262776.7160011999年125786885.333462929.8166782000年126743848.537213001.6163182001年12762780539873455.1161972002年12845378643013488.2178442003年129227811.446063655.4177642004年129988867.251384383.8183932005年130756823.157715408.5187032006年13144894564166458.9192462007年132129991.475727775.3198522008年1328021098.387079254.1197122009年1334501212.4951410875.7202912010年13409112411091912335.9209182011年1347351302.361313413892219792012年1354041323.591469915428.7231702013年1360721346.931619016392247092014年1367821306.741777817038.725860txtR(萬(wàn)對(duì)居民消費(fèi)水平(萬(wàn)元),參加生育保險(xiǎn)人數(shù)(萬(wàn)人),醫(yī)院數(shù)(個(gè))”依次命名為X1、X2、X3、X4,把“人口總數(shù)(萬(wàn)人)”,Y。在R軟件內(nèi)打開(kāi)txt:人口增長(zhǎng)<-read.table(file="人口增長(zhǎng).txt",header=T,sep="")人口增長(zhǎng)年份 Y X1 X2 X3 X41 1995年121121 934.10 2330 1500.22 1996年122389 938.70 2765 2015.6158333 1997年123626 914.10 2978 2485.9159444 1998年124761 891.70 3126 2776.7160015 1999年125786 885.30 3346 2929.8166786 2000年126743 848.50 3721 3001.6163187 2001年127627 805.00 3987 3455.1161978 2002年128453 786.00 4301 3488.2178449 2003年129227 811.40 4606 3655.417764102004年129988 867.20 5138 4383.818393112005年130756 823.10 5771 5408.518703122006年131448 945.00 6416 6458.919246數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文132007年132129 991.40 7572 7775.319852142008年1328021098.30 8707 9254.119712152009年1334501212.40 951410875.720291162010年1340911241.001091912335.920918172011年1347351302.361313413892.021979182012年1354041323.591469915428.723170192013年1360721346.931619016392.024709202014年1367821306.741777817038.725860回歸分析繪制散點(diǎn)圖先利用pairs函數(shù),繪制如圖1-1所示的矩陣散點(diǎn)圖。pairs(~Y+X1+X2+X3+X4,data=人口增長(zhǎng),main="人口增長(zhǎng)相關(guān)矩陣散點(diǎn)圖")IV數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文PAGE\*ROMANPAGE\*ROMANV(萬(wàn)人歸模型進(jìn)行回歸。建立回歸模型建立回歸模型為Y0
X11
X2
X33
X。4 4。Rlm語(yǔ)句:Fit<-lm(Y~X1+X2+X3+X4,data=人口增長(zhǎng))coefficients(Fit)(Intercept)X1X2X3X4130652.757898-24.032044-2.2838413.2472610.886581說(shuō)明建立的線性回歸方程為:Y130652.75824.032X2.284X3.247X0.887X1 2 3 4參數(shù)檢驗(yàn)查看人流量Y線性回歸方程的參數(shù)檢驗(yàn)結(jié)果:Call:lm(formula=Y~X1+X2+X3+X4,data=人口增長(zhǎng))Residuals:Median3QMax-201.8Median3QMax-201.8458.61368.0-1080.5 -477.6Coefficients:EstimateStd.ErrortvaluePr(>|t|)數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文I(Intercept)1.307e+057.716e+0316.9333.47e-11***X1-2.403e+013.216e+00-7.4721.97e-06***X2-2.284e+004.293e-01-5.3198.58e-05***X33.247e+003.435e-019.4541.04e-07***X48.866e-014.180e-012.1210.051.Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’Residualstandarderror:731.9on15degreesoffreedomMultipleR-squared: 0.9809, AdjustedR-squared: 0.9757F-statistic:192.1on4and15DF,p-value:1.09e-12192.1,概率p1.09e-12水平α0.05,pα,拒絕原假設(shè),選擇線性模型合理。X4t0.051,t統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤(分母)為2.121X4后重新建模。Fit<-lm(Y~X1+X2+X3,data=人口增長(zhǎng))Call:lm(formula=Y~X1+X2+X3,data=人口增長(zhǎng))Residuals:Min 1Q Median 3Q Max-1135.05 -490.66 -80.94 465.84 1797.51Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)1.464e+052.365e+0361.902<2e-16***X1-2.786e+012.937e+00-9.4865.70e-08***X2-1.678e+003.539e-01-4.7420.000221***X33.330e+003.767e-018.8401.48e-07***Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’Residualstandarderror:807.9on16degreesoffreedomMultipleR-squared: 0.9751, AdjustedR-squared: 0.9704F-statistic: 209on3and16DF, p-value:4.859e-13coefficients(Fit)(Intercept)X1X2X3146375.839081-27.863955-1.6779833.330386現(xiàn)在回歸方程的顯著性檢驗(yàn)和回歸系數(shù)的顯著性檢驗(yàn)均通過(guò),所以該模型可用。這是個(gè)三元線性回歸方程,方程表達(dá)式為:Y146375.83927.864X1.678X3.330X1 2 3小結(jié)(萬(wàn)個(gè)(萬(wàn)對(duì)(萬(wàn)元),參加生育保險(xiǎn)人數(shù)(萬(wàn)人),醫(yī)院數(shù)(個(gè))”有一定關(guān)系。方差分析X1Yaov(Y~X1,dataCall:aov(formula=Y~X1,data=人口增長(zhǎng))Terms:X1ResidualsSumofSquares 232695651186969574Deg.ofFreedom 1 18Residualstandarderror:3222.918Estimatedeffectsmaybeunbalanced1<-aov(Y~X1,data=人口增長(zhǎng))anova1)AnalysisofVarianceTableResponse:YDfSumSqMeanSqFvaluePr(>F)X11232695651232695651 22.4020.000166***Residuals1818696957410387199Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文PAGE\*ROMANPAGE\*ROMANXX1232695651,186969574,11910387199。F22.402,p0.000166α0.05,則因概率p小于α,拒絕原假設(shè),即認(rèn)為不同年份的婚姻登記(萬(wàn)對(duì))口總數(shù)具有影響。X2Yaov(Y~X2,dataCall:aov(formula=Y~X2,data=人口增長(zhǎng))Terms:X2ResidualsSumofSquares 340784192 Deg.ofFreedom 1 18Residualstandarderror:2093.389Estimatedeffectsmaybeunbalanced2<-aov(Y~X2,data=人口增長(zhǎng))anova2)AnalysisofVarianceTableResponse:YDf SumSq MeanSqFvalue Pr(>F)X2 1340784192340784192 77.7645.96e-08***Residuals18 78881033 4382280Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1X2340784192,78881033,1184382280。F77.764,p5.96e-08α為0.05,則因概率p小于α,拒絕原假設(shè),即認(rèn)為不同年份的居民消費(fèi)水平(萬(wàn)元)對(duì)人口總數(shù)具有影響。X3Yaov(Y~X3,dataCall:aov(formula=Y~X3,data=人口增長(zhǎng))Terms:X3ResidualsSumofSquares 349641867 Deg.ofFreedom 1 18Residualstandarderror:1972.356Estimatedeffectsmaybeunbalanced3<-aov(Y~X3,data=人口增長(zhǎng))數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文數(shù)據(jù)挖掘技術(shù)與實(shí)驗(yàn)課程論文Ianova3)AnalysisofVarianceTableResponse:YDfSumSqMeanSqFvalue Pr(>F)X31349641867349641867 89.8782.017e-08***Residuals18700233583890187Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1X3349641867,70023358,1183890187。F89.878,p2.017e-08。若顯著性水平αp(人)對(duì)人口總數(shù)具有影響。X4Yaov(Y~X4,dataCall:aov(formula=Y~X4,data=人口增長(zhǎng))Terms:X4ResidualsSumofSqu
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 抑郁癥心理護(hù)理效果評(píng)估-洞察分析
- 移動(dòng)支付安全風(fēng)險(xiǎn)-洞察分析
- 新材料對(duì)制造業(yè)升級(jí)影響研究-洞察分析
- 異常行為檢測(cè)與分析-洞察分析
- 碳中和戰(zhàn)略與能源轉(zhuǎn)型-洞察分析
- 醫(yī)療衛(wèi)生人才隊(duì)伍建設(shè)-洞察分析
- 碳酸飲料行業(yè)品牌營(yíng)銷(xiāo)策略-洞察分析
- 土地開(kāi)發(fā)與政策引導(dǎo)-洞察分析
- 文物保存技術(shù)發(fā)展趨勢(shì)-洞察分析
- 關(guān)于重陽(yáng)節(jié)的廣播稿(8篇)
- 機(jī)動(dòng)車(chē)檢測(cè)站新?lián)Q版20241124質(zhì)量管理手冊(cè)
- 廣東省深圳市2023-2024學(xué)年高一上學(xué)期期末考試物理試題(含答案)
- GB/T 44143-2024科技人才評(píng)價(jià)規(guī)范
- ICP-MS作用及功能的使用課件
- 校園一日安全巡查記錄表(共1頁(yè))
- 設(shè)備移交清單模板 (2)
- 江蘇省南通市2021屆新高考物理一模試卷含解析
- 高??萍汲晒D(zhuǎn)化問(wèn)題與對(duì)策建議
- (完整版)公司企業(yè)HSE管理體系及制度
- 校長(zhǎng)任職期間經(jīng)濟(jì)責(zé)任履行述職報(bào)告
- 藥物研發(fā)與評(píng)價(jià)研討之包裝材料和容器變更的技術(shù)要求及案例分析
評(píng)論
0/150
提交評(píng)論