![Lasso回歸模型區(qū)域可持續(xù)發(fā)展_第1頁](http://file1.renrendoc.com/fileroot_temp2/2021-1/19/309424f9-0d47-429b-b16b-b1d2b7690403/309424f9-0d47-429b-b16b-b1d2b76904031.gif)
![Lasso回歸模型區(qū)域可持續(xù)發(fā)展_第2頁](http://file1.renrendoc.com/fileroot_temp2/2021-1/19/309424f9-0d47-429b-b16b-b1d2b7690403/309424f9-0d47-429b-b16b-b1d2b76904032.gif)
![Lasso回歸模型區(qū)域可持續(xù)發(fā)展_第3頁](http://file1.renrendoc.com/fileroot_temp2/2021-1/19/309424f9-0d47-429b-b16b-b1d2b7690403/309424f9-0d47-429b-b16b-b1d2b76904033.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Lasso回歸模型區(qū)域可持續(xù)發(fā)展以四川省為例,構建區(qū)域社會經濟可持續(xù)發(fā)展模型。首先采用PCA方法計算近15年四川省的可持續(xù)發(fā)展水平;再根據可持續(xù)發(fā)展水平指標體系獲取27個指標數據,通過相關性分析、交叉驗證遞歸特征消除與Lasso回歸相結合的方法進行特征篩選;最后采用Lasso回歸構建可持續(xù)發(fā)展模型,結果表明:模型訓練集精度達到99.74%,結構風險較小,加入的L1正則化增強了模型的泛化能力;構建的模型能夠較好地應用到中短期區(qū)域社會經濟可持續(xù)發(fā)展水平的預測,對于區(qū)域可持續(xù)發(fā)展的研究具有一定的應用價值。關鍵詞PCA;區(qū)域可持續(xù)發(fā)展水平;遞歸特征消除;Lasso回歸區(qū)域可持續(xù)發(fā)展是全球面臨的中心問題
2、之一,區(qū)域社會經濟可持續(xù)發(fā)展水平直接影響了可持續(xù)發(fā)展戰(zhàn)略的實施。本文以四川省為研究區(qū)域,利用主成分分析法、Lasso回歸等算法構建和優(yōu)化經濟社會可持續(xù)發(fā)展模型,時間跨度為2004年到2018年共計15年,社會發(fā)展、資源和環(huán)境發(fā)展數據來自國家統(tǒng)計局、四川省統(tǒng)計局等多家單位。1指標體系構建可持續(xù)發(fā)展的評估通?;诳沙掷m(xù)發(fā)展指標(SDI)4。與可持續(xù)發(fā)展相關的評估方法和指標選擇模型有所不同,一個關鍵問題是指標數據的可用性以及可用統(tǒng)計信息中的不確定性1。根據文獻5的總結分析,可持續(xù)發(fā)展指標始終包括三類指標,即經濟發(fā)展,社會發(fā)展,資源和環(huán)境發(fā)展,故本文主要參考文獻6構建相應的指標體系見表1。2區(qū)域可持續(xù)
3、發(fā)展水平計算采用主成分分析法(PCA)計算四川省的區(qū)域可持續(xù)發(fā)展水平。為了消除量綱和方向性,首先對于正向型指標(值越大越好)按照公式1進行規(guī)范化處理,對于負向型指標(越小越好)按照公式2進行規(guī)范化處理2之后按照公式3將其轉換為服從均值為0、標準差為1分布的數據。根據27個指標數據間的相關系數,可以進一步計算出相關系矩陣的特征值與主成分的貢獻率、累積貢獻率;然后按照選擇的新指標個數累積能代表原指標信息的90以上為止;原則,提取主成分;最后構造綜合得分函數,并求出四川省2004-2018年的得分。計算出的得分即為當年的可持續(xù)發(fā)展水平,輸出結果如下。3特征篩選基于搜集到的數據具有不同的量綱,為了使不
4、同量綱的量也能進行比較以及滿足回歸模型構建的需要,且不改變因子數據的分布,采用最大最小平移方法對數據進行無量綱化處理,將數據壓縮在0,1區(qū)間上。顯然所有的都在區(qū)間上,同時也消除了量綱的影響。首先基于相關性分析結果初步篩除與可持續(xù)發(fā)展水平相關性弱的指標。進行相關性分析可以發(fā)現(xiàn),除了城市人口密度、客運量和人均水資源共三個指標的相關系數小于0.6,剩余24個指標均與區(qū)域可持續(xù)發(fā)展水平高度顯著相關。其中人均水資源指標與可持續(xù)發(fā)展水平的相關系數僅為0.262、p值為0.345,相關性很弱,而城市人口密度、客運量與可持續(xù)發(fā)展水平的相關系數分別為0.552和-0.56,相關性不高;根據相關系數矩陣可以得到關
5、于指標間的相關性熱力圖,據圖可以很清晰地看出,城市人口密度(X13)、客運量(X15)和人均水資源(X24)對可持續(xù)發(fā)展水平的影響很弱。進一步對初篩后指標數據采用具有交叉驗證的遞歸特征消除(RFECV)確定影響因素個數,并基于確定的影響因素個數采用Lasso回歸方法識別影響可持續(xù)發(fā)展水平的關鍵因素。其中通過RFECV算法可以得到最佳特征個數為12個,進一步得到Lasso回歸識別結果見圖2,從圖中可以確定反映區(qū)域經濟發(fā)展的第一生產總值、反映社會發(fā)展的民事專利申請和授權、反映資源環(huán)境狀況的廢水總量等12個指標為關鍵影響因素。4模型建立及結果分析將得到的關鍵指標作為本文的建模因子,然后探討因子數據與可持續(xù)發(fā)展水平間的線性關系。通過12個因子數據與可持續(xù)發(fā)展水平間的散點圖可以看出,各個因子數據與可持續(xù)發(fā)展水平均存在很強的線性關系,且影響方向基本統(tǒng)一,故適合建立線性回歸模型;其次由前面的相關性分析可以發(fā)現(xiàn),因子數據間也存在線性關系,即存在共線性問題。由前文分析,簡單的線性回歸無法完成此時模型的構建,故為了防止過擬合問題,增加模型的泛化能力,考慮采用正則化則方法。所以本文采用Lasso回歸來構建可持續(xù)發(fā)展模型3。經過調參優(yōu)化與模型求解,可以得到可持續(xù)發(fā)展模型如下:經計算,該模型輸出的訓練集精度達到了99.74%,結構
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療照明銷售合同范例
- 供暖法律合同范例
- 2025年度物流園區(qū)后勤保障與運營管理合同
- 產品英文訂購合同范本
- 中國針織襯衫行業(yè)市場深度分析及投資策略咨詢報告
- 倉儲承包服務合同范本
- 低價漁具轉讓合同范例
- 公寓電腦租賃合同范本
- 農機合同范本
- 仔豬購買合同范本
- 數學-河南省三門峽市2024-2025學年高二上學期1月期末調研考試試題和答案
- 2025年春新人教版數學七年級下冊教學課件
- 《心臟血管的解剖》課件
- 心肺復蘇課件2024
- 2024-2030年中國并購基金行業(yè)發(fā)展前景預測及投資策略研究報告
- 河道清淤安全培訓課件
- 2024各科普通高中課程標準
- 7.3.1印度(第1課時)七年級地理下冊(人教版)
- 教師培訓校園安全
- “君子教育”特色課程的探索
- AS9100D人力資源管理程序(范本)
評論
0/150
提交評論