




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、空氣污染研究的主成分分析一、提出問題本文對于給定的某城市42天中午12點的空氣污染數(shù)據(jù)進行主成分分析,主要解決以下幾個問題:(1) 分別用樣本協(xié)方差矩陣和樣本相關矩陣作主成分分析,對比二者的結(jié)果差異;(2) 對原始數(shù)據(jù)的變化選取三個或者更少的主成分反映,并對所選的主成分做出解釋。二、分析問題主成分分析旨在利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標。在實際問題研究中,為了系統(tǒng)、全面地分析問題,我們必須考慮眾多影響因素。因為每個因素都在不同程度上反映了所研究問題的某些信息,并且指標之間有一定的相關性,因而所得到的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。本文中所研究的問題變量較多,因此利用主成分分
2、析法研究本問題,減少計算量和降低分析問題的復雜性。針對問題一,首先將數(shù)據(jù)標準化,計算樣本協(xié)方差矩陣和相關矩陣,然后分別計算樣本協(xié)方差矩陣和相關矩陣的特征值和特征向量,貢獻率和累計貢獻率,確定選取成分個數(shù),列出主成分方程并解釋主成分意義。針對問題二,考慮主成分的貢獻率,只要主成分的累計貢獻率達到80%,就可以反映原始數(shù)據(jù)的變化,并且對所選取的主成分做出解釋。三、模型假設1、影響污染程度的變量只有本文中所提到的變量;2、隨機選取的42天;3、題目中所提到的城市是平衡發(fā)展,政府對環(huán)境治理干預較小,即此城市的環(huán)境不會出現(xiàn)強烈波動;4、題目中所給的污染濃度及氣象參數(shù)有效,數(shù)據(jù)都準確可靠,同時不考慮人為因
3、素、檢測儀器精確度不同等影響。四、符號說明符號符號含義樣本方差原始變量樣本主成分樣本協(xié)方差樣本相關矩陣樣本平均值協(xié)方差矩陣特征向量矩陣矩陣的特征值矩陣的特征向量信息提取率五、問題求解5.1協(xié)方差矩陣主成分分析設是的協(xié)方差矩陣,的特征值與正交化特征向量分別為及,且的第個主成分為 (1)根據(jù)已有數(shù)據(jù)計算得樣本的均值向量為根據(jù)協(xié)方差矩陣計算公式 (2)代入數(shù)據(jù)可求得隨機變量相應的樣本協(xié)方差矩陣為利用特征值計算公式代入數(shù)據(jù)可求得的特征值與對應單位正交化特征向量分別為,, 利用第個主成分的貢獻率 (3)及前個主成分的累計貢獻率 (4)代入數(shù)據(jù)計算得的各標準化主成分的貢獻率及累計貢獻率(如表1所示),可以
4、看出,前三個標準化樣本的累計貢獻率已經(jīng)達到98.6968%,故只需提取前三個主成分即可:表1 的各標準化主成分的貢獻率及累計貢獻率貢獻率(%)累計貢獻率(%)1304.257987.294887.2948228.27618.112795.4075311.46453.289398.696842.52430.724299.421051.27950.367199.788160.52870.151799.939870.20960.0601100.0000記主成分向量為 由 ,知的前三個主成分分別為因此,用前三個主成分代替原來7個變量,信息損失量較小。進一步由與的相關系數(shù) (5)計算出前三個主成分與各原
5、始變量的相關系數(shù)如下表:主成分相關系數(shù)原變量表2 前三個主成分與各原始變量的相關系數(shù)0.10870.2576-0.0672-0.99940.0357-0.0014-0.1937-0.41810.46750.07400.06260.4111-0.1274-0.23690.9585-0.3521-0.9299-0.1041-0.0613-0.18240.4168由表可看出,與相關度較高,而由相關矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個值)知,太陽輻射對空氣污染的影響最大;與相關度較高,由相關矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個值)知,對空氣污染的影響較大;與相關度較高,同理,由相關矩陣的主成分
6、權(quán)重系數(shù)(即特征向量中的各個值)知,對空氣污染的影響較大??紤]前三個主成分的貢獻率依次降低,得出結(jié)論:影響空氣污染的最重要因素為太陽輻射。由于的方差較大,第一主成分主要由變量控制,所以所得結(jié)論與實際不符。5.2樣本相關矩陣主成分分析利用標準化公式對原數(shù)據(jù)進行標準化處理得到一組新的數(shù)據(jù):即令 (6)其中為的平均值,為的方差。此時,由于的協(xié)方差矩陣即為的相關矩陣其中 (7) 為的協(xié)方差。代入數(shù)據(jù)計算得到樣本相關矩陣為利用特征值計算公式代入數(shù)據(jù)可求得的特征值與單位正交化特征向量分別為利用第個主成分的貢獻率 (8)及前個主成分的累計貢獻率 (9)其中。計算的各標準化主成分的貢獻率及累計貢獻率(如表3所
7、示)。表3 的各標準化主成分的貢獻率及累計貢獻率貢獻率(%)累計貢獻率(%)12.336833.382433.382421.386019.799753.182131.204117.201270.383340.727110.387080.770350.65359.335690.105960.53677.667097.772970.15592.2271100.00可以看出,當特征值大于1時,提取前三個標準化樣本的累計貢獻率為70.3833%。記主成分向量為 由 ,則的前三個主成分分別為由與的相關系數(shù) (10)計算出前三個主成分與各原始變量的相關系數(shù)如表:主成分相關系數(shù)原變量表4 前三個主成分與各原
8、始變量的相關系數(shù)-0.36810.32550.69360.3145-0.62020.25020.8307-0.0046-0.14670.59270.5123-0.43730.74520.23050.23500.4922-0.67140.17450.48840.35530.6072由表4可看出,與、相關度較高,近似是7個變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標,值越大,空氣質(zhì)量越差。與相關度較低,由相關矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個值)知,CO對空氣污染指標y2的影響較??;與、相關度較高,同理,由相關矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個值)知,風速和HC對空氣污染的影響較大??紤]
9、前三個主成分的貢獻率之和達到70.3833%,因此綜合考慮來,和來評判影響空氣污染的重要指標。5.3差異性從協(xié)方差矩陣出發(fā),對所有變量進行主成分分析,何從相關矩陣出發(fā)做主成分分析,兩個方向得出的結(jié)果顯示,原變量在第一主成分和第二主成分中的相對重要性,由于標準化而有很大變化。從協(xié)方差矩陣的角度進行主成分分析,所得第一主成分中,權(quán)重系數(shù)分別為-0.01、0.9922、0.941、-0.0047、0.0243、0.1124、0.0023,二重相對矩陣的角度進行主成分分析,所得的第一主成分分析,權(quán)重系數(shù)為-0.238、0.2056、0.5511、0.3776、0.4980、0.3246、0.3194。
10、兩者差距很大,并且在第二主成分中的兩個系數(shù)相差更遠。因此,由協(xié)方差矩陣和相關矩陣所得的主成分一般是不同的。為了滿足樣本主成分累計貢獻率達到80%以上,從相關矩陣出發(fā)做的主成分分析應保留4個主成分,而從協(xié)方差矩陣來看,只保留1個主成分即可。由此可知,用協(xié)方差矩陣進行主成分分析更能簡化運算。本文中,由于設計的各變量的變化范圍差異不大,因此應從先關矩陣出發(fā)求主成分比較合理。近似是7個變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標,值越大,空氣質(zhì)量越差。綜合考慮來,和來評判影響空氣污染的重要指標。六、模型評價模型優(yōu)點:(1) 用主成分分析方法能夠較好地揭示污染物于污染程度之間的關系;(2) 該模型所用工具較易操作;(3) 主成分分析法是從定量的角度出發(fā),充分利用全部數(shù)據(jù)當中所包含的信息。所確定的指標權(quán)數(shù)是基于數(shù)據(jù)分析而得到的指標間的內(nèi)在結(jié)構(gòu)關系,具有較好的客觀性;能有效消除不相關指標的影響,從而可進行有針對性的定量化評價;得到的綜合指標之間相互獨立,不僅簡化了評價系統(tǒng),還減少了信息的交叉和冗余。(4) 方法計算簡便,數(shù)學物理意義明確,有較強的可操作性和一定的推廣應用。模型缺點:(1) 尚未考慮到其他變量的影響,存在預測誤差;(2) 該模型未給出圖像,難以反映各變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 購林地定金合同協(xié)議
- 購房補充協(xié)議合同模板
- 訂制信貨亭合同協(xié)議
- 購車合同轉(zhuǎn)成借款協(xié)議
- 設備帶土建合同協(xié)議
- 2025幼兒園數(shù)學思考能力試題與答案
- 《Reading Helping Each Other;Young Girl Warns Others about Tsunami》教案初中英語八年級上冊北師大版
- 甘肅省蘭州市2024-2025學年八年級上學期期中考試物理試題2【含答案解析】
- 2025年康復醫(yī)學專業(yè)畢業(yè)生考試試卷及答案
- 2020年全國生物學聯(lián)賽試題
- 連云港2025年連云港市贛榆區(qū)事業(yè)單位招聘31人筆試歷年參考題庫附帶答案詳解
- 8.1薪火相傳的傳統(tǒng)美德 課件-2024-2025學年統(tǒng)編版道德與法治七年級下冊
- 診療規(guī)范考核試題及答案
- 臨沂市羅莊區(qū)興羅資本投資有限公司招聘筆試題庫2025
- 船舶動力系統(tǒng)可靠性提升-全面剖析
- 湖北省武漢市2025屆高中畢業(yè)生四月調(diào)研考試語文試卷及答案(武漢四調(diào))
- 彩超試題及答案三基
- 人工智能設計倫理知到智慧樹章節(jié)測試課后答案2024年秋浙江大學
- 品管圈PDCA獲獎案例-提高壓瘡高危患者預防措施落實率醫(yī)院品質(zhì)管理成果匯報
- 成人腦室外引流護理-中華護理學會團體 標準
評論
0/150
提交評論