版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
空氣污染研究的主成分分析一、提出問題本文對于給定的*城市42天中午12點的空氣污染數據進展主成分分析,主要解決以下幾個問題:分別用樣本協(xié)方差矩陣和樣本相關矩陣作主成分分析,比照二者的結果差異;對原始數據的變化選取三個或者更少的主成分反映,并對所選的主成分做出解釋。二、分析問題主成分分析旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。在實際問題研究中,為了系統(tǒng)、全面地分析問題,我們必須考慮眾多影響因素。因為每個因素都在不同程度上反映了所研究問題的*些信息,并且指標之間有一定的相關性,因而所得到的統(tǒng)計數據反映的信息在一定程度上有重疊。本文中所研究的問題變量較多,因此利用主成分分析法研究本問題,減少計算量和降低分析問題的復雜性。針對問題一,首先將數據標準化,計算樣本協(xié)方差矩陣和相關矩陣,然后分別計算樣本協(xié)方差矩陣和相關矩陣的特征值和特征向量,奉獻率和累計奉獻率,確定選取成分個數,列出主成分方程并解釋主成分意義。針對問題二,考慮主成分的奉獻率,只要主成分的累計奉獻率到達80%,就可以反映原始數據的變化,并且對所選取的主成分做出解釋。三、模型假設1、影響污染程度的變量只有本文中所提到的變量;2、隨機選取的42天;3、題目中所提到的城市是平衡開展,政府對環(huán)境治理干預較小,即此城市的環(huán)境不會出現(xiàn)強烈波動;4、題目中所給的污染濃度及氣象參數有效,數據都準確可靠,同時不考慮人為因素、檢測儀器準確度不同等影響。四、符號說明符號符號含義樣本方差原始變量樣本主成分樣本協(xié)方差樣本相關矩陣樣本平均值協(xié)方差矩陣特征向量矩陣矩陣的特征值矩陣的特征向量信息提取率五、問題求解5.1協(xié)方差矩陣主成分分析設是的協(xié)方差矩陣,的特征值與正交化特征向量分別為及,且的第個主成分為 (1)根據已有數據計算得樣本的均值向量為根據協(xié)方差矩陣計算公式(2)代入數據可求得隨機變量相應的樣本協(xié)方差矩陣為利用特征值計算公式代入數據可求得的特征值與對應單位正交化特征向量分別為,,,,,,,利用第個主成分的奉獻率(3)及前個主成分的累計奉獻率(4)代入數據計算得的各標準化主成分的奉獻率及累計奉獻率〔如表1所示〕,可以看出,前三個標準化樣本的累計奉獻率已經到達98.6968%,故只需提取前三個主成分即可:表1的各標準化主成分的奉獻率及累計奉獻率奉獻率(%)累計奉獻率〔%〕1304.257987.294887.2948228.27618.112795.4075311.46453.289398.696842.52430.724299.421051.27950.367199.788160.52870.151799.939870.20960.0601100.0000記主成分向量為由,知的前三個主成分分別為因此,用前三個主成分代替原來7個變量,信息損失量較小。進一步由與的相關系數(5)計算出前三個主成分與各原始變量的相關系數如下表:主成分相主成分相關系數原變量0.10870.2576-0.0672-0.99940.0357-0.0014-0.1937-0.41810.46750.07400.06260.4111-0.1274-0.23690.9585-0.3521-0.9299-0.1041-0.0613-0.18240.4168由表可看出,與相關度較高,而由相關矩陣的主成分權重系數〔即特征向量中的各個值〕知,太陽輻射對空氣污染的影響最大;與相關度較高,由相關矩陣的主成分權重系數〔即特征向量中的各個值〕知,對空氣污染的影響較大;與相關度較高,同理,由相關矩陣的主成分權重系數〔即特征向量中的各個值〕知,對空氣污染的影響較大。考慮前三個主成分的奉獻率依次降低,得出結論:影響空氣污染的最重要因素為太陽輻射。由于的方差較大,第一主成分主要由變量控制,所以所得結論與實際不符。5.2樣本相關矩陣主成分分析利用標準化公式對原數據進展標準化處理得到一組新的數據:即令(6)其中為的平均值,為的方差。此時,由于的協(xié)方差矩陣即為的相關矩陣其中(7)為的協(xié)方差。代入數據計算得到樣本相關矩陣為利用特征值計算公式代入數據可求得的特征值與單位正交化特征向量分別為利用第個主成分的奉獻率(8)及前個主成分的累計奉獻率(9)其中。計算的各標準化主成分的奉獻率及累計奉獻率〔如表3所示〕。表3的各標準化主成分的奉獻率及累計奉獻率奉獻率(%)累計奉獻率〔%〕12.336833.382433.382421.386019.799753.182131.204117.201270.383340.727110.387080.770350.65359.335690.105960.53677.667097.772970.15592.2271100.00可以看出,當特征值大于1時,提取前三個標準化樣本的累計奉獻率為70.3833%。記主成分向量為由,則的前三個主成分分別為由與的相關系數(10)計算出前三個主成分與各原始變量的相關系數如表:主成分相主成分相關系數原變量-0.36810.32550.69360.3145-0.62020.25020.8307-0.0046-0.14670.59270.5123-0.43730.74520.23050.23500.4922-0.67140.17450.48840.35530.6072由表4可看出,與、相關度較高,近似是7個變量的等權重之和,反映了空氣質量的綜合指標,值越大,空氣質量越差。與相關度較低,由相關矩陣的主成分權重系數〔即特征向量中的各個值〕知,CO對空氣污染指標y2的影響較?。慌c、相關度較高,同理,由相關矩陣的主成分權重系數〔即特征向量中的各個值〕知,風速和HC對空氣污染的影響較大??紤]前三個主成分的奉獻率之和到達70.3833%,因此綜合考慮來,和來評判影響空氣污染的重要指標。5.3差異性從協(xié)方差矩陣出發(fā),對所有變量進展主成分分析,何從相關矩陣出發(fā)做主成分分析,兩個方向得出的結果顯示,原變量在第一主成分和第二主成分中的相對重要性,由于標準化而有很大變化。從協(xié)方差矩陣的角度進展主成分分析,所得第一主成分中,權重系數分別為-0.01、0.9922、0.941、-0.0047、0.0243、0.1124、0.0023,二重相對矩陣的角度進展主成分分析,所得的第一主成分分析,權重系數為-0.238、0.2056、0.5511、0.3776、0.4980、0.3246、0.3194。兩者差距很大,并且在第二主成分中的兩個系數相差更遠。因此,由協(xié)方差矩陣和相關矩陣所得的主成分一般是不同的。為了滿足樣本主成分累計奉獻率到達80%以上,從相關矩陣出發(fā)做的主成分分析應保存4個主成分,而從協(xié)方差矩陣來看,只保存1個主成分即可。由此可知,用協(xié)方差矩陣進展主成分分析更能簡化運算。本文中,由于設計的各變量的變化*圍差異不大,因此應從先關矩陣出發(fā)求主成分比擬合理。近似是7個變量的等權重之和,反映了空氣質量的綜合指標,值越大,空氣質量越差。綜合考慮來,和來評判影響空氣污染的重要指標。六、模型評價模型優(yōu)點:用主成分分析方法能夠較好地提醒污染物于污染程度之間的關系;該模型所用工具較易操作;主成分分析法是從定量的角度出發(fā),充分利用全部數據當中所包含的信息。所確定的指標權數是基于數據分析而得到的指標間的內在構造關系,具有較好的客觀性;能有效消除不相關指標的影響,從而可進展有針對性的定量化評價;得到的綜合指標之間相互獨立,不僅簡化了評價系統(tǒng),還減少了信息的穿插和冗余。方法計算簡便,數學物理意義明確,有較強的可操作性和一定的推廣應用。模型缺點:尚未考慮到其他變量的影響,存在預測誤差;該模型未給出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年茶葉品牌區(qū)域銷售代理協(xié)議
- 2024秋季農產品銷售代理合同
- 2024年度特色車位買賣協(xié)議(兒童樂園配套)3篇
- 《煤礦運輸提升系統(tǒng)的安全檢查》培訓課件2025
- 2024政府采購保密協(xié)議范本(體育場館建設)3篇
- 2024新校區(qū)建設項目沉降數據收集與分析及基礎施工合同3篇
- 2024無線網絡覆蓋系統(tǒng)弱電裝修合同
- 2024政工程有限公承建的綠色環(huán)保智慧校園合同3篇
- 2024年精裝室內實木門采購合同版
- 2024手繪墻繪藝術裝置設計與制作合同3篇
- 創(chuàng)新科技2024年的科技創(chuàng)新和產業(yè)升級
- 中藥飲片行業(yè)研究報告(2024年)
- 2024年國家電投五凌電力限公司招聘歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 進修人員培養(yǎng)考核鑒定簿
- 人教版四年級上冊豎式計算300題及答案
- 2024年山東省春季高考技能考試汽車專業(yè)試題庫-上(單選題匯總)
- 鄉(xiāng)鎮(zhèn)權責清單
- 湖北省部分學校2023-2024學年高一上學期期末數學試題(解析版)
- 《活著》讀書分享課件
- 醫(yī)院醫(yī)療糾紛防范與處理實施辦法(試行)
- 前程無憂IQ測評題庫
評論
0/150
提交評論