版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
多元統(tǒng)計分析課程設計題目:《因子分析在環(huán)境污染方面的應用》姓名:專業(yè)班級:統(tǒng)計學2014級2班學院:數(shù)學與系統(tǒng)科學學院時間:2016年1月3日目錄TOC\o"1-5"\h\z1.摘要:12.引言:12.1背景12.2問題的研究意義12.3方法介紹23.實證分析103.1指標103.2原始數(shù)據(jù)103.3數(shù)據(jù)來源133.4分析過程:134.結(jié)論及建議255.參考文獻261.摘要:中國的環(huán)境問題,由于中國政府對環(huán)境問題的關注,環(huán)境法律日趨完善,執(zhí)法力度加大,對環(huán)境污染治理的投人逐年有較大幅度的增加,中國環(huán)境問題已朝著好的方面發(fā)展。但是,仍存在著環(huán)境問題,主要體現(xiàn)在環(huán)境污染問題,其中主要為水污染和大氣污染。關鍵詞:環(huán)境污染水污染大氣污染因子分析2.引言:背景:我國的環(huán)境保護取得了明顯的成就,部分地區(qū)環(huán)境質(zhì)量有所改善。但是,從整體上看,我國的環(huán)境污染仍在加劇,環(huán)境質(zhì)量還在惡化。大氣二氧化硫含量居高不下,境質(zhì)量呈惡化趨勢,固體廢棄物污染量大面廣,噪聲擾民嚴重,環(huán)境污染事故時有發(fā)生。據(jù)中國社會科學院公布的一項報告表明:中國環(huán)境污染的規(guī)模居世界前列。問題的研究意義:為分析比較各地環(huán)境污染特點,利用因子分析對環(huán)境污染的各個指標進行降維處理并得到影響環(huán)境的內(nèi)在因素,進一步對環(huán)境污染原因及治理措施進行分析,讓更多的人認識到環(huán)境的重要性,準確把握各地區(qū)環(huán)境治理方法以及針對不同地區(qū)制定不同的政策改善環(huán)境問題,這對綜合治理環(huán)境問題具有重要意義。方法介紹因子分析的意義:變量間的信息的高度重疊和高度相關會給統(tǒng)計方法的應用設置許多障礙。為解決此問題,最簡單和最直接的解決方案是削減變量個數(shù),但這必然會導致信息丟失和信息不完全等問題的產(chǎn)生。為此人們希望探索一種更有效地解決方法,它既能大幅減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會造成信息的大量丟失。因子分析正是這樣一種能夠有效降低變量維數(shù)的分析方法。因子分析的步驟:?因子分析的前提條件:要求原有變量之間存在較強的相關關系。?因子提取:將原有變量綜合成少數(shù)幾個因子是因子分析的核心內(nèi)容。若存在隨機向量F二(F1,…,J)'(q-P)及“(S1,…,8p)',使_X一.1=aii…a1q_F一i+81Xa…aF8pp1pqqp簡記為X=AF+£,且E(e)=0,D(£)=LQ訂(中心化);Cov(e,F)二0(不相關)。那么,稱指標向量X具有正交因子結(jié)構(gòu)(所有因子相互正交,即E(FFj)=0,匚j二1,…,q,i豐j);稱此模型為正交因子模型;稱J…,F(xiàn)q為公共因子(對整個X有影響的公共因素);稱e1,…,ep為特殊因子(只對X的各對應分量有影響的特殊因素);稱A二("j)pXq為因子載荷矩陣,aj為第i個指標在第j個公共因子上的載荷。因子載荷矩陣的建立因子分析的最基本任務之一就是建立因子載荷矩陣A。對于正交因子模型,有D(X)二AAr+D(e)若X已標準化,則R(X)二AA'+D(e)在絕大多數(shù)實際問題中,D(e)往往都是未知的,由此求出A是不可能的,這時可以通過主成分分析給出一組公共因子及其因子載荷矩陣。具體方法如下:
⑴求出R的特征根九1-…p>0,以及相應的單位特征向量u二(u⑴求出R的特征根九1-…p>0,以及相應的單位特征向量u二(u,…,u),(i二1,…,p)(i)i1ip2)建立主成分。U=(u⑴,…,u(p))是正交矩陣。九1E(Y)二UE(X)二0,D(Y)二UR(X)U二3)構(gòu)造公共因子,并建立因子載荷矩陣。X二UY二Ua2A-2Y(逆問題)丄F=A-2Yu11u!L;xplII1u1pupp迅u11入upp1pp容易驗證:E(F)=0,D(F)=Ip
X具有如下正交因子結(jié)構(gòu):X=AF(A__U,F(xiàn)__Y?)完全忽略了特殊因子的影響。X=TuF+…+」廠F+廠廠uF+???+「廠uFi=1,…,pi11i1'qqiqq+1(q+1)iq+1'ppip=、'入uF+-XuFq+1(q+1)iq+1ppipX=.-'TuF+…+J廠uF+8i11i1"qqiqi若只取前q個主成分,且令1111i'TuF=(F,…,F)'8=(8,…,8))'qqp」'1q'1p則有X=AF+8其中E(F)=0,D(F)=Iq,E(8)=0,Cov(8,F)=0,D(8)=R-AA'。忽略了不重要的公共因子,由特殊因子解析。換句話說,用主成分法獲得了X的正交因子分解(近似)中的A,F。這里的主要問題是如何確定因子數(shù)k方法一:根據(jù)特征值確定因子數(shù)。觀察各個特征值,一般取特征值大于1的。方法二:根據(jù)因子的累計方差貢獻率確定因子數(shù)。通常選取累計方差貢獻率大于0.85時的特征值個數(shù)為因子個數(shù)k。?使因子具有命名解釋性實際分析工作中人們總是希望對因子的實際含義有比較清楚的認識。未解決這個問題,可通過因子旋轉(zhuǎn)的方法使一個變量只在盡可能少的幾個因子上有比較高的載荷。最理想狀態(tài)下,使某個變量在某個因子上的載荷趨于1,在其他的因子上的載荷趨于0。這樣,一個因子就能夠成為某個變量的典型代表,于是因子的實際含義也就清楚了。因子正交旋轉(zhuǎn)當指標向量X具有正交因子結(jié)構(gòu)時,其公共因子向量、因子載荷矩陣及正交因子分解均不唯一確定。X=AF+£對任一q階正交矩陣t,有X=ATTF+£令F*二TF,A*二AT則X—A*F*+£E(F*)—0,D(F*)—TD(F)T—TT—ICov(F*,£)—E(F心)—TE(F£)—0(A*(A*)'—AA',(h*)2—h2,說明的問題)ii
利用正交因子分解的這一性質(zhì),在因子分析(正交因子模型)中,常常在建立了初始因子載荷矩陣之后,再對其作適當?shù)恼蛔儞Q(幾何解釋:因子軸旋轉(zhuǎn)),以使得因子載荷矩陣A*=AT具有更簡潔、更理想(近乎分塊對角矩陣形式)的結(jié)構(gòu),公共因子向量F*=TF具有更明顯、更直觀的實際意義,正交因子分解X二A*F*+£更合理、更能反映客觀實際。目前,已經(jīng)提出了各種因子旋轉(zhuǎn)的方法。比較常用的一種是方差極大因子軸正交旋轉(zhuǎn)法,簡稱方差極大法。先考慮兩個公共因子的平面正交旋轉(zhuǎn)。a11ap1a12a11ap1a12a-sin0COs0acos0+asin0—asin0+acos0bb11121112=1112acos0+asin0—asin0+acos0bbp1p2p1p2-p1p2p2具有更理想、更簡化的結(jié)構(gòu),即使其各列的因子載荷值盡可能地兩極分化,大者盡可能大,小者盡可能小。各載荷值可正可負,Xi的依賴程度hi2也不同,消除其影響:b*=b*=b2/h2gijijib,ili=1,…p;j=1,2)規(guī)格化)1T一V=—乞(b*—b*)2<4j=1,2(j)pij(j)i=1正交旋轉(zhuǎn)的目的就是要使新因子載荷矩陣的各列方差之和(總方差)=V=V+V(1)(2)1111達到最大。記aa二嚴i二1,...,p;j二1,2ijhia=a2-a2,B=2aai=1,…,pii1i2ii1i2=^a,p=Xp,丫iii=1i=1Y(a2-ii=1P2),8=2另apiiii=1則e可由下式確定:祁—p8-2ap=etgpY-(a2-卩2)g且*的符號可由e的符號確定:e>0n*g(0,—);e<0n*g(-—,0)44當公共因子數(shù)q>2時,需要對因子載荷矩陣中的q列因子載荷向量配兩兩對旋轉(zhuǎn),共旋轉(zhuǎn)C="V2次。s,t列。先確定e,后旋轉(zhuǎn)。st1cos*…-sin*sin*…cos*僅s,t列元素改變。全部列兩兩配對旋轉(zhuǎn)完畢后,就完成了第一輪旋轉(zhuǎn)。如果因子載荷矩陣還不能達到要求,那么進行第二輪旋轉(zhuǎn),如此進行下去,直到滿足要求為止。每經(jīng)一輪旋轉(zhuǎn),都可算出因子載荷矩陣的總方差。A(0)=ATA⑴TA(2)T…;V(0)TV(1)TV(2)T…A(i)=A(o)T⑴…T⑴=AT,A(2)=A⑴T⑵…T⑵=A⑴T=ATT,…12(q-1)q112(q-1)q212V(0),V(1),V⑵,…是一非降序列,且有上界(為4q),故必收斂于某一極限值V*,V*即為最大總方差。實際中,通常旋轉(zhuǎn)到總方差改進不大,即V(k)-V(k-BU(給定精度)時,旋轉(zhuǎn)停止。最后,取A*=A(k)=人-…—AT作為最終因子載荷矩陣。?計算因子得分因子得分是因子分析的最終體現(xiàn)。在因子分析的實際應用中,當因子確定以后,便可計算各因子在每個樣本觀測上的具體數(shù)值,這些數(shù)值稱為因子得分,形成的變量稱為因子得分變量。于是,在以后的分析中就可以因子得分變量代替原有變量進行數(shù)據(jù)建模,或利用因子得分變量對樣本進行分類或評價等研究,進而實現(xiàn)降維和簡化問題的目的。
11(F,…,F,F,…,F)=a~2Y,(FF,…,F)'=人一2Y1qq+1pq+1p11F*=TF二(T',0)(F',F,…,F)=(T',0)22Y二(T',0)(人2UUa-i)(UX)q+1p11二(T',O)(a2U')(Ua-1U')X二(T',O)(a2U')R-1X(T',0)廠q0+「0-0Pq+1.1f~uV)u'(q)u'(q+1)R-1X0uVLLwp」丿(p)二(T',0)AR-1X二(AT)R-1X二(A*)'R-1XX沁A*F*,(A*)'R-1X沁(A*)'R-1A*F*,r-1二ua-1U',A*=ATqxqqxq0(p-q)xq」,(A*)'R-1A*=…qxq3.實證分析3.1指標:廢水排放總量、需氧量排放總量、氨氮排放總量、二氧化硫排放總量、氮氧化物排放總量、煙塵灰塵排放總量3.2原始數(shù)據(jù):
地區(qū)廢水排放總量化學需氧量排放總量氨氮排放總量二氧化硫排放總量氮氧化物排放總量煙塵灰塵排放總量北京15.0716.881.97.8915.15.74天津8.9421.432.4520.9228.2313.95河北30.98126.8510.27118.99151.25179.77山西14.544.135.37120.82106.99150.68內(nèi)家古11.1984.774.93131.24125.83102.15遼寧26.29121.710.0199.4690.2112.07吉林12.2274.35.3137.2354.9247.51黑龍江14.96142.398.4947.2273.0679.35上海22.1222.444.4618.8133.2814.17江蘇60.1211014.2590.47123.2676.37浙江41.8372.5410.3257.468.7937.97安徽27.2388.5610.0549.380.7365.28福建26.0662.988.9335.641.1736.79江西20.8372.018.653.4454.0146.23
山東51.44178.0415.5159.02159.33120.81河南42.28131.8713.9119.82142.288.21湖北30.17103.3112.0458.3858.0250.4湖南31122.915.4462.3755.2849.62廣東90.51167.0620.8273.01112.2144.95廣西21.9374.47.9346.6644.2440.29海南3.9419.62.293.269.52.32重慶14.5838.645.1352.6935.522.61四川33.13121.6313.4779.6458.5442.86貴州11.0932.673.892.5849.1137.79云南15.7553.385.6563.6749.8936.68西藏0.542.790.340.424.831.39陜西14.5850.495.8278.170.5870.91甘肅6.637.323.8157.5641.8434.58青海2.310.50.9815.4313.4523.99寧夏3.7321.981.6637.7140.423.92新疆10.2767.024.5985.386.2881.393.33.3數(shù)據(jù)來源:中國環(huán)境年鑒》3.33.3數(shù)據(jù)來源:中國環(huán)境年鑒》3.4分析過程:利用SPSS軟件進行分析,首先錄入數(shù)據(jù),然后一次進行如下處理:一、考察原有變量是否適合進行因子分析首先考察收集到的原有變量之間是否存在一定的線性關系,是否適合采用因子分析。這里借助變量的相關系數(shù)矩陣進行分析。表一是原有變量的相關系數(shù)矩陣??梢钥吹剑捍蟛糠值南嚓P系數(shù)都較高,各變量呈較強的線性關系,能夠從中提取公共因子,適合進行因子分析。表一相關性矩陣廢水排放總量單位:億噸化學需氧量排放總量單位:萬噸氨氮排放總量單位:萬噸二氧化硫排放總量單位:萬噸氮氧化物排放總量單位:萬噸煙塵灰塵排放總量單位:萬噸相關廢水排放總量單位:億噸1.000.762.913.424.612.277說明的變異數(shù)總計說明的變異數(shù)總計化學需氧量排放總量單位:萬噸.7621.000.906.647.773.592氨氮排放總量單位:萬噸.913.9061.000.519.650.394二氧化硫排放總量單位:萬噸.424.647.5191.000.903.842氮氧化物排放總量單位:萬噸.612.773.650.9031.000.864煙塵灰塵排放總量單位:萬噸.277.592.394.842.8641.000二、提取因子這里首先進行嘗試性分析:根據(jù)原有變量的相關系數(shù)矩陣,采用主成分分析提取因子并選取大于1的特征值,分析結(jié)果如表2所Z示O表二Communalities
起始擷取廢水排放總量單位:億噸化學需氧量排放總量單位:萬噸氨氮排放總量單位:萬噸二氧化硫排放總量單位:萬噸氮氧化物排放總量單位:萬噸煙塵灰塵排放總量單位:萬噸1.0001.0001.0001.0001.0001.000.923.892.971.908.953.931擷取方法:主體元件分析。表二顯示了在指定提取2個變量共同度數(shù)據(jù)。第一列數(shù)據(jù)是因子分析初始解下的變量共同度,它表明:如果對原有7個變量采用主成分分析方法提取所有特征值,那么原有變量的所有方差都可被解釋,變量的共同度均1.事實上,因子個數(shù)小于原有變量的個數(shù)才是因子分析的目標,所以不可能提取全部特征值。第二列數(shù)據(jù)是在按指定提取條件提取特征值時的變量共同度??梢钥吹剿凶兞康慕^大部分信息可被因子解釋,信息丟失少。因此,本次因子提取的總體效果比較理想。表三
元件起始特徵值擷取平方和載入循環(huán)平方和載入總計變異的%累加%總計變異的%累加%總計變異的%累加%14.38273.04073.0404.38273.04073.0402.81046.83146.83121.19619.93292.9721.19619.93292.9722.76846.14192.9723.2073.44496.4164.1342.24198.6565.0621.03799.6946.018.306100.000擷取方法:主體元件分析。表三中,第一列是因子編號,以后三列組成一組,每組中數(shù)據(jù)項的含義依次是特征值、方差貢獻率和累計方差貢獻率。前兩個因子解釋原有變量總方差的93%,總體上,原有變量的信息丟失較少,因子分析效果較理想。表四表四中,橫坐標為因子數(shù)目,縱坐標是特征值。可以看到:第一個因子特征值很高,對解釋原有變量的貢獻最大;第二個以后的因子特征值都較小,對解釋原有變量的貢獻很小,因此提取兩個因子是合適的。表五元件矩陣a元件12氮氧化物排放總量單位:萬噸.939-.266化學需氧量排放總量單位:萬噸.917.226氨氮排放總量單位:萬噸.856.487
二氧化硫排放總量單位:萬噸廢水排放總量單位:億噸煙塵灰塵排放總量單位:萬噸.848二氧化硫排放總量單位:萬噸廢水排放總量單位:億噸煙塵灰塵排放總量單位:萬噸.848.778-.434.564.775-.575擷取方法:主體元件分析。a.擷取2個元件。表五顯示了因子載荷矩陣,是因子分析的核心內(nèi)容。根據(jù)該表可以寫出因子分析模型:氮氧化物排放總量=0.939*f-0.266*f化學需氧量排放總量=0.917*f+0.226*f氨氮排放總量=0.856*f+0.487*f二氧化硫排放總量=0.848*二氧化硫排放總量=0.848*f-0.434*f廢水排放總量=0.778*f+0.564*f煙塵灰塵排放總量=0.775*f-0.575*f由表五可知,六個變量在第一個因子上的載荷都很高,意味著他們與第一個因子的相關程度高,第一個因子很重要。第二個因子與原有變量的相關性均較小,它對原有不安量的解釋不顯著。a.a.在3疊代中收斂循環(huán)。a.a.在3疊代中收斂循環(huán)。三、因子的命名解釋采用方差極大法對因子載荷矩陣進行正交旋轉(zhuǎn)以使因子具有命名解釋性。得到旋轉(zhuǎn)后的因子載荷矩陣如圖六所示。圖六旋轉(zhuǎn)元件矩陣a元件12煙塵灰塵排放總量單位:萬噸.955.136二氧化硫排放總量單位:萬噸.909.287氮氧化物排放總量單位:萬噸.855.471氨氮排放總量單位:萬噸.268.948廢水排放總量單位:億噸.157.948化學需氧量排放總量單位:萬噸.494.805擷取方法:主體元件分析。轉(zhuǎn)軸方法:具有Kaiser正規(guī)化的最大變異法。由表六可知,煙塵灰塵排放總量、二氧化硫排放總量、氮氧化物排放總量在第一個因子上有較高的載荷,第一個因子可以解釋為大氣污染物排放總量。氨氮排放總量、廢水排放總量、化學需氧量排放總量在第二個因子上有較高的載荷,第二個因子可以解釋為水污染物排放總量。與旋轉(zhuǎn)前相比,因子含義較清晰。表七元件評分共變異數(shù)矩陣元件12121.000.000.0001.000擷取方法:主體元件分析。轉(zhuǎn)軸方法:具有Kaiser正規(guī)化的最大變異法。元件評分。表七顯示了兩因子的協(xié)方差矩陣。兩因子沒有線性相關關系實現(xiàn)了因子分析的設計目標。四、計算因子得分采用回歸法估計因子得分系數(shù),并輸出因子得分系數(shù)。
表八元件評分係數(shù)矩陣元件12廢水排放總量單位:億噸-.205.461化學需氧量排放總量萬噸單位:.016.282氨氮排放總量單位:萬噸-.147.427二氧化硫排放總量噸單位:萬.393-.122氮氧化物排放總量噸單位:萬.309-.007煙塵灰塵排放總量單位:萬噸.463-.218擷取方法:主體元件分析。轉(zhuǎn)軸方法:具有Kaiser正規(guī)化的最大變異法。元件評分。根據(jù)表八可寫出以下因子得分函數(shù):F=-0.205*廢水排放總量+0.016*化學需氧量排放總量-0.147*氨氮排1放總量+0.393*二氧化硫排放總量+0.309*氮氧化物排放總量+0.463*煙塵灰塵排放總量
F=0.461*廢水排放總量+0.282*化學需氧量排放總量0.427*氨氮排放2總量-0.122*二氧化硫排放總量-0.007*氮氧化物排放總量-0.218*煙塵灰塵排放總量另外,因子得分的均值為0,標準差為1。正值表示高于平均水平,負值表示低于平均水平。地區(qū)因子得分1因子得分2地區(qū)因子得分1因子得分2北京-1.24699-0.57979河南1.089550.97693天津-0.88044-0.73934湖北-0.374430.75745河北2.36983-0.09971湖南-0.464941.17204山西2.03859-1.24591廣東-0.774943.30542內(nèi)蒙古1.81446-0.91302廣西-0.503040.13154遼寧1.047180.15182海南-1.26173-0.76721吉林-0.25843-0.33525重慶-0.55114-0.41907黑龍江0.220970.20172四川-0.309471.03004上海-1.06205-0.24016貴州0.18358-0.85403江蘇0.320921.46441云南-0.20629-0.36888浙江-0.526020.77841西藏-1.24652-1.09844安徽-0.050730.37961陜西0.46793-0.62279福建-0.75070.30179甘肅-0.20203-0.80876江西-0.307840.09465青海-0.82359-1.11995山東1.82861.31332寧夏-0.43681-1.03388新疆0.85653-0.81297五、各地區(qū)的綜合評價可利用因子得分變量對地區(qū)進行對比研究。首先,繪制兩因子得分變量的散點圖,如圖九所示斗noaoa-3ooaoa^20Cfl(H-1JQKIKrOtMtM--1jooooa-jEoaoa-.OMO
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年外研版三年級起點選擇性必修1歷史上冊階段測試試卷
- 2025年牛津上海版七年級生物上冊月考試卷
- 2025年粵教滬科版八年級地理下冊階段測試試卷含答案
- 2025年廣東生態(tài)工程職業(yè)學院高職單招職業(yè)適應性測試近5年常考版參考題庫含答案解析
- 2025年山東特殊教育職業(yè)學院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年山東交通職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025年安徽城市管理職業(yè)學院高職單招職業(yè)適應性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年機械員(設備管理與維護)技能資格知識考試題庫與答案
- 2025年四川現(xiàn)代職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 中考模擬作文:假如我是一名科學家
- 八年級上冊 第三單元 11《簡愛》公開課一等獎創(chuàng)新教學設計
- 中小商業(yè)銀行數(shù)字化轉(zhuǎn)型現(xiàn)狀及對策研究
- 親子非暴力溝通培訓講座
- 保險投訴處理流程培訓
- JJG 707-2014扭矩扳子行業(yè)標準
- 2025財年美國國防預算概覽-美國國防部(英)
- 2024年江西省南昌市中考一模數(shù)學試題(含答案)
- 《采暖空調(diào)節(jié)能技術》課件
- 游戲綜合YY頻道設計模板
- 中興ZCTP 5GC高級工程師認證考試題庫匯總(含答案)
- 大學生創(chuàng)新創(chuàng)業(yè)教程PPT全套完整教學課件
評論
0/150
提交評論