主成分分析法在糧食產(chǎn)量中的應(yīng)用_第1頁
主成分分析法在糧食產(chǎn)量中的應(yīng)用_第2頁
主成分分析法在糧食產(chǎn)量中的應(yīng)用_第3頁
主成分分析法在糧食產(chǎn)量中的應(yīng)用_第4頁
主成分分析法在糧食產(chǎn)量中的應(yīng)用_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、主成分分析法在糧食產(chǎn)量中的應(yīng)用摘 要主成分分析的基本思想是設(shè)法將原來指標重新組合成一組新的互相無關(guān)的幾個綜合指標來代替原指標,并根據(jù)實際需要從中取幾個較少的綜合指標盡可能多的反映原來指標的信息。主成分分析法適合處理一些多變量,數(shù)據(jù)大的問題,具有廣泛的應(yīng)用。本文利用主成分分析法的方法對糧食產(chǎn)量問題予以分析。由于糧食產(chǎn)量受多個因素的影響,所以利用主成分分析法中降維的思想,通過多元回歸分析,得到回歸預(yù)測的模型。由于預(yù)測的模型存在共線的可能,所以進一步對所預(yù)測的模型進行檢驗,從而得到最優(yōu)的模型?!娟P(guān)鍵詞】 主成分分析 因子分析 糧食問題principal component analysis and

2、its applicationsabstractthe basic idea of principal component analysis is to try to reassemble the original indicators into a new set of several mutually independent comprehensive index to replace the original index, and according to the actual need to be taken several less comprehensive index as mu

3、ch as possible to reflect the original indicators information. principal component analysis method is suitable to deal with some multivariate data big problem, with a wide range of applications.in this paper, the principal component analysis methods are analyzed for food production problems. because

4、 food production affect multiple factors, so the use of principal component analysis in dimensionality reduction ideas, through multiple regression analysis, regression prediction model. may be due to the presence of the line model prediction, the prediction model further tested to obtain the optima

5、l model. 【 key words】principal component analysis factor analysis food issues目 錄一、引言1二、主成分分析法的基本概念1(一)主成分分析法的簡介1(二)主成分分析法的特點1(三)主成分分析法的基本原理1三、主成分分析法的應(yīng)用2(一)問題的提出2(二)樣本數(shù)據(jù)的選擇2(三)問題分析3(四)定義變量3(五)用spss進行主成分分析的步驟3(六)模型的建立與求解4四、結(jié)束語9參考文獻:9致謝11主成分分析及其應(yīng)用 一、引言主成分分析也稱主分量分析,是利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標。在實際問題的研究中,為了全

6、面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標,在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。本文主要針對我國的糧食問題,采用主成分分析的方法,利用spss軟件對影響我國糧食產(chǎn)量的因素做出分析,從而得到最優(yōu)的預(yù)測模型。二、主成分分析法的基本概念(一)主成分分析法的簡介主成分分析法主要是將影響問題的多種因素簡化,把有相關(guān)性的因素刪除,通過剩下的主要因素來分析問題。例如,企業(yè)活動中的活動項目數(shù)與項目經(jīng)費、經(jīng)費支出等之間會存在較高的相關(guān)性;學(xué)生綜合測評中的基礎(chǔ)

7、課成績和選修課成績、獲獎學(xué)金次數(shù)等之間也會存在較高的相關(guān)性。因而我們通過運用主成分分析法來解決多變量的問題。主成分分析法principal component analysis(pca)是一種數(shù)學(xué)變換的方法, 它把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量按照方差依次遞減的順序排列。在數(shù)學(xué)變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關(guān),稱為第二主成分。依次類推,個變量就有個主成分。(二)主成分分析法的特點主成分分析法是在不丟失重要信息的基礎(chǔ)下,把眾多的變量縮減為幾個主要因素,縮減后的變量通常有以下特點:1.

8、縮減后的主要成分的個數(shù)小于原來變量的個數(shù)。2.縮減后的主要成分必須含有大部分的原始信息。3.縮減后的主要成分應(yīng)該不再具有相關(guān)性。4.主成分具有命名解釋性。(三)主成分分析法的基本原理主成分分析實際上是一種降維方法。主要思想是將原本具有相關(guān)性的多個變量(例如個變量),通過降維,選出新的數(shù)量較少的不相關(guān)變量,組成新的綜合性指標來代替原來指標。設(shè)為原變量中的第一個具有線性相關(guān)的主成分指標,即,由數(shù)學(xué)知識可知,每一個主成分所提取的信息量可用其方差來度量,其方差越大,表示包含的信息越多。常常希望第一主成分所含的信息量最大,因此在所有的線性組合中選取的應(yīng)該是的所有線性組合中方差最大的,故稱為第一主成分。如

9、果第一主成分不足以代表原來個指標的信息,再考慮選取第二個主成分指標,為有效地反映原信息,已有的信息就不需要再出現(xiàn)在中,即與要保持獨立、不相關(guān),用數(shù)學(xué)語言表達就是其協(xié)方差,所以是與不相關(guān)的的所有線性組合中方差最大的,故稱為第二主成分,依此類推構(gòu)造出的為原變量指標第一、第二、第個主成分。根據(jù)以上分析得知:(1)與互不相關(guān),即。(2) 是的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即是與都不相關(guān)的的所有線性組合中方差最大者。為構(gòu)造的新變量指標,即原變量指標的第1、第2、第個主成分。 三、主成分分析法的應(yīng)用(一)問題的提出糧食是國家的根本,失去糧食或者缺少糧食不僅會對我們個人的生活產(chǎn)生影響,對國家

10、乃至世界都會有很大的沖擊。在我國,人口數(shù)量龐大,對糧食的需求量也相應(yīng)增大,因此要使糧食品種的產(chǎn)和銷、供與求滿足動態(tài)的平衡,確保生產(chǎn)足夠數(shù)量的糧食。而糧食的產(chǎn)量是隨著投入生產(chǎn)要素的變化而變化的,反映出投入與產(chǎn)出之間存在著一種數(shù)量關(guān)系,這種關(guān)系可以用一種數(shù)學(xué)表達式表現(xiàn)出來,這種表達式常稱作生產(chǎn)函數(shù)。而本文將利用主成分分析法,研究糧食產(chǎn)量與影響因素之間的關(guān)系,以此尋找糧食穩(wěn)定增產(chǎn)的有效途徑(二)樣本數(shù)據(jù)的選擇全文以2009年版的中國統(tǒng)計年鑒2009為資料來源,用到了1995年到2008年14年的數(shù)據(jù)作為樣本點。利用spss軟件,建立以糧食的播種面積、成災(zāi)面積、有效灌溉面積、農(nóng)業(yè)機械總動力和農(nóng)業(yè)化肥施

11、用量為變量的多元線性回歸模型,對影響糧食產(chǎn)量的因素進行實證分析。表1年份糧食產(chǎn)量(萬噸)/y播種面積(千公頃)/x1成災(zāi)面積(千公頃)/x2農(nóng)用機械總動力(萬千瓦)/x3有效灌溉面積(千公頃)/x4化肥施用量(萬噸)/x51995 46662 110060 45824 36118 49281 3594 1996 50454 112548 46991 38547 50381 3828 1997 49417 112912 53427 42016 51239 3981 1998 51230 113787 50145 45208 52296 4084 1999 50839 113161 49980 4

12、8996 53158 4124 2000 46218 108463 54688 52574 53820 4146 2001 45264 106080 52215 55172 54249 4254 2002 45706 103891 46946 57930 54355 4339 2003 43070 99410 54506 60387 54014 4412 2004 46947 101606 37106 64028 54478 4637 2005 48402 104278 38818 68398 55029 4766 2006 49804 104958 41091 72522 55750 492

13、8 2007 50160 105638 48992 76590 56518 5108 2008 52871 106793 39990 82190 58472 5239 數(shù)據(jù)來源:2009年版的中國統(tǒng)計年鑒2009(三)問題分析每年的糧食產(chǎn)量受很多因素的影響,例如勞動生產(chǎn)力,環(huán)境氣候變化,技術(shù)提高等,為了包含這些基本因素,本文選擇了以農(nóng)業(yè)化肥施用量、糧食播種面積、成災(zāi)面積、有效灌溉面積、農(nóng)業(yè)機械總動力等為解釋變量,以糧食產(chǎn)量為被解釋變量。(四)定義變量:表示糧食產(chǎn)量(萬噸);: 表示糧食播種面積(千萬頃);: 表示成災(zāi)面積(公頃);: 表示農(nóng)業(yè)機械總動力(萬千瓦);: 表示有效灌溉面積(千公頃)

14、;: 表示化肥施用量(萬噸);(五)用spss進行主成分分析的步驟1.利用spss對模型進行初步擬合(1)將原始數(shù)據(jù)輸入spss數(shù)據(jù)編輯窗口并命名。(2)在spss窗口點擊分析,選擇回歸分析中的線性菜單項,調(diào)出線性回歸的主界面。(3)將變量移入相應(yīng)變量框。(4)方法選擇:enter。點擊統(tǒng)計按鈕,選擇我們想要觀察的選項,例如:回歸系數(shù)的估計、模型擬合、共線性診斷等。(5)點擊確定。通過以上步驟即可得到最終模型的擬合優(yōu)度檢驗表、方差分析表、系數(shù)分析表、共線性診斷表等。2.利用spss進行因子分析(1)在spss窗口中點擊分析,選擇數(shù)據(jù)縮減中的因子分析菜單項,調(diào)出因子分析主界面。(2)將變量移入變

15、量框。(3)點擊描述,在相關(guān)矩陣中點擊系數(shù)和顯著性水平,然后點擊繼續(xù)。其他均為系統(tǒng)默認選項。(4)點擊確定。通過如上步驟即可得到特征根和方差貢獻率和因子載荷陣表。3.利用spss對模型進行逐步回歸(1)在spss窗口點擊分析,選擇回歸分析中的線性菜單項,調(diào)出線性回歸的主界面。(2)將變量移入變量框。(3)方法選擇:stepwise。點擊統(tǒng)計按鈕,選擇同之前一樣的選項。(4)點擊確定。通過以上步驟即可得到擬合的模型中只包含有用變量的相關(guān)分析表。(六)模型的建立與求解1. 多元回歸模型的初步建立與初步檢驗1.1多元回歸模型的初步建立(1)對糧食產(chǎn)量與糧食播種面積、成災(zāi)面積、農(nóng)業(yè)機械總動力、有效灌溉

16、面積、化肥施用量建立一個回歸模型:(注:是待定系數(shù))(2)利用spss軟件,通過最小二乘估計得到系數(shù)的估計值,如表2。表2 系數(shù)分析表coefficientsmodelunstandardized coefficientsstandardized coefficientstsig.bstd. errorbeta(constant)播種面積成災(zāi)面積農(nóng)用機械總動力有效灌溉面積化肥施用量-36622.5090.618-0.119-0.149-0.1329.08616184.8350.0770.0390.1730.3793.6521.017-0.255-0.775-0.1161.600-2.2637.

17、977-3.035-0.866-0.3492.4880.0530.0000.0160.4120.7360.038dependent variable: 糧食產(chǎn)量b是待定系數(shù)值;std. error是標準誤差;t檢驗是比較平均值的方法,sig值是t值的顯著性,它的意思是說,平均值是在百分之幾的概率上是相等的。所以t和sig兩者是等效的,看sig就夠了。sig值要求小于給定的顯著性水平,一般是0.05、0.01等,sig越接近于0越好。一般將這個sig值與0.05相比較,如果它大于0.05,說明平均值在大于5%的幾率上是相等的,而在小于95%的幾率上不相等。我們認為平均值相等的幾率還是比較大的,說

18、明差異是不顯著的,從而認為兩組數(shù)據(jù)之間平均值是相等的。如果它小于0.05,說明平均值在小于5%的幾率上是相等的,而在大于95%的幾率上不相等。我們認為平均值相等的幾率還是比較小的,說明差異是顯著的,從而認為兩組數(shù)據(jù)之間平均值是不相等的。(3)確定初步模型方程由表2可以看到b對應(yīng)的一列即為待定系數(shù)值,便可得到初步擬合后的多元回歸線性方程:1.2多元回歸模型的初步檢驗表3 最終模型的擬合優(yōu)度檢驗表 model summarymodelrr squareadjustedr squarestd. error of the estimate10.9840.9680.949626.81275predict

19、ors: (constant), 化肥施用量, 成災(zāi)面積, 播種面積, 有效灌溉面積, 農(nóng)用機械總動力dependent variable: 糧食產(chǎn)量是相關(guān)系數(shù);r square是相關(guān)系數(shù)的平方,又稱判定系數(shù),判定線性回歸的擬合程度,越大越好,一般的,大于0.8說明方程對樣本點的擬合效果很好,0.50.8之間也可以接受;adjust r square是調(diào)整后的判定系數(shù);std. error of the estimate是估計標準誤差。表4 回歸模型的方差分析表anovamodelsum of squaresdfmean squarefsig.regressionresidualtotal96

20、49826131431539964141458131929965239289449.1270.000predictors: (constant), 化肥施用量, 成災(zāi)面積, 播種面積, 有效灌溉面積, 農(nóng)用機械總動力dependent variable: 糧食產(chǎn)量f是檢驗方程顯著性的統(tǒng)計量,是平均回歸平方和與平均剩余平方和之比,越大越好。“sig”,sig=significance,意為“顯著性”,后面的值就是統(tǒng)計出來的p值,如果p值是 ,則為差異顯著,如果,則差異極顯著。(1)從表3可以看到,,很接近1,表明模型擬合程度很好。而表4中的,而查表得,所以,并且f檢驗的顯著性概率(sig)為0.

21、000,反映變量間呈高度線性。因此,我們可以得出結(jié)論:之間存在顯著的線性關(guān)系。(2)但從表2總的t檢驗的顯著性概率(sig)可以看出的參數(shù)大于顯著性水平,說明差異不顯著,所以沒有通過檢驗。我們首先考慮在變量間可能存在多重共線性。2.優(yōu)化模型2.1因子分析診斷表5 kmo檢驗和巴特利球體檢驗表kmo and bartletts testkaiser-meyer-olkin measure of sampling adequacy.0.589bartletts test of sphericityapprox. chi-squaredfsig.90.78100.000可以看到kmo的檢驗系數(shù),巴特

22、利球體檢驗的統(tǒng)計值的顯著性概率,滿足做因子分析的條件,可以進行因子分析。表6 變量間的相關(guān)系數(shù)矩陣表correlation matrix播種面積成災(zāi)面積農(nóng)用機械總動力有效灌溉面積化肥施用量correlation播種面積成災(zāi)面積農(nóng)用機械總動力有效灌溉面積化肥施用量1.0000.311-0.649-0.565-0.5720.3111.000-0.491-0.370-0.508-0.649-0.4911.0000.9680.990-0.565-0.3700.9681.0000.954-0.572-0.508-0.9900.9541.000從表6相關(guān)系數(shù)矩陣中,我們可以發(fā)現(xiàn),具有高度相關(guān)性。表7 總方

23、差解釋表total variance explainedcomponentinitial eigenvaluestotal% of variancecumulative %123453.6590.7450.5570.0360.00373.17914.89911.1380.7200.06473.17988.07799.21699.936100.00initial eigenvalues是初始特征根;從總方差解釋中可以看出,只有變量的特征值是大于1的,所有適合作為降維的公因子,它解釋的累積方差為73.179%。表8 變量的因子載荷陣表component matrixcomponent1播種面積成災(zāi)

24、面積農(nóng)用機械總動力有效灌溉面積化肥施用量-0.718-0.5830.9870.9410.971在因子載荷矩陣中,我們可以看出,第一個主成分因子是和高度相關(guān)的。2.2模型建立在因子分析的基礎(chǔ)上,我們使用spss軟件中的逐步分析,來觀測模型的擬合。 表9 最終模型擬合的優(yōu)度檢驗表model summarydmodelrr squareadjusted r squarestd. error of the estimatedurbin-watson1230.590a0.947b0.979c0.3480.8970.9580.2940.8780.9462326.74253966.42299645.9000

25、41.750a:predictors: (constant), 播種面積b:predictors: (constant), 播種面積, 化肥施用量c:predictors: (constant), 播種面積, 化肥施用量, 成災(zāi)面積d:dependent variable: 糧食產(chǎn)量 從表9中可以看出:第一種建立的模型(即只有一個變量)的,調(diào)整后的為0.294;第二種建立的模型(即有兩個變量)的,調(diào)整后的為0.878;第三種建立的模型(即有三個變量)的,調(diào)整后的為0.946。因為值越接近1,擬合程度越好,所以由值我們可以得出第三種模型的擬合程度較好。表10 方差分析表anovamodelsum

26、 of squaresdfmean squarefsig.1regressionresidualtotal346766456496476999641414112133467664554137306.4050.026a2regressionresidualtotal893677071027370799641414211134468385393397347.8430.000b3regressionresidualtotal95469546417186899641414310133182318241718676.2800.000ca:predictors: (constant), 播種面積b:pre

27、dictors: (constant), 播種面積, 化肥施用量c:predictors: (constant), 播種面積, 化肥施用量, 成災(zāi)面積d:dependent variable: 糧食產(chǎn)量 從表10中可以看出:第一種模型的,,并且sig.=0.026;第二種模型的,并且sig.=0.000;第三種模型的,并且sig.=0.000。看f檢驗的顯著性概率sig的數(shù)值,在0.01至0.05之間就是顯著,小于0.01就是極顯著。所以由表中的sig我們也可以看出第三種模型的擬合程度最好。表11系數(shù)分析表coefficientsamodelunstandardized coefficient

28、sstandardized coefficientstsig.bstd.errorbeta1(constant)播種面積9851.4470.35915228.340.1420.5900.6472.5310.5300.0262(constant)播種面積化肥施用量-46430.50.6735.1319700.650.0720.6701.1070.904-4.7869.3777.6520.0010.0000.0003(constant)播種面積化肥施用量成災(zāi)面積-37137.60.6784.330-0.1346923.740.0480.4950.0351.1160.763-0.287-5.3641

29、4.1338.753-3.8240.0000.0000.0000.003a:dependent variable: 糧食產(chǎn)量 從表11我們可以看出三種模型擬合的參數(shù),由此可寫出方程:第一種模型方程:;第二種模型方程:;第三種模型方程:。根據(jù)和,得出的結(jié)論,我們可以確定模型最佳的擬合方程為。2.3 最終模型的確定最后的回歸方程為:通過以上分析,我們可以得到結(jié)論:糧食的產(chǎn)量與播種面積,受災(zāi)面積,化肥施用量有密切關(guān)系。經(jīng)濟解釋: 播種面積每增加1千公頃,糧食產(chǎn)量就增加0.678萬噸。 成災(zāi)面積每增加1千公頃,糧食產(chǎn)量就減少0.134萬噸。化肥施用量每增加1萬噸,糧食產(chǎn)量就增加4.330萬噸,說明對我國的糧食產(chǎn)量的影響較大。2.4 結(jié)論與建議經(jīng)過實證分析,糧食產(chǎn)量的主要受化肥施用量、播種面積和成災(zāi)面積的影響。播種面積的增加和成災(zāi)面積的減少使糧食產(chǎn)量增加,化肥施用量的增加使得糧食產(chǎn)量增加,但在實際中,有限的土地上只能施用有限的化肥。近年來城市化和工業(yè)化不得不再占用耕地,在耕地不足的情況下,為減少污染而將減少化肥施用的情況下,糧食產(chǎn)量將更多的依賴于技術(shù)進步。以下總結(jié)了四點糧食增產(chǎn)的建議。第一,加強耕地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論