數(shù)學(xué)建模實(shí)用教程(主成分分析)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件_第1頁(yè)
數(shù)學(xué)建模實(shí)用教程(主成分分析)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件_第2頁(yè)
數(shù)學(xué)建模實(shí)用教程(主成分分析)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件_第3頁(yè)
數(shù)學(xué)建模實(shí)用教程(主成分分析)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件_第4頁(yè)
數(shù)學(xué)建模實(shí)用教程(主成分分析)市公開課一等獎(jiǎng)省名師優(yōu)質(zhì)課賽課一等獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

綜合評(píng)價(jià)方法之二

基于數(shù)據(jù)分析幾個(gè)方案

方案一

主成份分析法問(wèn)題實(shí)際背景在現(xiàn)實(shí)生活中,人們往往會(huì)對(duì)樣品搜集盡可能多指標(biāo),比如人口普查往往要調(diào)查每個(gè)人姓名、年紀(jì)、性別、文化程度、住房、職業(yè)、收入、消費(fèi)等幾十項(xiàng)指標(biāo),從搜集資料角度來(lái)看,搜集較多數(shù)據(jù)有利于完整反應(yīng)樣品特征,不過(guò)這些指標(biāo)從統(tǒng)計(jì)角度來(lái)看相互之間含有一定依賴關(guān)系,從而使所觀察數(shù)據(jù)在反應(yīng)信息上有一定重合。處理問(wèn)題之一:降維主成份分析正是針對(duì)這類問(wèn)題而產(chǎn)生,是處理這類題理想工具。

主成份分析也稱主分量分析(principalcomponentsanalysis,PCA)是由美國(guó)科學(xué)家哈羅德·霍特林(HaroldHotelling)于1933年首先提出。人們希望經(jīng)過(guò)克服相關(guān)性、重合性,用較少變量來(lái)代替原來(lái)較多變量,而這種代替能夠反應(yīng)原來(lái)多個(gè)變量大部分信息,這實(shí)際上是一個(gè)“降維”思想。多維數(shù)據(jù)一個(gè)圖形表示方法。

我們知道當(dāng)維數(shù)大于3時(shí)便不能畫出幾何圖形經(jīng)過(guò)主成份分析后,我們能夠選取前兩個(gè)主成份或其中某兩個(gè)主成份,這么既能夠就這兩個(gè)主成份性質(zhì)加以分析,還能夠依據(jù)主成分畫出n個(gè)樣品在二維平面上分布況,由圖形可直觀地看出各樣品在主成分中地位,進(jìn)而還能夠?qū)颖具M(jìn)行分類處理。處理問(wèn)題之二:幾何分析選擇評(píng)價(jià)指標(biāo)體系后經(jīng)過(guò)對(duì)各指標(biāo)加權(quán)方法來(lái)進(jìn)行綜合。不過(guò),怎樣對(duì)指標(biāo)加權(quán)是一項(xiàng)含有挑戰(zhàn)性工作。指標(biāo)加權(quán)依據(jù)是指標(biāo)主要性,指標(biāo)在評(píng)價(jià)中主要性判斷難免帶有一定主觀性,這影響了綜合評(píng)價(jià)客觀性和準(zhǔn)確性。主成份分析法是依據(jù)指標(biāo)間相對(duì)主要性進(jìn)行客觀加權(quán),能夠防止綜合評(píng)價(jià)者主觀影響,所以在實(shí)際應(yīng)用中越來(lái)越受到人們重視。處理問(wèn)題之三:客觀加權(quán)相關(guān)數(shù)學(xué)模型與常見實(shí)例美國(guó)數(shù)學(xué)建模競(jìng)賽題:“評(píng)價(jià)國(guó)家公共衛(wèi)生體系上應(yīng)用”啤酒風(fēng)味評(píng)價(jià)分析實(shí)例我國(guó)部分地域城鎮(zhèn)居民家庭收支基本情況分析實(shí)例

主成分分析的基本思想明確信息量大數(shù)學(xué)意義我們知道,當(dāng)一個(gè)變量只取一個(gè)數(shù)據(jù)時(shí),這個(gè)變量(數(shù)據(jù))提供信息量是非常有限,當(dāng)這個(gè)變量取一系列不一樣數(shù)據(jù)時(shí),我們能夠從中讀出最大值、最小值、平均數(shù)等信息。變量變異性越大,說(shuō)明它對(duì)各種場(chǎng)景“遍歷性”越強(qiáng),提供信息就愈加充分,信息量就越大。主成份分析中信息,就是指標(biāo)變異性,用標(biāo)準(zhǔn)差或方差表示它。為了便于了解以兩個(gè)指標(biāo)為例:主成份確定準(zhǔn)則:信息損失小,之間重合少假設(shè)共有n個(gè)樣品,每個(gè)樣品都測(cè)量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系x1-O-x2中,觀察散點(diǎn)分布,單獨(dú)看這n個(gè)點(diǎn)分量X1和X2,它們沿著x1方向和x2方向都含有較大離散性,其離散程度能夠分別用X1方差和X2方差測(cè)定。假如僅考慮X1或X2中任何一個(gè)分量,那么包含在另一分量中信息將會(huì)損失,所以,直接舍棄某個(gè)分量不是“確定主成份”有效方法。確定第一主成份方法實(shí)際上,散點(diǎn)分布總有可能沿著某一個(gè)方向略顯擴(kuò)張,這個(gè)方向就把它看作橢圓長(zhǎng)軸方向。結(jié)論:為第一主成份,為第二主成份。主成份數(shù)學(xué)模型:推廣普通主成份確定模型主成份分析數(shù)學(xué)模型是,設(shè)p個(gè)變量組成q維隨機(jī)向量為X=(X1,…,Xp)′對(duì)X作正交變換,令Y=T′X,其中T為正交陣,要求Y各分量是不相關(guān),而且Y第一個(gè)分量方差是最大,第二個(gè)分量方差次之,……,等等。為了保持信息不丟失,Y各分量方差和與X各分量方差和相等。Y是列向量T為正交陣有:T’T=I;T’=T^(-1)新舊變量關(guān)系表示式新指標(biāo)方差及它們協(xié)方差:其中表示方差,Cov表示協(xié)方差,表示X協(xié)方差陣主成份確定條件:第一主成份為,滿足,而且使得到達(dá)最大。第二主成份為,滿足,使得到達(dá)最大。普通情形,第主成份為,滿足,且(),使得到達(dá)最大。第一主成份求法第二主成份求法第主成份求法結(jié)論:主成份保持信息總量不少主成份個(gè)數(shù)確定標(biāo)準(zhǔn)第個(gè)主成份貢獻(xiàn)率:主成份個(gè)數(shù)確定標(biāo)準(zhǔn)

主成分分析的步驟結(jié)構(gòu)樣本陣樣本陣,其中是樣本容量即評(píng)價(jià)對(duì)象,是評(píng)價(jià)指標(biāo)個(gè)數(shù),是第個(gè)樣本中采集第項(xiàng)評(píng)價(jià)指標(biāo)值。

指標(biāo)正向化正向指標(biāo)是伴隨該指標(biāo)值增加總系統(tǒng)評(píng)價(jià)結(jié)果越好,因而轉(zhuǎn)化公式為轉(zhuǎn)化后樣本陣

指標(biāo)規(guī)范化為克服單位差異對(duì)評(píng)價(jià)結(jié)果影響,須將指標(biāo)規(guī)范化其中,

協(xié)方差矩陣:也是樣本陣相關(guān)系數(shù)陣顯然,協(xié)方差矩陣也是相關(guān)系數(shù)矩陣確定主成份結(jié)構(gòu)綜合評(píng)價(jià)函數(shù)1.求權(quán)值公式:2.結(jié)構(gòu)綜合評(píng)價(jià)函數(shù)這里我們應(yīng)該注意,從本質(zhì)上說(shuō)綜合評(píng)價(jià)函數(shù)是對(duì)原始指標(biāo)線性綜合,從計(jì)算主成份到對(duì)之加權(quán),經(jīng)過(guò)兩次線性運(yùn)算后得到綜合評(píng)價(jià)函數(shù)。

啤酒風(fēng)味評(píng)價(jià)實(shí)例分析題目:啤酒是個(gè)多指標(biāo)風(fēng)味食品,為了全方面了解啤酒風(fēng)味,啤酒企業(yè)開發(fā)了大量檢測(cè)方法用于分析啤酒指標(biāo),不過(guò)面對(duì)大量指標(biāo)數(shù)據(jù),大多數(shù)企業(yè)又感到茫然,不知道怎樣利用這些大量數(shù)據(jù),來(lái)對(duì)各品牌啤酒加以評(píng)價(jià),由上面介紹可知,在這種情況下,主成份分析法較為適合。結(jié)構(gòu)樣本陣(1)確定原始評(píng)價(jià)指標(biāo):即未經(jīng)簡(jiǎn)化指標(biāo)m個(gè)本題選有:乙醛、乙酸乙酯、異丁酯、乙酸異戊酯、異戊醇及己酸乙酯(m=6)(2)確定評(píng)價(jià)對(duì)象:即定抽樣,普通樣本容量n個(gè)本題選有:百威啤酒、喜力啤酒和青島啤酒,南方某種啤酒(n=4)(3)采集樣本數(shù)據(jù):采集4個(gè)樣本對(duì)應(yīng)指標(biāo),得到4個(gè)6維隨機(jī)向量。(4)結(jié)構(gòu)樣本陣:

。本題樣本陣乙醛乙酸乙酯異丁酯乙酸異戊酯異戊醇己酸乙酯百威啤酒1.22.33.10.72.14.5喜力啤酒2.13.25.16.47.61.3青島啤酒1.10.62.13.11.93南方某品牌2.31.54.13.213結(jié)構(gòu)標(biāo)準(zhǔn)化陣Z

指標(biāo)規(guī)范化為克服單位差異對(duì)評(píng)價(jià)結(jié)果響,須將樣本陣元素規(guī)范化,得標(biāo)準(zhǔn)化矩陣Z其中本題標(biāo)準(zhǔn)化矩陣-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.049362相關(guān)系數(shù)矩陣:對(duì)角元為1實(shí)對(duì)稱

本題相關(guān)系數(shù)陣

乙醛乙酸乙酯異丁酯乙酸異戊酯異戊醇己酸乙酯乙醛1乙酸乙酯0.4210551異丁酯0.8633970.8137331乙酸異戊酯0.6056130.4222220.6844671異戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.775321相關(guān)系數(shù)陣特征值及向量(1)解樣本相關(guān)系數(shù)矩陣R特征方程

得6個(gè)特征根,(2)確定主成份個(gè)數(shù)k:并由大到小排列:

使信息利用率達(dá)85%以上,

(3)結(jié)構(gòu)個(gè)主成份:

對(duì)每個(gè)λj,j=1,2,...,k,解得單位特征向量

則第j個(gè)主成份本題k=2,利用率d=45.1%+38.2%=83.3%結(jié)構(gòu)綜合評(píng)價(jià)價(jià)值函數(shù):(1)首先結(jié)構(gòu)權(quán)向量:其中

(2)結(jié)構(gòu)價(jià)值函數(shù):

本題結(jié)果:綜合結(jié)論:由好到差排序喜力啤酒

百威啤酒

青島啤酒南方某種啤酒隨機(jī)向量X方差協(xié)方差陣對(duì)角線上元素主成份方差協(xié)方差矩陣對(duì)角線元素正交矩陣T中對(duì)應(yīng)第k行第i列元素主成份因子載荷量:主成份因子載荷量:以為坐標(biāo)畫圖分析結(jié)果分析:從圖能夠看出,主成份1主要由乙酸乙酯、乙酸異戊酯和己酸乙酯決定,這些酯含量高,主成份1就越大,即主成份1代表了啤酒酯香,酯香越濃,主成份1就越大。主成份2主要由乙醛、異丁醇和異戊醇決定,這些成份能夠代表啤酒“酒勁”大小,這些成份含量越高,主成份2就越大,即啤酒酒味就越重。

模型結(jié)果分析(2):各樣本主成份各樣本主成份分析圖結(jié)論:關(guān)于個(gè)樣本結(jié)論結(jié)合這種解釋,就能夠?qū)D2中分類做出分析,其中百威啤酒是酒味適中和酯香相對(duì)較濃“濃香型”啤酒,喜力啤酒是酒味和酯香均較濃“濃醇型”啤酒青島啤酒是酒味較重,而酯香較弱“醇型”啤酒某品牌啤酒則是酒味和酯香均弱“淡型”啤酒。

SPSS實(shí)現(xiàn)主成份分析某市工業(yè)部門13個(gè)行業(yè)8項(xiàng)主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),這8項(xiàng)經(jīng)濟(jì)指標(biāo)分別是: X1:年末固定資產(chǎn)凈值,單位:萬(wàn)元; X2:職員人數(shù)據(jù),單位:人; X3:工業(yè)總產(chǎn)值,單位:萬(wàn)元; X4:全員勞動(dòng)生產(chǎn)率,單位:元/人年; X5:百元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值,單位:元; X6:資金利稅率,單位:%; X7:標(biāo)準(zhǔn)燃料消費(fèi)量,單位:噸; X8:能源利用效果,單位:萬(wàn)元/噸。樣本陣請(qǐng)問(wèn):怎樣從這些經(jīng)濟(jì)指標(biāo)出發(fā),對(duì)各工業(yè)部門進(jìn)行綜合評(píng)價(jià)與排序?我們目標(biāo)是:先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,得到相關(guān)矩陣R以后,計(jì)算該矩陣8個(gè)特征值及對(duì)應(yīng)特征向量。由下式建立8個(gè)主成份:分別計(jì)算各主成份(一)利用SPSS進(jìn)行因子分析將原始數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,將8個(gè)變量分別命名為X1~X8

。在SPSS窗口中選擇Analyze→DataReduction→Factor菜單項(xiàng),調(diào)出因子分析主界面,并將變量X1~X8移入Variables框中,其它均保持系統(tǒng)默認(rèn)選項(xiàng),單擊OK按鈕,執(zhí)行因子分析過(guò)程。因子提取方法:主成份用相關(guān)矩陣提取特征向量用X方差協(xié)方差陣進(jìn)行分析:默認(rèn)數(shù)據(jù)無(wú)標(biāo)準(zhǔn)化由R矩陣計(jì)算特征根前兩個(gè)特征根方差解釋度到達(dá)80%Total列為各因子對(duì)應(yīng)特征根,本例中共提取兩個(gè)公因子;%ofVariance列為各因子方差貢獻(xiàn)率;Cumulative%列為各因子累積方差貢獻(xiàn)率,由表中能夠看出,前兩個(gè)因子已經(jīng)能夠解釋79.31%方差(二)利用因子分析結(jié)果進(jìn)行主成份分析 1.將下表中因子載荷陣中數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,分別命名為a1和a2。2.為了計(jì)算第一個(gè)特征向量,點(diǎn)擊菜單項(xiàng)中Transform→Compute,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:z1=a1/SQRT(2.576) 點(diǎn)擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名第一特征向量。 再次調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:z2=a2/SQRT(1.389) 點(diǎn)擊OK按鈕,得到以z2為變量名第二特征向量。這么,我們得到了特征向量矩陣:從而有,兩個(gè)主成份表示式:3.再次使用Compute命令,就能夠計(jì)算得到兩個(gè)主成份。以下我們用SPSS對(duì)上例中13個(gè)行業(yè)綜合排序:進(jìn)入SPSSfactor分析窗口,用對(duì)應(yīng)命令取得以下結(jié)果:對(duì)R矩陣計(jì)算得到特征值得到因子載荷陣:此時(shí)僅提取前3個(gè)因子,已經(jīng)能夠解釋86%原變量方差利用載荷陣與特征向量之間關(guān)系,我們計(jì)算前三個(gè)特征向量:T1T2T3.4767.2961.1037.4727.2779.1628.4239.3778.1566-.2128.4512-.0083-.3882.3308.3215-.3524.4030.1452.2151-.3772.1400.0550.2726-.8918這三個(gè)主成份Y是在標(biāo)準(zhǔn)化數(shù)據(jù)基礎(chǔ)上提煉得到,所以在計(jì)算綜合得分時(shí),要注意先將原始數(shù)據(jù)標(biāo)準(zhǔn)化。由上表看出,第一主成份除了與X8相關(guān)性最弱以外,基本反應(yīng)了其它7個(gè)原始變量信息;第二主成份與8個(gè)原始變量相關(guān)性都差不多,也是綜合反應(yīng)了信息;第三個(gè)主成份僅與X8相關(guān)性最高,主要反應(yīng)了工業(yè)行業(yè)中能源利用率問(wèn)題。所以,我們得到三個(gè)主成份詳細(xì)表示式:接下來(lái),利用各特征值方差貢獻(xiàn)率做權(quán)重計(jì)算各行業(yè)綜合得分:行業(yè)Y1Y2Y3綜合得分排名冶金1.475250.758590.537770.909852電力0.49833-2.591150.22756-0.7186413煤炭1.05657-3.224610.40801-0.7104512化學(xué)0.460071.18356-0.998750.491083機(jī)器4.528142.26223

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論