![數(shù)學(xué)建模實(shí)用教程(主成分分析)_第1頁](http://file4.renrendoc.com/view/4ffa1c0c4d620fde477888d2689c5fb0/4ffa1c0c4d620fde477888d2689c5fb01.gif)
![數(shù)學(xué)建模實(shí)用教程(主成分分析)_第2頁](http://file4.renrendoc.com/view/4ffa1c0c4d620fde477888d2689c5fb0/4ffa1c0c4d620fde477888d2689c5fb02.gif)
![數(shù)學(xué)建模實(shí)用教程(主成分分析)_第3頁](http://file4.renrendoc.com/view/4ffa1c0c4d620fde477888d2689c5fb0/4ffa1c0c4d620fde477888d2689c5fb03.gif)
![數(shù)學(xué)建模實(shí)用教程(主成分分析)_第4頁](http://file4.renrendoc.com/view/4ffa1c0c4d620fde477888d2689c5fb0/4ffa1c0c4d620fde477888d2689c5fb04.gif)
![數(shù)學(xué)建模實(shí)用教程(主成分分析)_第5頁](http://file4.renrendoc.com/view/4ffa1c0c4d620fde477888d2689c5fb0/4ffa1c0c4d620fde477888d2689c5fb05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
綜合評(píng)價(jià)方法之二
基于數(shù)據(jù)分析幾種方案
方案一
主成份分析法問題實(shí)際背景在現(xiàn)實(shí)生活中,人們往往會(huì)對(duì)樣品收集盡可能多的指標(biāo),例如人口普查往往要調(diào)查每個(gè)人的姓名、年齡、性別、文化程度、住房、職業(yè)、收入、消費(fèi)等幾十項(xiàng)指標(biāo),從收集資料的角度來看,收集較多的數(shù)據(jù)有利于完整反映樣品的特征,但是這些指標(biāo)從統(tǒng)計(jì)角度來看相互之間具有一定的依賴關(guān)系,從而使所觀測(cè)的數(shù)據(jù)在反映信息上有一定重疊。解決的問題之一:降維主成份分析正是針對(duì)這類問題而產(chǎn)生的,是解決這類題的理想工具。
主成分分析也稱主分量分析(principalcomponentsanalysis,PCA)是由美國(guó)的科學(xué)家哈羅德·霍特林(HaroldHotelling)于1933年首先提出的。人們希望通過克服相關(guān)性、重疊性,用較少的變量來代替原來較多的變量,而這種代替可以反映原來多個(gè)變量的大部分信息,這實(shí)際上是一種“降維”的思想。多維數(shù)據(jù)的一種圖形表示方法。
我們知道當(dāng)維數(shù)大于3時(shí)便不能畫出幾何圖形經(jīng)過主成分分析后,我們可以選取前兩個(gè)主成分或其中某兩個(gè)主成分,這樣既可以就這兩個(gè)主成分性質(zhì)加以分析,還可以根據(jù)主成分畫出n個(gè)樣品在二維平面上的分布況,由圖形可直觀地看出各樣品在主成分中的地位,進(jìn)而還可以對(duì)樣本進(jìn)行分類處理。解決的問題之二:幾何分析選擇評(píng)價(jià)指標(biāo)體系后通過對(duì)各指標(biāo)加權(quán)的辦法來進(jìn)行綜合。但是,如何對(duì)指標(biāo)加權(quán)是一項(xiàng)具有挑戰(zhàn)性的工作。指標(biāo)加權(quán)的依據(jù)是指標(biāo)的重要性,指標(biāo)在評(píng)價(jià)中的重要性判斷難免帶有一定的主觀性,這影響了綜合評(píng)價(jià)的客觀性和準(zhǔn)確性。主成分分析法是根據(jù)指標(biāo)間的相對(duì)重要性進(jìn)行客觀加權(quán),可以避免綜合評(píng)價(jià)者的主觀影響,所以在實(shí)際應(yīng)用中越來越受到人們的重視。解決的問題之三:客觀加權(quán)有關(guān)數(shù)學(xué)模型與常見實(shí)例2008年美國(guó)數(shù)學(xué)建模競(jìng)賽題:“評(píng)價(jià)國(guó)家公共衛(wèi)生體系上的應(yīng)用
”啤酒風(fēng)味評(píng)價(jià)分析實(shí)例我國(guó)部分地區(qū)城鎮(zhèn)居民家庭收支基本情況分析實(shí)例
主成分分析的基本思想明確信息量大數(shù)學(xué)意義我們知道,當(dāng)一個(gè)變量只取一個(gè)數(shù)據(jù)時(shí),這個(gè)變量(數(shù)據(jù))提供的信息量是非常有限的,當(dāng)這個(gè)變量取一系列不同數(shù)據(jù)時(shí),我們可以從中讀出最大值、最小值、平均數(shù)等信息。變量的變異性越大,說明它對(duì)各種場(chǎng)景的“遍歷性”越強(qiáng),提供的信息就更加充分,信息量就越大。主成分分析中的信息,就是指標(biāo)的變異性,用標(biāo)準(zhǔn)差或方差表示它。為了便于理解以兩個(gè)指標(biāo)為例:主成分確定的準(zhǔn)則:信息損失小,之間重疊少假設(shè)共有n個(gè)樣品,每個(gè)樣品都測(cè)量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系x1-O-x2中,觀察散點(diǎn)的分布,單獨(dú)看這n個(gè)點(diǎn)的分量X1和X2,它們沿著x1方向和x2方向都具有較大的離散性,其離散的程度可以分別用的X1方差和X2的方差測(cè)定。如果僅考慮X1或X2中的任何一個(gè)分量,那么包含在另一分量中的信息將會(huì)損失,因此,直接舍棄某個(gè)分量不是“確定主成分”的有效辦法。確定第一主成分方法事實(shí)上,散點(diǎn)的分布總有可能沿著某一個(gè)方向略顯擴(kuò)張,這個(gè)方向就把它看作橢圓的長(zhǎng)軸方向。結(jié)論:為第一主成分,為第二主成分。主成分的數(shù)學(xué)模型:推廣一般主成分確定的模型主成分分析的數(shù)學(xué)模型是,設(shè)p個(gè)變量構(gòu)成的q維隨機(jī)向量為X=(X1,…,Xp)′對(duì)X作正交變換,令Y=T′X,其中T為正交陣,要求Y的各分量是不相關(guān)的,并且Y的第一個(gè)分量的方差是最大的,第二個(gè)分量的方差次之,……,等等。為了保持信息不丟失,Y的各分量方差和與X的各分量方差和相等。Y是列向量T為正交陣有:T’T=I;T’=T^(-1)新舊變量關(guān)系的表達(dá)式新指標(biāo)的方差及它們的協(xié)方差:其中表示方差,Cov表示協(xié)方差,表示X協(xié)方差陣主成分確定條件:第一主成分為,滿足,并且使得達(dá)到最大的。第二主成分為,滿足,使得達(dá)到最大的。一般情形,第主成分為,滿足,且(),使得達(dá)到最大的。第一主成分求法第二主成分求法第主成分求法結(jié)論:主成分保持信息總量不少主成分個(gè)數(shù)確定的標(biāo)準(zhǔn)第個(gè)主成分的貢獻(xiàn)率:主成分個(gè)數(shù)確定的標(biāo)準(zhǔn)
主成分分析的步驟構(gòu)造樣本陣樣本陣,其中是樣本容量即評(píng)價(jià)對(duì)象,是評(píng)價(jià)指標(biāo)個(gè)數(shù),是第個(gè)樣本中采集的第項(xiàng)評(píng)價(jià)指標(biāo)值。
指標(biāo)正向化正向指標(biāo)是隨著該指標(biāo)值的增長(zhǎng)總系統(tǒng)評(píng)價(jià)結(jié)果越好,因而轉(zhuǎn)化公式為轉(zhuǎn)化后樣本陣
指標(biāo)規(guī)范化為克服單位差異對(duì)評(píng)價(jià)結(jié)果的影響,須將指標(biāo)規(guī)范化其中,
協(xié)方差矩陣:也是樣本陣的相關(guān)系數(shù)陣顯然,的協(xié)方差矩陣也是的相關(guān)系數(shù)矩陣確定主成分構(gòu)造綜合評(píng)價(jià)函數(shù)1.求的權(quán)值公式:2.構(gòu)造綜合評(píng)價(jià)函數(shù)這里我們應(yīng)該注意,從本質(zhì)上說綜合評(píng)價(jià)函數(shù)是對(duì)原始指標(biāo)的線性綜合,從計(jì)算主成分到對(duì)之加權(quán),經(jīng)過兩次線性運(yùn)算后得到綜合評(píng)價(jià)函數(shù)。
啤酒風(fēng)味評(píng)價(jià)實(shí)例分析題目:啤酒是個(gè)多指標(biāo)風(fēng)味食品,為了全面了解啤酒的風(fēng)味,啤酒企業(yè)開發(fā)了大量的檢測(cè)方法用于分析啤酒的指標(biāo),但是面對(duì)大量的指標(biāo)數(shù)據(jù),大多數(shù)企業(yè)又感到茫然,不知道如何利用這些大量的數(shù)據(jù),來對(duì)各品牌的啤酒加以評(píng)價(jià),由上面的介紹可知,在這種情況下,主成分分析法較為適合。構(gòu)造樣本陣(1)確定原始評(píng)價(jià)指標(biāo):即未經(jīng)簡(jiǎn)化的指標(biāo)m個(gè)本題選有:乙醛、乙酸乙酯、異丁酯、乙酸異戊酯、異戊醇及己酸乙酯(m=6)(2)確定評(píng)價(jià)對(duì)象:即定抽樣,一般樣本容量n個(gè)本題選有:百威啤酒、喜力啤酒和青島啤酒,南方某種啤酒(n=4)(3)采集樣本數(shù)據(jù):采集4個(gè)樣本的對(duì)應(yīng)指標(biāo),得到4個(gè)6維的隨機(jī)向量。(4)構(gòu)造樣本陣:
。本題樣本陣乙醛乙酸乙酯異丁酯乙酸異戊酯異戊醇己酸乙酯百威啤酒1.22.33.10.72.14.5喜力啤酒2.13.25.16.47.61.3青島啤酒1.10.62.13.11.93南方某品牌2.31.54.13.213構(gòu)造標(biāo)準(zhǔn)化陣Z
指標(biāo)規(guī)范化為克服單位差異對(duì)評(píng)價(jià)結(jié)果的響,須將樣本陣元素規(guī)范化,得標(biāo)準(zhǔn)化矩陣Z其中本題標(biāo)準(zhǔn)化矩陣-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.049362相關(guān)系數(shù)矩陣:對(duì)角元為1的實(shí)對(duì)稱
本題相關(guān)系數(shù)陣
乙醛乙酸乙酯異丁酯乙酸異戊酯異戊醇己酸乙酯乙醛1乙酸乙酯0.4210551異丁酯0.8633970.8137331乙酸異戊酯0.6056130.4222220.6844671異戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.775321相關(guān)系數(shù)陣的特征值及向量(1)解樣本相關(guān)系數(shù)矩陣R的特征方程
得6個(gè)特征根,(2)確定主成分個(gè)數(shù)k:并由大到小排列:
使信息的利用率達(dá)85%以上,
(3)構(gòu)造個(gè)主成份:
對(duì)每個(gè)λj,j=1,2,...,k,解得單位特征向量
則第j個(gè)主成份本題k=2,利用率d=45.1%+38.2%=83.3%構(gòu)造綜合評(píng)價(jià)價(jià)值函數(shù):(1)首先構(gòu)造權(quán)向量:其中
(2)構(gòu)造價(jià)值函數(shù):
本題結(jié)果:綜合結(jié)論:由好到差排序喜力啤酒
百威啤酒
青島啤酒南方某種啤酒隨機(jī)向量X的方差協(xié)方差陣對(duì)角線上的元素主成分的方差協(xié)方差矩陣的對(duì)角線元素正交矩陣T中對(duì)應(yīng)的第k行第i列元素主成分因子載荷量:主成分因子載荷量:以為坐標(biāo)畫圖分析結(jié)果分析:從圖可以看出,主成分1主要由乙酸乙酯、乙酸異戊酯和己酸乙酯決定,這些酯含量高,主成分1就越大,即主成分1代表了啤酒的酯香,酯香越濃,主成分1就越大。主成分2主要由乙醛、異丁醇和異戊醇決定,這些成分能夠代表啤酒的“酒勁”的大小,這些成分含量越高,主成分2就越大,即啤酒的酒味就越重。
模型結(jié)果分析(2):各樣本主成分各樣本主成分分析圖結(jié)論:關(guān)于個(gè)樣本結(jié)論結(jié)合這種解釋,就可以對(duì)圖2中的分類做出分析,其中百威啤酒是酒味適中和酯香相對(duì)較濃的“濃香型”啤酒,喜力啤酒是酒味和酯香均較濃的“濃醇型”啤酒青島啤酒是酒味較重,而酯香較弱的“醇型”啤酒某品牌的啤酒則是酒味和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年專業(yè)除鼠服務(wù)合同
- 2025年出租車經(jīng)營(yíng)權(quán)承接策劃協(xié)議
- 2025年通信傳輸設(shè)備項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模范
- 2025年給皂液機(jī)項(xiàng)目提案報(bào)告模范
- 2025年建筑工程中介服務(wù)合同模板
- 2025年農(nóng)產(chǎn)品銷售合作協(xié)議合同
- 2025年棉花加工成套設(shè)備項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模稿
- 2025年新材料面料項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模板
- 2025年小家電項(xiàng)目申請(qǐng)報(bào)告范文
- 2025年標(biāo)桿住宅區(qū)前期物業(yè)管理服務(wù)合同樣本
- 氫能與燃料電池-課件-第四章-氫的性質(zhì)
- 供水企業(yè)安全培訓(xùn)班
- 生化檢驗(yàn)報(bào)告單模板
- 面試評(píng)估報(bào)告
- 蘋果樹病蟲害防治
- 2022年山東省青島一中自主招生化學(xué)模擬試卷一(附答案詳解)
- 深圳市非學(xué)科類校外培訓(xùn)機(jī)構(gòu)設(shè)立材料
- 《產(chǎn)品設(shè)計(jì)》(北希望)教學(xué)資料 課程標(biāo)準(zhǔn) 產(chǎn)品設(shè)計(jì)課程標(biāo)準(zhǔn)
- 部編版語文四年級(jí)下冊(cè)第7單元核心素養(yǎng)教案
- 雨巷戴望舒說課
- 魯教版六年級(jí)數(shù)學(xué)下冊(cè)(五四制)全冊(cè)課件【完整版】
評(píng)論
0/150
提交評(píng)論