版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
主成分分析法2023/2/3常見相關(guān)模型及其
建模方法2.專題求解模型1.發(fā)散思維模型2023/2/3近幾年賽題為例2009年A題制動器試驗(yàn)臺的控制方法分析
B題眼科病床的合理安排
2010年A題儲油罐的變位識別與罐容表標(biāo)定
B題上海世博會影響力的定量評估
2011年A題城市表層土壤重金屬污染分析
B題交巡警服務(wù)平臺的設(shè)置與調(diào)度2012年A題葡萄酒的評價(jià)
B題太陽能小屋的設(shè)計(jì)
近幾年全國數(shù)學(xué)建模競賽題2023/2/32010年B題上海世博會影響力的定量評估
2009年B題眼科病床的合理安排
2011年A題城市表層土壤重金屬污染分析2012年A題葡萄酒的評價(jià)
均可歸屬為-
基于數(shù)據(jù)分析的綜合評價(jià)模型2023/2/3兩類模型常用建模方法綜合評價(jià)法測試分析法專題建模法信息合理運(yùn)用法2023/2/3綜合評價(jià)基本方法簡易的方法有:常用的方法有:2023/2/3測試分析法回歸分析曲線擬合計(jì)算機(jī)模擬與仿真2023/2/3專題建模法數(shù)學(xué)規(guī)劃(線性規(guī)劃與非線性規(guī)劃)概率論與數(shù)理統(tǒng)計(jì)圖論微分方程各學(xué)科實(shí)際問題2023/2/3信息合理運(yùn)用法將與問題相關(guān)的論文合理運(yùn)用將其他問題的論文合理運(yùn)用07年選區(qū)的重新劃分與統(tǒng)計(jì)物理2023/2/3
主成份分析法2023/2/3問題實(shí)際背景,在眾多評價(jià)問題中,人們往往會對評價(jià)樣品收集盡可能多的指標(biāo),例如人口普查往往要調(diào)查每個(gè)人的姓名、年齡、性別、文化程度、住房、職業(yè)、收入、消費(fèi)等幾十項(xiàng)指標(biāo);再如,2012年葡萄評價(jià)有24指標(biāo)。從收集資料的角度來看,收集較多的數(shù)據(jù)有利于完整反映樣品的特征,但是這些指標(biāo)從統(tǒng)計(jì)角度來看相互之間具有一定的依賴關(guān)系,從而使所觀測的數(shù)據(jù)在反映信息上有一定重疊,同時(shí)又使得問題變得復(fù)雜。2023/2/3思考:如何減少變量,但信息量保留得較多。由此產(chǎn)生了主成分分析法。
主成分分析也稱主分量分析(principalcomponentsanalysis,PCA)是由美國的科學(xué)家哈羅德·霍特林(Haroldotelling)于1933年首先提出的。
2023/2/3解決的問題之一:降維2023/2/3解決的問題之二:幾何分析2023/2/3
解決的問題之三:客觀加權(quán)2023/2/3
主成分分析的基本思想2023/2/3一、降維的兩個(gè)準(zhǔn)則準(zhǔn)則1:信息量損失盡可能少。準(zhǔn)則2:新主成分之間相關(guān)性低、重疊少。2023/2/3二、明確信息量的數(shù)學(xué)意義
我們知道,當(dāng)一個(gè)變量所取數(shù)據(jù)相近時(shí),這個(gè)變量(數(shù)據(jù))提供的信息量較為單一,當(dāng)這個(gè)變量取數(shù)據(jù)差異較大時(shí),說明它對各種場景的“遍歷性”越強(qiáng),提供的信息就更加充分,從數(shù)學(xué)角度來論,變量的標(biāo)準(zhǔn)差或方差越大,變量涵蓋的信息越足。2023/2/3三、明確重疊少數(shù)學(xué)意義
我們知道,當(dāng)一個(gè)變量與有關(guān)聯(lián)時(shí)難免表達(dá)信息有重復(fù),沒關(guān)聯(lián)反映在數(shù)學(xué)上最好是兩變量獨(dú)立,而這一要求過強(qiáng),較難滿足,這里我們就要求新主成分之間無線性關(guān)系就好,反映在概率理論上就是每兩個(gè)主成分之間的協(xié)方差為“0”或相關(guān)系數(shù)為“0”。2023/2/3建立選取主成分分析模型2023/2/3引例:假設(shè)共有n個(gè)樣品,每個(gè)樣品都測量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系中,觀察散點(diǎn)的分布,假設(shè)共有n個(gè)樣品,每個(gè)樣品都測量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系中,觀察散點(diǎn)的分布,假設(shè)共有n個(gè)樣品,每個(gè)樣品都測量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系中,觀察散點(diǎn)的分布,假設(shè)共有n個(gè)樣品,每個(gè)樣品都測量了兩個(gè)指標(biāo)(X1,X2),在坐標(biāo)系中,觀察散點(diǎn)的分布,2023/2/3引例:單獨(dú)看這n個(gè)點(diǎn)的分量
,它們沿著
方向和
方向都具有相近的離散性,如果僅考慮其中的任何一個(gè)分量,那么包含在另一分量中的信息將會損失,因此,直接舍棄某個(gè)分量不是“確定主成分”的有效辦法。2023/2/3結(jié)論:為第一主成分,為第二主成分。換個(gè)角度觀察
事實(shí)上,散點(diǎn)的分布總有可能沿著某一個(gè)方向略顯擴(kuò)張,這里沿橢圓的長軸方向數(shù)據(jù)變化跨度就明顯大于橢圓的短軸方向。2023/2/3結(jié)論:為第一主成分,為第二主成分。換個(gè)角度觀察
結(jié)論:長軸方向變量為第一主成分;短軸方向變量為第二主成分。2023/2/3結(jié)論:為第一主成分,為第二主成分。當(dāng)新舊變量間夾角為時(shí),由坐標(biāo)變換公式可得主成分獲得的數(shù)學(xué)模型2023/2/3確定主成分的數(shù)學(xué)模型:2023/2/3推廣一般主成分確定的模型或其中T是正交矩陣2023/2/3主成分滿足的約束要求:①Y的各分量是不相關(guān)的;②并且Y的第一個(gè)分量的方差是最大的;第二個(gè)分量的方差次之,……,等等。③為了保持信息不丟失,Y的各分量方差和與X的各分量方差和相等。2023/2/3主成分的方差及它們的協(xié)方差其中表示方差,Cov表示協(xié)方差,這里X是多維隨機(jī)向量,D(X)則表述的是X的協(xié)方差陣,一般用其中表示方差,Cov表示協(xié)方差,這里X是多維隨機(jī)向量,D(X)則表述的是X的協(xié)方差陣,一般用其中表示方差,Cov表示協(xié)方差,這里X是多維隨機(jī)向量,D(X)則表述的是X的協(xié)方差陣,一般用2023/2/3所以協(xié)方差矩陣是對稱矩陣,且為非負(fù)定的!復(fù)習(xí):關(guān)于隨機(jī)向量的協(xié)方差矩陣的協(xié)方差矩陣為的協(xié)方差矩陣為2023/2/3第一主成分求法Y1的方差2023/2/3第二主成分及第k主成分滿足條件考慮到Y(jié)2=t21x1+t22x2+t23x3+...
+tp1xp
=
T'2X
,及我們的準(zhǔn)則
考慮到Y(jié)2=t21x1+t22x2+t23x3+...
+tp1xp
=
T'2X
,及我們的準(zhǔn)則
2023/2/3第二主成分及第k主成分求法表明是∑的特征值,T'2為特征向量?2023/2/3第主成分求法2023/2/3結(jié)論:思考:總信息量不變嗎?2023/2/3主成分保持信息總量不少2023/2/3主成分個(gè)數(shù)確定的標(biāo)準(zhǔn)2023/2/3主成分個(gè)數(shù)確定的標(biāo)準(zhǔn)2023/2/3
主成分分析的步驟2023/2/31.構(gòu)造樣本陣樣本陣,其中是樣本容量即評價(jià)對象,是評價(jià)指標(biāo)個(gè)數(shù),是第個(gè)樣本中采集的第項(xiàng)評價(jià)指標(biāo)值。
2023/2/32.指標(biāo)標(biāo)準(zhǔn)化
為克服單位差異對評價(jià)結(jié)果的影響,須將指標(biāo)標(biāo)準(zhǔn)化
其中,
2023/2/33.協(xié)方差矩陣(也是樣本陣的相關(guān)系數(shù)陣?)可證,由標(biāo)準(zhǔn)化后得到的矩陣,而2023/2/34.確定主成分2023/2/35.構(gòu)造綜合評價(jià)函數(shù)
1.求的權(quán)值公式:2.構(gòu)造綜合評價(jià)函數(shù):這里我們應(yīng)該注意,從本質(zhì)上說綜合評價(jià)函數(shù)是對原始指標(biāo)的線性綜合,從計(jì)算主成分到對之加權(quán),經(jīng)過兩次線性運(yùn)算后得到綜合評價(jià)函數(shù)。
2023/2/3啤酒風(fēng)味評價(jià)實(shí)例分析2023/2/3題目:啤酒是個(gè)多指標(biāo)風(fēng)味食品,為了全面了解啤酒的風(fēng)味,啤酒企業(yè)開發(fā)了大量的檢測方法用于分析啤酒的指標(biāo),但是面對大量的指標(biāo)數(shù)據(jù),大多數(shù)企業(yè)又感到茫然,不知道如何利用這些大量的數(shù)據(jù),來對各品牌的啤酒加以評價(jià),由上面的介紹可知,在這種情況下,主成分分析法較為適合。2023/2/31.樣本陣(1)確定原始評價(jià)指標(biāo):即未經(jīng)簡化的指標(biāo)6個(gè),選有:乙醛、乙酸乙酯、異丁酯、乙酸異戊酯、異戊醇及己酸乙酯(m=6)(2)確定評價(jià)對象:即定抽樣,本題選有:百威啤酒、喜力啤酒和青島啤酒,南方某種啤酒(n=4)2023/2/3(3)構(gòu)造樣本陣:
本題樣本陣
乙醛
乙酸乙酯
異丁酯乙酸異戊酯
異戊醇己酸乙酯
百威啤酒1.22.33.10.72.14.5
喜力啤酒2.13.25.16.47.61.3
青島啤酒1.10.62.13.11.93
南方某品牌2.31.54.13.2132023/2/32.構(gòu)造標(biāo)準(zhǔn)化陣Z
指標(biāo)規(guī)范化為克服單位差異對評價(jià)結(jié)果的響,須將樣本陣元素規(guī)范化,得標(biāo)準(zhǔn)化矩陣Z其中2023/2/3可得本題標(biāo)準(zhǔn)化矩陣-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.0493622023/2/33.協(xié)方差矩陣(相關(guān)系數(shù)陣的實(shí)對稱)
2023/2/3本題相關(guān)系數(shù)陣
乙醛乙酸乙酯異丁酯乙酸異戊酯
異戊醇己酸乙酯乙醛1乙酸乙酯0.4210551異丁酯0.8633970.8137331乙酸異戊酯0.6056130.4222220.6844671異戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.7753212023/2/34.確定主成分(1)解樣本相關(guān)系數(shù)矩陣R的特征方程
得6個(gè)特征根,
(2)確定主成分個(gè)數(shù)
k
:并由大到小排列:
使信息的利用率達(dá)85%以上,本題k=2,累計(jì)貢獻(xiàn)率d=45.1%+38.2%=83.3%2023/2/3
5.構(gòu)造2個(gè)主成份:
對每個(gè)λj,j=1,2解得單位特征向量
則第j個(gè)主成份2023/2/36.構(gòu)造綜合評價(jià)價(jià)值函數(shù):
(1)首先構(gòu)造權(quán)向量:其中
2023/2/3(2)構(gòu)造價(jià)值函數(shù):
2023/2/3本題結(jié)果:綜合結(jié)論:由好到差排序喜力啤酒
百威啤酒
青島啤酒南方某種啤酒2023/2/3主成分的方差協(xié)方差矩陣的對角線元素正交矩陣T中對應(yīng)的第k行第i列元素模型解釋-主成分因子載荷量:隨機(jī)向量X的方差協(xié)方差陣對的第k個(gè)特征值2023/2/32023/2/32023/2/3主成分因子載荷量分析:以為坐標(biāo)畫圖2023/2/3結(jié)果分析:從圖
可以看出:
主成分1,
主要由乙酸乙酯、乙酸異戊酯和己酸乙酯決定,這些酯含量高,主成分1就越大,即主成分1代表了啤酒的酯香。主成分2,
主要由乙醛、異丁醇和異戊醇決定,這些成分能夠代表啤酒的“酒
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年廣州客運(yùn)資格證考試資料
- 2024年寧夏客運(yùn)從業(yè)資格證考試試題及答案解析
- 2024年肇慶道路客運(yùn)輸從業(yè)資格證仿真考試題庫
- 2024年撫順客運(yùn)從業(yè)資格證考試培訓(xùn)試題和答案
- 車站現(xiàn)場施工臨時(shí)用電方案
- 有關(guān)工作感悟(30篇)
- 一年級家長會(32篇)
- 設(shè)備買賣合同(31篇)
- 社區(qū)重陽節(jié)活動方案
- 新版夫妻自愿離婚協(xié)議(30篇)
- 產(chǎn)品包裝設(shè)計(jì)合同正規(guī)范本(通用版)
- 國家安全教育課-教案3篇
- 傷口評估記錄表
- 幼兒園優(yōu)質(zhì)公開課:小班語言《小雞球球藏貓貓》課件(共同欣賞)
- 中建體育中心工程預(yù)制看臺吊裝專項(xiàng)施工方案
- 《西洋樂器介紹》課件
- 心理咨詢之精神分析療法
- 人教版八年級數(shù)學(xué)上冊全等三角形典型6類難題題型歸類
- 2023春國開合同法第10章試題及答案
- 如何進(jìn)行市場走訪
- QSYTZ0110-2023年雙相不銹鋼材料焊接施工及驗(yàn)收規(guī)范
評論
0/150
提交評論