版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主成分分析(PrincipalComponentAnalysisPCA)1主成分分析主成分分析主成分分析是對(duì)多變量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理的一種數(shù)據(jù)線性投影方法,它在盡可能保留原有信息的基礎(chǔ)上將高維空間中的樣本映射到較低維的主成分空間。其基本思路是以一種最優(yōu)化方法濃縮量測(cè)數(shù)據(jù)信息,使數(shù)據(jù)矩陣簡(jiǎn)化,降低維數(shù),尋找少數(shù)幾個(gè)由原始變量線性組合的主成分,以揭示數(shù)據(jù)結(jié)構(gòu)特征,提取基本信息。該法具有變差最優(yōu)性、信息損失最小性、相關(guān)最優(yōu)性、回歸最優(yōu)性等特點(diǎn)。2主成分分析主成分分析的概念主成分分析的中心目的是將數(shù)據(jù)降維,以排除眾多化學(xué)信息共相存相互重疊的信息。它是將原變量進(jìn)行轉(zhuǎn)換,使少數(shù)幾個(gè)新變量是原變量的線性組合,同時(shí),這些變量要盡可能多地表征原變量的數(shù)據(jù)結(jié)構(gòu)特征而不丟失信息,新變量互不相關(guān),即正交。文獻(xiàn)中有許多種叫法:本征矢量投影、奇異值分解、karhunenloeve展開(kāi)、和K-L投影3主成分分析主成分分析的基本原理在二維空間有一組測(cè)試點(diǎn)(y1i,y2i)(i=1,2,…,n),如下圖,這組數(shù)據(jù)在二維平面上分布大致為橢圓形,若似將二維降為一維,實(shí)際上就是將二維空間上的點(diǎn)投影到一維空間中的一條線上。4主成分分析主成分分析的基本原理Y1Y2Y1Y2μ11O1‘μ25主成分分析主成分分析的基本原理在一維空間中的這條線必須包含原數(shù)據(jù)的最大方差。更準(zhǔn)確些說(shuō),沿著這條線,使方差達(dá)到最大,其它方向使方差達(dá)到最小。從代數(shù)學(xué)的觀點(diǎn)看,這些點(diǎn)的分布可以表達(dá)成它們到其重心O距離之平方加和:S2=|O1|2+|O2|2+…+|O6|26主成分分析主成分分析的基本原理現(xiàn)在引入一直線L,6個(gè)數(shù)據(jù)點(diǎn)在L上的投影分別為1`,2`,…,6`,那么有:|Oi|2=|Oi`|2+|ii`|2S2=|O1`|2+|O2`|2+…+|O6`|2+|11`|2+|22`|2+…+|66`|2第一部分即為沿直線方向的方差,必須使之達(dá)到最大;第二部分即為沿其它方向的方差,必須達(dá)到最小。為實(shí)現(xiàn)上述思想,選定的第一個(gè)新變量μ1(主成分1)應(yīng)沿直線L方向,因?yàn)樗梢员碚髯畲蟮钠盍?。第二個(gè)新變量μ2(主成分2)應(yīng)與第一個(gè)新變量正交,即不相關(guān)。7主成分分析m維空間中的主成分分析在m維空間中,新變量μ1,μ2,…,μm表達(dá)為8主成分分析其系數(shù)矩陣為新變量μ和老變量x的列矢量分別為矩陣形式為:μ=VX9主成分分析m維空間中的主成分分析方差最大化等效于RxV=λVRx為數(shù)據(jù)矩陣的協(xié)方差矩陣,V為Rx的特征向量,λ為Rx的特征值。第一個(gè)主成分μ1對(duì)應(yīng)于第一個(gè)最大的特征值和第一個(gè)特征向量,第二個(gè)主成分μ2對(duì)應(yīng)于第二個(gè)最大的特征值和第二個(gè)特征向量。10主成分分析主成分的選取在m維空間中,可得m個(gè)主成分。在實(shí)際應(yīng)用中一般可取前幾個(gè)對(duì)偏差量貢獻(xiàn)大的主成分,這樣可使高維空間的數(shù)據(jù)降到低維如二維或三維空間。取前P個(gè)主成分的依據(jù)為:比率(%)11主成分分析注意事項(xiàng)當(dāng)數(shù)據(jù)的來(lái)源不一,不同變量間數(shù)據(jù)差異較大或量綱不同時(shí),應(yīng)作標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)化處理有以下方法:自動(dòng)調(diào)整法(autoscaling):將變量與本列的均值之差被標(biāo)準(zhǔn)偏差來(lái)除。此時(shí)相當(dāng)于應(yīng)用相關(guān)矩陣RX來(lái)計(jì)算本征矢量和本征值:
RXV=λV12主成分分析注意事項(xiàng)歸一化:對(duì)數(shù)據(jù)矩陣的列或整個(gè)矩陣進(jìn)行歸一化處理。用Matlab命令:normc(X)或norm(X)均值中心化:從每個(gè)變量中減去該列的平均值。值域調(diào)整法(rangescaling):13主成分分析數(shù)字實(shí)例試樣測(cè)定值測(cè)定值標(biāo)準(zhǔn)化值(自動(dòng)調(diào)節(jié)法)樣品號(hào)y1y2y314826172442015340248438181053291262862272658824412樣品號(hào)y1y2y311.4751.3350.83121.0210.6670.41630.5671.112-1.03940.3400.445-0.6245-0.340-0.556-0.2086-0.794-0.8901.8717-1.021-1.001-1.0398-1.248-1.112-0.20814主成分分析本征值及本征矢量的計(jì)算數(shù)據(jù)矩陣Cx=協(xié)方差矩陣Z=CxT×CxZ=15主成分分析本征值及本征矢量的計(jì)算通過(guò)協(xié)方差矩陣計(jì)算特征向量和特征值用Matlab的函數(shù):[V,D]=eig(Z)本征矢量矩陣
V=本征值矩陣
D=16主成分分析主成分的選擇從最大的本征值開(kāi)始加和,使比率大于80%即:選擇主成分1和主成分2比率(%)比率(%)17主成分分析新變量方程μ1=-0.7082C1-0.7046C2-0.0454C3
μ2=0.0465C1-0.1107C2+0.9928C3通過(guò)上述變換,將C1、C2、C3三維空間的各點(diǎn),變?yōu)槎S空間的點(diǎn)。18主成分分析不同采收期連翹的HPLC指紋圖譜研究將22批連翹色譜圖采用Chromafinger色譜指紋圖譜軟件進(jìn)行數(shù)據(jù)處理,以各月份代表性樣品生成的共有模式。(11號(hào)峰為連翹脂苷,17號(hào)峰為連翹苷)19主成分分析不同采收期連翹主成分分析貢獻(xiàn)率及累計(jì)貢獻(xiàn)率從主成分分析的貢獻(xiàn)率來(lái)看:PC1的貢獻(xiàn)率最大為85.42%,PC2的貢獻(xiàn)率次之為9.12%。其他的貢獻(xiàn)率較小。從累積貢獻(xiàn)率來(lái)看,取前2個(gè)特征值時(shí),累積貢獻(xiàn)率為94.54%,故取前2個(gè)為主成分。20主成分分析標(biāo)準(zhǔn)化特征向量PC1得分值是11、17和21號(hào)色譜峰峰面積值的綜合作用。PC2得分值是11、18和21號(hào)色譜峰峰面積值的綜合作用峰號(hào)主成分表達(dá)式21主成分分析樣本在2個(gè)主成分的二維平面分布圖綜上所述,根據(jù)各樣本PC1和PC2得分和相似度分析結(jié)果,進(jìn)行綜合評(píng)價(jià),可以確定連翹在8月底至9月份采收為佳。7月份連翹各主要成分含量也很高,但此時(shí)是果實(shí)生長(zhǎng)初期,10月份連翹大都已經(jīng)成熟,表皮開(kāi)始發(fā)黃,傳統(tǒng)上采收入藥為老翹。22主成分分析主成分分析法研究新疆產(chǎn)6種紅景天中無(wú)機(jī)元素在其功效中的協(xié)同作用景天科紅景天屬多種藥用植物,具有滋補(bǔ)強(qiáng)壯、抗衰老、抗病毒、抗腫瘤、抗心率失常、保護(hù)心臟、抗輻射等功效。新疆6種紅景天微量元素含量(μg/g)23主成分分析主成分分析結(jié)果通過(guò)求變量的相關(guān)矩陣確定特征值和特征向量,根據(jù)特征值來(lái)確定主成分個(gè)數(shù)。經(jīng)計(jì)算,當(dāng)主成分?jǐn)?shù)達(dá)到3時(shí),累計(jì)解釋率已達(dá)到80.133%,故取3個(gè)主成分即可。3個(gè)主成分所對(duì)應(yīng)的特征值為λ1為3.26、λ2為1.735、λ3為1.416。24主成分分析3個(gè)主成分所對(duì)應(yīng)的戴荷矩陣25主成分分析Z1得分及排名和解釋研究表明,人體Ca、Mg2種元素的含量與心腦疾病的發(fā)生密切相關(guān):陳麗霞等的研究指出Ca、Mg能降低膽固醇含量,從而起到預(yù)防冠心病的作用。地奧心血康中Ca、Mg含量較高,有利于治療冠心病。胡雪梅等研究了治療心血管疾病的8種中藥的功效與微量元素的關(guān)系,結(jié)果表明這8種中藥Ca、Mg含量較高。第一主成分主要由Ca、Mg2種元素的含量按一定比例線性組合而成。26主成分分析Z2得分及排名和解釋王健等研究了368種中藥表明,抗菌抗腫瘤藥中富含K,說(shuō)明K有抗腫瘤作用。有研究表明,Mg具有抗癌抑癌作用,Cu的鉻合物具有抗炎抗癌作用。表明K、Cu、Mg3種元素協(xié)同作用,共同起到抗炎抗癌作用。第二主成分主要由K、Cu、Mg3種元絮含量線性組合而成。27主成分分析Z3得分及排名和解釋益氣補(bǔ)血類藥中Zn、Cu、Mn、Fe含量較高,其益氣補(bǔ)血的作用與Zn、Cu、Mn、Fe的生化功能有著必然的聯(lián)系。錳能促進(jìn)銅的利用。銅能加速鐵的吸收和利用,鐵、錳、銅有生血協(xié)同作用。這4種元素按照一定的比例協(xié)同作用,共同起到益氣補(bǔ)血的作用。第三主成分主要由Zn、Cu、Mn、Fe4元素含量線性組合而成28主成分分析基于主成分分析的中藥色譜指紋圖譜多維多息特征數(shù)據(jù)挖掘方法研究選擇10批次不同產(chǎn)地的當(dāng)歸色譜指紋圖譜作為實(shí)驗(yàn)樣本,指紋圖譜見(jiàn)圖1。將10批指紋峰號(hào)為S01~S10的當(dāng)歸指紋圖譜導(dǎo)入“中藥色譜指紋圖譜多維多息特征參數(shù)分析系統(tǒng)”,輸入試驗(yàn)條件,進(jìn)樣量為10μl、檢測(cè)波長(zhǎng)為254nm,有效分離度最小值1.5、相對(duì)指數(shù)時(shí)間常數(shù)50,自動(dòng)計(jì)算當(dāng)歸的37個(gè)多維多息特征參數(shù)。29主成分分析10批當(dāng)歸指紋圖譜30主成分分析特征根分析31主成分分析主成分載荷矩陣第1主成分:試驗(yàn)條件優(yōu)化指標(biāo);第2主成分:指紋圖譜信息參數(shù);第3主成分:指紋成分含量參數(shù);第4主成分:指紋成分含量比例參數(shù)32主成分分析綜合主成分得分33主成分分析主成分分析運(yùn)用(1)降維(或稱數(shù)據(jù)壓縮),尋找?guī)讉€(gè)主成分(也稱潛變量)在低維空間表示高維數(shù)據(jù);(2)數(shù)據(jù)的可視化和分類聚類,主成分的投影顯示法即可用于分類判別又可用于聚類,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 體系合同評(píng)審過(guò)程的衡量目標(biāo)
- 2025年錦州貨運(yùn)從業(yè)資格證考試模擬
- 2025年北京貨運(yùn)從業(yè)資格證試題答題器
- 電力設(shè)備公司員工停薪留職
- 建筑防貓害安全施工協(xié)議
- 圖書館消毒操作規(guī)程
- 汽車制造空氣凈化合同
- 廠房改造項(xiàng)目租賃承包合同
- 酒店走廊綠植裝飾合作協(xié)議
- 政府信息資產(chǎn)整合辦法
- 刑法總論分析研究案例教學(xué)
- 濟(jì)南泉水的故事課件
- 節(jié)水型社會(huì)建設(shè)規(guī)劃編制導(dǎo)則
- 切割鋼絲,簾線濕拉
- 宜都市產(chǎn)業(yè)集群基本情況及產(chǎn)業(yè)鏈
- SF_T 0119-2021 聲像資料鑒定通用規(guī)范_(高清版)
- 汽車機(jī)械識(shí)圖圖期末考試卷
- 冪的運(yùn)算綜合專項(xiàng)練習(xí)50題(共7頁(yè))
- 內(nèi)臟疾病康復(fù) 向云
- 農(nóng)村留守婦女創(chuàng)業(yè)就業(yè)情況調(diào)研報(bào)告
- 大型電力變壓器安裝監(jiān)理工作要點(diǎn)
評(píng)論
0/150
提交評(píng)論