版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
SVM-RFE特征選擇算法改進(jìn)的多類特征選擇算法實驗設(shè)計與實驗結(jié)果總結(jié)主要內(nèi)容2支持向量機(jī)3SVM-RFE特征選擇算法支持向量機(jī)通過引入拉格朗日乘子,可以將SVM的優(yōu)化問題轉(zhuǎn)變?yōu)橐韵碌膶ε家?guī)劃問題:SVM-RFE特征選擇算法min2Ni
j
i
j
i
jiNsubject
toi
1
j
1
i
11
N
N
yiii
1
0,0
i
C,i
1,
2,...,
N
y
y
(
x
x
)
(2)4(3)(4)SVM-RFE特征選擇算法SVM-RFE特征選擇算法5多類SVM-RFE特征選擇算法目前已經(jīng)提出兩種多類SVM-RFE特征選擇算法。MSVM-RFEMSVM-RFE-KERNEL這兩種算法采用線性核時是等價的。MSVM-RFE算法先用一對一的策略把多類問題分解為多個兩類問題,每個兩類問題用一個SVM-RFE來進(jìn)行特征選擇。利用多個SVM-RFE獲得多個排序準(zhǔn)則分?jǐn)?shù),然后把多個排序準(zhǔn)則分?jǐn)?shù)相加后得到排序準(zhǔn)則總分,以此來作為特征剔除的依據(jù),每次迭代消去總分最小的特征,直至所有特征被刪除。MSVM-RFE的具體算法見算法2.6SVM-RFE特征選擇算法多類SVM-RFE特征選擇算法SVM-RFE特征選擇算法7改進(jìn)的多類特征選擇算法(MMSVM-RFE)問題:上述的多類SVM-RFE特征選擇方法考慮的是所有子學(xué)習(xí)機(jī)的權(quán)重融合,忽略了各子學(xué)習(xí)機(jī)自身挑選特征的能力。改進(jìn):利用一對一的策略把多類問題分解了多個兩類問題。每個兩類問題采用一個SVM-RFE方法逐漸剔除掉冗余特征,得到一個特征子集;最后將所有特征子集合并得到最終的特征子集。改進(jìn)的多類特征選擇算法X1X
2F1F22FX
Fl(l-1)2Fl(l-1)X
l(l-1)
28改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)
j
l
l
12ji
i1
j
12
j
l
3l
1
lN
Ni1N
Ni1N
Ni1X, 當(dāng)vi
1時,yi
1;當(dāng)vi
j
1,yi
1,j
1,,l1, 當(dāng)vi
2時,yi
1;當(dāng)vi
j
l
3,yi
1,j
l,,2l
3,當(dāng)vi
l
1時,yi
1;當(dāng)vi
l,yi
1,xi
,
yixi
,
yi
x
,
y9改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)X1X
2F1F22FX
Fl(l-1)2Fl(l-1)X
l(l-1)
21改進(jìn)的多類特征選擇算法改進(jìn)的多類特征選擇算法(MMSVM-RFE)11數(shù)據(jù)集類別基因數(shù)#訓(xùn)練樣本#測試樣本CNS
tumors5
(M/
CRE/
MG/N/
S)98921(5/5/5/2/4)21(5/5/5/2/4)Leukemia3
(ALL/
MLL/
AML)99920(10/4/6)18(9/4/6)Lung
cancer4
(AD/
NL/
SQ/
COID)1000100(70/9/11/10)97(69/8/10/10)12數(shù)據(jù)集描述我們采用了三個多類基因數(shù)據(jù)集:CNS
tumors,Leukemia和Lung
cancer。數(shù)據(jù)集的詳細(xì)信息實驗設(shè)計與實驗結(jié)果對比實驗:MMSVM-RFEVS.
MSVM-RFE實驗設(shè)計與實驗結(jié)果13對比實驗:MMSVM-RFE
VS.
MSVM-RFE下面是在三個基因數(shù)據(jù)集上的平均精度對比圖.實驗設(shè)計與實驗結(jié)果050
100
150200
250
0.40.50.60.70.80.91Gene
Num
berAverage
accuracyMMS
VM-
RFE
MSVM-R
FE050
100
150
2000.65
0.70.75
0.80.85
0.90.95
1Gene
Num
ber
Average
accuracyMMSVM-
RFE
MSVM-RFE50
1502002500.7250
0100Gene
Num
ber0.750.80.850.90.951Average
accuracyMMSVM-
RFEMSVM-R
FE(a)CNS
tumors14(b)
Leukemia(c)Lung
cancer實驗設(shè)計與實驗結(jié)果15(a)CNS
tumorMSVM-RFEMMSVM-RFEBest
number
of
selectedgenes14798Average
accuracy
(%)90.48±7.1092.38±6.02Average
accuracy
of
classM
(%)100.00±0.00100.00±0.00Average
accuracy
of
classCRE(%)94.00±9.6692.00±10.33Average
accuracy
of
class
MG
(%)98.00±6.3298.00±6.32Average
accuracy
of
class
N
(%)85.00±24.1595.00±15.81Average
accuracy
of
classS(%)67.50±33.4475.00±31.18對比實驗:MMSVM-RFEVS.
MSVM-RFE(b)
LeukemiaMSVM-RFEMMSVM-RFEBest
number
of
selected
genes143185Average
accuracy
(%)97.78±2.2299.44±0.56Average
accuracy
of
class
ALL
(%)97.78±4.68100.00±0.00Average
accuracy
of
class
MLL
(%)100.00±0.00100.00±0.00Average
accuracy
of
class
AML
(%)96.00±8.4398.00±6.32(c)Lung
cancerMSVM-RFEMMSVM-RFEBest
number
of
selected
genes242160Average
accuracy
(%)96.08±0.9596.29±1.00Average
accuracy
of
class
AD
(%)97.39±1.1497.54±1.53Average
accuracy
of
class
NL
(%)91.25±11.8691.25±8.44Average
accuracy
of
class
SQ
(%)87.00±9.4988.00±8.50Average
accuracy
of
class
COID
(%)100.00±0.00100.00±0.00實驗設(shè)計與實驗結(jié)果對比實驗:SVM
VS.
K近鄰
VS.
隨機(jī)森林將本文方法特征提取后的結(jié)果采用K近鄰和隨機(jī)森林等分類器進(jìn)行實驗1實驗設(shè)計與實驗結(jié)果(a)CNS
tumors(b)
Leukemia(c)Lung
cancer050
1502000.55100Gene
Num
ber0.60.650.70.750.80.850.90.95Average
accuracyMMSVM-KNNMMSVM-R
F
MMSVM-R
FE250
050
100
150200250
0.70.75
0.80.85
0.90.95
1Gene
Num
ber
Average
accuracyMMSVM-KNN
MMSVM-R
F
MMSVM-R
FE050
150200250
0.87
100
Gene
Num
ber0.88
0.89
0.90.91
0.92
0.93
0.94
0.95
0.96
0.97
Average
accuracyMMSVM-
KNN
MMSVM-
RFMMSVM-
RFE對比實驗:SVM
VS.
K近鄰
VS.
隨機(jī)森林下面是在三個分類器上的平均精度對比.17實驗設(shè)計與實驗結(jié)果對比實驗:MMSVM-RFE
VS.
PCA將本文MMSVM-RFE特征選擇算法與經(jīng)典的降維算法——主成分分析算法(principle
component
analysis,PCA)進(jìn)行對比1實驗設(shè)計與實驗結(jié)果19對比實驗:MMSVM-RFEVS.
PCA(a)CNS
tumorMMSVM-RFEPCABest
number
of
selectedgenes9898Average
accuracy
(%)92.38±6.0291.43±5.85Average
accuracy
of
classM
(%)100.00±0.00100.00±0.00Average
accuracy
of
classCRE(%)92.00±10.3392.00±10.33Average
accuracy
of
class
MG
(%)98.00±6.3298.00±6.32Average
accuracy
of
class
N
(%)95.00±15.8185.00±24.15Average
accuracy
of
classS(%)75.00±31.1862.50±31.18(b)
LeukemiaMMSVM-RFEPCABest
number
of
selected
genes185185Average
accuracy
(%)99.44±0.5698.89±5.85Average
accuracy
of
class
ALL
(%)100.00±0.0097.78±4.68Average
accuracy
of
class
MLL
(%)100.00±0.00100.00±0.00Average
accuracy
of
class
AML
(%)98.00±6.32100.00±0.00(c)Lung
cancerMMSVM-RFEPCABest
number
of
selected
ge
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 21《古詩三首》說課稿-2024-2025學(xué)年語文四年級上冊統(tǒng)編版001
- 6《摸一摸》說課稿-2024-2025學(xué)年科學(xué)一年級上冊青島版
- 2024-2025學(xué)年高中生物 第3章 植物的激素調(diào)節(jié) 第1節(jié) 植物生長素的發(fā)現(xiàn)說課稿 新人教版必修3001
- 2024年五年級英語下冊 Module 7 Unit 2 I will be home at seven oclock說課稿 外研版(三起)
- 2025住宅裝修物業(yè)管理合同(合同范本)
- 8《池子與河流》(說課稿)-2023-2024學(xué)年統(tǒng)編版語文三年級下冊
- 2025鍋爐拆除安全施工合同
- 2025有關(guān)電梯廣告的合同范本
- Unit 6 Disaster and Hope Understanding ideas 說課稿-2023-2024學(xué)年外研版高中英語(2019)必修第三冊
- 代理制 合同范本
- 職業(yè)衛(wèi)生培訓(xùn)課件
- 柴油墊資合同模板
- GB/T 44489-2024高級輔助駕駛地圖審查要求
- 2024-2030年中國體外除顫器行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 2024-2030年中國人力資源行業(yè)市場發(fā)展前瞻及投資戰(zhàn)略研究報告
- 2024-2030年中國樺樹汁行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 全冊(教案)外研版(一起)英語四年級下冊
- 偏差行為、卓越一生3.0版
- 國網(wǎng)浙江電科院:2024浙江工商業(yè)儲能政策及收益分析報告
- 中國兒童幽門螺桿菌感染診治專家共識2022
- JJG 4-2015鋼卷尺行業(yè)標(biāo)準(zhǔn)
評論
0/150
提交評論