下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
基于k-means算法的遙感圖像分類
0基于密度函數(shù)的聚類分析k-mean是基于分段的聚類算法。該算法簡單、快速,是一種得到最廣泛使用的聚類算法,在高光譜遙感圖像的非監(jiān)督分類中具有較強的實用性,并表現(xiàn)出明顯的優(yōu)點。K-means以K為參數(shù),把n個對象分為K個類別,以使類內(nèi)具有較高的相似度、類間的相似度較低。根據(jù)一個類別中對象的平均值進(jìn)行相似度的計算,對大數(shù)據(jù)集的處理,該算法是相對可伸縮和高效率的。但其缺點也非常明顯:①對初始值非常敏感,不同的初始值可能會導(dǎo)致不同的聚類結(jié)果;②必須預(yù)先設(shè)定預(yù)計劃分類數(shù)K。針對K-means的上述弱點,Stephen等提出采用kd-tree為K-means賦初始值。先用kd-tree估計數(shù)據(jù)在不同位置的密度,再用Katsavounidis算法修正選擇K-means的中心值,這種方法采用密度函數(shù)確定均值,是通過整個密度函數(shù)確定初始中心的比較完整的算法;但這種方法計算復(fù)雜、效率不高,而且對高維數(shù)據(jù)的效果不明顯。Lu等用分等級的方法為K-means選擇聚類中心,該方法的核心是把聚類看成加權(quán)聚類問題,依據(jù)分等級的方法可以選擇更好的初始中心值;但用該方法采樣時容易受到粗差的影響,且效率不高。本文提出的改進(jìn)的K-means,首先對多光譜數(shù)據(jù)進(jìn)行對數(shù)變換以突顯或強化類型特征;然后進(jìn)行主成分變換,采用核密度估算第一主成分的概率密度函數(shù);根據(jù)概率密度函數(shù)確定初始分類數(shù)和相應(yīng)的初始分類中心,通過迭代計算得到最終的分類圖。1改進(jìn)的k-mean算法1.1《m》jmj,當(dāng)K-means算法是MacQueen于1967年提出的,是至今運用最廣泛的聚類算法之一。對于一個觀測數(shù)據(jù)集X=(x1,x2,…,xn),每個觀測值是d維的實向量,K-means聚類就是把n個觀測值分為K個子集(K≤n),S=(s1,s2,…,sk)。具體過程如下:(1)從全部數(shù)據(jù)中隨機選取K個數(shù)據(jù)作為初始中心;(2)在第m次迭代中,對任一樣本X按如下的方法將其調(diào)整到K個類別中的某一類別中。對于所有的i≠j,i=1,2,…,K,如果‖X-Z(m)j(m)j‖<‖X-Z(m)i(m)i‖,則X∈S(m)j(m)j,其中,S(m)j(m)j是以Z(m)j(m)j為中心的類;(3)由過程(2)得到S(m)j(m)j類新的中心Z(m+1)j(m+1)j,即Ζ(m+1)j=1Νj∑X∈S(m)jX(1)式中,Nj為Sj類中的樣本數(shù);Z(m+1)j是按照使J最小的原則確定的,J的表達(dá)式為J=Κ∑j=1∑X∈S(m)j∥X-Ζj(m+1)∥2(2)(4)對于所有的i=1,2,…,m,如果Z(m+1)i=Z(m)i,則迭代結(jié)束,否則轉(zhuǎn)到過程(2)繼續(xù)進(jìn)行迭代。1.2算法的效率比較多光譜數(shù)據(jù)用于分類研究和應(yīng)用是當(dāng)今遙感技術(shù)熱點之一,龐大的數(shù)據(jù)量往往會降低分類算法的效率。對多(高)光譜數(shù)據(jù)進(jìn)行主成分變換,根據(jù)各主成分的貢獻(xiàn)率選擇參與分類的主成分?jǐn)?shù),既實現(xiàn)了對數(shù)據(jù)的壓縮,也提高了分類效率。為了增強類別差異,一種有效的方法是先對觀測數(shù)據(jù)進(jìn)行對數(shù)變換,然后進(jìn)行主成分變換,最后再進(jìn)行分類。1.3概率密度函數(shù)的密度在統(tǒng)計學(xué)中,核密度估計是一種非參估計隨機變量概率密度函數(shù)的方法。如果“x1,x2,…xn”~f是互相獨立分布的隨機樣本,那么它的概率密度函數(shù)的密度估計近似為?fh(x)=1nn∑i=1k(x-xih)(3)式中,k為某種密度核;h為平滑參數(shù)(也稱為帶寬)。通常采用均值為0、方差為單位陣的標(biāo)準(zhǔn)正態(tài)分布為密度核,這樣密度估計只和參數(shù)h相關(guān)。有多種選擇帶寬h的方法,本文采用下面的帶寬公式,因為它最接近帶寬最優(yōu)值,即h=δ(43n)15(4)式中,n為樣本數(shù);δ為樣本標(biāo)準(zhǔn)偏差。1.4初始分類中心的確定改進(jìn)的K-means算法的具體流程如下:(1)對數(shù)化log(xi)→xi;(2)應(yīng)用1.2節(jié)原理進(jìn)行主成分變換:(U1,U2,…,Uk)Txi→xi;(3)采用核密度估算第一主成分的概率密度函數(shù);依據(jù)概率密度函數(shù)的峰態(tài)確定初始分類數(shù)和相應(yīng)的分類中心;對第一主成分進(jìn)行K-means分類,獲得各類的標(biāo)簽;(4)按照主成分貢獻(xiàn)率k∑i=1Si/Ρ∑i=1Si≥85%的要求,選擇參與分類的主成分個數(shù);根據(jù)流程(3)得到的各類標(biāo)簽,計算多個主成分的初始分類中心;(5)按照K-means分類法進(jìn)行分類,最后進(jìn)行分類精度評定。2實驗與結(jié)果分析2.1遙感測量方法實驗區(qū)位于亞利桑那州的Maricopa縣境內(nèi),主要地類包括綠地、水體、道路、裸地和居民建筑用地等。實驗采用的遙感數(shù)據(jù)是2004年3月17日獲取的QuickBird多波段圖像,圖像大小為317像素×315像素,空間分辨率為2.44m,有4個波段(藍(lán)光、綠光、紅光和近紅外波段)。圖1為近紅外波段(R)、紅光波段(G)、綠光波段(B)組合的假彩色合成圖像。2.2基于meas算法的分類方法(1)使用傳統(tǒng)的基于均值-方差的K-means方法,對QuickBird原始數(shù)據(jù)(4個波段)多次采用K-means分類,從中選擇結(jié)果最優(yōu)的一個(圖2);(2)采用本文提出的改進(jìn)的K-means算法分類(圖3)。相應(yīng)的精度評價見表1??梢钥闯?本文提出的改進(jìn)的K-means算法優(yōu)于傳統(tǒng)的基于均值-方差的K-means算法?;诰?方差的K-means算法根據(jù)分類數(shù)據(jù)的均值μ和δ方差,將(μ-δ,μ+δ)分成K等分,獲得初始分類中心。此方法要求類別之間具有明顯的可分性,對于光譜特性相近的兩個類別往往存在誤分現(xiàn)象。本案例中,這種方法把水域和道路混為一個類。本文提出的改進(jìn)的K-means通過對數(shù)變換強化類型特征(比較原始數(shù)據(jù)第一主成分密度函數(shù)(圖4)和對數(shù)—主成分變換第一主成分直方圖(圖5(a)),進(jìn)一步用對數(shù)-主成分變換后的第一主成分密度函數(shù)(圖5(a))確定初始分類數(shù)和相應(yīng)的類型幾何中心,然后用一維K-means法針對第一主成分確定的初始分類標(biāo)簽作為多維K-means方法的初始輸入。由于對數(shù)-主成分變換后第一主成分最大限度地包含了地物類型信息,峰態(tài)更明顯,根據(jù)其密度函數(shù)(圖5(a))確定初始分類數(shù)(6類:綠地、房屋、裸地1、裸地2、道路和水域)和類型幾何中心,避開了隨機選取初值,得到的初始標(biāo)簽也最大限度地反映了類型的真實情況。此外,根據(jù)主成分貢獻(xiàn)率(≥85%)確定的主成分?jǐn)?shù)(第一、二兩個主成分),充分利用了多波段信息,壓縮了噪聲(可以看出圖5(c)和圖5(d)中第三、四主成分直方圖為單峰噪聲),因此所得分類結(jié)果優(yōu)于傳統(tǒng)的均值—方差K-means算法。3k-me病算法的分類結(jié)果(1)K-means分類算法是動態(tài)聚類,具有一定的自適應(yīng)性;但是分類結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度教育信息化設(shè)備代理采購協(xié)議3篇
- 2025年度冷鏈運輸裝卸搬運承包合同:冷凍食品安全搬運作業(yè)合同4篇
- 2025年度個人貨車運輸租賃合同糾紛處理辦法
- 二零二五年度企業(yè)內(nèi)部審計與內(nèi)部控制服務(wù)合同
- 《財務(wù)預(yù)測和預(yù)算》課件
- 《創(chuàng)新水資源及環(huán)?!氛n件
- 二零二五年度高速公路橋梁純勞務(wù)清包工施工合同4篇
- 二零二五年度智能化車間場地租賃與自動化生產(chǎn)線合同4篇
- 二零二五年度電子商務(wù)平臺充值卡銷售與營銷支持合同3篇
- 2025年度企業(yè)年金待遇發(fā)放賠償及社保補償協(xié)議范本4篇
- 2024版塑料購銷合同范本買賣
- 【高一上】【期末話收獲 家校話未來】期末家長會
- JJF 2184-2025電子計價秤型式評價大綱(試行)
- GB/T 44890-2024行政許可工作規(guī)范
- 有毒有害氣體崗位操作規(guī)程(3篇)
- 兒童常見呼吸系統(tǒng)疾病免疫調(diào)節(jié)劑合理使用專家共識2024(全文)
- 2025屆山東省德州市物理高三第一學(xué)期期末調(diào)研模擬試題含解析
- 《華潤集團全面預(yù)算管理案例研究》
- 2024-2025高考英語全國卷分類匯編之完型填空(含答案及解析)
- 二年級下冊加減混合豎式練習(xí)360題附答案
- 蘇教版五年級數(shù)學(xué)下冊解方程五種類型50題
評論
0/150
提交評論