不確定性人工智能-KJ6高斯云變換講課_第1頁(yè)
不確定性人工智能-KJ6高斯云變換講課_第2頁(yè)
不確定性人工智能-KJ6高斯云變換講課_第3頁(yè)
不確定性人工智能-KJ6高斯云變換講課_第4頁(yè)
不確定性人工智能-KJ6高斯云變換講課_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

高斯云變換《不確定性人工智能》課件之六GaussianCloudTransformation

如何用物化了的機(jī)器、系統(tǒng)或網(wǎng)絡(luò)研究來(lái)模擬人類(lèi)的感知、記憶、情感、推理、識(shí)別、理解、溝通、思考、學(xué)習(xí)、創(chuàng)造等不確定性智能行為,是人工智能研究中的一個(gè)重要目標(biāo)。語(yǔ)言是人類(lèi)思維的載體,自然語(yǔ)言是人工智能研究的一個(gè)很重要的切入點(diǎn)?;谌祟?lèi)知識(shí)和自然語(yǔ)言的信息交互、存儲(chǔ)和處理方式從內(nèi)容層面帶來(lái)了更多的不確定性,自然語(yǔ)言理解、網(wǎng)絡(luò)化數(shù)據(jù)挖掘和大數(shù)據(jù)處理等給傳統(tǒng)的數(shù)值邏輯計(jì)算和關(guān)系數(shù)據(jù)庫(kù)帶來(lái)了新的挑戰(zhàn)。

不確定性知識(shí)表示和處理,包括定性定量轉(zhuǎn)換、軟計(jì)算、變(跨)粒度計(jì)算等,逐漸成為網(wǎng)絡(luò)計(jì)算中亟待解決的熱點(diǎn)問(wèn)題。

粒計(jì)算是研究和模擬人類(lèi)從不同粒度、不同層次對(duì)事物進(jìn)行表示、分析和推理的方法,是人工智能中智能信息處理技術(shù)研究的一個(gè)重要方向。目前主要模型:模糊集、粗糙集、商空間、區(qū)間集等

模糊集是最早提出的一種粒計(jì)算方法,其對(duì)經(jīng)典集合論進(jìn)行了擴(kuò)展,利用隸屬度和隸屬函數(shù)描述概念外延的亦此亦彼性,但是隸屬度的確定,以及通過(guò)定義模糊運(yùn)算形成的模糊邏輯,常常受到質(zhì)疑。粗糙集、區(qū)間集和商空間等粒計(jì)算方法的數(shù)學(xué)基礎(chǔ)是經(jīng)典集合論,基于等價(jià)關(guān)系或者模糊等價(jià)關(guān)系進(jìn)行集合劃分、集合運(yùn)算、集合約簡(jiǎn)等實(shí)現(xiàn)不確定性知識(shí)的表示和處理。

在人類(lèi)認(rèn)知思維過(guò)程中使用的常常是定性的概念知識(shí),并不是一個(gè)個(gè)精確的數(shù)據(jù)集合,也沒(méi)有發(fā)生太多、太復(fù)雜的邏輯運(yùn)算和數(shù)值運(yùn)算。

概率論是一個(gè)重要的研究隨機(jī)性的數(shù)學(xué)分支,基于概率統(tǒng)計(jì)的不確定理論與方法已有百余年歷史,也是目前應(yīng)用最廣、最被普遍接受的不確定性表示方法。2011年度圖靈獎(jiǎng)得主JudeaPearl教授的主要貢獻(xiàn)之一就是將貝葉斯網(wǎng)絡(luò)和概率方法引入人工智能。

云模型是基于概率統(tǒng)計(jì)研究人類(lèi)認(rèn)知中概念內(nèi)涵的表示、內(nèi)涵與外延間的定性定量轉(zhuǎn)換。

云模型及算法的理解認(rèn)知中的概念是?對(duì)某一概念,有一個(gè)基本的形象——

期望概念外延包含的數(shù)據(jù)范圍——

熵概念外延包含的數(shù)據(jù)范圍是不確定的——超熵粒度?N(En,He2)Eni’N(Ex,En’2)xi計(jì)算Eni’2Ex,En,He正向云算法中云滴的生成過(guò)程:計(jì)算確定度yiEni’(i=1,…,n)構(gòu)成隨機(jī)變量En’Eni’2(i=1,…,n)構(gòu)成隨機(jī)變量En’2xi(i=1,…,n)構(gòu)成隨機(jī)變量Xyi(i=1,…,n)構(gòu)成隨機(jī)變量YEn’En’2XYEx,En,He是三個(gè)已知確定量En’和En’2是中間量云滴X和確定度Y是輸出量正向云算法中的參數(shù)分析En’服從高斯分布,期望是En,方差是He2En’2服從什么分布?期望、方差是什么?X服從分布?En’2的分布特征(1)因?yàn)镋n’~N(En,He2),根據(jù)方差計(jì)算公式所以,(2)因?yàn)樗裕琗服從分布在論域U上定義均值為En、方差為He2的高斯隨機(jī)變量S,即S的概率密度函數(shù)為在S=

的條件下,定義在論域上的隨機(jī)變量X的條件概率密度函數(shù)為X的期望X的一階絕對(duì)中心矩X的方差X的四階中心矩逆向云算法有確定度的逆向云算法無(wú)確定度的逆向云算法基于一階絕對(duì)中心矩和方差(劉常昱)基于方差和四階中心矩(王立新)分組后基于分組期望和方差(許昌林)一、粒計(jì)算中的幾個(gè)基本術(shù)語(yǔ)云模型是一個(gè)基于概率統(tǒng)計(jì)的定性定量轉(zhuǎn)換認(rèn)知模型。逆向云算法可以將一組數(shù)據(jù)樣本轉(zhuǎn)換為一個(gè)基本概念的三個(gè)數(shù)字特征,但是該算法默認(rèn)的前提是,給定的所有數(shù)據(jù)樣本對(duì)應(yīng)于同一個(gè)概念在同一個(gè)粒度上的外延表征,而不能在整個(gè)問(wèn)題域中解決多粒度、多概念的生成問(wèn)題,這在一定程度上限制了逆向云算法從數(shù)據(jù)樣本中獲得更多概念、更多知識(shí)的認(rèn)知能力。多粒度概念生成、合適粒度和概念層次的選擇、不同粒度之間的切換都是粒計(jì)算研究中必須解決的問(wèn)題。尺度是指研究某一物體或現(xiàn)象時(shí)所采用的空間或時(shí)間單位,又指某一現(xiàn)象或過(guò)程在空間和時(shí)間上所涉及的范圍和發(fā)生的頻率,還可指人們觀(guān)察事物對(duì)象、模式或過(guò)程時(shí)所采用的窗口。在測(cè)繪學(xué)、地圖制圖學(xué)和地理學(xué)中通常把尺度表述為比例尺,即地圖上的距離與其所表達(dá)的實(shí)際距離的統(tǒng)一比率。在不同尺度上認(rèn)識(shí)人與自然時(shí),可能在整體上會(huì)呈現(xiàn)出自相似性粒度原本是一個(gè)物理學(xué)的概念,是指物質(zhì)微粒大小的平均度量。在這里被借用作為對(duì)概念中包含信息量的度量,從不同概念層次分析和處理論域空間中的數(shù)據(jù),只是從不同粒度理解這些信息量而已,正如大數(shù)據(jù)中的深度學(xué)習(xí)。我們把云模型作為表示概念的基本模型,期望等同于模型中的核,而數(shù)據(jù)相對(duì)于核的離散程度通過(guò)熵來(lái)反映,說(shuō)明概念粒度的大小,超熵可以作為概念成熟度的度量。人類(lèi)智能的一個(gè)公認(rèn)特點(diǎn),就是能夠從不同粒度、不同層次上觀(guān)察和分析同一現(xiàn)象或問(wèn)題。從較細(xì)粒度的概念躍升到較粗粒度的概念,是對(duì)信息或知識(shí)的抽象,可以使問(wèn)題簡(jiǎn)化,通常這一過(guò)程稱(chēng)為數(shù)據(jù)簡(jiǎn)約或歸約。用粗粒度概念觀(guān)察和分析信息,忽略了細(xì)粒度上的細(xì)微差別,尋找共性。共性常常比個(gè)性更深刻,可以求得宏觀(guān)的把握。相反,如果用細(xì)粒度概念觀(guān)察和分析信息,則可發(fā)現(xiàn)紛繁復(fù)雜的個(gè)性特征,更準(zhǔn)確地區(qū)分差別,區(qū)分小眾。個(gè)性要比共性豐富和典型,但是不能完全進(jìn)入共性之中。通過(guò)概念提升,可以發(fā)現(xiàn)更普遍的知識(shí)。

SlingoJulia,BatesKevin,andNikiforakisNikos.et.al;Developingthenext-generationclimatesystemmodels:challengesandachievementsPHILOSOPHICALTRANSACTIONSOFTHEROYALSOCIETYA-MATHEMATICALPHYSICALANDENGINEERINGSCIENCESvol:367(1890):815-831,MAR,2009.世界衛(wèi)生組織年齡分段的概念樹(shù)

不同概念對(duì)應(yīng)的數(shù)值區(qū)間界限分明,不允許有亦此亦彼的過(guò)渡現(xiàn)象存在,缺少了概念固有的模糊性。例如,44歲和45歲屬于兩個(gè)不同的年齡概念過(guò)于武斷;隸屬關(guān)系單一,無(wú)法反映一個(gè)屬性值可能同時(shí)屬于多個(gè)上層概念的現(xiàn)象。概念樹(shù)通常是與特定情境和主題相關(guān)的,具有相對(duì)性。例如對(duì)于科學(xué)家而言48歲還是一個(gè)非常年輕的年齡。又例如1995年世界衛(wèi)生組織將“中年”劃定為45-65歲,2000年為45-59歲。再例如美國(guó)將“中年”劃定為40-65歲,葡萄牙為29-51歲,日本和中國(guó)為40-60歲。因此,概念樹(shù)的結(jié)構(gòu)常常和問(wèn)題域的時(shí)間、地區(qū)等相關(guān)。

傳統(tǒng)的概念樹(shù)存在以下局限性

人們?cè)趯?duì)概念認(rèn)知的過(guò)程中,很多時(shí)候并不存在層次結(jié)構(gòu)分明、邊界劃分明確的唯一的樹(shù)形結(jié)構(gòu),概念之間或許存在交疊,一個(gè)低層次的概念也可以隸屬于多個(gè)高層次的概念,整體呈樹(shù)狀結(jié)構(gòu)、局部呈現(xiàn)出網(wǎng)狀結(jié)構(gòu),稱(chēng)之為泛概念樹(shù)。如何構(gòu)建泛概念樹(shù)?二、從高斯變換到高斯云變換空間變換或域變換是科學(xué)研究中常用的一種方法。在一個(gè)空間中呈現(xiàn)復(fù)雜狀態(tài)的問(wèn)題轉(zhuǎn)換到另一個(gè)空間,可能就會(huì)變得簡(jiǎn)單而容易理解了。例如物理學(xué)中的傅里葉變換可以將一個(gè)時(shí)域的函數(shù)變換為頻域里多個(gè)正弦函數(shù)的疊加,反之亦然,這種變換具有唯一性,快速傅里葉變換是現(xiàn)代工程應(yīng)用中的一個(gè)重要工具。如何實(shí)現(xiàn)從數(shù)據(jù)到多粒度概念的轉(zhuǎn)換?高斯混合模型GMM:任意一種概率分布都可以分解為若干個(gè)高斯分布之和,可以通過(guò)EM算法估計(jì)每個(gè)高斯分布的參數(shù)。將問(wèn)題域的一個(gè)頻度分布轉(zhuǎn)化為若干高斯分布疊加的過(guò)程稱(chēng)之為高斯變換(GaussianTranformation,GT)。根據(jù)中國(guó)工程院網(wǎng)站()公布的院士年齡分布數(shù)據(jù),至2012年4月中國(guó)工程院現(xiàn)有院士776名,年齡分布在43歲至99歲之間,男性院士740名,女性院士36名,超過(guò)80歲的資深院士206名。中國(guó)工程院院士群體年齡分布圖

multiplegranularityconcept?Somuchoverlapped?高斯變換只是一種數(shù)學(xué)擬合;高斯個(gè)數(shù)越多,擬合誤差越小。高斯變換本身,沒(méi)有體現(xiàn)概念的形成機(jī)理,沒(méi)有考慮“類(lèi)內(nèi)關(guān)系強(qiáng)、類(lèi)間關(guān)系弱”的聚類(lèi)原則。如何確定概念的個(gè)數(shù)?如何體現(xiàn)類(lèi)內(nèi)關(guān)系強(qiáng)、類(lèi)間關(guān)系弱?如何體現(xiàn)概念認(rèn)知中層次和粒度的不確定性?根據(jù)數(shù)據(jù)聚類(lèi)中類(lèi)內(nèi)關(guān)系強(qiáng)、類(lèi)間關(guān)系弱的原則,借用高斯云中的熵和超熵,構(gòu)建概念含混度:3He/En去衡量高斯變換結(jié)果中概念的交疊程度。任何一個(gè)概念,如果其概念含混度大,則此概念的外延會(huì)更加離散,與相鄰概念的重疊通常會(huì)多,劃分混亂;反之,這個(gè)概念的含混度小,此概念的外延會(huì)比較匯聚,與相鄰概念的交疊通常會(huì)少,概念共識(shí)程度強(qiáng)。高斯云變換的基本思想對(duì)于任意兩個(gè)相交的高斯分布,以它們目前的標(biāo)準(zhǔn)差作為概念的最大粒度參數(shù),保持它們的期望不變,進(jìn)行等比例縮減,直至它們的弱外圍元素不相交,此時(shí)可以獲得每個(gè)概念的最小粒度參數(shù),利用概念粒度變化范圍可以求出每個(gè)概念的En和He,由于進(jìn)行等比例縮減,所以它們的He/En相同,稱(chēng)3He/En=(1-a)/(1+a)為概念含混度(ConfusionDegree,CD),a為縮減比例。用概念含混度衡量概念間的交疊程度對(duì)于高斯變換中的第k個(gè)高斯分布,分別計(jì)算其與左右相鄰兩個(gè)高斯分布之間的重疊程度,如果他們的弱外圍元素都不重疊,說(shuō)明這個(gè)高斯分布表示的概念劃分非常清晰,它的否則,說(shuō)明此概念與相鄰概念之間存在劃分不清晰的重疊區(qū)域,保持期望值不變,對(duì)他們的標(biāo)準(zhǔn)差按等比例進(jìn)行縮減,計(jì)算獲得與左側(cè)相鄰概念之間弱外圍元素不重疊的縮減比例

滿(mǎn)足

計(jì)算獲得與左側(cè)相鄰概念之間弱外圍元素不重疊的縮減比例滿(mǎn)足

第k個(gè)高斯分布由于概念劃分不清晰引起的標(biāo)準(zhǔn)差變化范圍為根據(jù)高斯云的定義,熵是標(biāo)準(zhǔn)差的期望,超熵是標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差,同樣符合3sigma原則,因此:不同區(qū)域內(nèi)的云滴群對(duì)定性概念的貢獻(xiàn)μ(x)1ExEx-0.67EnEx+0.67EnEx-EnEx+EnEx+2EnEx-2EnEx-3EnEx+3En骨干元素基本元素外圍元素外圍元素弱外圍元素弱外圍元素骨干區(qū):50%[Ex-0.67En,Ex+0.67En]基本區(qū):68.26%[Ex-En,Ex+En]外圍區(qū):27.18%[Ex-2En,Ex-En]和[Ex+En,

Ex+2En]弱外圍區(qū):4.3%[Ex-3En,Ex-2En]和[Ex+2En,Ex+3En]與相鄰高斯分布元素之間交疊程度標(biāo)準(zhǔn)差縮放比概念含混度定性描述期望相同01霧化骨干區(qū)交疊(0,0.223)(0.6354,1)含混骨干區(qū)不交疊基本區(qū)交疊[0.223,0.333)(0.5004,0.6354]較含混外圍區(qū)交疊[0.3333,0.667)(0.2,0.5004]較成熟弱外圍區(qū)交疊[0.667,1)(0,0.2]成熟弱外圍區(qū)不交疊10非常成熟啟發(fā)式高斯云變換通過(guò)指定生成的概念數(shù)量M,調(diào)用高斯變換,獲得滿(mǎn)足迭代終止條件的M個(gè)高斯分布的期望、標(biāo)準(zhǔn)差和幅值。對(duì)于每個(gè)高斯分布分別計(jì)算其對(duì)應(yīng)的表征概念的高斯云的期望、熵和超熵,進(jìn)而將高斯變換的劃分結(jié)果轉(zhuǎn)換為一個(gè)個(gè)認(rèn)知概念,同時(shí)可以計(jì)算出每個(gè)概念的概念含混度,對(duì)其進(jìn)行排序可獲得概念劃分清晰度的順序關(guān)系。(HeuristicGaussianCloudTransformation,H-GCT)

算法:H-GCT輸入:原始數(shù)據(jù)集X,初始概念數(shù)k輸出:

m個(gè)高斯云

步驟1:利用高斯變換(GT)將數(shù)據(jù)集合X轉(zhuǎn)換為生成m個(gè)高斯分布

步驟2:對(duì)k個(gè)高斯分布計(jì)算其縮減比例則對(duì)應(yīng)的第k個(gè)表示概念的高斯云參數(shù)利用啟發(fā)式高斯云變換將院士按年齡聚類(lèi)成五個(gè)概念群概念期望(歲)熵(歲)超熵(歲)含混度占總數(shù)比例非常年輕院士53.12.70.420.46810%年輕院士67.05.41.30.72312%中年院士74.22.40.640.831%老年院士77.52.80.750.831%長(zhǎng)壽院士83.53.40.890.78515%利用啟發(fā)式高斯云變換將院士按年齡聚類(lèi)成3個(gè)概念群概念期望(歲)熵(歲)超熵(歲)含混度占總數(shù)比例年輕院士55.84.80.390.24416%中年院士74.52.60.580.67547%老年院士80.63.70.840.67537%啟發(fā)式高斯云變換可以根據(jù)預(yù)先給定的概念個(gè)數(shù)對(duì)數(shù)據(jù)進(jìn)行聚類(lèi),概念含混度為高斯變換劃分結(jié)果的交疊程度提供了一種度量方法,為實(shí)現(xiàn)類(lèi)內(nèi)關(guān)聯(lián)強(qiáng)、類(lèi)間關(guān)聯(lián)弱提供了基礎(chǔ)。

自適應(yīng)高斯云變換常識(shí)知識(shí)告訴我們,相對(duì)于低頻率出現(xiàn)的數(shù)據(jù)值,高頻率出現(xiàn)的數(shù)據(jù)值對(duì)定性概念的貢獻(xiàn)更大,因此可以統(tǒng)計(jì)計(jì)算數(shù)據(jù)樣本頻度分布中的波峰數(shù)作為高斯云變換的初始概念數(shù)量M,調(diào)用啟發(fā)式高斯云變換生成M個(gè)高斯云表征的概念,根據(jù)每個(gè)概念的含混度,制定高斯云變換策略,例如,保證每個(gè)概念的含混度He/En<=0.5004,即它與相鄰概念之間的基本區(qū)不交疊,通過(guò)不斷調(diào)用啟發(fā)式高斯云變換來(lái)進(jìn)行迭代收斂,形成滿(mǎn)足迭代終止條件要求的多個(gè)不同概念。

(AutonomicGaussianCloudTransformation,A-GCT)

算法:A-GCT輸入:原始數(shù)據(jù)集X,概念含混度上限輸出:

m個(gè)高斯云步驟1:統(tǒng)計(jì)樣本集X的頻度分布,并對(duì)其進(jìn)行去噪聲的預(yù)處理,獲得波峰數(shù)量M

步驟2:利用啟發(fā)式高斯云變換(H_GCT)將X聚類(lèi)成M個(gè)高斯分布

步驟3:按順序?qū)γ總€(gè)高斯云的概念含混度進(jìn)行判斷,如果存在一個(gè)高斯云的概念含混度超過(guò)則M=M-1

步驟4:循環(huán)步驟2-3,形成m個(gè)概念含混度小于等于,即概念之間的基本元素都不重疊的高斯云自適應(yīng)高斯云變換將院士按年齡聚類(lèi)成2個(gè)概念群概念期望(歲)熵(歲)超熵(歲)含混度占總數(shù)比例年輕院士533.30.160.14514%年老院士76.45.90.290.14586%

ArnetMiner()是清華大學(xué)軟件與知識(shí)工程實(shí)驗(yàn)室開(kāi)發(fā)的專(zhuān)門(mén)用于研究者社會(huì)網(wǎng)絡(luò)挖掘和學(xué)術(shù)搜索的網(wǎng)站,從2006年運(yùn)行以來(lái),至2012年3月26日共有來(lái)自196個(gè)國(guó)家的988645個(gè)注冊(cè)用戶(hù)。

自適應(yīng)高斯云變換將學(xué)術(shù)網(wǎng)用戶(hù)按年齡聚類(lèi)成2個(gè)概念群概念期望(歲)熵(歲)超熵(歲)含混度比例青年學(xué)者30.42.10.290.4080.65中年學(xué)者40.93.80.550.4370.301老年學(xué)者57.05.70.830.4370.049高斯云變換中的概念之間的粒度和層次關(guān)系粗粒度細(xì)粒度自適應(yīng)高斯云變換生成的泛概念樹(shù)

從細(xì)粒度到粗粒度的概念提升過(guò)程中,如果原始數(shù)據(jù)分布中的峰值過(guò)多,迭代的次數(shù)增加,算法的復(fù)雜度也會(huì)增加。然而,在人類(lèi)認(rèn)知過(guò)程中,對(duì)于同一個(gè)論域上的概念個(gè)數(shù)常常是有限的,例如“極小”、“超小”、“非常小”、“很小”、“小”、“偏小”、“中”、“偏大”、“大”、“很大”、“非常大”、“超大”、“極大”這13個(gè)形容詞基本上可以涵蓋人類(lèi)對(duì)任意一維屬性空間針對(duì)數(shù)據(jù)值的分類(lèi)。尤其是在圖像分割中,最常見(jiàn)的就是差異性目標(biāo)提取。因此,可以對(duì)自適應(yīng)高斯云變換算法進(jìn)行調(diào)整從而實(shí)現(xiàn)從粗粒度到細(xì)粒度的概念細(xì)化過(guò)程。算法:A-GCT-2輸入:原始數(shù)據(jù)集X,概念含混度上限輸出:含混度小于的高斯云步驟1:設(shè)m=2

步驟2:利用啟發(fā)式高斯云變換(H_GCT)將X聚類(lèi)成m個(gè)高斯分布

步驟3:最小的概念含混度超過(guò)則m=m+1

步驟4:循環(huán)步驟2-3,找到含混度小于的概念

以2011年中國(guó)各市轄區(qū)的職工平均工資分類(lèi)為例,根據(jù)中國(guó)城市統(tǒng)計(jì)年鑒2011//2-26勞動(dòng)工資,全國(guó)286個(gè)市轄區(qū)的的職工平均工資的頻度分布。全國(guó)職工2011年平均工資為31969.23元,其中工資較低的地區(qū)為湖北省鄂州市13818.39、廣西壯族自治區(qū)欽州市14665.42、黑龍江升伊春市16261.46,少數(shù)地區(qū)的職工平均收入特別少,少數(shù)工資較高地區(qū)為北京66458.74、上海71923.60等。粗粒度細(xì)粒度概念期望(萬(wàn)元)熵(萬(wàn)元)超熵(萬(wàn)元)含混度占總數(shù)比例低工資地區(qū)2.580.230.0600.750.162普通工資地區(qū)2.950.2710.6860.750.513較高工資地區(qū)3.690.4180.090.640.276高工資地區(qū)5.00.7920.1510.5720.049理論上,高斯云變換算法可以針對(duì)一維屬性數(shù)據(jù),也可以用于對(duì)二維或者多維屬性數(shù)據(jù)進(jìn)行處理。例如,對(duì)于二維屬性,兩個(gè)概念的交疊程度是通過(guò)兩個(gè)橢圓的交疊區(qū)來(lái)計(jì)算的。對(duì)于三維屬性,兩個(gè)概念的交疊程度是通過(guò)兩個(gè)橢球的交疊區(qū)域來(lái)計(jì)算的,其呈現(xiàn)出的高斯云是一個(gè)四維圖形。對(duì)于四維以上的屬性數(shù)據(jù),已經(jīng)無(wú)法在坐標(biāo)空間內(nèi)直觀(guān)顯示。此時(shí),概念含混度通過(guò)幾何圖形交疊區(qū)域的計(jì)算已經(jīng)無(wú)法獲得,可以通過(guò)概念在各維度上的投影分別計(jì)算概念含混度,因此得到的概念含混度就是一個(gè)多維向量。

為了簡(jiǎn)化問(wèn)題,本論文暫設(shè)定每個(gè)概念在各維屬性上的粒度投影相同,即二維屬性數(shù)據(jù)對(duì)應(yīng)的概念外延為一個(gè)具有不確定半徑的圓形區(qū)域,圓心(Ex1,Ex2)就是期望,半徑是一個(gè)以三倍熵(En)為期望、超熵(He)為標(biāo)準(zhǔn)差的隨機(jī)數(shù)。三維屬性數(shù)據(jù)對(duì)應(yīng)的概念外延為一個(gè)具有不確定球徑的球形區(qū)域,球心(Ex1,Ex2,Ex3)就是期望,球徑是一個(gè)以三倍熵(En)為期望、超熵(He)為標(biāo)準(zhǔn)差的隨機(jī)數(shù)。此時(shí)概念含混度計(jì)算方法與一維屬性的計(jì)算方法相同,即通過(guò)兩個(gè)概念期望之間的距離與半徑之間的關(guān)系來(lái)計(jì)算獲得兩個(gè)概念之間的含混度。

基于高斯云和高斯變換提出的高斯云變換方法給出了一個(gè)通用的認(rèn)知工具,不僅將數(shù)據(jù)集合轉(zhuǎn)換為不同粒度的概念,而且可以實(shí)現(xiàn)不同粒度概念之間的柔性切換,構(gòu)建泛概念樹(shù),解決了粒計(jì)算中的變粒度問(wèn)題,有著廣闊的應(yīng)用前景。三、用高斯云變換實(shí)現(xiàn)圖像分割隨著計(jì)算機(jī)視覺(jué)研究的深入,簡(jiǎn)單的圖像分割已經(jīng)不能滿(mǎn)足個(gè)性化的需求,有時(shí)候人們真正感興趣的恰恰是圖像中亦此亦彼的那些不確定性區(qū)域,如何模擬人類(lèi)自然視覺(jué)中的認(rèn)知能力進(jìn)行圖像分割一直以來(lái)都是一個(gè)難點(diǎn)問(wèn)題,而高斯云變換正是一種模擬人類(lèi)認(rèn)知中可變粒計(jì)算能力的方法,在處理不確定性信息上具有優(yōu)勢(shì)。因此,發(fā)現(xiàn)圖像中存在的不確定性區(qū)域是高斯云變換的一個(gè)重要能力。一方面是其具有明顯統(tǒng)計(jì)特征,宏觀(guān)上導(dǎo)致分割目標(biāo)數(shù)量發(fā)生變化,例如,一幅圖像中如果顏色混合的過(guò)渡區(qū)概念已占據(jù)相當(dāng)比例,在頻率統(tǒng)計(jì)圖中明顯區(qū)別于背景和前景兩個(gè)概念,則圖像分割結(jié)果應(yīng)是背景區(qū)、前景區(qū)、過(guò)渡區(qū)三個(gè)概念;另一個(gè)方面就是宏觀(guān)統(tǒng)計(jì)特征不明顯,像素點(diǎn)數(shù)量少不足以構(gòu)成一個(gè)新概念,但是在微觀(guān)上的目標(biāo)邊緣提取中,影響著邊緣像素點(diǎn)的歸屬問(wèn)題。圖像中概念數(shù)量的自適應(yīng)優(yōu)化和目標(biāo)邊緣不確定性區(qū)域的提取,這兩方面正是包括高斯變換在內(nèi)的其他圖像分割方法中面臨的難題,也是高斯云變換的優(yōu)勢(shì)所在。一幅圖像中的不確定性區(qū)域主要表現(xiàn)在兩個(gè)方面:圖像過(guò)渡區(qū)提取激光熔覆是指在工業(yè)中利用高能激光束將熔覆材料與基材表面薄層一起熔凝形成添料熔覆層。如何從激光熔覆圖像獲取精確的激光高度是激光熔覆圖分割的關(guān)鍵,通常依靠先驗(yàn)知識(shí)設(shè)定概念數(shù)量的算法往往直接指定圖像中存在前景和背景兩個(gè)目標(biāo),忽略了過(guò)渡區(qū)域,而過(guò)渡區(qū)正是不同分割算法結(jié)果差異的關(guān)鍵所在。

(a)Kapur分割的二色圖(b)C-means分割的二色圖(c)Otsu分割的二色圖(d)FCM分割的二色圖概念期望熵超熵含混度黑色背景區(qū)81.315.31.810.354灰色過(guò)渡區(qū)172.331.73.740.354白色激光區(qū)253.21.30.110.247不確定性邊緣提取C1和C2之間的不確定性邊緣C2和C3之間的不確定性邊緣

概念期望熵超熵含混度黑色背景區(qū)87.9712.21.600.393灰色過(guò)渡區(qū)165.6130.43.980.393白色激光區(qū)253.081.50.100.205概念期望熵超熵含混度紅綠藍(lán)棕黑色目標(biāo)區(qū)68.8566.0751.5632.7800漸進(jìn)色過(guò)渡區(qū)177.41207.66193.643.880.360.28淡藍(lán)色背景區(qū)148.66178.65176.2716.581.530.28用簡(jiǎn)單三維高斯云變換實(shí)現(xiàn)彩色圖像分割用高斯云變換實(shí)現(xiàn)自然視覺(jué)認(rèn)知能的形式化

高斯云變換利用統(tǒng)計(jì)擬合中高斯變換和定性概念表示中的高斯云,根據(jù)圖像統(tǒng)計(jì)特征直接生成符合人類(lèi)認(rèn)知規(guī)律的概念數(shù)量、粒度和層次。因此高斯云變換為人類(lèi)自然認(rèn)知中的變粒度計(jì)算能力模擬研究提供了方法,也為高斯云變換研究自然視覺(jué)認(rèn)知能力中全局優(yōu)先、前景優(yōu)先和差異性?xún)?yōu)先的形式化奠定了基礎(chǔ)。

高斯云變換從數(shù)據(jù)統(tǒng)計(jì)分布出發(fā),不依賴(lài)于先驗(yàn)知識(shí),但是在初始參數(shù)的選擇優(yōu)化時(shí)可以借助先驗(yàn)知識(shí)。利用高斯云變換策略可以實(shí)現(xiàn)不同粒度上的概念抽取,因此可以用來(lái)實(shí)現(xiàn)全局優(yōu)先的形式化;概念含混度是一個(gè)概念共識(shí)程度的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論