版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能和認(rèn)知物理學(xué)ArtificialIntelligenceandCognitivePhysics李德毅11月25日1第1頁(yè)認(rèn)知科學(xué)——研究人類(lèi)怎樣獲取知識(shí)和使用知識(shí)
數(shù)據(jù)挖掘——讓機(jī)器模擬人智能從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)2第2頁(yè)目錄人工智能50年發(fā)展回憶20世紀(jì)物理學(xué)成就不確定性認(rèn)知原子模型數(shù)據(jù)場(chǎng)和勢(shì)函數(shù)認(rèn)知場(chǎng)中知識(shí)發(fā)現(xiàn)3第3頁(yè)一、人工智能50年發(fā)展回憶人工智能興起智能鑒定原則人工智能研究不一樣樣切入點(diǎn)人工智能研究目旳4第4頁(yè)人工智能自誕生之日起就引起人們無(wú)限漂亮想象和憧憬;已經(jīng)成為學(xué)科交叉發(fā)展中一盞明燈,光輝四射;但其理論起伏跌宕,也存在爭(zhēng)議和誤解。5第5頁(yè)人工智能興起數(shù)學(xué)家和邏輯學(xué)家;認(rèn)知學(xué)家和心理學(xué)家;神經(jīng)生理學(xué)家;計(jì)算機(jī)科學(xué)家1956年著名“達(dá)特茅斯(Dartmouth)會(huì)議”標(biāo)志人工智能學(xué)科誕生,它從一開(kāi)始就是交叉學(xué)科產(chǎn)物。與會(huì)者有:
6第6頁(yè)人工智能興起達(dá)特茅斯會(huì)議上,明斯基(MarvinMinsky)神經(jīng)網(wǎng)絡(luò)模擬器、麥卡錫(JohnMccarthy)搜索法、以及西蒙(HerbertSimon)和紐厄爾(AllenNewell)“邏輯理論家”是會(huì)議3個(gè)亮點(diǎn)。分別討論怎樣穿過(guò)迷宮,怎樣搜索推理和怎樣證明數(shù)學(xué)定理。這是初期人們期待人工智能。7第7頁(yè)人工智能經(jīng)典著作由費(fèi)根鮑姆主編《ComputersandThought》被認(rèn)為是世界上第一本人工智能經(jīng)典專(zhuān)著,含21篇著名論文,1963年出版。80年代出版1-4卷《TheHandbookofArtificialIntelligence》是人工智能杠鼎之作。8第8頁(yè)人工智能研究杰出人物20世紀(jì)40位圖靈獎(jiǎng)獲得者中有6名人工智能學(xué)者,可見(jiàn)人工智能學(xué)科影響之深遠(yuǎn)。1969年:馬文·明斯基1971年:約翰·麥卡錫1975年:赫伯特·西蒙和艾倫·紐厄爾1994年:愛(ài)德華·費(fèi)根鮑姆和勞伊·雷迪9第9頁(yè)智能鑒定原則圖靈(Turing)測(cè)試:假如機(jī)器在與人隔離房間回答人提出問(wèn)題,且人無(wú)法判斷回答問(wèn)題是機(jī)器還是人時(shí),則應(yīng)當(dāng)認(rèn)為機(jī)器已經(jīng)具有人智能。10第10頁(yè)猴子摘香蕉11第11頁(yè)梵塔游戲
初始柱替代柱目柱12第12頁(yè)計(jì)算機(jī)下棋:1997年IBM“深藍(lán)”計(jì)算機(jī)以2勝3平1負(fù)戰(zhàn)績(jī)戰(zhàn)勝?lài)?guó)際象棋冠軍卡斯帕羅夫,“深藍(lán)”計(jì)算速度為200萬(wàn)棋步/秒,采用啟發(fā)式搜索措施;在與下棋領(lǐng)域具有類(lèi)似性質(zhì)和類(lèi)似復(fù)雜性問(wèn)題上,計(jì)算機(jī)具有有智能。13第13頁(yè)計(jì)算機(jī)下棋:卡斯帕羅夫自1990年稱(chēng)霸國(guó)際象棋棋壇,年舉行國(guó)際世界象棋冠軍比賽中,克拉莫尼克以8:6領(lǐng)先卡斯帕羅夫。“深藍(lán)”計(jì)算機(jī)能否打敗克拉莫尼克?也就是說(shuō),“深藍(lán)”計(jì)算機(jī)智能能否“與時(shí)俱進(jìn)”?14第14頁(yè)追求智能三步曲1)??!真了不起!2)??!是這樣啊!3)?。∵@也算智能嗎?4)又回到第一步。
15第15頁(yè)人工智能研究對(duì)象不確定非線(xiàn)性不完全變構(gòu)造多變量分布式16第16頁(yè)人工智能應(yīng)用人工智能實(shí)際應(yīng)用越來(lái)越普遍。智能機(jī)器人、智能控制、智能網(wǎng)絡(luò)、智能、智能數(shù)據(jù)庫(kù)、智能管理、智能小區(qū)、智能交通、甚至智能經(jīng)濟(jì)等等不絕于耳,知識(shí)就是力量。17第17頁(yè)人工智能研究切入點(diǎn)先后出現(xiàn)了3個(gè)主流學(xué)派:符號(hào)主義措施--邏輯學(xué)派聯(lián)結(jié)主義措施--仿生學(xué)派行為主義措施--控制論學(xué)派
18第18頁(yè)符號(hào)主義學(xué)派(西蒙和紐厄爾為代表)物理符號(hào)系統(tǒng)假說(shuō)(physicalsymbolsystemhypothesis)。由一組稱(chēng)為符號(hào)實(shí)體構(gòu)成系統(tǒng),這些符號(hào)可作為組份出目前另一符號(hào)實(shí)體中。任何時(shí)候系統(tǒng)內(nèi)部均有一組符號(hào)構(gòu)造,以及作用在這些符號(hào)構(gòu)造上生成其他符號(hào)構(gòu)造一組過(guò)程。任一物理符號(hào)系統(tǒng)假如是有智能,則必能執(zhí)行對(duì)符號(hào)輸入、輸出、寄存、復(fù)制、條件轉(zhuǎn)移和建立符號(hào)構(gòu)造這樣6種操作。反之,能執(zhí)行這6種操作任何系統(tǒng),也就一定可以體現(xiàn)出智能。19第19頁(yè)符號(hào)主義學(xué)派認(rèn)知基元是符號(hào),智能行為通過(guò)符號(hào)操作來(lái)實(shí)現(xiàn),以美國(guó)科學(xué)家Robinson提出歸結(jié)原理為基礎(chǔ),以L(fǎng)isp和Prolog語(yǔ)言為代表;著重問(wèn)題求解中啟發(fā)式搜索和推理過(guò)程,在邏輯思維模擬方面獲得成功,如自動(dòng)定理證明和專(zhuān)家系統(tǒng);歸結(jié)原理不也許成為所有數(shù)學(xué)分支證明基礎(chǔ),問(wèn)題求解和邏輯推理本質(zhì)僅僅是演譯。20第20頁(yè)聯(lián)結(jié)主義學(xué)派(J.J.Hopfield為代表)人思維基元是神經(jīng)元,把智能理解為互相聯(lián)結(jié)神經(jīng)元競(jìng)爭(zhēng)與協(xié)作成果,以人工神經(jīng)網(wǎng)絡(luò)為代表,其中,反向傳播網(wǎng)絡(luò)模型(BP)和Hopfield網(wǎng)絡(luò)模型更為突出;著重構(gòu)造模擬,研究神經(jīng)元特性、神經(jīng)元網(wǎng)絡(luò)拓樸、學(xué)習(xí)規(guī)則、網(wǎng)絡(luò)非線(xiàn)性動(dòng)力學(xué)性質(zhì)和自適應(yīng)協(xié)同行為。21第21頁(yè)遺傳算法和進(jìn)化計(jì)算:1975年,JohnHolland提出遺傳算法(GeneticAlgorithm),模仿生物染色體中基因選擇(selection)、交叉(crossover)和變異(mutation)自然進(jìn)化過(guò)程,通過(guò)個(gè)體構(gòu)造重組,形成一代代新群體(populations),最終收斂于近似優(yōu)化解。用于處理多變量、非線(xiàn)性、不確定、甚至混沌大搜索空間有約束優(yōu)化問(wèn)題;22第22頁(yè)麻將原理:剛發(fā)到手牌就“和”了概率是非常非常小。不管開(kāi)始手中牌有多壞,通過(guò)一次次摸牌、選擇、淘汰,可以逐漸迫近到最優(yōu)解。這相稱(chēng)進(jìn)化中變異和選擇原理。麻將魅力在于可以在容忍時(shí)間內(nèi)讓牌“和”了。遺傳算法和進(jìn)化計(jì)算收斂性問(wèn)題。23第23頁(yè)行為主義學(xué)派(R.A.Brooks為代表)控制論研究導(dǎo)致機(jī)器人和智能控制,機(jī)器人是“感知--行為”模式,是沒(méi)有知識(shí)智能(iwk,iwr),強(qiáng)調(diào)直覺(jué)和反饋重要性;智能行為體現(xiàn)在系統(tǒng)與環(huán)境交互之中,功能、構(gòu)造和智能行為不可分割。90年代起智能Agent成為新熱點(diǎn)。它是一種自治、具有自發(fā)行為、體現(xiàn)交互性和環(huán)境適應(yīng)性新型智能機(jī)模型,具有移動(dòng)性、推理、規(guī)劃、學(xué)習(xí)和適應(yīng)能力。24第24頁(yè)行為主義學(xué)派反饋是控制論基石,沒(méi)有反饋就沒(méi)有智能。根據(jù)目旳與實(shí)際行為之間誤差來(lái)消除此誤差控制方略。PID控制是控制論對(duì)付不確定性最基本手段。強(qiáng)調(diào)智能系統(tǒng)與環(huán)境交互,從運(yùn)行環(huán)境中獲取信息(感知),通過(guò)自己動(dòng)作對(duì)環(huán)境施加影響。25第25頁(yè)目前,以實(shí)際問(wèn)題驅(qū)感人工智能研究成為主流。人工智能不再是陽(yáng)春白雪,尤其是數(shù)據(jù)挖掘技術(shù),要以機(jī)器再現(xiàn)人類(lèi)認(rèn)識(shí)過(guò)程方式,為認(rèn)知科學(xué)提供了一種新實(shí)體模型和實(shí)在形式。26第26頁(yè)研究熱點(diǎn)模式識(shí)別智能檢索專(zhuān)家系統(tǒng)自然語(yǔ)言理解知識(shí)工程數(shù)據(jù)挖掘智能控制智能機(jī)器人27第27頁(yè)人工智能三次大躍進(jìn)第一次:智能系統(tǒng)替代人完畢部分邏輯推理工作,如專(zhuān)家系統(tǒng)。
第二次:智能系統(tǒng)可以和環(huán)境交互,從運(yùn)行環(huán)境中獲取信息,替代人完畢包括不確定性在內(nèi)部分思維工作,通過(guò)自身動(dòng)作,對(duì)環(huán)境施加影響,并適應(yīng)環(huán)境變化。如智能機(jī)器人。
第三次:智能系統(tǒng)具有類(lèi)人認(rèn)知和思維能力,可以發(fā)現(xiàn)新知識(shí),去完畢面臨任務(wù),如基于數(shù)據(jù)挖掘系統(tǒng)。28第28頁(yè)人工智能目旳:程序==智能?計(jì)算==思維?計(jì)算機(jī)==電腦?目旳:以機(jī)器方式再現(xiàn)人智能29第29頁(yè)二、20世紀(jì)物理學(xué)成就物質(zhì)層次構(gòu)造和原子物理模型場(chǎng)理論和四種互相作用30第30頁(yè)物質(zhì)層次構(gòu)造和原子物理模型可以把物質(zhì)構(gòu)成層次當(dāng)作一種個(gè)等級(jí),眼前物體當(dāng)作是宏觀,天體當(dāng)作是宇觀,把分子和原子作為界標(biāo),比它們小物質(zhì)可以稱(chēng)之為微觀。原子這個(gè)層次十分重要。原子模型提出與演進(jìn),從開(kāi)爾文模型、湯姆孫模型、勒納德模型、長(zhǎng)岡模型、尼克爾森模型直到盧瑟福原子有核構(gòu)造模型,以及原子核模型,都表明構(gòu)思物質(zhì)構(gòu)成模型是一種普遍有效科學(xué)措施。原子物理模型成為人類(lèi)認(rèn)識(shí)世界五個(gè)里程碑之一。31第31頁(yè)物理學(xué)中勢(shì)場(chǎng)場(chǎng)可視為一種充斥能量空間。例如,將一種位于無(wú)窮遠(yuǎn)處電荷移至電場(chǎng)中需要消耗能量。場(chǎng)在某點(diǎn)P(r)處單位作功能力被稱(chēng)為該點(diǎn)勢(shì),記為(r)。勢(shì)函數(shù)(r)是一種有關(guān)場(chǎng)點(diǎn)位置標(biāo)量函數(shù),它在場(chǎng)空間中構(gòu)成一種標(biāo)量場(chǎng),即勢(shì)場(chǎng)。32第32頁(yè)梯度、散度與旋度梯度是描述標(biāo)量場(chǎng)變化特性矢量函數(shù),它可以將一種標(biāo)量場(chǎng)轉(zhuǎn)換為矢量場(chǎng),也可以通過(guò)引入一種輔助標(biāo)量函數(shù)來(lái)分析簡(jiǎn)化矢量場(chǎng)。散度、旋度是描述矢量場(chǎng)兩個(gè)固有特性:源密度和旋渦密度物理量。在最一般狀況下,一種矢量場(chǎng)總可以被看作由一種有源場(chǎng)和一種旋渦場(chǎng)疊合構(gòu)成,如電磁場(chǎng)。因此一種含義不明矢量場(chǎng)只有當(dāng)弄清它兩個(gè)分量各自奉獻(xiàn)和物理本質(zhì)后,即已知它散度和旋度后才算明確。33第33頁(yè)梯度場(chǎng)與旋度場(chǎng)、散度場(chǎng)梯度場(chǎng)=有勢(shì)場(chǎng)=有源場(chǎng)=保守場(chǎng)=無(wú)旋場(chǎng)34第34頁(yè)電場(chǎng)和引力場(chǎng)勢(shì)函數(shù)電場(chǎng)勢(shì)函數(shù)引力場(chǎng)勢(shì)函數(shù)從靜電場(chǎng)和引力場(chǎng)勢(shì)函數(shù)計(jì)算中可以發(fā)現(xiàn),兩種場(chǎng)物理機(jī)制雖然各不相似,但在數(shù)學(xué)形態(tài)上卻非常相似,即空間區(qū)域中不一樣樣物質(zhì)粒子互相作用數(shù)學(xué)本質(zhì)是相似或相近。35第35頁(yè)物理學(xué)中四種互相作用牛頓萬(wàn)有引力定律(引力反比于距離平方)認(rèn)為在多質(zhì)點(diǎn)系中存在兩兩互相作用引力場(chǎng)和引力勢(shì)能。庫(kù)倫定律(電力反比于距離平方)認(rèn)為電荷之間通過(guò)電場(chǎng)互相作用,用電場(chǎng)線(xiàn)和等勢(shì)線(xiàn)可使電場(chǎng)分布形象化。具有相等電勢(shì)點(diǎn)構(gòu)成等勢(shì)面。36第36頁(yè)物理學(xué)中四種互相作用核物理認(rèn)為,核子之間、核子與介子之間,通過(guò)夸克間互換膠子實(shí)現(xiàn)強(qiáng)互相作用。這就是力程甚短核力。按照普適費(fèi)米理論,弱互相作用是一種點(diǎn)作用,不包括到任何場(chǎng)。后來(lái)人們發(fā)現(xiàn)這一觀點(diǎn)有問(wèn)題。1984年若貝爾獎(jiǎng)被授予魯比亞(CarloRubbia)和范得米爾(SimonVanderMeer)以表?yè)P(yáng)他們發(fā)現(xiàn)弱作用場(chǎng)量子W+ˉ和Z杰出奉獻(xiàn)。37第37頁(yè)物理學(xué)大統(tǒng)一理論假如以強(qiáng)互相作用強(qiáng)度為1話(huà),電磁互相作用強(qiáng)度,其值約為10-2;弱互相作用約為10-13∽10-19;引力互相作用最弱,約為10-39。物理學(xué)家一直企圖將這四種互相作用進(jìn)行統(tǒng)一。愛(ài)因斯坦努力了,沒(méi)有獲得成果。真正獲得進(jìn)展是量子場(chǎng)論。量子電動(dòng)力學(xué)解釋了電磁互相作用;量子色動(dòng)力學(xué)解釋了強(qiáng)互相作用,又將弱互相作用與電磁互相作用進(jìn)行統(tǒng)一,即溫伯格-薩拉姆電弱統(tǒng)一理論。大統(tǒng)一理論到目前還缺乏試驗(yàn)驗(yàn)證。38第38頁(yè)三、不確定性認(rèn)知原子模型人類(lèi)思維基本單元云模型及其數(shù)字特性正向云發(fā)生器和逆向云發(fā)生器持續(xù)數(shù)據(jù)離散化(概念化)概念粒度、概念空間和泛概念樹(shù)39第39頁(yè)人類(lèi)思維活動(dòng)層次性生命科學(xué)可還原成不一樣樣層次:如腦生物化學(xué)層次和神經(jīng)構(gòu)造層次。認(rèn)知活動(dòng)也許對(duì)應(yīng)著一定生理上化學(xué)、電學(xué)變化。不過(guò),目前生命科學(xué)還不能在思維活動(dòng)與亞細(xì)胞化學(xué)、電學(xué)層次活動(dòng)建立確切關(guān)系。如:一種概念怎樣以生物學(xué)形式寄存,它與其他概念發(fā)生聯(lián)絡(luò)生物學(xué)過(guò)程是什么。也不能決定什么樣神經(jīng)構(gòu)造可以決定著哪些認(rèn)知模式發(fā)生。40第40頁(yè)人類(lèi)思維活動(dòng)層次性目前從腦生物化學(xué)層次和神經(jīng)構(gòu)造層次研究認(rèn)知活動(dòng)尚有困難。再說(shuō),如同我們不能從最基礎(chǔ)硅芯片活動(dòng)來(lái)推測(cè)計(jì)算機(jī)網(wǎng)絡(luò)上電子郵件行為同樣,我們又怎么可以設(shè)想從分析單個(gè)離子、神經(jīng)元、突觸性質(zhì)就可以推斷人腦認(rèn)知和思維活動(dòng)呢?系統(tǒng)論有關(guān)系統(tǒng)整體特性不是由低層元素加和而成原理對(duì)還原論提出質(zhì)疑。因此,人工智能研究目前需要找到一種合適層次和單元,向上模擬人類(lèi)認(rèn)知和思維活動(dòng)。41第41頁(yè)人類(lèi)思維活動(dòng)工具自然語(yǔ)言使人類(lèi)獲得一種強(qiáng)有力思維工具,這是不爭(zhēng)事實(shí),起到展現(xiàn)和保留思維對(duì)象及組織思維過(guò)程作用。它是其他多種形式化系統(tǒng)(語(yǔ)言)基礎(chǔ),派生出像計(jì)算機(jī)語(yǔ)言這樣特殊語(yǔ)言,也派生出包括多種專(zhuān)業(yè)理論專(zhuān)門(mén)化語(yǔ)言,如數(shù)學(xué)語(yǔ)言。這些符號(hào)構(gòu)成形式系統(tǒng),又成為新一級(jí)形式化。42第42頁(yè)數(shù)學(xué)漢語(yǔ)
外語(yǔ)
自然語(yǔ)言符號(hào)語(yǔ)言自然語(yǔ)言和符號(hào)語(yǔ)言43第43頁(yè)人類(lèi)思維活動(dòng)工具自然語(yǔ)言中語(yǔ)言值表達(dá)概念,最基本語(yǔ)言值代表最基本概念,成為思維原子模型。同步,概念具有層次性。44第44頁(yè)概念—人類(lèi)思維基本單元客觀世界包括物理對(duì)象,主觀世界從認(rèn)知單元和它指向物理對(duì)象開(kāi)始,反應(yīng)了主客觀內(nèi)外聯(lián)絡(luò)特性。任何思維活動(dòng)都是指向一定對(duì)象,通過(guò)對(duì)象存在到主觀意識(shí)自身存在。概念作為外部事物在主觀認(rèn)知中對(duì)應(yīng)物成為思維活動(dòng)基本單元。不過(guò)概念不是孤立,它同外部背景有著種種聯(lián)絡(luò),是演變和流動(dòng)過(guò)程。因此,概念必然具有不確定性,甚至包括盲目性和散漫性。45第45頁(yè)概念形成:學(xué)習(xí)和記憶原則特性是概念一種構(gòu)成部分,是用來(lái)確認(rèn)某一詳細(xì)樣例屬于該類(lèi)別必要或充足條件。原型在概念中占有尤其地位。模糊邊界和不清晰樣例是概念普遍狀況。在一種概括性更高而詳細(xì)性更低組織水平上,下位概念作為一種樣例被使用,形成基本水平、下位水平和上位水平層次構(gòu)造(basiclever/subordinatelevel/superordinatelever)。概念形成是一再反復(fù)學(xué)習(xí)和記憶過(guò)程。46第46頁(yè)困擾人工智能認(rèn)知模型怎樣表達(dá)用自然語(yǔ)言表述定性知識(shí)?怎樣反應(yīng)自然語(yǔ)言中不確定性,尤其是模糊性和隨機(jī)性?怎樣實(shí)現(xiàn)定性和定量知識(shí)之間互相轉(zhuǎn)換?怎樣體現(xiàn)語(yǔ)言思索中軟推理能力?47第47頁(yè)知識(shí)表達(dá)人工智能要以機(jī)器為載體模仿以人腦為載體人思維活動(dòng)——智能,必須找到在人腦和機(jī)器兩種載體之間建立聯(lián)絡(luò)手段,而這個(gè)任務(wù)正是由形式化來(lái)?yè)?dān)當(dāng)。知識(shí)表達(dá)形式化在人工智能中居于措施論重要地位。48第48頁(yè)認(rèn)知模型(CognitiveModeling) 云由許許多多云滴構(gòu)成,每一種云滴就是這個(gè)定性概念映射到數(shù)域空間一種點(diǎn),即一次反應(yīng)量樣例實(shí)現(xiàn)。這種實(shí)現(xiàn)帶有不確定性,模型同步給出這個(gè)點(diǎn)可以代表該定性概念確實(shí)定程度。49第49頁(yè)云圖可視化措施一給出云滴在數(shù)域(一維、二維或多維)位置,用一種點(diǎn)表達(dá)一種云滴;同步,用該點(diǎn)輝度表達(dá)出這個(gè)云滴可以代表概念確實(shí)定度。50第50頁(yè)“靠近坐標(biāo)原點(diǎn)左右”10000個(gè)量化云滴。任何一種云滴都可以在一定程度上代表這個(gè)概念。51第51頁(yè)云圖可視化措施二用數(shù)域里一種圈或球表達(dá)一種云滴,其中心反應(yīng)云滴在數(shù)域位置;同步,圈或球大小表達(dá)出這個(gè)云滴可以代表概念確實(shí)定度。52第52頁(yè)-3-2-1123-3-2-1123“靠近坐標(biāo)點(diǎn)左右”200個(gè)量化云滴。任何一種云滴都可以在一定程度上代表這個(gè)概念。53第53頁(yè)云圖可視化措施三用N+1維表達(dá),N維空間點(diǎn)表達(dá)云滴在數(shù)域位置,另一維表達(dá)這個(gè)云滴可以代表概念確實(shí)定度。54第54頁(yè)不一樣數(shù)值代表語(yǔ)言值“20km左右”確定程度55第55頁(yè)不一樣樣數(shù)值代表平面上點(diǎn)“靠近中心”確實(shí)定程度56第56頁(yè)期望值:在數(shù)域空間最可以代表這個(gè)定性概念點(diǎn),反應(yīng)了云滴群重心位置。云數(shù)字特性雙重性ExEnHe熵首先反應(yīng)了在數(shù)域空間可被概念接受范圍,即模糊度,是定性概念亦此亦彼性度量;另一方面還反應(yīng)了在數(shù)域空間點(diǎn)可以代表這個(gè)概念概率,表達(dá)定性概念云滴出現(xiàn)隨機(jī)性。熵揭示了模糊性和隨機(jī)性關(guān)聯(lián)性。超熵是熵不確定度量,即熵熵,反應(yīng)了在數(shù)域空間代表該語(yǔ)言值所有點(diǎn)不確定度凝聚性,即云滴凝聚度。57第57頁(yè)正態(tài)云發(fā)生器實(shí)現(xiàn)算法1.生成以En為期望值,He為方差一種正態(tài)隨機(jī)數(shù)En’;2.生成以Ex為期望值,En’為方差一種正態(tài)隨機(jī)數(shù)x;3.計(jì)算4.使(x,y)成為論域中一種云滴;5.反復(fù)環(huán)節(jié)1~4直至規(guī)定數(shù)目旳云滴產(chǎn)生。58第58頁(yè)逆向云發(fā)生器算法1由Ex=求得Ex;2對(duì)每一對(duì)(xi,yi),由求出Eni;3由En=求得En;4求Eni均方差得到He;59第59頁(yè)云模型多種形態(tài)正態(tài)云
云其他多維云60第60頁(yè)例子:射擊評(píng)判射手乙射手甲射手丙評(píng)判人員:記錄學(xué)家、模糊學(xué)家、云理論研究者61第61頁(yè)射擊評(píng)判記錄學(xué)家用概率值表達(dá)射擊效果;模糊學(xué)家用從屬度表達(dá)射擊效果;裁判用總環(huán)數(shù)(模糊+記錄)表達(dá)射擊效果;人們用定性語(yǔ)言評(píng)價(jià)射擊效果,云措施用3個(gè)數(shù)字特性表達(dá)定性概念。62第62頁(yè)云評(píng)價(jià)措施略偏左上,比較離散,不穩(wěn)定略偏右下,射點(diǎn)集中,較穩(wěn)定射點(diǎn)靠近靶心,比較離散,不穩(wěn)定63第63頁(yè)原始靶標(biāo)還原10發(fā)彈著點(diǎn)還原100發(fā)彈著點(diǎn)64第64頁(yè)誤解:云措施是模糊措施╳云措施沒(méi)有僅僅停留在哲學(xué)上思辯,也不能簡(jiǎn)樸地說(shuō)是概率措施或模糊措施,通過(guò)云模型實(shí)現(xiàn)定性概念和定量數(shù)據(jù)之間轉(zhuǎn)換是一種十分嚴(yán)格數(shù)學(xué)措施,使得定性和定量之間轉(zhuǎn)換變得十分清晰、詳細(xì)和可操作,同步又反應(yīng)了轉(zhuǎn)換過(guò)程不確定性。65第65頁(yè)持續(xù)數(shù)據(jù)離散化對(duì)持續(xù)數(shù)據(jù),首先求得各數(shù)據(jù)點(diǎn)頻數(shù),對(duì)其分布進(jìn)行云變換,使之成為若干個(gè)大小不一樣樣云疊加,每個(gè)云代表一種離散、定性概念。數(shù)據(jù)轉(zhuǎn)換為概念。66第66頁(yè)原始數(shù)據(jù)分布擬合成果云變換持續(xù)數(shù)據(jù)離散化:云變換67第67頁(yè)概念粒度在人意識(shí)活動(dòng)中,思維推進(jìn)是與概念轉(zhuǎn)移和提高相聯(lián)絡(luò)。轉(zhuǎn)移和提高跨度和途徑也是多樣,我們可以把在一定層次上思維模式看作是為原始思維活動(dòng)拍攝一張快照。反應(yīng)概念對(duì)應(yīng)客觀事物粒度。概念粒度可以用云模型中熵度量。68第68頁(yè)概念空間概念空間是指同一類(lèi)概念數(shù)域。例如,當(dāng)討論語(yǔ)言變量—年齡這個(gè)范圍內(nèi)不一樣樣語(yǔ)言值時(shí),如10歲左右、少年、青少年、中年、晚年等等概念,常常要明確它們?cè)跀?shù)域上所體現(xiàn)出內(nèi)涵和外延,以及互相之間等價(jià)(相似)關(guān)系或從屬(包括)關(guān)系。因此,不一樣樣信息粒度之間概念在概念空間會(huì)形成層次構(gòu)造。69第69頁(yè)概念層次構(gòu)造當(dāng)討論語(yǔ)言變量—年齡這個(gè)范圍內(nèi)不一樣樣語(yǔ)言值(概念)時(shí),常常要明確這些概念是大概念還是小概念,粗概念還是細(xì)概念,以及互相之間等價(jià)(相似)關(guān)系或從屬(包括)關(guān)系。因此,不一樣樣信息粒度之間概念在概念空間會(huì)形成層次構(gòu)造,或者說(shuō)是泛概念樹(shù)構(gòu)造。70第70頁(yè)不一樣樣年齡人泛概念樹(shù)少年未成年人幼兒青年中年嬰幼兒兒童小學(xué)生中青年中學(xué)生大學(xué)生全部成年人青壯年老年…...71第71頁(yè)用云表達(dá)泛概念樹(shù)微觀層中觀層宏觀層年齡72第72頁(yè)泛概念樹(shù)可動(dòng)態(tài)生成不一樣樣層次概念體現(xiàn)了定性概念隨機(jī)性和模糊性體現(xiàn)不一樣樣層次概念間多從屬關(guān)系反應(yīng)了數(shù)據(jù)實(shí)際分布狀況泛概念樹(shù)爬升和跳躍73第73頁(yè)四、數(shù)據(jù)場(chǎng)和勢(shì)函數(shù)客體間互相作用和數(shù)據(jù)場(chǎng)勢(shì)函數(shù)及其確定準(zhǔn)則用數(shù)據(jù)場(chǎng)思想進(jìn)行特性提取和模式識(shí)別74第74頁(yè)數(shù)據(jù)場(chǎng)引入學(xué)科交叉滲透是目前科學(xué)發(fā)展總趨勢(shì),對(duì)客觀世界認(rèn)識(shí)和描述,不管是力學(xué)、熱物理、電磁學(xué)和近代物理,從粒子到宇宙在不一樣樣尺度上均有場(chǎng)作用。那么,人自身認(rèn)知和思維過(guò)程,從數(shù)據(jù)到信息到知識(shí),與否也可以用場(chǎng)來(lái)描述?75第75頁(yè)物理場(chǎng)舉例在一種質(zhì)量為M質(zhì)點(diǎn)產(chǎn)生引力場(chǎng)中,任一場(chǎng)點(diǎn)r處勢(shì)可以描述為:假如空間中存在多種質(zhì)點(diǎn),則r處勢(shì)等于每個(gè)質(zhì)點(diǎn)單獨(dú)產(chǎn)生勢(shì)疊加,即76第76頁(yè)數(shù)據(jù)與數(shù)據(jù)場(chǎng)受物理場(chǎng)啟發(fā),可將物質(zhì)粒子間互相作用及其場(chǎng)描述措施擴(kuò)展至抽象數(shù)據(jù)空間。數(shù)據(jù)空間中每個(gè)對(duì)象都相稱(chēng)于一種質(zhì)點(diǎn)或核子,在其周?chē)a(chǎn)生一種球形對(duì)稱(chēng)作用場(chǎng),位于場(chǎng)內(nèi)所有對(duì)象都將受到其他對(duì)象聯(lián)合作用,從而在整個(gè)數(shù)據(jù)空間上形成一種場(chǎng),我們稱(chēng)之為數(shù)據(jù)場(chǎng)。正如引力場(chǎng)、核力場(chǎng)可以用勢(shì)函數(shù)描述,我們也引入勢(shì)函數(shù)來(lái)描述數(shù)據(jù)場(chǎng)性質(zhì)。77第77頁(yè)確定勢(shì)函數(shù)形態(tài)準(zhǔn)則勢(shì)函數(shù)具有各向同性,即對(duì)稱(chēng)性;勢(shì)函數(shù)是定義在數(shù)域空間上持續(xù)函數(shù);勢(shì)函數(shù)值隨離開(kāi)場(chǎng)源距離增大而下降;表達(dá)勢(shì)函數(shù)持續(xù)函數(shù),應(yīng)當(dāng)光滑,即可微。78第78頁(yè)可選勢(shì)函數(shù)形態(tài)擬引力場(chǎng)勢(shì)函數(shù):擬核力場(chǎng)勢(shì)函數(shù):其中,為以場(chǎng)源坐標(biāo)為原點(diǎn)時(shí)場(chǎng)點(diǎn)徑向半徑;參數(shù)k為一種正整數(shù),用于調(diào)整勢(shì)函數(shù)衰減特性;參數(shù)b∈(0,+∞),用于控制對(duì)象作用范圍,稱(chēng)為影響因子;參數(shù)a相稱(chēng)于質(zhì)點(diǎn)或核子質(zhì)量代表數(shù)據(jù)場(chǎng)強(qiáng)度。79第79頁(yè)兩種勢(shì)函數(shù)形態(tài)比較擬引力場(chǎng)勢(shì)函數(shù)擬核力場(chǎng)勢(shì)函數(shù)80第80頁(yè)數(shù)據(jù)場(chǎng)勢(shì)函數(shù)定義已知數(shù)據(jù)空間中對(duì)象集及其產(chǎn)生數(shù)據(jù)場(chǎng),則任一場(chǎng)點(diǎn)y處勢(shì)函數(shù)可以定義為所有對(duì)象在該點(diǎn)處產(chǎn)生單位勢(shì)值疊加:其中,為場(chǎng)點(diǎn)y與對(duì)象xi間距離;81第81頁(yè)數(shù)據(jù)場(chǎng)可視化二維數(shù)據(jù)空間中一種數(shù)據(jù)集及其產(chǎn)生數(shù)據(jù)場(chǎng)等勢(shì)線(xiàn)圖82第82頁(yè)數(shù)據(jù)場(chǎng)擴(kuò)展自然語(yǔ)言中基本語(yǔ)言值是定性概念,由于每個(gè)定性概念都可以用一種數(shù)值型集合來(lái)表達(dá)其內(nèi)涵和外延,即對(duì)應(yīng)著一種定量數(shù)據(jù)子空間,稱(chēng)為概念空間。概念和概念之間也可以通過(guò)場(chǎng)互相作用,形成概念間泛層次樹(shù),又稱(chēng)上、下位詞表。人類(lèi)思維過(guò)程中對(duì)象,對(duì)應(yīng)著一種定量數(shù)據(jù)空間,反應(yīng)對(duì)象多種屬性,稱(chēng)為特性空間。對(duì)象和對(duì)象之間也通過(guò)場(chǎng)互相作用,形成知識(shí)。概念空間和特性空間中場(chǎng)統(tǒng)稱(chēng)為數(shù)據(jù)場(chǎng)。83第83頁(yè)我們將云滴確實(shí)定度視為場(chǎng)源質(zhì)量,顯然,確定度高云滴具有較強(qiáng)作用場(chǎng)。右圖中每個(gè)云滴位置坐標(biāo)和確定度為:A(10,12,0.6)B(10,10,1)C(13,11,0.3)8910111213141589101112131415ABC不一樣樣確定度三個(gè)云滴形成數(shù)據(jù)場(chǎng)等勢(shì)線(xiàn)圖84第84頁(yè)用數(shù)據(jù)場(chǎng)思想進(jìn)行特性提取和模式識(shí)別85第85頁(yè)ABCDEFGHIJ預(yù)處理后人臉圖像每幅圖象原始尺寸為256x256個(gè)像素點(diǎn),256級(jí)灰度86第86頁(yè)灰度數(shù)據(jù)集映射成為數(shù)據(jù)場(chǎng)及勢(shì)局部極值A(chǔ)BCDEFGHIJ87第87頁(yè)8.6917308.41101913.612820J11.80192811.14101913.912718I12.45182911.8391814.082716H11.71182912.66101913.202619G10.96182812.80101913.142619F11.92182912.39101913.052619E11.25183012.05101812.812618D11.10182912.55101912.692619C10.92182911.88101913.292519B11.21193012.13101912.632619AVPYXVPYXVPYXThethirdfeatureThesecondfeatureThefirstfeatureNamefeature數(shù)據(jù)場(chǎng)極值成為邏輯特性88第88頁(yè)二次生成數(shù)據(jù)場(chǎng)進(jìn)行模式識(shí)別Ifwepickupanextremelocalmaximumpotentialvalueanditspositionasthemostimportantfeatureforeachfaceimage,thefacialfeaturedatafieldforthetenfaceimagesmaybe,onceagain,illustratedbyanewisopotentiallines.89第89頁(yè)Faceidentificationwiththefirstfeature
ABCDEFGHIJ90第90頁(yè)IsopotentiallinesshowthesimilaritiesandoutliersforthetenimagesACEFGBDIHJABCDEFGHIJ91第91頁(yè)FaceRecognitionusingFacialMainFeatureDataFieldWemayalsopickupNlocalmaximumpotentialvaluesandtheirpositionsasthemainfeaturesforeachfacepicture,themainfeaturedataarecalculatedbyThemainfeaturedatafieldforthetenfacepictureisillustratedonceagainbyequalpotentiallines.and92第92頁(yè)用多種特性值融合后識(shí)別成果ABCDEFGHIJ93第93頁(yè)Faceidentification:discoveringsimilaritiesanddiscriminationBCGEDFAHIJABCDEFGHIJ94第94頁(yè)用數(shù)據(jù)場(chǎng)措施看IRIS數(shù)據(jù)分類(lèi)95第95頁(yè)IRIS原始數(shù)據(jù)集2.15.43.16.9Virginica1.84.83.06.0Virginica…………Virginica2.55.73.36.7Virginica2.35.93.26.8Virginica…………Versicolour1.54.93.16.9Versicolour1.54.53.26.4Versicolour1.44.73.27.0Versicolour…………Setosa
0.21.43.65.0Setosa
0.21.33.24.7Setosa
0.21.43.04.9Setosa
0.21.43.55.1Setosa
花片寬度花瓣長(zhǎng)度萼片寬度萼片長(zhǎng)度類(lèi)型96第96頁(yè)數(shù)據(jù)預(yù)處理對(duì)iris數(shù)據(jù)中萼片屬性和花瓣屬性分別做降維處理,得到新屬性:花瓣張角=arctg(花瓣寬度/花瓣長(zhǎng)度);萼片張角=arctg(萼片寬度/萼片長(zhǎng)度);97第97頁(yè)處理后數(shù)據(jù)集0.33930.4704Virginica0.40270.5016Virginica……Virginica0.41330.4577Virginica0.37170.4398Virginica……Versicolour0.29710.4223Versicolour0.32180.4636Versicolour0.28950.4288Versicolour……Setosa0.13260.5930Setosa0.15260.5978Setosa
0.14190.5494Setosa
0.14190.6015Setosa
花瓣張角萼片張角類(lèi)型98第98頁(yè)預(yù)處理后數(shù)據(jù)分布99第99頁(yè)從數(shù)據(jù)場(chǎng)平面分布看分類(lèi)成果100第100頁(yè)從數(shù)據(jù)場(chǎng)立體分布看分類(lèi)成果12.376019.00029.99463.4336101第101頁(yè)五、認(rèn)知場(chǎng)中知識(shí)發(fā)現(xiàn)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)發(fā)現(xiàn)實(shí)狀況態(tài)空間類(lèi)譜圖102第102頁(yè)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
DataMiningandKnowledgeDiscovery從大量、不完全、有噪聲、模糊、隨機(jī)實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中、人們事先不懂得、但又是潛在有用信息和知識(shí)過(guò)程。103第103頁(yè)從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)難點(diǎn)大量甚至海量數(shù)據(jù)中,存在有數(shù)據(jù)誤差、畸變、丟失或過(guò)度重疊,以歸納為主知識(shí)發(fā)現(xiàn)過(guò)程,實(shí)際上是建立在或多或少病態(tài)數(shù)據(jù)之上;由種種案例數(shù)據(jù)反推對(duì)象性質(zhì)可認(rèn)為是逆向思維,人們?cè)诿}、措施或成果三個(gè)方面會(huì)獲得更多目旳選擇。104第104頁(yè)數(shù)據(jù)挖掘數(shù)據(jù)選擇預(yù)處理挖掘和發(fā)現(xiàn)知識(shí)解釋和驗(yàn)證第105頁(yè)SelectionPreprocessingTransformationDataMiningInterpretation/EvaluationTragetDataProcessedDataTransformedDataPatternsKnowledgeDMKD系統(tǒng)基本構(gòu)成106第106頁(yè)發(fā)現(xiàn)什么樣知識(shí)?關(guān)聯(lián)知識(shí)聚類(lèi)知識(shí)序列知識(shí)
分類(lèi)知識(shí)預(yù)測(cè)知識(shí)相似時(shí)間序列第107頁(yè)數(shù)據(jù)挖掘工具歸納演繹聯(lián)想類(lèi)比證偽第108頁(yè)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
DataMiningandKnowledgeDiscovery特定問(wèn)題或特定環(huán)境下數(shù)據(jù),是一種原始、混亂、不成形自然狀態(tài)積累,但又是一種可以從中生長(zhǎng)出秩序和規(guī)則源泉。怎樣透過(guò)表觀上千頭萬(wàn)緒、混亂無(wú)規(guī),去挖掘蘊(yùn)含其中規(guī)則性、有序性、有關(guān)性和離群性,這就是知識(shí)發(fā)現(xiàn)。109第109頁(yè)DMKD本質(zhì)什么是數(shù)據(jù)?什么是信息?什么是知識(shí)?本質(zhì)是歸納,是由微觀到中觀到宏觀抽象.瓶頸是數(shù)據(jù)、信息和知識(shí)表達(dá)不確定性問(wèn)題.110第110頁(yè)發(fā)現(xiàn)實(shí)狀況態(tài)空間抽象程度AMTO111第111頁(yè)發(fā)現(xiàn)實(shí)狀況態(tài)空間特性空間對(duì)象通過(guò)場(chǎng)發(fā)生互相作用。如同物理學(xué)中粒子之間通過(guò)場(chǎng)(場(chǎng)量子)形成強(qiáng)力、電磁力、弱力或引力互相作用同樣。對(duì)象在特性空間互相作用形成場(chǎng)構(gòu)造反應(yīng)了對(duì)象普遍知識(shí)(廣義知識(shí))。伴隨描述對(duì)象粒度(熵)越來(lái)越大,形成普遍知識(shí)越來(lái)越宏觀。發(fā)現(xiàn)了知識(shí)上升到抽象級(jí)別更高層次。20世紀(jì)物理學(xué)發(fā)展是簡(jiǎn)化歸納。數(shù)據(jù)挖掘本質(zhì)也是簡(jiǎn)化歸納。112第112頁(yè)人類(lèi)認(rèn)知過(guò)程是對(duì)復(fù)雜對(duì)象關(guān)系中觀、宏觀知識(shí)發(fā)現(xiàn)過(guò)程,是對(duì)象所在特性空間微觀數(shù)據(jù)通過(guò)用自然語(yǔ)言表述不一樣樣抽象度概念非線(xiàn)性互相作用下涌現(xiàn)(突現(xiàn))自組織特性。113第113頁(yè)發(fā)現(xiàn)實(shí)狀況態(tài)空間==(特性空間|概念粒度)
114第114頁(yè)數(shù)據(jù)挖掘過(guò)程,實(shí)際上是從不一樣樣抽象度上認(rèn)識(shí)數(shù)據(jù)。所謂微觀、中觀、宏觀,就是可視化稱(chēng)謂。因此,數(shù)據(jù)挖掘需要各級(jí)視圖支持。115第115頁(yè)伴隨抽象度提高:描述每個(gè)屬性中概念粒度越來(lái)越大;特性空間對(duì)象之間關(guān)系越來(lái)越普遍;發(fā)現(xiàn)知識(shí)逐漸由微觀走向中觀、宏觀;整個(gè)歸納過(guò)程形成發(fā)現(xiàn)實(shí)狀況態(tài)空間不停轉(zhuǎn)換。116第116頁(yè)對(duì)象屬性選用形成不一樣樣視圖,好比是從不一樣樣角度投射到客體不一樣樣光柱,它們各有所見(jiàn)不及之處,但也各自照亮了不一樣樣景象。117第117頁(yè)從不一樣樣距離觀測(cè)客體群,各有所見(jiàn)之景象。通過(guò)推拉鏡頭,可以變化觀測(cè)距離,形成不一樣樣粒度視圖。118第118頁(yè)特性空間當(dāng)我們討論一種客體(對(duì)象、事物、案例、記錄等)具有不一樣樣屬性或特性時(shí),常常用特性空間作為討論問(wèn)題范圍,N個(gè)屬性或特性,構(gòu)成N維空間。這時(shí),這個(gè)客體成為特性空間一種點(diǎn)。特性空間任何一點(diǎn)勢(shì)可認(rèn)為是所有客體在這一點(diǎn)勢(shì)疊加。119第119頁(yè)特性空間聚類(lèi)和類(lèi)譜圖當(dāng)我們進(jìn)行數(shù)據(jù)挖掘時(shí),將數(shù)據(jù)庫(kù)中一條記錄按照其N(xiāo)個(gè)屬性,把這條記錄映射到特性空間中一種特定點(diǎn)上,成千上萬(wàn)記錄在特性空間是成千上萬(wàn)個(gè)點(diǎn),整體上展現(xiàn)出抱團(tuán)特性,可以通過(guò)嵌套等勢(shì)線(xiàn)(面)--自然拓?fù)錁?gòu)造,形成自然聚類(lèi)和類(lèi)譜圖。120第120頁(yè)分類(lèi)和聚類(lèi)研究基礎(chǔ)性分類(lèi)和聚類(lèi),乃是人類(lèi)社會(huì)活動(dòng)、生產(chǎn)活動(dòng)以及科研活動(dòng)中最基本、最重要活動(dòng)之一。分類(lèi)和聚類(lèi)研究基礎(chǔ)性決定了其應(yīng)用普遍性。121第121頁(yè)場(chǎng)措施發(fā)現(xiàn)聚類(lèi)知識(shí)姓名工齡(月)工資(千元)A3030B5030C4070D6070E7050122第122頁(yè)304050607080工齡304050607080工資ABCDE特性空間5個(gè)對(duì)象自然聚類(lèi)123第123頁(yè)5個(gè)對(duì)象構(gòu)成泛類(lèi)譜系圖ABCDE124第124頁(yè)特性空間3000個(gè)對(duì)象自然聚類(lèi)
ABC304050607080工齡304050607080工資ABCDE125第125頁(yè)和老式聚類(lèi)措施比較:一般,人們用N個(gè)客體中N1個(gè)樣本作為訓(xùn)練集去形成聚類(lèi)成果,用N-N1個(gè)樣本作為測(cè)試集去驗(yàn)證聚類(lèi)效果。實(shí)際上,這就宣布了只有這N1個(gè)樣本才對(duì)聚類(lèi)有奉獻(xiàn),若N=100,極端地設(shè)想N1=2或N1=98,必然會(huì)有不一樣樣成果。怎樣確定N1并選用那些樣本為N1,成為一種大問(wèn)題,也暴露出這種措施缺陷。126第126頁(yè)和老式聚類(lèi)措施比較:從極微觀上看,這N個(gè)客體各自均有體現(xiàn)自身價(jià)值不一樣樣特性,差異是絕對(duì)旳,最嚴(yán)最細(xì)分法應(yīng)當(dāng)是N類(lèi)。從極宏觀上看,這N個(gè)客體既然被用若干特性放到一起比較,闡明具有可比性,可以統(tǒng)屬一類(lèi)。在發(fā)現(xiàn)實(shí)狀況態(tài)空間不一樣樣概念層次上聚類(lèi),以及聚類(lèi)相對(duì)性,就是我們聚類(lèi)觀。127第127頁(yè)知識(shí)就是不一樣樣層次上“規(guī)則+例外”128第128頁(yè)304050607080工齡304050607080工資清除例外后聚類(lèi)圖AC304050607080工齡304050607080工資129第129頁(yè)304050607080工齡304050607080工資304050607080工齡304050607080工資3000個(gè)對(duì)象中類(lèi)和離群相對(duì)性130第130頁(yè)信息粒度粒度(Granularity)原本是一種物理學(xué)概念,是指“微粒大小平均度量”,在這里被借用作為對(duì)概念抽象度度量。把概念可視化。概念粒度用云熵來(lái)度量。概念在定量空間位置用云期望值來(lái)標(biāo)定。131第131頁(yè)信息粒度人類(lèi)智能一種公認(rèn)特點(diǎn)是人們可以從極不相似粒度上觀測(cè)和分析同一問(wèn)題,各有各用處。人們不僅可以在同一粒度世界上進(jìn)行問(wèn)題求解,并且可以很快地從一種粒度世界跳到另一種粒度世界,來(lái)回自如;甚至具有同步處理不一樣樣粒度世界能力。這正是人類(lèi)問(wèn)題求解強(qiáng)有力體現(xiàn)。132第132頁(yè)觀測(cè)距離:境界決定了認(rèn)知高度從較細(xì)粒度世界躍升到較粗粒度世界,是對(duì)信息或知識(shí)抽象,可以使問(wèn)題簡(jiǎn)化,數(shù)據(jù)處理量大大減少,這一過(guò)程稱(chēng)為數(shù)據(jù)簡(jiǎn)約或歸約。換句話(huà)說(shuō),用粗粒度觀測(cè)和分析信息,就是增長(zhǎng)觀測(cè)距離,忽視細(xì)微差異,尋找共性。共性常常比個(gè)性更深刻,可以求得宏觀把握。133第133頁(yè)觀測(cè)距離:境界決定了認(rèn)知高度反過(guò)來(lái),縮短觀測(cè)距離,用細(xì)粒度觀測(cè)和分析信息,發(fā)現(xiàn)紛繁復(fù)雜表象,更精確地區(qū)分差異,個(gè)性要比共性豐富,不過(guò)不能完全進(jìn)入共性之中。通過(guò)概念提高,就是增長(zhǎng)觀測(cè)距離,可以發(fā)現(xiàn)更普遍知識(shí)。134第134頁(yè)拉鏡頭—發(fā)現(xiàn)特性空間宏觀知識(shí):屬性方向和宏元組方向概括性加大;知識(shí)模板物理尺寸減小。從較細(xì)粒度躍升到較粗粒度世界,是對(duì)數(shù)據(jù)抽象,簡(jiǎn)化問(wèn)題,減少數(shù)據(jù)量,這一過(guò)程稱(chēng)為數(shù)據(jù)歸約。忽視細(xì)微差異,尋找共性。共性常常比個(gè)性更深刻。135第135頁(yè)推鏡頭—發(fā)現(xiàn)特性空間微觀知識(shí):在發(fā)現(xiàn)空間某個(gè)抽象層次上,縮短觀測(cè)距離,用較細(xì)粒度觀測(cè)和分析信息,發(fā)現(xiàn)紛繁復(fù)雜表象,更精確地區(qū)分差異;個(gè)性要比共性豐富,不過(guò)不能完全進(jìn)入共性之中。136第136頁(yè)發(fā)現(xiàn)方略和措施發(fā)現(xiàn)是微觀和宏觀之間跳躍,是信息粒度變化,或者說(shuō)是觀測(cè)距離不一樣樣;綜合運(yùn)用歸納、類(lèi)比、聯(lián)想,并結(jié)合證偽和演繹,形成五大手段;以云模型作為定性定量轉(zhuǎn)換和知識(shí)表達(dá)工具。詳細(xì)發(fā)現(xiàn)措施可以是多種多樣。137第137頁(yè)知識(shí)發(fā)現(xiàn)機(jī)理數(shù)據(jù)挖掘揭示了人類(lèi)由個(gè)別到一般、從詳細(xì)到抽象“數(shù)據(jù)—概念—規(guī)則”認(rèn)知規(guī)律。概念是認(rèn)知基元;數(shù)據(jù)是形成概念要素;規(guī)則是在不一樣樣概念層次上客體之間關(guān)聯(lián);不一樣樣抽象度知識(shí),實(shí)際上是不一樣樣概念層次上“規(guī)則加例外”而已;境界決定了認(rèn)知高度。認(rèn)知物理學(xué)用計(jì)算機(jī)詳細(xì)實(shí)現(xiàn)了這一規(guī)律發(fā)現(xiàn)過(guò)程。138第138頁(yè)從數(shù)據(jù)開(kāi)采角度看專(zhuān)家系統(tǒng):專(zhuān)家系統(tǒng)是正向方式認(rèn)識(shí)世界,以演繹為主;數(shù)據(jù)開(kāi)采是逆向方式認(rèn)識(shí)世界,以歸納為主。通過(guò)數(shù)據(jù)開(kāi)采來(lái)發(fā)現(xiàn)知識(shí)過(guò)程,就是構(gòu)造專(zhuān)家系統(tǒng)、生成知識(shí)庫(kù)過(guò)程。139第139頁(yè)TheExperimentalDatabase140第140頁(yè)MiningAssociationRulesApriorialgorithmCloudbasedgeneralizationaspreprocessing2Dclouds:location1Dclouds:elevation,roaddensity,distancetothesea,averageineMinimumSupport:6%MinimumConfidence:75%Miningassociationatmultipleconceptlevels141第141頁(yè)DiscoveredAssociationRulesfor“averageine”Rule1:Iflocationis“southeast”,roaddensityis“high”,anddistancetotheseais“close”,thenaverageineis“high”.Rule2:Iflocationis
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)性化美發(fā)店服務(wù)股份制合作合同4篇
- 二零二五版新能源汽車(chē)充電樁投資分紅合同3篇
- 2025年倉(cāng)儲(chǔ)租賃協(xié)議審核
- 二零二五年度木地板工程環(huán)保認(rèn)證與施工合同4篇
- 2025年民用航空器租賃合規(guī)審查協(xié)議
- 2025年度綠色校園綠植種植與教育推廣合同4篇
- 2024 年浙江公務(wù)員考試行測(cè)試題(A 類(lèi))
- 二零二五年度二手挖掘機(jī)轉(zhuǎn)讓與長(zhǎng)期維護(hù)服務(wù)協(xié)議3篇
- 二零二五年度SSL協(xié)議安全審計(jì)與合規(guī)檢查合同3篇
- 2025年度鮮花電商物流配送與銷(xiāo)售合作協(xié)議3篇
- 2024年供應(yīng)鏈安全培訓(xùn):深入剖析與應(yīng)用
- 飛鼠養(yǎng)殖技術(shù)指導(dǎo)
- 壞死性筋膜炎
- 整式的加減單元測(cè)試題6套
- 股權(quán)架構(gòu)完整
- 山東省泰安市2022年初中學(xué)業(yè)水平考試生物試題
- 注塑部質(zhì)量控制標(biāo)準(zhǔn)全套
- 銀行網(wǎng)點(diǎn)服務(wù)禮儀標(biāo)準(zhǔn)培訓(xùn)課件
- 二年級(jí)下冊(cè)數(shù)學(xué)教案 -《數(shù)一數(shù)(二)》 北師大版
- 晶體三極管資料
- 石群邱關(guān)源電路(第1至7單元)白底課件
評(píng)論
0/150
提交評(píng)論