版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
知識(shí)圖譜
知識(shí)圖譜
1
知識(shí)圖譜(KnowledgeGraph)是一種揭示實(shí)體之間關(guān)系的語(yǔ)義網(wǎng)絡(luò)。2012年5月17日,Google正式提出了知識(shí)圖譜的概念,其初衷是優(yōu)化搜索引擎返回的結(jié)果,增強(qiáng)用戶(hù)搜索質(zhì)量及體驗(yàn)。知識(shí)圖譜(KnowledgeG2
知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系,將互聯(lián)網(wǎng)的信息表達(dá)成更接近人類(lèi)認(rèn)知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界3
知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)絡(luò),其中的節(jié)點(diǎn)代表實(shí)體(Entity)或者概念(Concept),邊代表實(shí)體/概念之間的各種語(yǔ)義關(guān)系。知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)絡(luò),4知識(shí)圖譜的發(fā)展歷史1.第一階段(1955年~1977年)
第一階段是知識(shí)圖譜的起源階段,在這一階段中研究者們提出了引文網(wǎng)絡(luò)和語(yǔ)義網(wǎng)絡(luò)的概念知識(shí)圖譜的發(fā)展歷史1.第一階段(1955年~1977年)52.第二階段(1977年~2012年)
第二階段是知識(shí)圖譜的發(fā)展階段,語(yǔ)義網(wǎng)絡(luò)得到快速發(fā)展,“知識(shí)本體”的研究開(kāi)始成為計(jì)算機(jī)科學(xué)的一個(gè)重要領(lǐng)域,知識(shí)圖譜吸收了語(yǔ)義網(wǎng)、本體在知識(shí)組織和表達(dá)方面的理念,使得知識(shí)更易于在計(jì)算機(jī)之間和計(jì)算機(jī)與人之間交換、流通和加工。2.第二階段(1977年~2012年)63.第三階段(2012年至今)
第三階段是知識(shí)圖譜的繁榮階段,2012年谷歌提出GoogleKnowledgeGraph,知識(shí)圖譜正式得名,谷歌通過(guò)知識(shí)圖譜技術(shù)改善了搜索引擎性能。在人工智能的蓬勃發(fā)展下,知識(shí)圖譜涉及的知識(shí)抽取、表示、融合、推理、問(wèn)答等關(guān)鍵問(wèn)題得到一定程度的解決和突破,知識(shí)圖譜成為知識(shí)服務(wù)領(lǐng)域的一個(gè)新熱點(diǎn)3.第三階段(2012年至今)7知識(shí)圖譜的類(lèi)型(1)事實(shí)知識(shí)
事實(shí)知識(shí)是知識(shí)圖譜中最常見(jiàn)的知識(shí)類(lèi)型。大部分事實(shí)都是在描述實(shí)體的特定屬性或者關(guān)系,例如:三元組(柏拉圖,出生地,雅典)中的“出生地”就是其中一個(gè)屬性。知識(shí)圖譜的類(lèi)型(1)事實(shí)知識(shí)8(2)概念知識(shí)
概念知識(shí)分為兩類(lèi),一類(lèi)是實(shí)體與概念之間的類(lèi)屬關(guān)系,另一類(lèi)是子概念與父概念之間的子類(lèi)關(guān)系。(2)概念知識(shí)9(3)詞匯知識(shí)
詞匯知識(shí)主要包括實(shí)體與詞匯之間的關(guān)系(實(shí)體的命名、稱(chēng)謂、英文名等)以及詞匯之間的關(guān)系(同義關(guān)系、反義關(guān)系、縮略詞關(guān)系、上下位詞關(guān)系等)。例如,(“Plato”,中文名,柏拉圖)、(趙匡胤,廟號(hào),宋太祖)、(妻子,同義,老婆)。(3)詞匯知識(shí)10(4)常識(shí)知識(shí)
常識(shí)是人類(lèi)通過(guò)身體與世界交互而積累的經(jīng)驗(yàn)與知識(shí),是人們?cè)诮涣鲿r(shí)無(wú)須言明就能理解的知識(shí)。例如,我們都知道鳥(niǎo)有翅膀、鳥(niǎo)能飛等;又如,如果X是一個(gè)人,則X要么是男人要么是女人。常識(shí)知識(shí)的獲取是構(gòu)建知識(shí)圖譜時(shí)的一大難點(diǎn)。(4)常識(shí)知識(shí)11知識(shí)圖譜的重要性
知識(shí)圖譜已成為推動(dòng)機(jī)器基于人類(lèi)知識(shí)獲取認(rèn)知能力的重要途徑,并將逐漸成為未來(lái)智能社會(huì)的重要生產(chǎn)資料。知識(shí)圖譜的重要性知識(shí)圖譜已成121.知識(shí)圖譜是人工智能的重要基石2.知識(shí)圖譜推動(dòng)智能應(yīng)用3.知識(shí)圖譜是強(qiáng)人工智能發(fā)展的核心驅(qū)動(dòng)力之一1.知識(shí)圖譜是人工智能的重要基石13知識(shí)表示和知識(shí)建模
知識(shí)表示與知識(shí)建模是知識(shí)圖譜中的重要內(nèi)容,在構(gòu)建知識(shí)圖譜的時(shí)候,首先要建立知識(shí)表達(dá)的數(shù)據(jù)模型,也就是知識(shí)圖譜的整個(gè)數(shù)據(jù)組織體系。知識(shí)表示和知識(shí)建模
知識(shí)表示與知14
知識(shí)表示學(xué)習(xí)主要是面向知識(shí)圖譜中的實(shí)體和關(guān)系進(jìn)行表示學(xué)習(xí),使用建模方法將實(shí)體和向量表示在低維稠密向量空間中,然后進(jìn)行計(jì)算和推理。知識(shí)表示學(xué)習(xí)主要是面向知識(shí)圖譜中15
知識(shí)是人類(lèi)在認(rèn)識(shí)和改造客觀世界的過(guò)程中總結(jié)出的客觀事實(shí)、概念、定理和公理的集合。知識(shí)具有不同的分類(lèi)方式,例如,按照知識(shí)的作用范圍可分為常識(shí)性知識(shí)與領(lǐng)域性知識(shí)。知識(shí)表示是將現(xiàn)實(shí)世界中存在的知識(shí)轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別和處理的內(nèi)容,是一種描述知識(shí)的數(shù)據(jù)結(jié)構(gòu),用于對(duì)知識(shí)的描述或約定。知識(shí)是人類(lèi)在認(rèn)識(shí)和改造客觀世16知識(shí)表示方法
知識(shí)表示方法主要分為基于符號(hào)的知識(shí)表示方法與基于表示學(xué)習(xí)的知識(shí)表示方法。(1)基于符號(hào)的知識(shí)表示方法基于符號(hào)的知識(shí)表示方法分為一階謂詞邏輯表示法、產(chǎn)生式規(guī)則表示法、框架表示法與語(yǔ)義網(wǎng)絡(luò)表示法。知識(shí)表示方法
知識(shí)表示方法主要分為基于符號(hào)的知識(shí)表示方法與基17(2)基于表示學(xué)習(xí)的知識(shí)表示方法
早期知識(shí)表示方法與語(yǔ)義網(wǎng)知識(shí)表示法通過(guò)符號(hào)顯式地表示概念及其關(guān)系。事實(shí)上,許多知識(shí)具有不易符號(hào)化、隱含性等特點(diǎn),因此僅通過(guò)顯式表示的知識(shí)無(wú)法獲得全面的知識(shí)特征。此外,語(yǔ)義計(jì)算是知識(shí)表示的重要目標(biāo),基于符號(hào)的知識(shí)表示方法無(wú)法有效計(jì)算實(shí)體間的語(yǔ)義關(guān)系。(2)基于表示學(xué)習(xí)的知識(shí)表示方法18技術(shù)發(fā)展趨勢(shì)
(1)符號(hào)與表示學(xué)習(xí)的融合統(tǒng)一(2)面向事理邏輯的知識(shí)表示(3)融合時(shí)空間維度的知識(shí)表示(4)融合跨媒體元素的知識(shí)表示技術(shù)發(fā)展趨勢(shì)
(1)符號(hào)與表示學(xué)習(xí)的融合統(tǒng)一19知識(shí)建模
知識(shí)建模是通過(guò)各種知識(shí)獲取方法獲得突發(fā)事件領(lǐng)域的主要概念和概念之間的關(guān)系,用精確的語(yǔ)言加以描述的過(guò)程。知識(shí)建模知識(shí)建模是通過(guò)各種知20
知識(shí)建模是指建立知識(shí)圖譜的數(shù)據(jù)模型,即采用什么樣的方式來(lái)表達(dá)知識(shí),構(gòu)建一個(gè)本體模型對(duì)知識(shí)進(jìn)行描述。知識(shí)建模是指建立知識(shí)圖譜的數(shù)據(jù)模型21
知識(shí)建模一般有自頂向下和自底向上兩種構(gòu)建方法。自頂向下的方法是指在構(gòu)建知識(shí)圖譜時(shí)首先定義數(shù)據(jù)模式即本體,一般通過(guò)領(lǐng)域?qū)<胰斯ぞ幹?。從最頂層的概念開(kāi)始定義,然后逐步細(xì)化,形成結(jié)構(gòu)良好的分類(lèi)層次結(jié)構(gòu)。知識(shí)建模一般有自頂向下和自底向上22知識(shí)建模方法
知識(shí)建模目前的實(shí)際操作過(guò)程,可分為手工建模方式和半自動(dòng)建模方式。手工建模方式適用于容量小、質(zhì)量要求高的知識(shí)圖譜,但是無(wú)法滿足大規(guī)模的知識(shí)構(gòu)建,是一個(gè)耗時(shí)、昂貴、需要專(zhuān)業(yè)知識(shí)的任務(wù);半自動(dòng)建模方式將自然語(yǔ)言處理與手工方式結(jié)合,適于規(guī)模大且語(yǔ)義復(fù)雜的知識(shí)圖譜。知識(shí)建模方法
知識(shí)建模目前的23(1)手工建模方式
手工建模方式過(guò)程主要可以分為6個(gè)步驟:明確領(lǐng)域本體及任務(wù)、模型復(fù)用、列出本體涉及領(lǐng)域中的元素、明確分類(lèi)體系、定義屬性及關(guān)系和定義約束條件。(1)手工建模方式24(2)半自動(dòng)建模方式
半自動(dòng)建模方式先通過(guò)自動(dòng)方式獲取知識(shí)圖譜,然后再進(jìn)行大量的人工干預(yù)。運(yùn)用自然語(yǔ)言處理技術(shù)半自動(dòng)建模的方法可以分為3大類(lèi):基于結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法、基于半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法和基于非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法。(2)半自動(dòng)建模方式25(3)知識(shí)建模評(píng)價(jià)
對(duì)知識(shí)建模質(zhì)量評(píng)價(jià)也是知識(shí)建模的重要組成部分,通常與實(shí)體對(duì)齊任務(wù)一起進(jìn)行。質(zhì)量評(píng)價(jià)的作用在于可以對(duì)知識(shí)模型的可信度進(jìn)行量化,通過(guò)舍棄置信度較低的知識(shí)來(lái)保障知識(shí)庫(kù)的質(zhì)量。(3)知識(shí)建模評(píng)價(jià)26知識(shí)抽取
知識(shí)抽取指從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識(shí)提取,形成知識(shí)的過(guò)程。為了提供令用戶(hù)滿意的知識(shí)服務(wù),知識(shí)圖譜不僅要包含其涉及領(lǐng)域已知的知識(shí),還要能及時(shí)發(fā)現(xiàn)并添加新的知識(shí)。知識(shí)抽取知識(shí)抽取指從不同來(lái)源、不同27第七章知識(shí)圖譜課件28實(shí)體抽取
實(shí)體抽取也被稱(chēng)為命名實(shí)體識(shí)別(NamedEntityRecognition,NER),指從原始數(shù)據(jù)中自動(dòng)識(shí)別出命名實(shí)體。實(shí)體抽取實(shí)體抽取也被稱(chēng)為命名29
實(shí)體抽取的方法主要有基于規(guī)則與詞典的方法、基于機(jī)器學(xué)習(xí)的方法以及面向開(kāi)放域的抽取方法。實(shí)體抽取的方法主要有基于規(guī)30關(guān)系抽取
關(guān)系抽取的目標(biāo)是抽取語(yǔ)料中命名實(shí)體的語(yǔ)義關(guān)系。實(shí)體抽取技術(shù)會(huì)在原始的語(yǔ)料上標(biāo)記一些命名實(shí)體。為了形成知識(shí)結(jié)構(gòu),還需要從中抽取命名實(shí)體間的關(guān)聯(lián)信息,從而利用這些信息將離散的命名實(shí)體連接起來(lái),這就是關(guān)系抽取技術(shù)。關(guān)系抽取關(guān)系抽取的目標(biāo)是抽取語(yǔ)料中命名實(shí)31屬性抽取
實(shí)體的屬性可以使實(shí)體對(duì)象更加豐滿。屬性抽取的目的是從多種來(lái)源的數(shù)據(jù)中抽取目標(biāo)實(shí)體的屬性?xún)?nèi)容。實(shí)體的屬性可以看作是連接實(shí)體與屬性值的關(guān)系,因此,在實(shí)際應(yīng)用中,一些學(xué)者將屬性抽取問(wèn)題轉(zhuǎn)化為關(guān)系抽取問(wèn)題。屬性抽取
實(shí)體的屬性可以使32知識(shí)存儲(chǔ)
知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜的知識(shí)表示形式設(shè)計(jì)底層存儲(chǔ)方式,完成各類(lèi)知識(shí)的存儲(chǔ),以支持對(duì)大規(guī)模數(shù)據(jù)的有效管理和計(jì)算。知識(shí)存儲(chǔ)
知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜的知33
知識(shí)存儲(chǔ)的對(duì)象包括基本屬性知識(shí)、關(guān)聯(lián)知識(shí)、事件知識(shí)、時(shí)序知識(shí)和資源類(lèi)知識(shí)等。知識(shí)存儲(chǔ)方式的質(zhì)量直接影響知識(shí)圖譜中知識(shí)查詢(xún)、知識(shí)計(jì)算及知識(shí)更新的效率。知識(shí)存儲(chǔ)的對(duì)象包括基34
從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存儲(chǔ)和基于圖結(jié)構(gòu)的存儲(chǔ)。從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存35知識(shí)存儲(chǔ)工具
知識(shí)圖譜的存儲(chǔ)并不依賴(lài)特定的底層結(jié)構(gòu),一般的做法是按數(shù)據(jù)和應(yīng)用的需求采用不同的底層存儲(chǔ),甚至可以基于現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)進(jìn)行構(gòu)建。1.關(guān)系型數(shù)據(jù)庫(kù)2.圖數(shù)據(jù)庫(kù)知識(shí)存儲(chǔ)工具
知識(shí)圖譜的存儲(chǔ)并36知識(shí)融合
知識(shí)融合即合并兩個(gè)知識(shí)圖譜(本體),基本的問(wèn)題是研究將來(lái)自多個(gè)來(lái)源的關(guān)于同一個(gè)實(shí)體或概念的描述信息融合起來(lái)的方法。知識(shí)融合知識(shí)融合即合并兩個(gè)知識(shí)37
知識(shí)融合的概念最早出現(xiàn)在霍爾薩普爾(Holsapple)和溫士頓(Whinston)在1983年發(fā)表的文章ASoftwareToolsForKnowledgeFusion中,并在20世紀(jì)90年代得到研究者的廣泛關(guān)注。知識(shí)融合的概念最早出現(xiàn)在霍爾薩38
知識(shí)融合是面向知識(shí)服務(wù)和決策問(wèn)題,以多源異構(gòu)數(shù)據(jù)為基礎(chǔ),在本體庫(kù)和規(guī)則庫(kù)的支持下,通過(guò)知識(shí)抽取和轉(zhuǎn)換獲得隱藏在數(shù)據(jù)資源中的知識(shí)因子及其關(guān)聯(lián)關(guān)系,進(jìn)而在語(yǔ)義層次上組合、推理、創(chuàng)造出新知識(shí)的過(guò)程,并且這個(gè)過(guò)程需要根據(jù)數(shù)據(jù)源的變化和用戶(hù)反饋進(jìn)行實(shí)時(shí)動(dòng)態(tài)調(diào)整。知識(shí)融合是面向知識(shí)服務(wù)和決策39知識(shí)推理
知識(shí)圖譜的表示(Representation)指的是用什么數(shù)據(jù)結(jié)構(gòu)來(lái)表示一個(gè)知識(shí)圖譜。顧名思義,知識(shí)圖譜是以圖的方式來(lái)展示知識(shí),但是這并不代表知識(shí)圖譜必須采用圖的表示。從圖的角度看,知識(shí)圖譜是一個(gè)語(yǔ)義網(wǎng)絡(luò),即一種用互聯(lián)的節(jié)點(diǎn)和邊來(lái)表示知識(shí)的結(jié)構(gòu)。知識(shí)推理
知識(shí)圖譜的表示(Rep40
語(yǔ)義網(wǎng)絡(luò)中的語(yǔ)義主要體現(xiàn)在圖中邊的含義上,為了賦予這些邊語(yǔ)義,研究人員先是提出了術(shù)語(yǔ)語(yǔ)言(TerminologicalLanguage),并最終提出了描述邏輯(DescriptionLogic),描述邏輯是一階謂詞邏輯的一個(gè)子集,推理復(fù)雜度是可判定的(Decidable)。W3C采用了以描述邏輯為邏輯基礎(chǔ)的本體語(yǔ)言O(shè)WL(OntologyWebLanguage)作為定義Web術(shù)語(yǔ)的標(biāo)準(zhǔn)語(yǔ)言,還推出了另外一種用于表示W(wǎng)eb本體的語(yǔ)言RDFSchema(簡(jiǎn)稱(chēng)RDFS)。語(yǔ)義網(wǎng)絡(luò)中的語(yǔ)義主要體現(xiàn)在圖中41并行知識(shí)推理
現(xiàn)有的并行推理方法主要集中在前向鏈推理,即應(yīng)用推理規(guī)則到知識(shí)圖譜生成新的三元組,所以對(duì)于動(dòng)態(tài)知識(shí)圖譜的推理處理效果不佳。另外,前向鏈推理會(huì)導(dǎo)致知識(shí)圖譜存儲(chǔ)大量冗余知識(shí),也不利于高效的知識(shí)檢索和查詢(xún)。并行知識(shí)推理現(xiàn)有的42知識(shí)圖譜的應(yīng)用
知識(shí)圖譜的應(yīng)用場(chǎng)景很多,在不同行業(yè)、不同領(lǐng)域都有廣泛應(yīng)用,知識(shí)圖譜在商業(yè)領(lǐng)域的應(yīng)用主要體現(xiàn)在語(yǔ)義搜索和問(wèn)答系統(tǒng)這兩方面。知識(shí)圖譜的應(yīng)用
知識(shí)圖譜43語(yǔ)義搜索
語(yǔ)義搜索的研究涉及多個(gè)領(lǐng)域,包括搜索引擎、語(yǔ)義網(wǎng)、數(shù)據(jù)挖掘和知識(shí)推理等。運(yùn)用的主要方法有圖論、匹配算法和邏輯(特別是描述邏輯、模糊邏輯等方法)。語(yǔ)義搜索語(yǔ)義搜索的研究涉及多個(gè)44問(wèn)答系統(tǒng)
問(wèn)答系統(tǒng)也是知識(shí)圖譜應(yīng)用較為廣泛的領(lǐng)域,問(wèn)答系統(tǒng)需要理解查詢(xún)的語(yǔ)義信息,將輸入的自然語(yǔ)言轉(zhuǎn)化為知識(shí)庫(kù)中的實(shí)體和關(guān)系的映射。例如,輸入“阿里巴巴的創(chuàng)始人”,系統(tǒng)會(huì)到知識(shí)庫(kù)中尋找“馬云”這個(gè)實(shí)體,并搜索該實(shí)體下“創(chuàng)始人”這個(gè)屬性的值,將其展現(xiàn)在系統(tǒng)頁(yè)面上。問(wèn)答系統(tǒng)問(wèn)答系統(tǒng)也是知識(shí)圖45小結(jié)(1)知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系。(2)知識(shí)表示方法主要分為基于符號(hào)的知識(shí)表示方法、基于表示學(xué)習(xí)的知識(shí)表示方法2種。(3)知識(shí)抽取指從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識(shí)提取,形成知識(shí)的過(guò)程。(4)知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜的知識(shí)表示形式設(shè)計(jì)底層存儲(chǔ)方式,完成各類(lèi)知識(shí)的存儲(chǔ),以支持對(duì)大規(guī)模數(shù)據(jù)的有效管理和計(jì)算。(5)知識(shí)融合的目標(biāo)是產(chǎn)生新的知識(shí),是對(duì)松耦合來(lái)源中的知識(shí)進(jìn)行集成,構(gòu)成一個(gè)合成的資源,用來(lái)補(bǔ)充不完全的知識(shí)和獲取新知識(shí)。(6)知識(shí)圖譜的推理首先需要考慮的是知識(shí)如何表達(dá)的問(wèn)題,即知識(shí)圖譜的知識(shí)表示,它包括基于圖結(jié)構(gòu)的表示以及相應(yīng)的邏輯基礎(chǔ),還有基于張量的表示。(7)語(yǔ)義搜索是指搜索引擎的工作不再拘泥于用戶(hù)所輸入請(qǐng)求語(yǔ)句的字面本身,而是透過(guò)現(xiàn)象看本質(zhì),準(zhǔn)確地捕捉到用戶(hù)的真實(shí)意圖,并依此來(lái)進(jìn)行搜索,從而更準(zhǔn)確地向用戶(hù)返回最符合其需求的搜索結(jié)果。(8)知識(shí)庫(kù)問(wèn)答系統(tǒng)在回答用戶(hù)問(wèn)題時(shí),需要正確理解用戶(hù)所提出的自然語(yǔ)言問(wèn)題,抽取其中的關(guān)鍵語(yǔ)義信息,然后在已有單個(gè)或多個(gè)知識(shí)庫(kù)中通過(guò)檢索、推理等手段獲取答案并返回給用戶(hù)。小結(jié)(1)知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其46知識(shí)圖譜
知識(shí)圖譜
47
知識(shí)圖譜(KnowledgeGraph)是一種揭示實(shí)體之間關(guān)系的語(yǔ)義網(wǎng)絡(luò)。2012年5月17日,Google正式提出了知識(shí)圖譜的概念,其初衷是優(yōu)化搜索引擎返回的結(jié)果,增強(qiáng)用戶(hù)搜索質(zhì)量及體驗(yàn)。知識(shí)圖譜(KnowledgeG48
知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系,將互聯(lián)網(wǎng)的信息表達(dá)成更接近人類(lèi)認(rèn)知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。知識(shí)圖譜以結(jié)構(gòu)化的形式描述客觀世界49
知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)絡(luò),其中的節(jié)點(diǎn)代表實(shí)體(Entity)或者概念(Concept),邊代表實(shí)體/概念之間的各種語(yǔ)義關(guān)系。知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)絡(luò),50知識(shí)圖譜的發(fā)展歷史1.第一階段(1955年~1977年)
第一階段是知識(shí)圖譜的起源階段,在這一階段中研究者們提出了引文網(wǎng)絡(luò)和語(yǔ)義網(wǎng)絡(luò)的概念知識(shí)圖譜的發(fā)展歷史1.第一階段(1955年~1977年)512.第二階段(1977年~2012年)
第二階段是知識(shí)圖譜的發(fā)展階段,語(yǔ)義網(wǎng)絡(luò)得到快速發(fā)展,“知識(shí)本體”的研究開(kāi)始成為計(jì)算機(jī)科學(xué)的一個(gè)重要領(lǐng)域,知識(shí)圖譜吸收了語(yǔ)義網(wǎng)、本體在知識(shí)組織和表達(dá)方面的理念,使得知識(shí)更易于在計(jì)算機(jī)之間和計(jì)算機(jī)與人之間交換、流通和加工。2.第二階段(1977年~2012年)523.第三階段(2012年至今)
第三階段是知識(shí)圖譜的繁榮階段,2012年谷歌提出GoogleKnowledgeGraph,知識(shí)圖譜正式得名,谷歌通過(guò)知識(shí)圖譜技術(shù)改善了搜索引擎性能。在人工智能的蓬勃發(fā)展下,知識(shí)圖譜涉及的知識(shí)抽取、表示、融合、推理、問(wèn)答等關(guān)鍵問(wèn)題得到一定程度的解決和突破,知識(shí)圖譜成為知識(shí)服務(wù)領(lǐng)域的一個(gè)新熱點(diǎn)3.第三階段(2012年至今)53知識(shí)圖譜的類(lèi)型(1)事實(shí)知識(shí)
事實(shí)知識(shí)是知識(shí)圖譜中最常見(jiàn)的知識(shí)類(lèi)型。大部分事實(shí)都是在描述實(shí)體的特定屬性或者關(guān)系,例如:三元組(柏拉圖,出生地,雅典)中的“出生地”就是其中一個(gè)屬性。知識(shí)圖譜的類(lèi)型(1)事實(shí)知識(shí)54(2)概念知識(shí)
概念知識(shí)分為兩類(lèi),一類(lèi)是實(shí)體與概念之間的類(lèi)屬關(guān)系,另一類(lèi)是子概念與父概念之間的子類(lèi)關(guān)系。(2)概念知識(shí)55(3)詞匯知識(shí)
詞匯知識(shí)主要包括實(shí)體與詞匯之間的關(guān)系(實(shí)體的命名、稱(chēng)謂、英文名等)以及詞匯之間的關(guān)系(同義關(guān)系、反義關(guān)系、縮略詞關(guān)系、上下位詞關(guān)系等)。例如,(“Plato”,中文名,柏拉圖)、(趙匡胤,廟號(hào),宋太祖)、(妻子,同義,老婆)。(3)詞匯知識(shí)56(4)常識(shí)知識(shí)
常識(shí)是人類(lèi)通過(guò)身體與世界交互而積累的經(jīng)驗(yàn)與知識(shí),是人們?cè)诮涣鲿r(shí)無(wú)須言明就能理解的知識(shí)。例如,我們都知道鳥(niǎo)有翅膀、鳥(niǎo)能飛等;又如,如果X是一個(gè)人,則X要么是男人要么是女人。常識(shí)知識(shí)的獲取是構(gòu)建知識(shí)圖譜時(shí)的一大難點(diǎn)。(4)常識(shí)知識(shí)57知識(shí)圖譜的重要性
知識(shí)圖譜已成為推動(dòng)機(jī)器基于人類(lèi)知識(shí)獲取認(rèn)知能力的重要途徑,并將逐漸成為未來(lái)智能社會(huì)的重要生產(chǎn)資料。知識(shí)圖譜的重要性知識(shí)圖譜已成581.知識(shí)圖譜是人工智能的重要基石2.知識(shí)圖譜推動(dòng)智能應(yīng)用3.知識(shí)圖譜是強(qiáng)人工智能發(fā)展的核心驅(qū)動(dòng)力之一1.知識(shí)圖譜是人工智能的重要基石59知識(shí)表示和知識(shí)建模
知識(shí)表示與知識(shí)建模是知識(shí)圖譜中的重要內(nèi)容,在構(gòu)建知識(shí)圖譜的時(shí)候,首先要建立知識(shí)表達(dá)的數(shù)據(jù)模型,也就是知識(shí)圖譜的整個(gè)數(shù)據(jù)組織體系。知識(shí)表示和知識(shí)建模
知識(shí)表示與知60
知識(shí)表示學(xué)習(xí)主要是面向知識(shí)圖譜中的實(shí)體和關(guān)系進(jìn)行表示學(xué)習(xí),使用建模方法將實(shí)體和向量表示在低維稠密向量空間中,然后進(jìn)行計(jì)算和推理。知識(shí)表示學(xué)習(xí)主要是面向知識(shí)圖譜中61
知識(shí)是人類(lèi)在認(rèn)識(shí)和改造客觀世界的過(guò)程中總結(jié)出的客觀事實(shí)、概念、定理和公理的集合。知識(shí)具有不同的分類(lèi)方式,例如,按照知識(shí)的作用范圍可分為常識(shí)性知識(shí)與領(lǐng)域性知識(shí)。知識(shí)表示是將現(xiàn)實(shí)世界中存在的知識(shí)轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別和處理的內(nèi)容,是一種描述知識(shí)的數(shù)據(jù)結(jié)構(gòu),用于對(duì)知識(shí)的描述或約定。知識(shí)是人類(lèi)在認(rèn)識(shí)和改造客觀世62知識(shí)表示方法
知識(shí)表示方法主要分為基于符號(hào)的知識(shí)表示方法與基于表示學(xué)習(xí)的知識(shí)表示方法。(1)基于符號(hào)的知識(shí)表示方法基于符號(hào)的知識(shí)表示方法分為一階謂詞邏輯表示法、產(chǎn)生式規(guī)則表示法、框架表示法與語(yǔ)義網(wǎng)絡(luò)表示法。知識(shí)表示方法
知識(shí)表示方法主要分為基于符號(hào)的知識(shí)表示方法與基63(2)基于表示學(xué)習(xí)的知識(shí)表示方法
早期知識(shí)表示方法與語(yǔ)義網(wǎng)知識(shí)表示法通過(guò)符號(hào)顯式地表示概念及其關(guān)系。事實(shí)上,許多知識(shí)具有不易符號(hào)化、隱含性等特點(diǎn),因此僅通過(guò)顯式表示的知識(shí)無(wú)法獲得全面的知識(shí)特征。此外,語(yǔ)義計(jì)算是知識(shí)表示的重要目標(biāo),基于符號(hào)的知識(shí)表示方法無(wú)法有效計(jì)算實(shí)體間的語(yǔ)義關(guān)系。(2)基于表示學(xué)習(xí)的知識(shí)表示方法64技術(shù)發(fā)展趨勢(shì)
(1)符號(hào)與表示學(xué)習(xí)的融合統(tǒng)一(2)面向事理邏輯的知識(shí)表示(3)融合時(shí)空間維度的知識(shí)表示(4)融合跨媒體元素的知識(shí)表示技術(shù)發(fā)展趨勢(shì)
(1)符號(hào)與表示學(xué)習(xí)的融合統(tǒng)一65知識(shí)建模
知識(shí)建模是通過(guò)各種知識(shí)獲取方法獲得突發(fā)事件領(lǐng)域的主要概念和概念之間的關(guān)系,用精確的語(yǔ)言加以描述的過(guò)程。知識(shí)建模知識(shí)建模是通過(guò)各種知66
知識(shí)建模是指建立知識(shí)圖譜的數(shù)據(jù)模型,即采用什么樣的方式來(lái)表達(dá)知識(shí),構(gòu)建一個(gè)本體模型對(duì)知識(shí)進(jìn)行描述。知識(shí)建模是指建立知識(shí)圖譜的數(shù)據(jù)模型67
知識(shí)建模一般有自頂向下和自底向上兩種構(gòu)建方法。自頂向下的方法是指在構(gòu)建知識(shí)圖譜時(shí)首先定義數(shù)據(jù)模式即本體,一般通過(guò)領(lǐng)域?qū)<胰斯ぞ幹?。從最頂層的概念開(kāi)始定義,然后逐步細(xì)化,形成結(jié)構(gòu)良好的分類(lèi)層次結(jié)構(gòu)。知識(shí)建模一般有自頂向下和自底向上68知識(shí)建模方法
知識(shí)建模目前的實(shí)際操作過(guò)程,可分為手工建模方式和半自動(dòng)建模方式。手工建模方式適用于容量小、質(zhì)量要求高的知識(shí)圖譜,但是無(wú)法滿足大規(guī)模的知識(shí)構(gòu)建,是一個(gè)耗時(shí)、昂貴、需要專(zhuān)業(yè)知識(shí)的任務(wù);半自動(dòng)建模方式將自然語(yǔ)言處理與手工方式結(jié)合,適于規(guī)模大且語(yǔ)義復(fù)雜的知識(shí)圖譜。知識(shí)建模方法
知識(shí)建模目前的69(1)手工建模方式
手工建模方式過(guò)程主要可以分為6個(gè)步驟:明確領(lǐng)域本體及任務(wù)、模型復(fù)用、列出本體涉及領(lǐng)域中的元素、明確分類(lèi)體系、定義屬性及關(guān)系和定義約束條件。(1)手工建模方式70(2)半自動(dòng)建模方式
半自動(dòng)建模方式先通過(guò)自動(dòng)方式獲取知識(shí)圖譜,然后再進(jìn)行大量的人工干預(yù)。運(yùn)用自然語(yǔ)言處理技術(shù)半自動(dòng)建模的方法可以分為3大類(lèi):基于結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法、基于半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法和基于非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)建模方法。(2)半自動(dòng)建模方式71(3)知識(shí)建模評(píng)價(jià)
對(duì)知識(shí)建模質(zhì)量評(píng)價(jià)也是知識(shí)建模的重要組成部分,通常與實(shí)體對(duì)齊任務(wù)一起進(jìn)行。質(zhì)量評(píng)價(jià)的作用在于可以對(duì)知識(shí)模型的可信度進(jìn)行量化,通過(guò)舍棄置信度較低的知識(shí)來(lái)保障知識(shí)庫(kù)的質(zhì)量。(3)知識(shí)建模評(píng)價(jià)72知識(shí)抽取
知識(shí)抽取指從不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行知識(shí)提取,形成知識(shí)的過(guò)程。為了提供令用戶(hù)滿意的知識(shí)服務(wù),知識(shí)圖譜不僅要包含其涉及領(lǐng)域已知的知識(shí),還要能及時(shí)發(fā)現(xiàn)并添加新的知識(shí)。知識(shí)抽取知識(shí)抽取指從不同來(lái)源、不同73第七章知識(shí)圖譜課件74實(shí)體抽取
實(shí)體抽取也被稱(chēng)為命名實(shí)體識(shí)別(NamedEntityRecognition,NER),指從原始數(shù)據(jù)中自動(dòng)識(shí)別出命名實(shí)體。實(shí)體抽取實(shí)體抽取也被稱(chēng)為命名75
實(shí)體抽取的方法主要有基于規(guī)則與詞典的方法、基于機(jī)器學(xué)習(xí)的方法以及面向開(kāi)放域的抽取方法。實(shí)體抽取的方法主要有基于規(guī)76關(guān)系抽取
關(guān)系抽取的目標(biāo)是抽取語(yǔ)料中命名實(shí)體的語(yǔ)義關(guān)系。實(shí)體抽取技術(shù)會(huì)在原始的語(yǔ)料上標(biāo)記一些命名實(shí)體。為了形成知識(shí)結(jié)構(gòu),還需要從中抽取命名實(shí)體間的關(guān)聯(lián)信息,從而利用這些信息將離散的命名實(shí)體連接起來(lái),這就是關(guān)系抽取技術(shù)。關(guān)系抽取關(guān)系抽取的目標(biāo)是抽取語(yǔ)料中命名實(shí)77屬性抽取
實(shí)體的屬性可以使實(shí)體對(duì)象更加豐滿。屬性抽取的目的是從多種來(lái)源的數(shù)據(jù)中抽取目標(biāo)實(shí)體的屬性?xún)?nèi)容。實(shí)體的屬性可以看作是連接實(shí)體與屬性值的關(guān)系,因此,在實(shí)際應(yīng)用中,一些學(xué)者將屬性抽取問(wèn)題轉(zhuǎn)化為關(guān)系抽取問(wèn)題。屬性抽取
實(shí)體的屬性可以使78知識(shí)存儲(chǔ)
知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜的知識(shí)表示形式設(shè)計(jì)底層存儲(chǔ)方式,完成各類(lèi)知識(shí)的存儲(chǔ),以支持對(duì)大規(guī)模數(shù)據(jù)的有效管理和計(jì)算。知識(shí)存儲(chǔ)
知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜的知79
知識(shí)存儲(chǔ)的對(duì)象包括基本屬性知識(shí)、關(guān)聯(lián)知識(shí)、事件知識(shí)、時(shí)序知識(shí)和資源類(lèi)知識(shí)等。知識(shí)存儲(chǔ)方式的質(zhì)量直接影響知識(shí)圖譜中知識(shí)查詢(xún)、知識(shí)計(jì)算及知識(shí)更新的效率。知識(shí)存儲(chǔ)的對(duì)象包括基80
從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存儲(chǔ)和基于圖結(jié)構(gòu)的存儲(chǔ)。從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)的存81知識(shí)存儲(chǔ)工具
知識(shí)圖譜的存儲(chǔ)并不依賴(lài)特定的底層結(jié)構(gòu),一般的做法是按數(shù)據(jù)和應(yīng)用的需求采用不同的底層存儲(chǔ),甚至可以基于現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)進(jìn)行構(gòu)建。1.關(guān)系型數(shù)據(jù)庫(kù)2.圖數(shù)據(jù)庫(kù)知識(shí)存儲(chǔ)工具
知識(shí)圖譜的存儲(chǔ)并82知識(shí)融合
知識(shí)融合即合并兩個(gè)知識(shí)圖譜(本體),基本的問(wèn)題是研究將來(lái)自多個(gè)來(lái)源的關(guān)于同一個(gè)實(shí)體或概念的描述信息融合起來(lái)的方法。知識(shí)融合知識(shí)融合即合并兩個(gè)知識(shí)83
知識(shí)融合的概念最早出現(xiàn)在霍爾薩普爾(Holsapple)和溫士頓(Whinston)在1983年發(fā)表的文章ASoftwareToolsForKnowledgeFusion中,并在20世紀(jì)90年代得到研究者的廣泛關(guān)注。知識(shí)融合的概念最早出現(xiàn)在霍爾薩84
知識(shí)融合是面向知識(shí)服務(wù)和決策問(wèn)題,以多源異構(gòu)數(shù)據(jù)為基礎(chǔ),在本體庫(kù)和規(guī)則庫(kù)的支持下,通過(guò)知識(shí)抽取和轉(zhuǎn)換獲得隱藏在數(shù)據(jù)資源中的知識(shí)因子及其關(guān)聯(lián)關(guān)系,進(jìn)而在語(yǔ)義層次上組合、推理、創(chuàng)造出新知識(shí)的過(guò)程,并且這個(gè)過(guò)程需要根據(jù)數(shù)據(jù)源的變化和用戶(hù)反饋進(jìn)行實(shí)時(shí)動(dòng)態(tài)調(diào)整。知識(shí)融合是面向知識(shí)服務(wù)和決策85知識(shí)推理
知識(shí)圖譜的表示(Representation)指的是用什么數(shù)據(jù)結(jié)構(gòu)來(lái)表示一個(gè)知識(shí)圖譜。顧名思義,知識(shí)圖譜是以圖的方式來(lái)展示知識(shí),但是這并不代表知識(shí)圖譜必須采用圖的表示。從圖的角度看,知識(shí)圖譜是一個(gè)語(yǔ)義網(wǎng)絡(luò),即一種用互聯(lián)的節(jié)點(diǎn)和邊來(lái)表示知識(shí)的結(jié)構(gòu)。知識(shí)推理
知識(shí)圖譜的表示(Rep86
語(yǔ)義網(wǎng)絡(luò)中的語(yǔ)義主要體現(xiàn)在圖中邊的含義上,為了賦予這些邊語(yǔ)義,研究人員先是提出了術(shù)語(yǔ)語(yǔ)言(TerminologicalLanguage),并最終提出了描述邏輯(DescriptionLogic),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 銷(xiāo)售合同模板文檔
- 2023年資陽(yáng)市消防救援支隊(duì)社會(huì)招聘消防文員筆試真題
- 遠(yuǎn)程培訓(xùn)服務(wù)合同范例
- 購(gòu)車(chē)庫(kù)定金合同范例
- 2024年度版權(quán)許可使用合同:音樂(lè)作品授權(quán)與分成3篇
- 2024版房產(chǎn)出售附帶產(chǎn)權(quán)車(chē)位買(mǎi)賣(mài)合同3篇
- 2024版城鄉(xiāng)實(shí)體地域劃分與城鄉(xiāng)信息化基礎(chǔ)設(shè)施建設(shè)合同3篇
- 北京墓地銷(xiāo)售合同范例
- 餐飲會(huì)員合同范例
- 陶瓷潔具購(gòu)銷(xiāo)合同模板
- 福建百校2025屆高三12月聯(lián)考?xì)v史試卷(含答案解析)
- 2023年益陽(yáng)市安化縣招聘鄉(xiāng)鎮(zhèn)衛(wèi)生院護(hù)理人員筆試真題
- 人音版音樂(lè)七年級(jí)上冊(cè)《父親的草原母親的河》課件
- 2024年度短視頻內(nèi)容創(chuàng)作服務(wù)合同3篇
- 2024年度拼多多店鋪托管經(jīng)營(yíng)合同2篇
- 2023年北京腫瘤醫(yī)院(含社會(huì)人員)招聘筆試真題
- 能源管理總結(jié)報(bào)告
- 2024年時(shí)事政治試題庫(kù)
- 2024-2025學(xué)年統(tǒng)編版五年級(jí)語(yǔ)文上冊(cè)第七單元達(dá)標(biāo)檢測(cè)卷(原卷+答案)
- 【初中數(shù)學(xué)】基本平面圖形單元測(cè)試 2024-2025學(xué)年北師大版數(shù)學(xué)七年級(jí)上冊(cè)
- 旅行社分店加盟協(xié)議書(shū)(2篇)
評(píng)論
0/150
提交評(píng)論