




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、姓 名導(dǎo) 師張書涵夏幼明教授(jioshu)基于(jy)RDF的教育資源描述共二十九頁(yè)目錄1234元數(shù)據(jù)(shj)與教育資源建設(shè)技術(shù)規(guī)范XML語(yǔ)言與資源(zyun)描述框架RDF基于RDF模型的半結(jié)構(gòu)化知識(shí)表示教育資源特征提取與分類算法共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 什么(shn me)是元數(shù)據(jù)? 元數(shù)據(jù)可以出現(xiàn)在數(shù)據(jù)內(nèi)部、獨(dú)立于數(shù)據(jù)、伴隨著數(shù)據(jù)、與數(shù)據(jù)包裹在一起等形式。 元數(shù)據(jù),最常見(jiàn)的寬泛定義是關(guān)于數(shù)據(jù)的數(shù)據(jù),具體講的是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 元數(shù)據(jù)(shj)的種類對(duì)于元數(shù)據(jù)的種類有不同的分類方法,一般分為描述性元數(shù)據(jù)、結(jié)構(gòu)性元
2、數(shù)據(jù)、存取控制性元數(shù)據(jù)、評(píng)價(jià)性元數(shù)據(jù)。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 元數(shù)據(jù)(shj)在教育領(lǐng)域中的應(yīng)用1、用于教育信息資源的組織2、用于教育信息資源的檢索與導(dǎo)航3、用于教育信息資源數(shù)據(jù)庫(kù)的設(shè)計(jì)與維護(hù)4、用于系統(tǒng)管理機(jī)制的描述共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有的教育資源元數(shù)據(jù)(shj)標(biāo)準(zhǔn)1、都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn) 英文名是“Dublin Core Metadata”,簡(jiǎn)稱DC元數(shù)據(jù)。它于1995年3月,由美國(guó)聯(lián)機(jī)圖書館中心與國(guó)家超級(jí)計(jì)算應(yīng)用中心聯(lián)合發(fā)起,目的是希望建立一套描述網(wǎng)絡(luò)學(xué)習(xí)資源的方法,方便人們檢索。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有
3、的教育資源元數(shù)據(jù)(shj)標(biāo)準(zhǔn)1、都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn)DC元數(shù)據(jù)為網(wǎng)絡(luò)教育資源制定了一組通用核心集,該標(biāo)準(zhǔn)對(duì)網(wǎng)絡(luò)教育資源相關(guān)的15個(gè)核心元素進(jìn)行了規(guī)定,并分成了三類。一是教育資源內(nèi)容描述類,主要包括Title, Subject, Description,Source, Language, Relation等;二是知識(shí)產(chǎn)權(quán)類,包括Creator, Publisher等;三是外部屬性描述類,包括Date, Type, Format等。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有(xin yu)的教育資源元數(shù)據(jù)標(biāo)準(zhǔn)1、都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn)DC元數(shù)據(jù)比較簡(jiǎn)單,容易理解,規(guī)定的內(nèi)容也較少,是一個(gè)
4、良好的教育資源描述元數(shù)據(jù)集。但是,在描述較復(fù)雜的學(xué)習(xí)對(duì)象時(shí),不能詳細(xì)的對(duì)教育資源的屬性進(jìn)行描述,具有一定的局限性。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有(xin yu)的教育資源元數(shù)據(jù)標(biāo)準(zhǔn)2、學(xué)習(xí)對(duì)象元數(shù)據(jù)(Learning Object Metadata) 簡(jiǎn)稱LOM元數(shù)據(jù),是與學(xué)習(xí)對(duì)象相關(guān)的一切信息。它于1996年IEEE的學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)委員會(huì)研究產(chǎn)生,方便對(duì)學(xué)習(xí)對(duì)象進(jìn)行檢索、查詢、定位和管理。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有的教育資源元數(shù)據(jù)(shj)標(biāo)準(zhǔn)2、學(xué)習(xí)對(duì)象元數(shù)據(jù)(Learning Object Metadata)IEEE LOM主要對(duì)學(xué)習(xí)對(duì)象的9
5、個(gè)基礎(chǔ)類別的特征進(jìn)行規(guī)范和描述:通用類、生存周期類、元-元數(shù)據(jù)、技術(shù)類、教育類、權(quán)利類、關(guān)聯(lián)類、注釋類、分類類共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有(xin yu)的教育資源元數(shù)據(jù)標(biāo)準(zhǔn)2、學(xué)習(xí)對(duì)象元數(shù)據(jù)(Learning Object Metadata)從元素構(gòu)成上看,LOM較為復(fù)雜,分為9大類,每一類下面由有二級(jí)元素,一共47個(gè)左右。但是其修飾詞卻不復(fù)雜,只有部分元素有修飾詞。從資源描述能力上看,相比DC元數(shù)據(jù),LOM的資源描述深度和廣度要強(qiáng)的多,是更專業(yè)的教育資源描述工具。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有的教育資源元數(shù)據(jù)(shj)標(biāo)準(zhǔn)3、中國(guó)網(wǎng)絡(luò)教育技術(shù)標(biāo)
6、準(zhǔn)英文名稱China E-Learning Technology Standards,簡(jiǎn)稱CELTS。它于2001年由中國(guó)教育信息化技術(shù)標(biāo)準(zhǔn)委員會(huì)提出,是一個(gè)具有中國(guó)特色的網(wǎng)絡(luò)技術(shù)標(biāo)準(zhǔn)。共二十九頁(yè)1元數(shù)據(jù)(shj)與教育資源技術(shù)規(guī)范 現(xiàn)有(xin yu)的教育資源元數(shù)據(jù)標(biāo)準(zhǔn)3、中國(guó)網(wǎng)絡(luò)教育技術(shù)標(biāo)準(zhǔn)學(xué)習(xí)對(duì)象元數(shù)據(jù)規(guī)范CELTS-3教育資源建設(shè)技術(shù)規(guī)范CELTS-41基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范CELTS-42共二十九頁(yè)2XML語(yǔ)言(yyn)與資源描述框架RDF 什么是資源描述(mio sh)框架RDF? RDF是一種元數(shù)據(jù)框架,它借助網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器可識(shí)別應(yīng)用程序之間的互操作性,使網(wǎng)絡(luò)資源自動(dòng)化處理。
7、RDF的主要目標(biāo)是為了解決互聯(lián)網(wǎng)中信息的語(yǔ)義化,它支持對(duì)元數(shù)據(jù)語(yǔ)義的描述以及元數(shù)據(jù)之間的互操作性,在應(yīng)用中也支持基于推理的知識(shí)發(fā)現(xiàn)而不是全文匹配檢索。共二十九頁(yè)2XML語(yǔ)言(yyn)與資源描述框架RDF RDF框架(kun ji)RDF數(shù)據(jù)模型、RDF模式和RDF語(yǔ)法 1、RDF數(shù)據(jù)模型RDF數(shù)據(jù)模型形成對(duì)資源的形式描述,通過(guò)使用標(biāo)記圖(或“節(jié)點(diǎn)和弧”圖)表示,包括:資源、屬性、屬性值三部分。資源屬性值屬性資源可能是整個(gè)網(wǎng)頁(yè)、網(wǎng)頁(yè)的一部分或頁(yè)面的全部集合,或者是不能通過(guò)Web直接訪問(wèn)的對(duì)象屬性是描述某個(gè)資源特定的方面、特征、性質(zhì)或關(guān)系共二十九頁(yè)2XML語(yǔ)言(yyn)與資源描述框架RDF2、RD
8、F模式(RDF Schema)RDF模式定義了RDF描述資源時(shí)所用的詞匯集,包括(boku)類和屬性。3、RDF語(yǔ)法-基于XML的語(yǔ)法共二十九頁(yè)2XML語(yǔ)言與資源描述(mio sh)框架RDF xmlns:g=“grid:/schema#”LiMing共二十九頁(yè)2XML語(yǔ)言(yyn)與資源描述框架RDF資源類型屬性名稱含義屬性描述資源包含的基本屬性(Resources)Name表示資源名稱由資源創(chuàng)建者都提供者給出的資源名稱。Address表示資源地址使用URI進(jìn)行標(biāo)識(shí)。Type表示資源類型從類型列表中選取。Provider表示資源的提供者提供資源的個(gè)人或機(jī)構(gòu)registerDate表示資源的注
9、冊(cè)日期使用YYYY MM-DD形式Validate表示資源的有效日期資源可利用到不可利用狀態(tài)的日期下限D(zhuǎn)escription表示資源的簡(jiǎn)略描述資源內(nèi)容的文本描述網(wǎng)格中資源(zyun)基本屬性共二十九頁(yè)2XML語(yǔ)言與資源(zyun)描述框架RDF!DOTYPE rdf:RDF” xmlns:rdf=“ /1999/02/22-rdf-syntax-ns#” xmlns:rdf=“ /2000/01/rdf-schema#” xml:base=“/schemas/allresource” 共二十九頁(yè)3基于RDF模型(mxng)的半結(jié)構(gòu)化知識(shí)表示設(shè)有目標(biāo)域?yàn)镈,D中所以數(shù)據(jù)源的集合(jh)為SD=S
10、i,Si為二元組,E為Si中數(shù)據(jù)元素的集合E=e ,R為Si 中數(shù)據(jù)元素之間關(guān)系的集合R=e ,e ,rik(e ,e Ei)則有:Si,f,sM,f(si)=f()=f() f(si)= f(e ) E,f(e ),f(e ),f(e ) R設(shè)目標(biāo)域D上的元數(shù)據(jù)M,其描述能力為二元組,E為M支持的數(shù)據(jù)元素的集合,E=ei,R為M中數(shù)據(jù)元素之間的關(guān)系集合R=ei,ej,rk (ei ,ej) E) RDF形式化模型共二十九頁(yè)3基于RDF模型(mxng)的半結(jié)構(gòu)化知識(shí)表示LOM=General,Lifecycle,Metamedata,Technical,Educational,Rights,R
11、elation,Annotation,ClassificationGeneral=Identifier,Title,Catalogentry,Language,Description,Keywords,Coverage,Structure,Aggregationievel Lifecycle=Version,Status,ContributeMetamedata=Identifier,Catalogentry,Contribute,Metadata schema,LanguageTechnical=Format,Size,Requirment,Installatio_remarks,Other
12、_latform,Requirements,DurationEducational=Interactivity_type,Learning_resource_type, Interactivity_level,Semantic_density,Intend-ed_enduser_role,Context,Typical_agerange,Difficulty,Typica_larning_time,Description,LanguageRights=Cost,Copyright and restructions,DescriptionRelation=Kind,ResourceAnnotat
13、ion=Person,Date,DescriptionClassification=Purpose,Taxopath,Description,Keyword RDF形式化描述(mio sh)-LOM基本命名空間的縮寫共二十九頁(yè)3基于RDF模型(mxng)的半結(jié)構(gòu)化知識(shí)表示Base schema xmlns:rdf=“ /1999/02/22-rdf-syntax-ns#” xmlns:rdfs=“ /2000/01/rdf-schema#” xmlns:dc=“ /dc/elements/1.1/” xmlns:dcterms=“http:/dc/terms/” xml:base=“/2002
14、/09/lom-base#” ISO8601 Instances of this class are dates and times encoded with ISO8601. Entity Instances of this class are persons or organizations described by Cards RDF形式化描述(mio sh)-RDFS 詞匯表 示例共二十九頁(yè)4教育資源特征提取與聚類算法(sun f) 聚類框架(kun ji)混合XML文檔文檔約簡(jiǎn)約簡(jiǎn)文檔WordNet&自定義詞庫(kù)計(jì)算結(jié)構(gòu)相似度文檔結(jié)構(gòu)相似度結(jié)構(gòu)相似度權(quán)重文檔結(jié)構(gòu)相似度聚類文檔簇計(jì)算語(yǔ)義
15、相似度文檔語(yǔ)義 相似度語(yǔ)義相似度權(quán)重文檔預(yù)處理,去除冗余結(jié)構(gòu)共二十九頁(yè)4教育資源特征提取與聚類算法(sun f)在XML文檔樹中,完全標(biāo)簽路徑是從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑上所有節(jié)點(diǎn)標(biāo)簽構(gòu)成的序列。任意一條從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑不僅包含了根節(jié)點(diǎn)、葉子節(jié)點(diǎn),還包括(boku)所有從根節(jié)點(diǎn)到達(dá)葉子節(jié)點(diǎn)所經(jīng)歷的中間節(jié)點(diǎn)。假設(shè)有N個(gè)待比較的文檔,定義D=d1,d2,dN為N個(gè)文檔所對(duì)應(yīng)的N棵DOM樹集合,di中的完全標(biāo)簽路徑集合為Pi=p1,p2,pm。完全標(biāo)簽路徑的個(gè)數(shù)對(duì)應(yīng)了葉子節(jié)點(diǎn)的個(gè)數(shù)。 XML文檔特征描述方法-完全標(biāo)簽路徑XML文檔片段樹ProductsBookISBNAuthorTitle算法
16、 完全標(biāo)簽路徑的獲取輸入 DOM樹集/樹的個(gè)數(shù)為N輸出 文檔的路徑集合P=p1,p2,pN, Pi=pi1,pi2,piMi/Mi表示文檔i的路徑數(shù)量Begin while(di in D) while(葉子節(jié)點(diǎn)jM) 先序遍歷di并獲得pij; add pij 到Pi END共二十九頁(yè)4教育資源特征提取與聚類算法(sun f) 語(yǔ)義相似(xin s)度計(jì)算算法 語(yǔ)義相似度計(jì)算輸入 矢量特征模型Doc;輸出 語(yǔ)義相似度矩陣Begin抽取XML文檔中的全部元素; while(Doci在文檔集D中) 創(chuàng)建擴(kuò)展元素向量Doci; while(Doci在文檔集D中) while(Docj在文檔集D中)
17、 計(jì)算Doci與Docj的相似度;END該算法比傳統(tǒng)的僅考慮詞頻的相似度計(jì)算方法相比,元素匹配程度提高了50%-100%。但是該方法未考慮元素所在層次結(jié)構(gòu)對(duì)相似度的影響。2001年美國(guó)Jung-Won Lee發(fā)表在IEEE上的文章Preparations for Semantics-Based XML Mining提出了一種計(jì)算XML文檔語(yǔ)義相似度的方法,該算法抽取XML文檔的元素節(jié)點(diǎn),然后對(duì)每個(gè)元素節(jié)點(diǎn)建立擴(kuò)展標(biāo)記向量,通過(guò)擴(kuò)展標(biāo)記向量中的元素匹配程度進(jìn)行語(yǔ)義相似度計(jì)算,時(shí)間復(fù)雜度為O(N2),其中N是文檔數(shù)目。共二十九頁(yè)4教育資源特征提取與聚類算法(sun f)在XML文檔中,層次越高的元
18、素(yun s)往往比層次的的元素(yun s)更能反映文檔的信息,在描述文檔的時(shí)候更具有意義,因此在計(jì)算語(yǔ)義相似度時(shí),應(yīng)把層次作為因子納入計(jì)算。 層次影響因子層次影響因子(Layer Affecting Factor)是指在XML文檔中,元素在文檔樹結(jié)構(gòu)中所處層次對(duì)語(yǔ)義相似度的影響程度。 定義為:其中, 是文檔i中第P個(gè)元素所在層次的數(shù)值, 是關(guān)于元素所在層次的函數(shù)。令 =于是,任意兩個(gè)元素之間的相似度有:共二十九頁(yè)4教育資源特征提取與聚類算法(sun f)以元素作為(zuwi)文檔的特征,用空間向量模型(VSM)為文檔建模,下面給出相似度計(jì)算公式: 語(yǔ)義相似度計(jì)算其中,m n 是文檔i ,j的元素個(gè)數(shù),HighestScore為某對(duì)元素完全匹配時(shí)的最高評(píng)分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅游景區(qū)設(shè)施場(chǎng)地租賃合同范本
- 拆遷安置補(bǔ)償房交易合同范本解析
- 環(huán)保項(xiàng)目部分股權(quán)轉(zhuǎn)讓與生態(tài)修復(fù)協(xié)議
- 綠色食品采購(gòu)咨詢及招標(biāo)代理服務(wù)合同
- 餐飲店加盟店區(qū)域保護(hù)與市場(chǎng)拓展協(xié)議書
- 成都市區(qū)限價(jià)商品房買賣合同范本
- 文化藝術(shù)中心停車場(chǎng)租賃服務(wù)合同
- 餐飲店服務(wù)員服務(wù)質(zhì)量監(jiān)控與勞動(dòng)合同
- 財(cái)務(wù)會(huì)計(jì)勞動(dòng)合同(財(cái)務(wù)審計(jì))
- 波形鋼腹板箱梁拼裝技術(shù)專題
- 2024-2025 學(xué)年八年級(jí)英語(yǔ)下學(xué)期期末模擬卷 (深圳專用)原卷
- 內(nèi)蒙古呼和浩特市實(shí)驗(yàn)中學(xué)2024-2025學(xué)年下學(xué)期七年級(jí)數(shù)學(xué)試卷
- 2024年注冊(cè)核安全工程師歷年真題答案
- 結(jié)直腸癌腹膜轉(zhuǎn)移診治專家共識(shí)(2025版)解讀
- 秸稈主題班會(huì)課件
- 《GPCR信號(hào)轉(zhuǎn)導(dǎo)》課件
- 2025年內(nèi)蒙古自治區(qū)呼和浩特市中考二模語(yǔ)文試題(含答案)
- 醫(yī)院圍手術(shù)期管理制度
- 無(wú)人機(jī)課程培訓(xùn)大綱
- 天津市西青區(qū)楊柳青第二中學(xué)2024-2025學(xué)年八年級(jí)下學(xué)期4月期中數(shù)學(xué)試題(含部分答案)
- 2025春統(tǒng)編版小學(xué)道德與法治五年級(jí)下冊(cè)(全冊(cè))教案、教學(xué)反思、教學(xué)計(jì)劃(附教材目錄P141)
評(píng)論
0/150
提交評(píng)論