版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于可視化系統(tǒng)的知識圖譜教學形式〔〕:
摘要:知識圖譜是計算機專業(yè)前沿技術(shù)之一,可用于挖掘分析數(shù)據(jù)之間的關(guān)聯(lián)。但是該技術(shù)缺乏成熟的知識體系,加之學生對于該技術(shù)接觸少,傳統(tǒng)教學方法無法生動形象使學生理解掌握該技術(shù)?;诳梢暬到y(tǒng)的知識圖譜教學形式,通過將理論知識與可視化系統(tǒng)結(jié)合,加深學生對知識圖譜應(yīng)用場景和應(yīng)用方法的理解,進而獲得較好的教學效果。
關(guān)鍵詞:知識圖譜;可視化系統(tǒng);教學形式
本文引用格式:王成,胡瑞鑫.基于可視化系統(tǒng)的知識圖譜教學形式[J].教育現(xiàn)代化,2022,8(39):166-169.
TeachingModeofKnowledgeGraphbasedonVisualSystem
WANGCheng,HURuixin
(DepartmentofputerScienceandTechnology,TongjiUniversity,Shanghai)
Abstract:Knowledgegraphisoneofthecutting-edgetechnologiesofputerscience,whichcanbeusedtomineandanalyzetheassociationsbetweendata.However,thetechnologylacksamatureknowledgeframework,andstudentshavelittlecontactwiththetechnology,traditionalteachingmethodscannotvividlymakestudentsunderstandandmasterthetechnology.Thevisualteachingmodeoftheknowledgegraph,throughthebinationoftheoreticalknowledgeandthevisualizationsystem,deepensstudents"understandingoftheapplicationscenariosandapplicationmethodsoftheknowledgegraph,andthenobtainsabetterteachingeffect.
Keywords:knowledgegraph;visualsystem;teachingmode
一引言
知識圖譜作為研究生算法課程的重要內(nèi)容之一,所涉及的技術(shù)新穎前沿。知識圖譜技術(shù)可用來挖掘發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),通過對數(shù)據(jù)進展處理【1】,分析得出數(shù)據(jù)集中實體之間的關(guān)系構(gòu)建知識圖譜。知識圖譜在現(xiàn)實中有許多的應(yīng)用場景,聚類分析[2-4]那么是知識圖譜應(yīng)用場景之一。知識圖譜作為前沿技術(shù)之一,現(xiàn)階段該技術(shù)的知識體系較為碎片化,缺乏明晰明了的知識體系,同時學生未接觸過該技術(shù)的相關(guān)知識,對知識圖譜的概念和應(yīng)用場景陌生。加之研究生算法課程安排,針對知識圖譜的課時相對較少,因此如何在較短的時間內(nèi)掌握知識圖譜的根本概念和適用場景是亟待解決的問題之一,傳統(tǒng)的教學方式枯燥無味,學生雖然聽課過程會記住相應(yīng)概念,但是存在理論與理論脫節(jié)的現(xiàn)象。
為進一步優(yōu)化課程教學,使學生可以在較短的課時內(nèi)建立對知識圖譜的概念理解,在授課期間加以詳細應(yīng)用場景的可視化系統(tǒng),以可視化系統(tǒng)為主線從數(shù)據(jù)的預(yù)處理,到知識圖譜的構(gòu)建,最終闡述可視化系統(tǒng)的搭建,使得學生對知識圖譜的應(yīng)用場景以及應(yīng)用方法有個立體直觀的認知。利用課下時間,設(shè)計相關(guān)實驗進步學生的理論才能,通過理論使學生脫離以往做實驗時的依賴性[5-6],從而進一步進步培養(yǎng)學生將掌握的知識應(yīng)用到實際場景中??梢暬到y(tǒng)對課程帶來的優(yōu)異效果也在多方面得到了驗證,例如將可視化系統(tǒng)應(yīng)用于軍事課程中【7】模擬軍隊運動情況,利用可視化方法應(yīng)用在常微分方程[8]課程中教學,也有將可視化教學技術(shù)應(yīng)用在臨床麻醉學教學[9]中獲得良好的教學效果。
二課程內(nèi)容組成
知識圖譜技術(shù)涉及自然語言處理、圖數(shù)據(jù)庫、機器學習等各領(lǐng)域知識,適用于金融反欺詐、信息檢索等多種場景。需要合理安排各領(lǐng)域知識,通過詳細場景的應(yīng)用實例進展教學。通過詳細的應(yīng)用場景帶入,講述根本的數(shù)據(jù)處理技巧、知識圖譜的構(gòu)建更新技巧、知識圖譜的存儲方式以及知識圖譜的根底應(yīng)用方法。通過詳細案例引入知識圖譜的概念,針對該案例講述每一步驟的處理方式,從而到達學生可以生動形象的理解知識圖譜的概念和應(yīng)用技巧。
針對數(shù)據(jù)處理局部,通過詳細場景的數(shù)據(jù)集分析該數(shù)據(jù)集所存在的問題,可能存在的問題包括但不限于關(guān)鍵值為空、重復數(shù)據(jù)和特征數(shù)據(jù)選取。針對每一個問題,給出相關(guān)解決方案,也可以安排學生自主討論問題解決方案。利用處理后的數(shù)據(jù),構(gòu)建知識圖譜并將該圖譜進展存儲,可通過圖數(shù)據(jù)庫如Neo4j構(gòu)建和存儲數(shù)據(jù),通過實例數(shù)據(jù)將數(shù)據(jù)導入Neo4j中,使學生通過詳細案例掌握圖數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫之間的區(qū)別,同時該局部內(nèi)容可以引導學生理解圖數(shù)據(jù)庫冷啟動和熱加載兩種情況下的導入數(shù)據(jù)方法,講解每種方法適用的場景。構(gòu)建完成的知識圖譜需要應(yīng)用解決詳細的場景問題,例如挖掘網(wǎng)絡(luò)借貸欺詐申請的問題,講述利用知識圖譜結(jié)合機器學習領(lǐng)域的無監(jiān)視聚類方法發(fā)現(xiàn)網(wǎng)絡(luò)借貸場景中欺詐申請的審批。
數(shù)據(jù)處理局部是課程的基石,通過對問題數(shù)據(jù)集進展數(shù)據(jù)清洗,獲得高質(zhì)量的數(shù)據(jù),課程需要在該局部講解的內(nèi)容包括但不限于以下內(nèi)容:
數(shù)據(jù)處理的重要性,數(shù)據(jù)處理為算法應(yīng)用的基石,假設(shè)數(shù)據(jù)處理不恰當會導致算法應(yīng)用時無法發(fā)揮算法的性能優(yōu)勢且模型調(diào)優(yōu)復雜化。
常見數(shù)據(jù)問題及其對應(yīng)的數(shù)據(jù)處理方法,例如數(shù)據(jù)集中空值問題可以采用平均值填充或刪除等方式對數(shù)據(jù)集中空字段進展處理。
數(shù)據(jù)處理后的應(yīng)用場景,介紹各領(lǐng)域?qū)?shù)據(jù)的應(yīng)用方式,例如推薦算法分析數(shù)據(jù)對用戶推薦,反欺詐算法利用數(shù)據(jù)構(gòu)建風控平臺。
知識圖譜構(gòu)建局部對課程內(nèi)容起著承上啟下的功能,通過將處理得到的數(shù)據(jù)導入圖數(shù)據(jù)庫構(gòu)建知識圖譜,并講解知識圖譜的使用場景。該局部講解的內(nèi)容包括但不限于以下的內(nèi)容:
NoSQL的種類,圖數(shù)據(jù)庫在NoSQL中的作用,NoSQL數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫之間的區(qū)別,不同種類的NoSQL數(shù)據(jù)庫適用場景。
Neo4j數(shù)據(jù)庫在冷啟動和熱加載兩種場景下的數(shù)據(jù)導入方法,Cypher語句的根底功能,Neo4j數(shù)據(jù)庫提供的擴展才能。
異質(zhì)知識圖譜的構(gòu)建過程,以及如何對異質(zhì)知識圖譜挖掘有效特征信息,如何將異質(zhì)知識圖譜提獲得出同質(zhì)知識圖譜。
聚類算法實現(xiàn)局部是該課程的重點講授內(nèi)容,通過分析不同種類的聚類算法,分析這些聚類算法的工作原理及其使用場景,該局部講解內(nèi)容包括但不限于以下內(nèi)容:
聚類算法的種類,不同種類聚類算法的工作原理和使用場景,同時介紹每種聚類算法中的代表算法及其優(yōu)化方案。
如何將聚類算法應(yīng)用在前述構(gòu)建的知識圖譜中,根據(jù)詳細的應(yīng)用場景,介紹從模型選型到詳細實現(xiàn)的思路。
介紹不同代表性聚類算法的調(diào)優(yōu)方案,以及聚類算法的研究方向。
課程內(nèi)容也可根據(jù)詳細課時靈敏安排,上述的課程內(nèi)容主要針對碩士研究生的算法課程,本科生的算法課程可以簡化相關(guān)內(nèi)容,以課程核心根底內(nèi)容為主,讓本科生可以宏觀理解算法的重要性,激起學生對算法學習的好奇心,引導學生自主學習其他相關(guān)算法知識,課程講述過程中加以可視化系統(tǒng)作為輔助工具,方便學生理解詳細算法的工作流程,也鼓勵學生自主開發(fā)相關(guān)可視化工具,將理論知識與理論相結(jié)合,進步教學質(zhì)量。
三可視化系統(tǒng)展示
可視化系統(tǒng)可以有效地展示知識圖譜技術(shù)在詳細應(yīng)用場景下的工作流程,為了形象直觀地向?qū)W生展示該技術(shù)的構(gòu)建和應(yīng)用方式,可以通過構(gòu)建詳細應(yīng)用場景下的可視化系統(tǒng),展示該場景下知識圖譜的工作流程。在此以構(gòu)建的應(yīng)用于互聯(lián)網(wǎng)金融反欺詐的可視化系統(tǒng)為例,展示授課期間涉及到的知識圖譜的技術(shù)以及應(yīng)用,圖1-2展示了互聯(lián)網(wǎng)金融反欺詐的可視化系統(tǒng)截圖。
可視化系統(tǒng)基于網(wǎng)絡(luò)借貸場景構(gòu)建,目的是通過機器學習領(lǐng)域中聚類算法將異常借貸申請?zhí)嵩绨l(fā)現(xiàn)并在申請階段回絕借貸人申請,系統(tǒng)所使用的數(shù)據(jù)集為國內(nèi)某銀行加密脫敏后的數(shù)據(jù)集,數(shù)據(jù)集包括申請人的根本信息,例如:經(jīng)過MD5加密的申請人申請?zhí)柎a,號等特征信息。
數(shù)據(jù)處理過程對所得數(shù)據(jù)集首先進展去重處理,將重復借貸申請數(shù)據(jù)刪除,對關(guān)鍵特征的缺失數(shù)據(jù)進展填充,非關(guān)鍵特征數(shù)據(jù)那么采取丟棄的方法,同時挖掘出申請單號之間的關(guān)聯(lián)信息,方便后續(xù)構(gòu)建同質(zhì)知識圖譜的操作。構(gòu)建知識圖譜階段,針對Neo4j的冷啟動添加數(shù)據(jù),可以將挖掘出來的申請單號關(guān)聯(lián)信息,通過Neo4j提供的導入工具將數(shù)據(jù)導入Neo4j中構(gòu)建一張同質(zhì)的知識圖譜,該知識圖譜僅包括申請單號節(jié)點。針對Neo4j的熱加載過程,那么可以通過特定計算機語言借助第三方工具導入數(shù)據(jù)。機器學習中聚類算法構(gòu)建階段,結(jié)合網(wǎng)絡(luò)資源,學生可自主選擇聚類算法,實現(xiàn)將數(shù)據(jù)集中相似節(jié)點聚集在一起的操作。
可視化系統(tǒng)總共分成三個功能,圖1左圖為同質(zhì)知識圖譜網(wǎng)絡(luò),當點擊新增按鈕后,會根據(jù)索引號查詢Neo4j數(shù)據(jù)庫,將檢索到的數(shù)據(jù)返回給前端,假設(shè)節(jié)點為正常借貸申請的節(jié)點,節(jié)點顏色標記為藍色,否那么標記為紅色。根據(jù)返回的節(jié)點關(guān)聯(lián)信息,判斷新增節(jié)點與已有知識圖譜內(nèi)節(jié)點是否關(guān)聯(lián),假設(shè)存在關(guān)聯(lián)關(guān)系那么自動添加至對應(yīng)的節(jié)點附近,并通過直線連接,直線上標記數(shù)字表示兩個節(jié)點所具有的一樣特征。圖1右圖表示通過聚類算法,借貸節(jié)點聚類情況,左方點擊算法按鈕,對已有知識圖譜節(jié)點進展聚類操作,將相似節(jié)點聚集在一起,一樣社區(qū)ID的節(jié)點間隔較近,不同社區(qū)ID的節(jié)點那么間隔較遠。同時左下方分別標明聚類算法每添加一個新的節(jié)點后的性能變化情況,假設(shè)聚類算法對新增節(jié)點判斷錯誤那么對應(yīng)的性能指標用紅色標記,假設(shè)判斷正確那么用藍色標記。通過向?qū)W生講解整個可視化系統(tǒng)的構(gòu)造,明確實驗詳細細節(jié),從而進一步進步學生對算法課程的理解。圖2為節(jié)點的詳細信息,可以通過雙擊圖1中知識圖譜中節(jié)點進入該節(jié)點的詳情頁,查看該節(jié)點的關(guān)鍵信息。該局部內(nèi)容可以根據(jù)詳細需要勾選對應(yīng)的關(guān)鍵特征展示該節(jié)點信息。
四課程實驗設(shè)計
算法設(shè)計實驗往往要求學生利用詳細計算機語言實現(xiàn)算法核心思想,通過不同的測試用例來驗證算法實現(xiàn)是否正確。但是這類實驗效果較差,學生僅實現(xiàn)算法,但是對算法的應(yīng)用場景和優(yōu)化流程并未熟悉。為了進一步進步學生的動手才能,以及詳細應(yīng)用場景的分析才能,通過設(shè)置詳細的實驗內(nèi)容包括但不限于完成數(shù)據(jù)處理、系統(tǒng)搭建等流程,鍛煉學生的動手理論才能,使得學生可以理解算法的設(shè)計思路和工作流程。拓展算法實驗的內(nèi)容,表達出實驗的靈敏性、個性化和綜合性。
為此將基于知識圖譜的可視化實驗分成三種模塊,分別為數(shù)據(jù)處理模塊、知識圖譜構(gòu)建模塊、聚類算法模塊。整個實驗系統(tǒng)的模塊構(gòu)造如圖3所示。提供應(yīng)學生的實驗數(shù)據(jù)集可以為公開數(shù)據(jù)集或者經(jīng)過加密脫敏處理后的真實應(yīng)用場景的數(shù)據(jù),不建議提供仿真數(shù)據(jù)。數(shù)據(jù)集應(yīng)具有空值缺失、數(shù)據(jù)重復、噪聲數(shù)據(jù)干擾等特征,從而鍛煉學生面對真實場景數(shù)據(jù)集的應(yīng)對才能。學生根據(jù)提供的數(shù)據(jù)集,構(gòu)建數(shù)據(jù)處理模塊,通過利用數(shù)據(jù)分析處理工具,對空值進展填充或刪除,刪除重復數(shù)據(jù)以及剔除噪聲數(shù)據(jù)。并將采取的方案梳理成文檔,用于后續(xù)成績斷定。
選取Neo4j作為知識圖譜構(gòu)建模塊的底層存儲數(shù)據(jù)庫,一方面可以擴展學生對不同類型數(shù)據(jù)庫功能的認識,使得學生理解到圖數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫之間的差異性,另一方面Neo4j提供豐富的文檔資源,可以鍛煉學生實際實驗過程中對文檔閱讀才能。學生將處理完成后的數(shù)據(jù),通過自主編寫腳本代碼的方式,將數(shù)據(jù)導入到Neo4j圖數(shù)據(jù)庫中。
聚類算法設(shè)計模塊,要求學生選擇課程講授的一種或多種聚類算法,實現(xiàn)對所提供數(shù)據(jù)集的聚類操作,學生需要通過調(diào)參等方式進一步進步算法的準確性。算法模型訓練完成后,根據(jù)測試集數(shù)據(jù)來驗證模型性能,并根據(jù)測試數(shù)據(jù)集所得到的模型性能決定學生的實驗成績。
課程實驗內(nèi)容和設(shè)計要求可參考表1,可以將該實驗設(shè)置為課程作業(yè)作為課程成績評估參考項之一。
五總結(jié)
基于可視化系統(tǒng)的知識圖譜教學形式,利用可視化系統(tǒng)作為引導,向?qū)W生展示了知識圖譜技術(shù)如何應(yīng)用以及處理的流程,進一步進步學生對算法應(yīng)用和解決實際問題的才能。通過設(shè)置課程實驗內(nèi)容,學生從獲取數(shù)據(jù)集,對數(shù)據(jù)集進展數(shù)據(jù)處理,利用處理完成的數(shù)據(jù)構(gòu)建知識圖譜,自主選擇實現(xiàn)聚類算法,實驗內(nèi)容幾乎涉及到計算機專業(yè)課程的全部內(nèi)容,從算法理論到詳細實現(xiàn)。進而進步學生對算法課程的興趣,以及自主學習意識,進步教學質(zhì)量。
參考文獻
【1】呂小鋒.基于Sta
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智慧城市建設(shè)個人工勞務(wù)分包合同4篇
- 2025年物業(yè)經(jīng)營托管與設(shè)施設(shè)備更新改造合同3篇
- 二零二五年度商業(yè)街區(qū)租賃管理合同3篇
- 2025年西瓜種植與農(nóng)村電商平臺合作承包協(xié)議3篇
- 2025年度個人收藏品買賣合同樣本3篇
- 二零二五年護理員勞動合同范本(含離職手續(xù))3篇
- 2025年物流企業(yè)物流園區(qū)消防安全管理合同3篇
- 2025年新媒體信息推廣業(yè)務(wù)合作協(xié)議3篇
- 天橋安全施工方案
- 二零二五年度美容院美容院形象設(shè)計與裝修合同4篇
- 上海車位交易指南(2024版)
- 醫(yī)學脂質(zhì)的構(gòu)成功能及分析專題課件
- 通用電子嘉賓禮薄
- 錢素云先進事跡學習心得體會
- 道路客運車輛安全檢查表
- 宋曉峰辣目洋子小品《來啦老妹兒》劇本臺詞手稿
- 附錄C(資料性)消防安全評估記錄表示例
- 噪音檢測記錄表
- 推薦系統(tǒng)之協(xié)同過濾算法
- 提高筒倉滑模施工混凝土外觀質(zhì)量QC成果PPT
- 小學期末班級頒獎典禮動態(tài)課件PPT
評論
0/150
提交評論