《自然語言處理》教學(xué)大綱_第1頁
《自然語言處理》教學(xué)大綱_第2頁
《自然語言處理》教學(xué)大綱_第3頁
《自然語言處理》教學(xué)大綱_第4頁
《自然語言處理》教學(xué)大綱_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《自然語言處理》教學(xué)大綱適用范圍:202X版本科人才培養(yǎng)方案課程代碼:22150091課程性質(zhì):專業(yè)選修課學(xué)分:2學(xué)分學(xué)時:32學(xué)時(理論24學(xué)時,上機(jī)8學(xué)時)先修課程:人工智能導(dǎo)論、程序設(shè)計基礎(chǔ)、人工智能程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)與算法分析等后續(xù)課程:人工智能拓展創(chuàng)新、人工智能綜合創(chuàng)新、畢業(yè)設(shè)計適用專業(yè):人工智能專業(yè)開課單位:智能工程學(xué)院一、課程說明《自然語言處理》是人工智能專業(yè)的一門專業(yè)選修課。自然語言處理是用計算機(jī)通過可計算的方法對自然語言的各級語言單位進(jìn)行轉(zhuǎn)換、傳輸、存貯、分析等加工處理的科學(xué),是一門計算機(jī)科學(xué)、人工智能以及語言學(xué)相聯(lián)系的交叉性學(xué)科。本課程介紹了自然語言處理技術(shù)的基本原理、實用方法和主要應(yīng)用,通過本課程的學(xué)習(xí),使學(xué)生掌握自然語言(特別是中文語言)處理技術(shù)(特別是基于統(tǒng)計的語言處理技術(shù))的基本概念、基本原理和主要方法,了解當(dāng)前國際國內(nèi)語言處理技術(shù)的發(fā)展概貌,接觸語言處理技術(shù)的前沿課題,具備運(yùn)用基本原理和主要方法解決科研工作中出現(xiàn)的實際問題的能力。為學(xué)生開展相關(guān)領(lǐng)域(如網(wǎng)絡(luò)信息處理、機(jī)器翻譯、語音識別)的研究奠定基礎(chǔ)。二、課程目標(biāo)通過本課程的學(xué)習(xí),使學(xué)生達(dá)到如下目標(biāo):課程目標(biāo)1:熟練掌握自然語言所需基本知識,對文本信息進(jìn)行分析。課程目標(biāo)2:能夠針對一個實際的人工智能應(yīng)用問題,采用算法從訓(xùn)練數(shù)據(jù)中提取特征,建立合理的學(xué)習(xí)模型。課程目標(biāo)3:逐步培養(yǎng)學(xué)生應(yīng)用計算機(jī)解決和處理實際問題的思維方法與基本能力,利用所掌握的知識能獨(dú)立或合作制定有效的工程技術(shù)方案,進(jìn)行簡單系統(tǒng)的應(yīng)用開發(fā)。課程目標(biāo)4:幫助學(xué)生養(yǎng)成嚴(yán)謹(jǐn)?shù)目蒲兴季S,樹立追求真理,勇于探索的精神;提高其責(zé)任擔(dān)當(dāng)意識,塑造社會主義核心價值觀,為更好的服務(wù)社會、建設(shè)國家貢獻(xiàn)力量。課程目標(biāo)5:培養(yǎng)學(xué)生樹立正確科學(xué)的世界觀、人生觀和價值觀,堅定正確的政治方向,培養(yǎng)學(xué)生的法治觀念、社會責(zé)任感和創(chuàng)新意識樹立正確的審美觀念和勞動觀念。三、課程目標(biāo)與畢業(yè)要求《自然語言處理》課程教學(xué)目標(biāo)對人工智能專業(yè)畢業(yè)要求的支撐見表1。表1課程教學(xué)目標(biāo)與畢業(yè)要求關(guān)系畢業(yè)要求指標(biāo)點課程目標(biāo)支撐強(qiáng)度1.工程知識1.3能夠?qū)I(yè)和數(shù)學(xué)等相關(guān)知識用于專業(yè)工程問題的解決方案設(shè)計、比較和綜合。課程目標(biāo)1:熟練掌握自然語言所需基本知識,對文本信息進(jìn)行分析。M2.問題分析2.1能夠?qū)I(yè)和數(shù)學(xué)等相關(guān)知識用于專業(yè)工程問題的解決方案設(shè)計、比較和綜合。課程目標(biāo)2:能夠針對一個實際的人工智能應(yīng)用問題,采用算法從訓(xùn)練數(shù)據(jù)中提取特征,建立合理的學(xué)習(xí)模型。M3.設(shè)計/開發(fā)解決方案3.2針對特定需求和約束條件設(shè)計人工智能及相關(guān)應(yīng)用領(lǐng)域的系統(tǒng)集成、軟件模塊或算法流程。課程目標(biāo)2:能夠針對一個實際的人工智能應(yīng)用問題,采用算法從訓(xùn)練數(shù)據(jù)中提取特征,建立合理的學(xué)習(xí)模型。M4.研究4.2能夠構(gòu)建模擬或?qū)嶒炏到y(tǒng),通過信息綜合分析和實驗結(jié)果解釋,說明其有效性、合理性,得到解決方案實施質(zhì)量的合理有效結(jié)論。課程目標(biāo)3:逐步培養(yǎng)學(xué)生應(yīng)用計算機(jī)解決和處理實際問題的思維方法與基本能力,利用所掌握的知識能獨(dú)立或合作制定有效的工程技術(shù)方案,進(jìn)行簡單系統(tǒng)的應(yīng)用開發(fā)。M注:表中“H(高)、M(中)”表示課程與相關(guān)畢業(yè)要求的關(guān)聯(lián)度。四、教學(xué)內(nèi)容、基本要求與學(xué)時分配1.理論部分理論部分的教學(xué)內(nèi)容、基本要求與學(xué)時分配見表2。表2教學(xué)內(nèi)容、基本要求與學(xué)時分配教學(xué)內(nèi)容教學(xué)要求,教學(xué)重點難點理論學(xué)時上機(jī)學(xué)時對應(yīng)的課程目標(biāo)1.緒論1.1自然語言處理概述1.2NPL基本流程1.3NPL的開發(fā)環(huán)境思政1:由自然語言處理引申到自然界的各種語言,引導(dǎo)學(xué)生有更廣闊的世界觀。教學(xué)要求:理解NPL的發(fā)展歷程及研究內(nèi)容、模型的構(gòu)建;牢記本課程出勤、作業(yè)和考核的要求。重點:理解NPL基本流程難點:NPL開發(fā)環(huán)境搭建2012.語料庫2.1語料庫概述2.2語料庫種類與原則2.3NLTK庫2.4語料庫的獲取2.5語料庫的構(gòu)建與應(yīng)用教學(xué)要求:掌握語料庫的構(gòu)建原則;更深入地理解和掌握NLTK模塊及功能;能夠獲取語料庫函數(shù)。重點:語料庫的獲取難點:語料庫的構(gòu)建及應(yīng)用2213.正則表達(dá)式3.1正則表達(dá)式3.2正則表達(dá)式應(yīng)用思政2:規(guī)則的應(yīng)用擴(kuò)展到我們社會的規(guī)則和秩序,正確的價值觀。教學(xué)要求:理解正則表達(dá)式的元字符;掌握正則表達(dá)式可以對指定的文本實現(xiàn)匹配測試、內(nèi)容查找、內(nèi)容替換、字符串分割等功能。重點:match函數(shù)、search函數(shù)、findall函數(shù)、sub函數(shù)的應(yīng)用難點:正則表達(dá)式應(yīng)用2014.中文分詞技術(shù)4.1中文分詞簡介4.2基于規(guī)則的分詞4.3基于統(tǒng)計的分詞4.4中文分詞工具jieba庫4.5中文分詞的應(yīng)用教學(xué)要求:掌握基于規(guī)則分詞的思想和方法;掌握基于統(tǒng)計的分詞方法;掌握中文分詞工具jieba庫分詞的步驟及模式。重點:分詞的方法難點:中文分詞的應(yīng)用6225.詞性標(biāo)注與命名實體識別5.1詞性標(biāo)準(zhǔn)5.2命名實體識別5.3中文命名實體識別思政3:詞性標(biāo)準(zhǔn)規(guī)范,職業(yè)發(fā)展也需要標(biāo)準(zhǔn)和規(guī)范,引導(dǎo)更正確的職業(yè)道德觀。教學(xué)要求:理解詞性標(biāo)注的定義,命名實體識別概念;掌握詞性標(biāo)準(zhǔn)規(guī)范、Jieba詞性標(biāo)注、CRF模型的使用方法;重點:命名實體識別難點:中文命名實體識別2226.關(guān)鍵詞提取6.1關(guān)鍵詞提取技術(shù)6.2關(guān)鍵詞提取算法6.3自動提取文本關(guān)鍵詞教學(xué)要求:理解關(guān)鍵詞提取技術(shù)的概念;掌握關(guān)鍵詞提取的算法;掌握自動提取文本關(guān)鍵詞的方法。重點:關(guān)鍵詞提取的算法難點:編寫算法自定義函數(shù),并實現(xiàn)關(guān)鍵詞提取2227.文本向量化7.1文本向量化簡介7.2文本離散表示7.3分布式表示7.4論文相似度計算教學(xué)要求:理解文本向量化的概念;掌握文本離散表示、分布式表示的方法。重點:文本離散表示、分布式表示的方法難點:能計算論文的相似度2038.文本分類與聚類8.1文本挖掘簡介8.2文本分類常用算法8.3文本聚類常用算法8.4文本分類與聚類的步驟教學(xué)要求:理解文本挖掘簡介和挖掘技術(shù)。掌握文本分類常用算法和文本聚類常用算法;了解文本分類與聚類的步驟。重點:文本分類常用算法和文本聚類常用算法難點:文本分類常用算法和文本聚類常用算法4039.文本情感分析9.1情感分析簡介9.2情感分析的常用方法思政4:人類情感很復(fù)雜,要學(xué)會調(diào)整情緒,保持樂觀積極向上的情緒。教學(xué)要求:理解情感分析簡介、主要內(nèi)容。掌握情感分析的常見應(yīng)用、基于情感詞典的方法。重點:基于LDA模型的方法難點:基于LDA模型的方法203合計2482.上機(jī)部分上機(jī)部分的教學(xué)內(nèi)容、基本要求與學(xué)時分配見表3。表3上機(jī)項目、上機(jī)內(nèi)容與學(xué)時上機(jī)項目上機(jī)內(nèi)容和要求上機(jī)學(xué)時對應(yīng)的課程目標(biāo)1.語料庫的構(gòu)建上機(jī)內(nèi)容:構(gòu)建語料庫;NLTK模塊庫;NLTK庫的安裝使用及語料庫獲取的方法,并對語料文本進(jìn)行分析。上機(jī)要求:熟悉并掌握NLTK數(shù)據(jù)包的安裝步驟、函數(shù)的調(diào)用、語料庫的獲取。212.中文分詞技術(shù)上機(jī)內(nèi)容:基于規(guī)則的分詞方法、基于統(tǒng)計的分詞方法以及使用jieba進(jìn)行分詞;。上機(jī)要求:使用Python實現(xiàn)逆向最大匹配法分詞;使用Python實現(xiàn)基于HMM的分詞;通過jieba庫完成高頻詞提取。223.詞性標(biāo)注與命名實體識別上機(jī)內(nèi)容:詞性標(biāo)注和基于條件隨機(jī)場的命名實體識別。上機(jī)要求:利用條件隨機(jī)場對命名實體識別。224.關(guān)鍵詞提取上機(jī)內(nèi)容:關(guān)鍵詞提取技術(shù)的3種算法。上機(jī)要求:根據(jù)3種關(guān)鍵詞提取算法原理,編寫每種算法自定義函數(shù),并通過實例實現(xiàn)關(guān)鍵詞提取。23合計8五、教學(xué)方法及手段課程教學(xué)以課堂講授為主,結(jié)合實驗、作業(yè)、慕課、雨課堂資源,配合多媒體課件等共同課完成堂授課內(nèi)容。采釘釘、學(xué)習(xí)通、QQ、微信等交流工具,加強(qiáng)和學(xué)生之間的交流和溝通。六、課程資源推薦教材:作者(譯者).書名.出版社.出版時間.[1]肖剛,張良均.Python中文自然語言處理基礎(chǔ)與實戰(zhàn).人民郵電出版社.2021。參考書:作者(譯者).書名.出版社.出版時間.[1]何晗.自然語言處理入門.人民郵電出版社,2019。[2][美]霍布森·萊恩,科爾·霍華德,漢納斯·馬克斯·哈普克.自然語言處理實戰(zhàn).人民郵電出版社,2020。[3]涂銘.Python自然語言處理實戰(zhàn):核心技術(shù)與算法.機(jī)械工業(yè)出版社,2018。[4]Bishop,C.M.PatternRecognitionandMachineLearning.SpringScience+BusinessMedia,LLC,2006。3.期刊:作者.文題.刊名,年,卷號(期號).或者:刊名,主辦單位[1]吳凡,李松濤,呂書悅,趙晴.人工智能自然語言處理在阿爾茨海默病中的應(yīng)用[J],重慶醫(yī)科大學(xué)學(xué)報,2021-11-17.[2]周小詩,張梓,葳文娟.基于神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的自然語言信息隱藏[J],計算機(jī)科學(xué).2021,48(S2).[3]艾山·吾買爾,買合木提·買買提,汪烈軍.基于人工智能技術(shù)的“自然語言處理”課程教學(xué)模式改革與探索[J].無線互聯(lián)科技,2020,17(10):92-94.[4]鐘茂生,黃曉輝,張紅斌.“問題引導(dǎo)+項目驅(qū)動”并舉的自然語言處理課程教學(xué)改革實踐[J].計算機(jī)教育,2018(6):72-75.[5]傅迎華,李江,付東翔.自然語言處理課程教學(xué)探索和實踐[J].計算機(jī)教育,2018(4):56-59.[6]WENJ,ZHOUX,ZHONGP,etal.ConvolutionalNeuralNetworkBasedTextSteganalysis[J].IEEESignalProcessingLetters,2019,PP(3):1-1.4.網(wǎng)絡(luò)資源:網(wǎng)站名,訪問路徑/14709944?from=search&seid=10515923042889975838&spm_id_from=333.337.0.0/14709944?from=search&seid=10515923042889975838&spm_id_from=333.337.0.0七、課程考核對課程目標(biāo)的支撐課程成績由過程性考核成績和期末考核成績兩部分構(gòu)成,具體考核/評價細(xì)則及對課程目標(biāo)的支撐關(guān)系見表4。表4課程考核對課程目標(biāo)的支撐考核環(huán)節(jié)占比考核/評價細(xì)則課程目標(biāo)123過程性考核課堂表現(xiàn)10(1)根據(jù)課堂出勤情況和課堂回答問題情況進(jìn)行考核,滿分100分。(2)以平時考核成績乘以其在總評成績中所占的比例計入課程總評成績?!獭獭?42實驗20(1)根據(jù)每次實驗的實驗操作完成情況和實驗報告質(zhì)量單獨(dú)評分,滿分100分;(2)每次實驗單獨(dú)評分,取各次實驗成績的平均值作為此環(huán)節(jié)的最終成績。(3)以實驗成績乘以其在總評成績中所占的比例計入課程總評成績。√15作業(yè)10(1)主要考核學(xué)生對各章節(jié)知識點的復(fù)習(xí)、理解和掌握程度,滿分100分;(2)每次作業(yè)單獨(dú)評分,取各次成績的平均值作為此環(huán)節(jié)的最終成績。(3)以作業(yè)成績乘以其在總評成績中所占的比例計入課程總評成績。√√√663期末考核60(1)期末考核以課程大作業(yè)的方式提交,大作業(yè)卷面成績100分,以卷面成績乘以其在總評成績中所占的比例計入課程總評成績。(2)主要考核學(xué)生運(yùn)用自然語言處理對實際問題的綜合分析的能力。(3)大作業(yè)題型為:綜合分析題√√√252510合計:100分355015八、考核與成績評定1.考核方式及成績評定考核方式:本課程主要以課堂表現(xiàn)、實驗、作業(yè)、期末大作業(yè)等方式對學(xué)生進(jìn)行考核評價。考核基本要求:考核總成績由期末大作業(yè)和過程性考核成績組成。其中:期末大作業(yè)成績?yōu)?00分(權(quán)重60%),大作業(yè)類型為綜合分析題;課堂表現(xiàn)、實驗、作業(yè)等過程性考核成績?yōu)?00分(權(quán)重40%);過程性考核和考試試題分值分配應(yīng)與教學(xué)大綱各章節(jié)的學(xué)時基本成比例。2.過程性考核成績的標(biāo)準(zhǔn)過程性考核方式重點考核內(nèi)容、評價標(biāo)準(zhǔn)、所占比重見表5。表5過程性考核方式評價標(biāo)準(zhǔn)考核方式所占比重(%)100>x≥9090>x≥8080>x≥7070>x≥60x<60課堂表現(xiàn)25積極參與教學(xué)活動,踴躍回答問題,準(zhǔn)確率大于90%。認(rèn)真參與教學(xué)活動,回答問題準(zhǔn)確率大于80%。偶爾參與教學(xué)活動,回答問題準(zhǔn)確率大于70%。上課不認(rèn)真,偶爾參與教學(xué)活動。上課不認(rèn)真,不參與教學(xué)活動。實驗50實驗原理清晰、繪圖規(guī)范,實驗操作過程熟練、規(guī)范、正確,數(shù)據(jù)處理及討論正確。實驗原理較清晰、繪圖較規(guī)范,實驗操作過程較熟練、規(guī)范、正確,數(shù)據(jù)處理及討論較正確。實驗原理基本清晰、繪圖基本規(guī)范,實驗操作過程基本熟練、能完成基本操作,數(shù)據(jù)處理及討論基本正確。實驗原理不夠清晰、繪圖不夠規(guī)范,需在指導(dǎo)下完成基本操作,數(shù)據(jù)處理及討論不夠正確。無實驗報告,實驗操作步驟有誤,數(shù)據(jù)處理及討論有誤。作業(yè)25作業(yè)完整,思路清晰,準(zhǔn)確率大于90%,字跡工整。作業(yè)完整,準(zhǔn)確率大于80%,字跡工整。不交作業(yè)2次以內(nèi),準(zhǔn)確率大于70%.不交作業(yè)4次以內(nèi),準(zhǔn)確率大于60%.不交作業(yè)5次以上,準(zhǔn)確率小于60%。3.大作業(yè)評分標(biāo)準(zhǔn)優(yōu)秀(90-100分):具有完整的程序界面和程序功能,程序中具有復(fù)雜的數(shù)據(jù)結(jié)構(gòu);設(shè)計者不僅完成了規(guī)定的任務(wù),而且實現(xiàn)的功能具有創(chuàng)新

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論