中文信息處理與挖掘知到章節(jié)答案智慧樹2023年山東交通學(xué)院_第1頁
中文信息處理與挖掘知到章節(jié)答案智慧樹2023年山東交通學(xué)院_第2頁
中文信息處理與挖掘知到章節(jié)答案智慧樹2023年山東交通學(xué)院_第3頁
中文信息處理與挖掘知到章節(jié)答案智慧樹2023年山東交通學(xué)院_第4頁
中文信息處理與挖掘知到章節(jié)答案智慧樹2023年山東交通學(xué)院_第5頁
免費預(yù)覽已結(jié)束,剩余6頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

中文信息處理與挖掘知到章節(jié)測試答案智慧樹2023年最新山東交通學(xué)院第一章測試本課程將詳細(xì)介紹的自然語言處理應(yīng)用有哪些()。

參考答案:

自動問答;情感分析;機器翻譯;自動摘要下列那個概念與自然語言處理無關(guān)。()

參考答案:

ComputerVision黏著型語言比較有代表性的語言是日語。()

參考答案:

對自然語言中最小的有意義的構(gòu)成單位是()。

參考答案:

詞中文信息處理的第一步是()。

參考答案:

分詞如果打開校正功能,對于一些典型的語法錯誤、拼寫錯誤以及用詞錯誤就可以自動檢測出來。()

參考答案:

對就分詞來講,主要有三類分詞方法()。

參考答案:

基于規(guī)則的分詞方法;基于詞典的分詞方法;基于統(tǒng)計的分詞方法基于詞典的分詞方法從匹配的方法來講,一般使用最大匹配法,而最匹配法又包括()。

參考答案:

逆向最大匹配算法;雙向最大匹配算法;正向最大匹配算法詞性標(biāo)注的主要方法主要有()。

參考答案:

統(tǒng)計與規(guī)則相結(jié)合的詞性標(biāo)注方法;基于規(guī)則的詞性標(biāo)注方法;基于統(tǒng)計的詞性標(biāo)注方法命名實體識別事實上就是識別出以下三類命名實體。()

參考答案:

人名;組織機構(gòu)名;地名第二章測試概率論作為統(tǒng)計語言模型的數(shù)學(xué)基礎(chǔ),應(yīng)用到自然語言處理領(lǐng)域,是由于:統(tǒng)計語言處理技術(shù)已經(jīng)成為自然語言處理的主流,而在統(tǒng)計語言處理的步驟中,收集自然語言詞匯(或者其他語言單位)的分布情況、根據(jù)這些分布情況進行統(tǒng)計推導(dǎo)都需要用到概率論。()

參考答案:

對設(shè)E為隨機試驗,Ω是它的樣本空間,對于E的每一個事件A賦予一個實數(shù),記為P(A),如果集合函數(shù)P(?)滿足下列哪些條件,則實數(shù)P(A)為事件A的概率。()

參考答案:

規(guī)范性;非負(fù)性;可列可加性設(shè)A、B是兩個事件,且P(B)>0,則稱P(A|B)為在已知事件B發(fā)生的條件下,事件A發(fā)生的()。

參考答案:

條件概率某一事件B的發(fā)生有各種可能的原因n個,B發(fā)生的概率是各原因引起B(yǎng)發(fā)生概率的總和,也就是()。

參考答案:

全概率公式貝葉斯公式于1763年由貝葉斯(Bayes)給出,它是在觀察到事件B已發(fā)生的條件下,尋找導(dǎo)致B發(fā)生的每個原因的概率。()

參考答案:

對在自然語言處理中,以句子為處理單位時一般假設(shè)句子獨立于它前面的其它語句,句子的概率分布近似地符合以下哪項()。

參考答案:

二項式分布在概率論和統(tǒng)計學(xué)中,一個離散性隨機變量的期望值,是試驗中每次可能結(jié)果的概率乘以其結(jié)果的總和,也被稱為()。

參考答案:

期望;均值;數(shù)學(xué)期望在概率論和統(tǒng)計學(xué)中,一個隨機變量的方差,描述的是它的離散程度,也就是該變量離其期望值的距離.()

參考答案:

對以下哪項表示信源X每發(fā)一個符號且不論發(fā)什么符號所提供的平均信息量。()

參考答案:

熵哪一項常被用以衡量兩個隨機分布的差距。()

參考答案:

相對熵第三章測試以下哪一個屬于序列標(biāo)注問題()。

參考答案:

命名實體識別在詞法分析里,需要處理的最小單位是()。

參考答案:

詞下列(

)形式是最主要的信息載體()。

參考答案:

文字詞性標(biāo)注的主要方法包括()。

參考答案:

基于統(tǒng)計的和基于規(guī)則的相結(jié)合的方法;基于統(tǒng)計的方法;基于規(guī)則的方法設(shè)輸入句子“我愛人工智能”,經(jīng)過詞性標(biāo)注等得到“我/PN愛/VV人工智能/NR”,其中,PN、VV和NR的含義分別是代詞、動詞、專有名詞;()是命名實體。

參考答案:

“人工智能”自然語言處理(NLP)通過詞、句子、篇章的分析,理解內(nèi)容。處理一個中文句子(漢字序列)時,在其NLP基本任務(wù)中,()負(fù)責(zé)將輸入的句子轉(zhuǎn)換為單詞序列。

參考答案:

分詞自然語言處理過程可以有多個層次,包括()。

參考答案:

句法分析;詞法分析;語義分析語言是人類交流思想、表達(dá)情感最自然的工具,是思維的載體,也是人類區(qū)別其他動物的本質(zhì)特性。()

參考答案:

對孤立語就是被孤立的語言。()

參考答案:

錯用“信息熵”來衡量自由度,用“點間互信息”衡量一個詞匯內(nèi)部的凝聚程度。()

參考答案:

對第四章測試句法分析主要包括兩類,分別是短語結(jié)構(gòu)分析和依存關(guān)系分析。()

參考答案:

對重寫規(guī)則表示取代或擴展的規(guī)則,箭頭左邊代表一個或幾個成分構(gòu)成的序列,右邊符號代表單一的結(jié)構(gòu)成分。()

參考答案:

錯一個完整的語法表示,應(yīng)該包括以下哪些元素()。

參考答案:

非終結(jié)符號集合;終結(jié)符號集合;重寫規(guī)則;一個特殊的非終結(jié)符句子形式語法是指面向機器處理的語法,它規(guī)定語言中允許出現(xiàn)的結(jié)構(gòu)的形式化說明。()

參考答案:

對依存樹和句法樹都屬于語法表示方法,二者最大的不同在于句法樹上都是終結(jié)符結(jié)點,依存樹上還有非終結(jié)符結(jié)點。()

參考答案:

錯在引入點規(guī)則后,以下屬于非活性邊的是()。

參考答案:

NP->ran。線圖分析算法解決了從輸入詞串開始,一步步形成線圖,使得在一條邊可以覆蓋全部結(jié)點。()

參考答案:

對在線圖句法分析中需要用到的數(shù)據(jù)結(jié)構(gòu)是()。

參考答案:

線圖(Chart);活動邊集(ActiveArc);進程表(Agenda)上下文無關(guān)文法(PCFG)在滿足以下什么條件下,計算分析樹的概率可以使用所有規(guī)則概率的乘積()。

參考答案:

祖先無關(guān);位置不變性;上下文無關(guān)性下列屬于依存句法分析算法的是()。

參考答案:

決策式分析方法;生成式分析方法;判別式分析方法第五章測試篇章(discourse)又稱為語篇或文本.()

參考答案:

對篇章結(jié)構(gòu)可以是篇章內(nèi)部關(guān)系的不同結(jié)構(gòu)化表達(dá)形式,主要包括下列哪些結(jié)構(gòu)。()

參考答案:

功能結(jié)構(gòu);修辭結(jié)構(gòu);話題結(jié)構(gòu);指代結(jié)構(gòu)話題的完整性從形式和內(nèi)容兩方面分別體現(xiàn)為篇章的兩大基本特性,即篇章連貫性和篇章銜接性.()

參考答案:

對篇章的哪幾個基本特征更是有力地促進了自然語言處理研究的發(fā)展。()

參考答案:

連貫性;信息性;銜接性;意圖性篇章的()基本特征已被自然語言處理領(lǐng)域的研究者廣為接受。

參考答案:

7個而通過分析篇章的信息性和意圖性,則可以挖掘篇章的語義特征。()

參考答案:

對下列屬于Hobbs定義的12類關(guān)系的有()。

參考答案:

并列;背景;結(jié)果;詳述1898年馬建忠的《馬氏文通》出版為標(biāo)志創(chuàng)建了漢語復(fù)句理論。()

參考答案:

對()是最早研究篇章銜接關(guān)系的理論體系。

參考答案:

淺層銜接理論下圖哪個例子能構(gòu)成一個篇章

參考答案:

例2第六章測試下列不屬于基于情感詞典的情感分析方法優(yōu)點的是()。

參考答案:

預(yù)測準(zhǔn)確率高詞語級情感分析又稱為方面級情感分析,是一種細(xì)粒度的情感分析,它包括方面的提取和方面的情感分析。()

參考答案:

對以下屬于文本情感分析過程的是()。

參考答案:

特征選擇;情感類別的輸出;使用分類器進行情感分析;特征表示特征表示是指將文字表示的內(nèi)容轉(zhuǎn)換成計算機可以處理的數(shù)字化特征向量,常見的特征表示方法有one-hot、word2vec。()

參考答案:

對常見的特征選擇方法包括{詞頻計數(shù)模型(N-gram)、詞袋模型(TF-IDF)和深度學(xué)習(xí)方法等。()

參考答案:

對根據(jù)樣本數(shù)據(jù)標(biāo)簽的有無或者多少,可以將機器學(xué)習(xí)算法主要分為()

參考答案:

有監(jiān)督方法;聚類方法;半監(jiān)督方法樸素貝葉斯是一種分類方法,可以在任何情況下使用此方法進行文本情感分析。()

參考答案:

錯K近鄰(KNN)算法是依據(jù)最鄰近的幾個樣本的類別來決定待分類樣本所屬的類別,其中常用的距離公式包括()

參考答案:

切比雪夫距離;曼哈頓距離;歐式距離;余弦距離BERT使用的是Transformer編碼器,由于Self-attention機制,所以模型上下層直接全部互相連接。()

參考答案:

對LSTM模型和RNN模型都是屬于深度學(xué)習(xí)模型,都可用于情感分析任務(wù)中,但是LSTM模型克服了梯度消失問題。()

參考答案:

對第七章測試不管是賢二機器僧,還是同學(xué)們所熟知的QQ小弟、微軟小冰,在我們自然語言處理領(lǐng)域,都有一個共同的名字,那就是()。

參考答案:

自動問答系統(tǒng)以直接而準(zhǔn)確的方式回答用戶自然語言提問的自動問答系統(tǒng)將構(gòu)成下一代搜索引擎的基本形態(tài)。()

參考答案:

對問答系統(tǒng)的起源,可以追溯到1950年,A.M.Turning提出的”圖靈測試”。()

參考答案:

對根據(jù)問答系統(tǒng)處理的數(shù)據(jù)格式,將問答系統(tǒng)分為哪幾個歷史階段()。

參考答案:

基于機構(gòu)化數(shù)據(jù)的問答系統(tǒng);基于知識圖譜的問答系統(tǒng);基于自由文本的問答系統(tǒng);基于問題答案對的問答系統(tǒng)對應(yīng)問答系統(tǒng)的處理流程,一般問答系統(tǒng)包括哪三個主要部分?()。

參考答案:

問題分析;答案抽取;信息檢索根據(jù)問答系統(tǒng)的發(fā)展、數(shù)據(jù)源、提問類型等,將問答系統(tǒng)分為哪幾種?()。

參考答案:

社區(qū)問答系統(tǒng);檢索式問答系統(tǒng);面向知識圖譜的問答系統(tǒng)衡量和分析問答系統(tǒng)得復(fù)雜性,可以從問題、數(shù)據(jù)、答案3個維度來評價,同時問答系統(tǒng)根據(jù)問題、數(shù)據(jù)、答案3個維度的不同而屬于不同類別。()

參考答案:

對信息抽取的任務(wù)主要包括()。

參考答案:

事件抽取;實體消岐;關(guān)系抽取;實體識別與抽取區(qū)別于傳統(tǒng)問答式檢索系統(tǒng)僅能回答有限類型的問題,社區(qū)問答系統(tǒng)的特點是()。

參考答案:

問題的類型和答案的類型不限定哪一個概念由谷歌2012年正式提出,旨在實現(xiàn)更智能的搜索引擎,并且于2013年以后開始在學(xué)術(shù)界和業(yè)界普及。()。

參考答案:

知識圖譜第八章測試關(guān)于文本摘要說法正確的是()

參考答案:

文本摘要必須保留原文中的重要信息。;文本摘要需盡可能簡短精煉。;可以對多文檔進行抽取文本摘要。;可以對單文檔進行抽取文本摘要。按照輸出類型劃分文本摘要主要分為哪幾類()

參考答案:

抽取式摘要;生成式摘要下面哪些是文本自動摘要經(jīng)歷的發(fā)展階段()

參考答案:

基于語言學(xué)的自動摘要;啟發(fā)式自動摘要;基于神經(jīng)網(wǎng)絡(luò)的自動摘要;基于統(tǒng)計的自動摘要與單文檔摘要相比,多文檔摘要有哪些特點()

參考答案:

多文檔摘要比單文檔面臨更多挑戰(zhàn)。;多文檔摘要需注意減小句子之間的冗余度。;從多個文檔抽取出的句子要確定它們的順序。;多文檔摘要要確定壓縮比率,即從每個文檔中抽取句子的比例。下面哪些項是影響句子重要性的因素()

參考答案:

句子中詞語的重要性;句子位置;句子是否包括線索詞;句子的長度關(guān)于生成式摘要常用的一個方法:基于深度學(xué)習(xí)之序列轉(zhuǎn)換模型的方法說法錯誤的是()

參考答案:

輸入序列較長時,語義向量中先提取的信息并不會被后提取的信息稀釋。下面關(guān)于ROUGE說法正確的是()

參考答案:

ROUGE既是評估自動文摘也是及機器翻譯的一組指標(biāo)。;ROUGE是一種基于召回率的相似性度量方法。;ROUGE要求由多個專家分別生成人工摘要,構(gòu)成標(biāo)準(zhǔn)摘要集。按照輸入類型劃分,文本摘要分為抽取式摘要和生成式摘要。()

參考答案:

錯多文檔摘要不必關(guān)心多個文檔中抽取處的句子之間的順序。()

參考答案:

錯5、

抽取式摘要典型模型一共有以下步驟,請按照先后順序?qū)⒉襟E進行排序(

)①摘要語句排序②語句重要性計算與排名③文檔理解④語句選擇

參考答案:

③②④①第九章測試機器翻譯可以有多種實現(xiàn)方法。給定源語言句子,對目標(biāo)語言句子的條件概率進行建模,再用大規(guī)模語料庫訓(xùn)練模型的方法是()。

參考答案:

基于統(tǒng)計的機器翻譯基于神經(jīng)網(wǎng)絡(luò)的機器翻譯中,近年引入的()可以提高長句的翻譯質(zhì)量,它賦予句子中的每個詞相同的權(quán)重。

參考答案:

注意力機制在人工智能領(lǐng)域,機器翻譯屬于()范疇。

參考答案:

自然語言處理近年,神經(jīng)機器翻譯逐漸成為機器翻譯的主流技術(shù);通常有兩個模塊,其中,()模塊把源語言句子轉(zhuǎn)換成中間語義表示.

參考答案:

編碼器基于規(guī)則的方法由上到下可以分成四個層次,即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論