![基于語義的自動文摘介紹_第1頁](http://file4.renrendoc.com/view/31ea5367d993a510d5352f483a9b4cbc/31ea5367d993a510d5352f483a9b4cbc1.gif)
![基于語義的自動文摘介紹_第2頁](http://file4.renrendoc.com/view/31ea5367d993a510d5352f483a9b4cbc/31ea5367d993a510d5352f483a9b4cbc2.gif)
![基于語義的自動文摘介紹_第3頁](http://file4.renrendoc.com/view/31ea5367d993a510d5352f483a9b4cbc/31ea5367d993a510d5352f483a9b4cbc3.gif)
![基于語義的自動文摘介紹_第4頁](http://file4.renrendoc.com/view/31ea5367d993a510d5352f483a9b4cbc/31ea5367d993a510d5352f483a9b4cbc4.gif)
![基于語義的自動文摘介紹_第5頁](http://file4.renrendoc.com/view/31ea5367d993a510d5352f483a9b4cbc/31ea5367d993a510d5352f483a9b4cbc5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于語義的自動文摘介紹計算機1介紹2兩個語義模型
2.1
語義知識模型
2.2
統(tǒng)計主題模型
3總結目錄31、介紹基于語義的自動文摘方法能解決自動文摘處理中語言復雜性問題,在克服領域局限性的同時從本質上提高文摘的質量.常用語義模型包括統(tǒng)計主題模型和語義知識模型.基于語義的自動文摘是對傳統(tǒng)文摘技術基于語義模型的擴充,在自動文摘的預處理、文檔轉換、文檔候選片段提取和文摘生成4個基本過程中使用各種語義分析方法.4基于語義的自動文摘方法,采用語義學、哲學、統(tǒng)計學和概率學等多領域知識,通過語義模型對語義空間建模,生成文檔在語義空間里的表示,然后通過語義分析手段提取文摘候選片段,根據片段之間的語義關系得到可讀性強的文摘結果.基于語義的自動文摘方法能解決自動文摘處理中語言復雜性問題,在克服領域局限性的同時從本質上提高文摘的質量.1、介紹52、兩個語義模型統(tǒng)計主題模型和語義知識模型.2.1語義知識模型以語義關系為重點描述對象,以語義知識庫為表示形式,為涉及到語言形式的計算機處理操作提供語義知識約束條件.作為一個具有結構性、代表性、可機讀性的一定規(guī)模的語義知識集合,語義知識庫在自然語言處理的各個領域都有廣泛的應用.應用較為廣泛的語義知識庫包括:WordNet和HowNet等本體庫.6WordNetWordNet是一個覆蓋面較廣的英文語義知識庫.在WordNet里,n、v、adj和adv等被分成同義詞集合(Synset)。每個集合表示一個概念,每個詞可屬于多個集合(即一詞多義),不同集合又按概念之間的同義、上下位等各種關系組織起來.建立語義網絡。時間:時代、時候和時期。7HowNetHowNet:漢語+英語以揭示概念與概念之間,以及概念所具有的屬性之間的關系為基本內容的常識知識庫。知識工程師來設計知識庫的框架。HowNet認為所有概念都是由基本義元組成.它通過對中文基本義元的分析,用有限的義元集合描述無限的概念集合,然后再將概念與概念之間的關系及概念的屬性與屬性之間的關系用網狀的知識系統(tǒng)表示出來.8Ontology本體本體是關于一些主題的清晰規(guī)范的說明。1術語表2術語關系集主題圖的概念模型9MeSH基于語義的自動文摘系統(tǒng)的移植性有待增強.自動文摘系統(tǒng)的移植性是決定自動文摘技術發(fā)展的關鍵之一.使用本體的自動文摘系統(tǒng)現(xiàn)在大部分出現(xiàn)在醫(yī)學領域,這主要是由于其他領域中尚還缺少類似于MeSH的大型領域本體.《醫(yī)學主題詞表》(MedicalSubjectHeadings,簡稱MeSH)是美國醫(yī)學圖書館編纂的一部大型醫(yī)學專業(yè)敘詞表,是手工檢索IM(IndexMedicus)和計算機檢索Medline的主題詞文本,也是醫(yī)學領域使用最廣泛最具權威的詞表。MeSH是對生物醫(yī)學文獻進行主題分析、標引和檢索時使用的權威性詞表。10MeSH1.嚴格規(guī)范的科學語言。不允許一詞多義和一義多詞。把同義檢索詞歸一檢索。嚴格的同義規(guī)范、詞義規(guī)范、詞類規(guī)范、詞型規(guī)范,明確詞的含義及所涉及的范圍,使得每一個敘詞在詞語的形式和語義上只能有一個概念,不允許一詞多義和一義多詞,避免了標引人員和檢索人員人為造成的誤差。在檢索中,最為檢索人員熟悉的是Neoplasm這個科學用詞,它包含了Tumors,Tumor,BenignNeoplasms,Neoplasms,Benign,BenignNeoplasm,Neoplasm,Benign,Cancer,Cancers這些同義詞,這些同義詞以入口詞的形式出現(xiàn)在MeSH表中,當用MeSH對醫(yī)學知識進行標引、組織和檢索時,表達腫瘤概念的也只能是科學語言———Neoplasm,而不是本時常用的Tumor,Cancer等自然語言。11MeSH2、樹狀結構表主題詞劃分15類:1-9級邏輯和隸屬關系樹狀結構表將字順表中的主題詞按照每個詞的詞義范疇和學科屬性,分別歸入15個大類之中,多數大類又進一步細分多達9級。每
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國交通運輸用觸控平板電腦行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 摩托車剎車制動臂項目可行性研究報告建議書案例
- 2025年手柄式大便延時閥行業(yè)深度研究分析報告
- 2025年吸塑門板項目可行性研究報告
- 苯磺酸氨氯地平項目可行性研究報告
- 鋁板帶深加工建設項目可行性研究報告申請立項備案
- 2025-2030年中國特種玻璃鍋蓋項目投資可行性研究分析報告
- 2025年度企業(yè)派遣員工勞動合同簽訂流程與注意事項
- 2025年度綠色建筑評價標識勘察設計施工勞務分包合同(綠色建筑認證)
- 2025年度國際貿易數據安全保護合同執(zhí)行規(guī)范
- 充電樁知識培訓課件
- 2025年七年級下冊道德與法治主要知識點
- 2025年交通運輸部長江口航道管理局招聘4人歷年高頻重點提升(共500題)附帶答案詳解
- 老年髖部骨折患者圍術期下肢深靜脈血栓基礎預防專家共識(2024版)解讀
- 偏癱足內翻的治療
- 藥企質量主管競聘
- 信息對抗與認知戰(zhàn)研究-洞察分析
- 心腦血管疾病預防課件
- 手術室專科護士工作總結匯報
- 2025屆高三聽力技巧指導-預讀、預測
- 蘇州市2025屆高三期初陽光調研(零模)政治試卷(含答案)
評論
0/150
提交評論