漢語句義結構標注語料庫_第1頁
漢語句義結構標注語料庫_第2頁
漢語句義結構標注語料庫_第3頁
漢語句義結構標注語料庫_第4頁
漢語句義結構標注語料庫_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

漢語語義分析中不可逾越的重要環(huán)節(jié)漢語句義結構標注語料庫01標注內容方面來源規(guī)模方面組織結構方面功能研究目錄030204基本信息句義結構分析是漢語語義分析中不可逾越的重要環(huán)節(jié),為了滿足漢語句義結構分析的需要,北京森林工作室(BFS)基于現(xiàn)代漢語語義學理論構建了一種層次化的漢語句義結構模型,定義了標注規(guī)范和標記形式,建設了一個漢語句義結構標注語料庫BFS-CTC(BeijingForestStudio–ChineseTaggedCorpus)。標注內容方面標注內容方面基于句義結構模型的定義標注了句義結構句型層、描述層、對象層和細節(jié)層中所包含的各個要素及其組合關系,包括句義類型、謂詞及其時態(tài)、語義格類型等信息,并且提供了詞法和短語結構句法信息,便于詞法、句法、句義的對照分析研究。

組織結構方面組織結構方面該語料庫包括四個部分,即原始句子庫、詞法標注庫、句法標注庫和句義結構標注庫,可根據研究的需要,在詞法、句法、句義結構標注的基礎上進行深加工,在核心標注庫的基礎上添加更多具有針對性的擴展標注庫,利用句子的唯一ID號進行識別和使用。

來源規(guī)模方面來源規(guī)模方面原始數(shù)據全部來自新聞語料,經過人工收集、整理,合理覆蓋了主謂句、非主謂句、把字句等六種主要句式類型,規(guī)模已達到句。功能研究功能研究BFS-CTC基于現(xiàn)代漢語語義學,提供了多層次的句義結構標注信息,在兼容現(xiàn)有標注規(guī)范的情況下進行了詞法和語法標注。BFS標注的詞法、句法及句義既可以單獨使用也可綜合使用,可用于自然語言處理多方面的研究。為共同推動漢語語義分析的研究和發(fā)展,北京森林工作室(BFS)從2013年4月15日起對外開放下載3,000句句義結構標注示例,更多句義結構標注語料可向BFS申請

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論