知識產(chǎn)權(quán)管理ArchIPat系統(tǒng)_第1頁
知識產(chǎn)權(quán)管理ArchIPat系統(tǒng)_第2頁
免費預(yù)覽已結(jié)束,剩余3頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)為分析競爭對手的專利情況,獲得風(fēng)險信息并洞察公 司創(chuàng)新資產(chǎn)的整體價值,決策者可利用全文專利數(shù)據(jù)庫檢索 專利進行分析, 全文數(shù)據(jù)庫可較快獲得全球?qū)@麛?shù)據(jù), 因此, 先進的檢索工具是必須的,用戶通過檢索工具可以檢索到需 要的數(shù)據(jù)進行有效地分析,因此,對檢索到的大量數(shù)據(jù)便產(chǎn) 生一種需求,用有效的工具將檢索到的數(shù)據(jù)轉(zhuǎn)化為決策者需 要的市場信息。Archlpat 系統(tǒng)已由里雅斯特學(xué)院的一個研究小組開發(fā), 知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)可以將檢索到的數(shù)據(jù)轉(zhuǎn)化為市場 信息,有助于決策者進行市場監(jiān)控和在特定的領(lǐng)域建立更廣 闊的專利信息框架。知識產(chǎn)權(quán)管理 ArehIPa

2、t 系統(tǒng)框架的重點在數(shù)據(jù)類型管理 上,專利可被界定為結(jié)構(gòu)化信息 (如申請?zhí)枺诸惖?)、非結(jié) 構(gòu)化信息 (如說明書摘要、說明書等 )和附圖 (如說明書附圖、 圖片等)。知識產(chǎn)權(quán)管理 ArchiPat 系統(tǒng)采用數(shù)據(jù)關(guān)系結(jié)構(gòu)管理 模式,具有以下優(yōu)勢;加強著錄項目之間的聯(lián)系;把文本數(shù) 據(jù)置于上下文中;在一個特定文檔區(qū)域中快速檢索信息:使 整個專利文檔轉(zhuǎn)化到所需的文件格式,只需創(chuàng)建一個包含專 利數(shù)據(jù)的 XML 文件。如圖 1 所示的知識產(chǎn)權(quán)管理 ArchlPat 系統(tǒng)框架反映了實體和專利文檔特性之間的關(guān)系,使用知識產(chǎn)權(quán)管理 ArchlPat 系統(tǒng)可以檢索文本和著錄項目的數(shù)據(jù),該知識產(chǎn)權(quán)管理 ArchI

3、Pat 系統(tǒng)的核心是一個關(guān)系型數(shù)據(jù)庫, 能夠支持常用的 數(shù)據(jù)庫管理系統(tǒng) (DBMS) 。圖 1 中的知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)包括以下子系統(tǒng)關(guān) 系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS),用于存儲和管理數(shù)據(jù);專利 文檔下載系統(tǒng)(DownLoad)和文檔理解系統(tǒng)(Document UnderstandingSystem)。將存儲在關(guān)系型數(shù)據(jù)庫管理系統(tǒng)中的 專利文獻提取不同的領(lǐng)域和有意義的信息進行語義分析;信 息檢索系統(tǒng) (InformationRetrieval) ,用來檢索信息;數(shù)據(jù) /文 本挖掘(TM)系統(tǒng),用于分析收集信息。子系統(tǒng)是原始模塊 (如數(shù)據(jù)庫結(jié)構(gòu)、 信息提取算法, 數(shù)據(jù) 挖掘算法

4、和系統(tǒng)接口 )及商業(yè)產(chǎn)品的集合, 通過這些子系統(tǒng)可 以使用戶獲得所需的信息。首先,建立專利文獻集合,專利文獻集合包括系統(tǒng)之外 提供者提供的信息、專利文檔下載系統(tǒng),文檔理解系統(tǒng)和知 識產(chǎn)權(quán)管理ArchIPat 數(shù)據(jù)庫,用戶在檢索時通過知識產(chǎn)權(quán)管 理 ArchIPat 界面選擇合適的數(shù)據(jù)庫進行專利檢索,提交的查 詢可以是一般查詢 (如查詢從特定日期所有的專利申請)或具體查詢 (如查詢某一特定日期由特定公司申請的專利和特定 的國際專利分類號 ),檢索到對比文獻的準(zhǔn)確性取決于提交的 查詢條件。其次,通過對數(shù)據(jù)庫進行檢索,用戶可獲得并在線下載 需要的專利文獻,該檢索結(jié)果存儲在系統(tǒng)數(shù)據(jù)庫中,當(dāng)用戶 選擇在

5、線下載所列出的專利文獻時,文檔理解系統(tǒng)運用信息 提取算法自動識別和提取不同字段 (發(fā)明人,申請人、 摘要等 ) 的專利文獻并將其存儲在數(shù)據(jù)庫表中,這種算法是基于規(guī)則 算法和模型的結(jié)合,通過建立專利文獻集合,用戶可獲得所 需的專利信息。為了對專利字段的文本進行分析, 有效地進行數(shù)據(jù) / 文本 挖掘(TM),最后有必要對數(shù)據(jù)庫表中的文本信息進行預(yù)處理, 該預(yù)處理包含了若干語言處理技術(shù),滿足信息檢索和數(shù)據(jù)挖 掘系統(tǒng),知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)采用反向索引技術(shù)預(yù)先 對文本數(shù)據(jù)進行語言上的處理,知識產(chǎn)權(quán)管理ArchIPat 系統(tǒng)產(chǎn)生兩種不同類型的索引:正文索引和主題索引,正文索引 考慮文檔的整

6、個文本和每個文字,基于文本信息來進行檢索; 主題索引是從專利文獻中提取一些指定的主題,將這些主題 鏈接成詞庫,在數(shù)據(jù)庫中每條專利記錄包含提取最相關(guān)的主 題,這些記錄是專利數(shù)據(jù)庫的基本結(jié)構(gòu)。語言處理是系統(tǒng)自動形成的,在處理結(jié)束時,對文檔進 行檢索和分析,其中語言處理步驟是瞬間完成的,以便迅速 地滿足用戶的需要,更好地使用信息檢索或數(shù)據(jù)文本挖掘 系統(tǒng)。使用信息檢索系統(tǒng)時,用戶能夠根據(jù)專利數(shù)據(jù)庫中的全 文、字段或包含一些特定字段的關(guān)鍵詞、特定主題對專利進 行檢索,使用數(shù)據(jù)文本挖掘系統(tǒng)用戶可以獲得更多隱藏在 文本中的信息,利用圖形工具將這些信息表示出來。系統(tǒng)功能:信息檢索和數(shù)據(jù) / 文本挖掘信息檢索信

7、息檢索的目的是提供快捷、有效的方法,從信息集合 中找出需要的信息, 根據(jù)用戶需求的相關(guān)度對檢索到的對比 文獻進行排序。一篇文檔內(nèi)容的解釋涉及從文檔的文字中提 取句法和語義信息,信息檢索系統(tǒng)使用多種技術(shù)如對文字建 立索引、建模和文檔分類。如前所述, 知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)使用反向索引技術(shù)來衡量每個詞在文檔中的份量。知識產(chǎn)權(quán)管理 ArchIPat 系統(tǒng)具有友好的用戶界面,用戶 可以通過檢索著錄項目獲得檢索來的專利文獻,為了獲取檢 索信息,用戶只需使用查詢列表在數(shù)據(jù)庫中檢索,用戶根據(jù) 提交的查詢將獲得的專利文獻或著錄項目 (如發(fā)明人 )按照相 關(guān)度的順序排序列表。在檢索期間,用戶提交的

8、查詢和檢索 結(jié)果可以進行跟蹤并保存成略圖形式,用戶如需回顧檢索歷 史,只需雙擊相應(yīng)的保存圖標(biāo),專利文獻的查詢結(jié)果以申請 號。標(biāo)題、文摘的形式呈現(xiàn)。信息檢索系統(tǒng)允許用戶:點擊專利文獻列表查看全文:點擊引用圖標(biāo),查看所有專利的引用文獻,如果在收集的信 息中引用文獻不存在,用戶可從供應(yīng)商那里進行檢索,決定 是否下載;選擇部分專利文檔,點擊記事圖標(biāo),自動生成記 事本,并記錄顯亮文本;以一種理想的文件格式發(fā)送或保存: 進行專利分析,實現(xiàn)網(wǎng)絡(luò)共享。著錄項目數(shù)據(jù)的查詢顯示結(jié)果由一個共生矩陣組成,用 戶可以通過圖形工具瀏覽,例如,用戶瀏覽一個共生矩陣, 這個矩陣代表一家企業(yè)每人每年的申請數(shù)量,它以簡單直方 圖的形式表示,利用此矩陣,用戶可觀察隨著時間的推移, 申請人專利公開的趨勢并瀏覽逐年的公開專利。這樣可提供 某企業(yè)擁有專利最多者并能判斷個人是否積極參與企業(yè)或 已離開。數(shù)據(jù)與文本挖掘數(shù)據(jù)與文本挖掘技術(shù)可被定義為隱含抽取,即先前未知 但可能是有用的信息數(shù)據(jù),它包括多種技術(shù)以便確定信息是 否有用,可用于決策、預(yù)測預(yù)報、評估等領(lǐng)域,其中數(shù)據(jù)與 文本挖掘包含若干不同的技術(shù)方法如專利聚類算法、數(shù)據(jù)匯 總、分類規(guī)則,發(fā)現(xiàn)從屬網(wǎng)絡(luò),發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論