




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1 數(shù)據(jù)庫基本概念在專利檢索中數(shù)據(jù)庫基本概念在專利檢索中 的運用的運用 陳衛(wèi)明 許瑛 姚文 閆小蘇 2007.7.23 2 目錄目錄 n1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n3 3、關系型數(shù)據(jù)庫的三種操作、關系型數(shù)據(jù)庫的三種操作 n4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n5 5、三種字段類型、三種字段類型 3 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.1、三個世界 n按照數(shù)據(jù)庫理論,有現(xiàn)實世界、信息世界、計 算機世界等三個世界。 n現(xiàn)實世界的“客觀事物”(事實、事件)在信 息世界中抽象為“實體”,并定
2、義了各種“屬 性”來描述“實體”。 n“實體”在計算機世界被描述成一條“記錄”。 n客觀事物-實體-記錄 4 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.2、數(shù)據(jù)(data)是一些符號,用來描 述客觀事物的特征。 n這些符號可以是數(shù)字形式、文字形式 (以及圖形、圖像和聲音等)。 n例如學生成績、飛機班次、測量溫度、 (CPRS中的)發(fā)明人姓名、發(fā)明名稱、 文摘、優(yōu)先權項、文獻號、申請?zhí)?、?類號、申請日、公開日等。 5 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.3、信息(information) n信息是經(jīng)過加工(記載、分類、組織、關聯(lián)、 解釋、提煉、消化理解)而
3、具有使用價值的數(shù) 據(jù)。(信息=數(shù)據(jù)+數(shù)據(jù)處理) n有的信息由一個數(shù)據(jù)構成,比如分類號;有的 信息由幾個數(shù)據(jù)構成,比如優(yōu)先權項、CPRS中 的一條記錄。 n數(shù)據(jù)和信息在形式上往往并無區(qū)別,尤其是那 些由一個數(shù)據(jù)構成的信息。例如分類號。 6 一、數(shù)據(jù)、信息和數(shù)據(jù)處理一、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.4、數(shù)據(jù)和信息的關系 n(信息是數(shù)據(jù)的內涵、二者是形與質的關系。) n(數(shù)據(jù)是信息的載體,信息的表現(xiàn)形式仍是數(shù)據(jù)。) n(信息是經(jīng)過加工而具有使用價值的數(shù)據(jù),信息=數(shù)據(jù) +數(shù)據(jù)處理。) n數(shù)據(jù)只是把客觀事物記錄下來,并沒有特定目的;而 信息是有針對性的(某一問題、某一論點、某一特定 目的)來收集、處理數(shù)據(jù)
4、,用來作為決策或參考的依 據(jù)。所以兩者的差別在于是否存在某一特定目的特定目的。 7 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.5、數(shù)據(jù)處理 n數(shù)據(jù)處理是指對各種類型的數(shù)據(jù)進行加工 (收集、存儲、分類、計算、檢索、傳輸) 的過程。 n數(shù)據(jù)處理的目的使之成為信息。 n數(shù)據(jù)處理通常也稱為信息處理。 8 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.1、數(shù)據(jù)庫(Datebase,DB) n長期存放在外部存儲設備(外存儲器、 外存介質)上、可以以各種方式進行組 織、可以共享的數(shù)據(jù)(包括這些數(shù)據(jù)之 間的聯(lián)系)集合。 n(這些數(shù)據(jù)與應用程序例如VB相互獨 立) 9 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)
5、據(jù)庫系統(tǒng)概述 n2.2、數(shù)據(jù)庫系統(tǒng)(Database System,DBS) n數(shù)據(jù)庫不能獨立存在,是數(shù)據(jù)庫系統(tǒng)的一部 分。 n在實際應用中,人們所面對的其實是數(shù)據(jù)庫 系統(tǒng)。 n數(shù)據(jù)庫系統(tǒng)具有管理和控制數(shù)據(jù)庫的能力 (輸入、輸出、組織數(shù)據(jù))。 10 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 數(shù)據(jù)庫系統(tǒng)包括: n 硬件(計算機) n數(shù)據(jù)庫(DB) n數(shù)據(jù)庫管理系統(tǒng)(DBMS,常用的數(shù)據(jù)庫管理系 統(tǒng)有FoxPro、Oracle、SYBASE、INFORMIX等, 用來建立、管理、控制數(shù)據(jù)庫) n數(shù)據(jù)庫管理員 n用戶和應用程序 11 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.3、信息世界的術語 n
6、實體(Entity) 對應于現(xiàn)實世界中的“客觀事物”。實體 可以指代具體事物,如一個學生,一本 書(一件專利文獻);也可以指代抽象 事件,如一場足球比賽。 12 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n屬性(attribute) n屬性用來描述實體的特性。 n如學生實體可以用若干屬性(學號、姓名、年 齡、性別、出生日期、班級)來描述。 n屬性的具體值稱為屬性值,如CN2745142Y (授權公告號)、馬林(申請專利權人)、 2004年9月16日2004.9.16(申請日)是屬性 值。 13 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.4、計算機世界的術語 n記錄(record)、元組 對應
7、于信息世界的“實體”,二維表中的一行。 n 字段(field) 對應于信息世界的“屬性”,二維表中的一列。每個字 段有字段名(標頭),例如“發(fā)明人”、“申請?zhí)枴?等等。 n字段值(value)、數(shù)據(jù)項 對應于信息世界的“屬性值”,二維表中的一格。 n關系(relation)、數(shù)據(jù)庫文件 14 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n一個關系就是一個二維表,每個關系有 一個關系名。一個關系可以存儲為一個 數(shù)據(jù)庫文件。 n例如某專利文獻數(shù)據(jù)庫可以有專利號的 表,發(fā)明名稱的表,專利權人的表等。 n下面是一個模擬數(shù)據(jù)庫,該表是由一個 以上的表(關系)通過“關聯(lián)”而成。 15 PN(PN(字段名字段名
8、) )TIPAICPDPD 5000000 (5000000) carG&MB60j31/0 0 10/25/1998(一行表示 一條記錄) (5000001) computerIBMG06f3/0001/02/2000 模擬數(shù)據(jù)庫(不是真的) (一列表示一 個屬性) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 16 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.5、關系的三種類型 n一對一的關系(例如一個學生只有一個學號; 再例如一件專利只有一個申請?zhí)枺?n一對多的關系(例如某班主任老師可以有多個 學生,再例如一個發(fā)明人可以有多件專利) n多對多的關系(例如一個學生可以選修多門課, 一門課可以供
9、多名學生選修;再例如一個分類 號之下可以有多件專利文獻,一件專利也可以 有多個分類號) 17 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.6、數(shù)據(jù)庫的三種類型 n數(shù)據(jù)模型是數(shù)據(jù)庫結構的組織形式,目前數(shù)據(jù) 庫系統(tǒng)中常用的數(shù)據(jù)模型有三種: n層次模型(Hierarchical Model):用樹形結 構表示數(shù)據(jù)及其聯(lián)系的數(shù)據(jù)模型,樹形結構只 能表示一對多聯(lián)系: 18 班主任(微 機871班) 王小艷李峰張勇 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 19 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n網(wǎng)狀模型(Network Model):用網(wǎng)絡結 構表示數(shù)據(jù)及其聯(lián)系的數(shù)據(jù)模型。 n網(wǎng)狀模型可以直接表
10、示多對多聯(lián)系,但 其中的結點間連線或指針更加復雜,因 而數(shù)據(jù)結構更加復雜: 20 dl001(刑法) 王小艷李峰張勇 dl002(聲樂)dl003(繪畫) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 21 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n關系模型(Relational Model):用關 系表示的數(shù)據(jù)模型。 n關系是指由行與列構成的二維表,關系 不但可以表示實體間一對多的聯(lián)系,通 過關系間的連接,也可以表示多對多的 聯(lián)系(見連接): 22 學號姓名年齡性別班級 870101王小艷18女微機871 870102李峰18男微機871 870103張勇19男微機871 微機871班學生表(A)
11、 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 23 學號課程編號課程編號 870101(王)dl001(刑) 870101(王)dl002(聲) 870102(李)dl001(刑) 870102(李)Dl002(聲) 870103(張)Dl002(聲) 870103(張)dl003(畫) 選修表(B) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 24 課程編號課程編號課程名授課教師授課地點 dl001刑法周火主樓102教室 dl002聲樂劉琴主樓102教室 dl003繪畫任安主樓504教室 課程表(C) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 25 3 3、關系型數(shù)據(jù)庫的三種操作、關系型數(shù)據(jù)庫的三種操
12、作 n3.1、選擇:從關系中找出滿足給定條件的記 錄(元組),即在二維表中選行。(例(例如: 對表A中李峰的選擇) n3.2、投影:從關系中找出若干字段(屬性) 組成新的關系,即在二維表中選列。(例如: 對表B課程編號的投影) n3.3、連接:將兩個關系按某種條件提取部分 (或全部)記錄及部分(或全部)字段組合成 新的關系。(例如:表B、表C按照課程編號 關鍵字連接) 26 課程編課程編 號號 課程 名 授課教師授課地點學號 dl001刑法周火主樓102教室8 7 0 1 0 1 、 870102 dl002聲樂劉琴主樓102教室8 7 0 1 0 1 、 8 7 0 1 0 2 、 8701
13、03 dl003繪畫任安主樓504教室870103 連接而成的新表(D) 3 3、關系型數(shù)據(jù)庫的三種操作、關系型數(shù)據(jù)庫的三種操作 27 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.1、并(或、or)(AB) nA集合和B集合所有元組合并,再刪去重復的元組,這種運算稱為 “并”(或);所組成新的C集合,稱為A、B的并集 n4.2、差(非、not)(A-B) nA集合中刪去(A集合中)與B集合相同(重復)的元組,這種運算 稱為“差”(非);所組成新的C集合稱為A、B的差集 n4.3、交(與、and)(AB) n既屬于A集合又屬于B集合的元組,這種運算稱為“交”(與); 所組成
14、新的C集合,稱為A、B的交集 28 交(交(,與,與,andand) n屬于集合A且屬于集合B 的元素組成的集合C,叫 做A,B的交集(屬于A 又屬于B的元素組成的集 合,A and B=C) n例:A-汽車,B- 發(fā)動機, C-即有汽車也有 發(fā)動機的記錄集 ncaps中兩詞間空格, “and”, “+” 集合B 集合A 集合C 29 并(并(,或,或,oror) n屬于集合A或屬于集合B 的元素組成的集合C,叫 做A,B的并集(A,B所 有元素合并,刪除重復 元素組成的集合,A or B=C)。 n例:A-汽車,B-發(fā)動機,C-僅 有汽車的記錄集,僅有 發(fā)動機的記錄集,即有 汽車也有發(fā)動機的
15、 記錄集。 ncaps中用“or”,“,” 集合A集合B 集合C 30 差(差(- -,非,非,NOTNOT,與非,與非,ANDNOTANDNOT) n屬于集合A而不屬于集合 B的元素組成的集合C, 叫做A,B的差集(在A 中排除屬于B的元素后組 成的集合,A not B=C) n例:A-汽車,B-發(fā)動機, C-從所有含汽車的 記錄集中去掉含發(fā)動 機的記錄集 ncaps中用“without”, “not”,“#” 集合A 集合B 集合C 31 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.4、差并(ornot、或非) n從總集合排除B,再與A集合合并。 n三種情況 n4.4
16、.1、A集合的所有元素都是B集合的元素時, 還要考慮A集合與B集合哪個更大: n4.4.1.1、如果A集合更大,或非結果=總集合; n4.4.1.2、如果B集合更大,總集合被挖去部分 B只填入了局部,有“空區(qū)”) 32 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.4.2、A集合的所有元素都不是B集合的 元素,或非結果=總集合 not B n4.4.3、A集合的部分元素是B集合的元素, 總集合被挖去部分B只填入局部,有 “空區(qū)”) 33 總 B A 或非(4.1.1.1、A所有元素都是B的元 素,且AB) 34 總 或非(4.1.1.1、A所有元素都是B的元 素,且AB)
17、35 或非(4.1.1.2、A所有元素都是B的元 素,且AB) 總 B A 36 總 或非(4.1.1.2、A所有元素都是B的元 素,且A”; 必須輸入完整的年月日(YYMMDDYYMMDD), 例如:850101020831;可用YYYY和YY;年月 日格式;連續(xù)輸入時可用“+” 79 5 5、三種字段類型、三種字段類型 n情形3:USPTO的“patent search”(ISD授權日PD公 開日/APD申請日/PRIR優(yōu)先權日),輸入值間不能用or, “日”可用“$”,時間區(qū)間用“-”。授權專利數(shù)據(jù) 庫日期型輸入值有多種輸入格式:20030403、4-30- 2003(月日年)、4/30/2003(月日年)、20030327- 20030403(時間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- TCZSYSJLXH 002-2024 全國藝術行業(yè)職業(yè)能力水平評價團體標準
- 太原單柱式標志桿施工方案
- 吉安市防水補漏施工方案
- 浦東新區(qū)2024學年度第一學期期末教學質量檢測高三語文試卷
- 生態(tài)茶園修復工程施工方案
- 建筑工程竣工驗收檢測報告
- 右安門鋼結構施工方案
- 簡支鋼箱梁橋施工方案
- 酉陽四星級酒店施工方案
- 陶鋁吸音板施工方案
- 夾膠玻璃作業(yè)指導書
- NLP高效能溝通影響力集團李炫華
- 預應力錨索安全專項施工方案
- 站長辦公會議事規(guī)則
- 在泰居留90天移民局報到表格(TM47)
- 銅陵職業(yè)技術學院“十三五”發(fā)展規(guī)劃編制工作方案
- EDTA絡合滴定法測定銀合金中的銀
- 某屠宰場廢水處理工藝設計_畢業(yè)設計(論文)
- 江蘇省無錫市2020年中考語文真題試題(含解析)
- 癌癥患者生命質量量表FACT-G v4
- 李清照詞修辭現(xiàn)象探析畢業(yè)論文
評論
0/150
提交評論