第一講 文獻信息檢索基礎(chǔ)知識_第1頁
第一講 文獻信息檢索基礎(chǔ)知識_第2頁
第一講 文獻信息檢索基礎(chǔ)知識_第3頁
第一講 文獻信息檢索基礎(chǔ)知識_第4頁
第一講 文獻信息檢索基礎(chǔ)知識_第5頁
已閱讀5頁,還剩105頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一講文獻信息檢索基礎(chǔ)知識第一節(jié)信息與信息素養(yǎng)第二節(jié)科技文獻的類型第三節(jié)信息檢索與文獻檢索工具第四節(jié)信息檢索原理第五節(jié)信息檢索的方法和途徑第六節(jié)信息檢索常用技術(shù)及檢索效果評價第一節(jié)信息與信息素養(yǎng)

一、信息的根本含義1、圖書館學(xué)和情報學(xué)領(lǐng)域,信息被定義為事物或記錄。2、綜合學(xué)術(shù)界對信息的定義,可以認為信息是以物質(zhì)介質(zhì)為載體,傳遞和反映世界各種事物存在方式、運動規(guī)律及特點的表征。風(fēng)、雨、雷、電、春、夏、秋、自然信息語言、戰(zhàn)爭、貧困、喜、怒、哀、樂社會信息科學(xué)家破譯染色體的基因信息科學(xué)信息從生產(chǎn)力的角度可以將人類社會劃分為四個開展階段:原始社會、農(nóng)業(yè)社會、工業(yè)社會和信息社會。信息社會的主要標志是信息與知識成為社會最重要的根底性資源?!惨弧承畔⑴c社會在人類漫長的開展歷程中,物質(zhì)、能量、信息三種資源支配著人類最根本的生產(chǎn)活動。物質(zhì)---向人類提供材料及生活必需品信息---向人類提供知識和智慧能量---向人類提供動力信息社會的主要標志是信息與知識成為社會最重要的根底性資源?!捕承畔⒌母咎卣饕粋€完整的信息傳遞過程必須具備信源〔信息的發(fā)出體〕、信宿〔信息的承受體〕、信道〔信息的傳遞媒介〕和信息四個根本要素。知識是人們對客觀事物的認識和經(jīng)歷總和。知識與信息的關(guān)系:知識是信息的一局部,不直接等同于信息;知識是人類大腦活動的產(chǎn)物,是系統(tǒng)化、精煉化的信息。情報是傳遞中的有用的知識或信息,是為解決特定問題所需要的知識?!踩撑c信息有關(guān)的根本概念

文獻是記錄知識的一切載體。三個根本要素:1〕文獻含有知識信息;2〕負載知識信息的物質(zhì)載體;3〕記錄知識信息的符號和技術(shù);二、什么是信息素養(yǎng)信息素養(yǎng)有廣義狹義之分。廣義指信息社會對個人品質(zhì)、道德觀念、知識體系和能力要求的總合,或信息時代國民應(yīng)有的素質(zhì),包括品質(zhì)和能力兩個方面。狹義指獲取信息和使用信息的能力與品質(zhì)。美國信息產(chǎn)業(yè)協(xié)會主席保羅.澤考斯基〔PaulZurkowaski〕1974年在美國全國圖書館與情報學(xué)委員會上,最早提出了信息素養(yǎng)的概念,他把信息素養(yǎng)概括為:“利用大量的信息工具及主要信息源使問題得到解答的技術(shù)和技能。〞信息素養(yǎng)為什么重要在科技飛速開展、信息資源激增的當(dāng)今時代,信息素養(yǎng)越來越顯示其重要性聯(lián)合國教科文組織〔UNESCO〕2003年把信息素養(yǎng)定為終身學(xué)習(xí)的根底和未來公民的必備能力之一國外興旺國家早已把信息素養(yǎng)融入到自己的教育體系中,而我國在信息素養(yǎng)教育領(lǐng)域尚處于探索和起步階段我國教育界在?面向21世紀教育振興行動方案?中明確提出到2021年在全國建立起終身學(xué)習(xí)體系,信息素養(yǎng)是終身學(xué)習(xí)的條件。IL的簡明定義Tobeinformationliterate,apersonmustbeabletorecognizewheninformationisneededandhavetheabilitytolocate,evaluate,anduseeffectivelytheneededinformation.具有信息素養(yǎng)的人能夠知道什么時候需要信息,能夠有效地獲取、評價和利用所需要的信息。

——美國圖書館協(xié)會ALA,1989發(fā)現(xiàn)、檢索、分析、評價與利用信息的技能或能力。信息素養(yǎng)的主要內(nèi)容信息意識信息技能信息評價及利用信息平安及信息道德信息意識研究策略信息需求對新信息的敏銳,時刻追求新知識的熱情提高學(xué)生的信息關(guān)注程度信息技能信息源:了解信息如何產(chǎn)生及其傳播途徑;了解各種不同的信息源及其特征;選用適當(dāng)?shù)男畔M足個人的信息需求。信息檢索策略:分析個人的信息需求,檢索并利用根本的信息制定信息檢索策略,識別重點概念并提練檢索用的關(guān)鍵詞,利用根本檢索技巧構(gòu)建檢索式,將課題或是問題納入一個適宜的研究范圍內(nèi)。檢索路徑:查找圖書目錄,期刊索引,中外文電子文獻數(shù)據(jù)庫,有效的網(wǎng)絡(luò)搜索信息獲取的能力和技巧。

信息評價及利用信息評價的重要性信息評價的準那么:對獲取的信息進展辯識、選擇,創(chuàng)新知識的能力,養(yǎng)成批判性地分析、評價信息資源的能力〔評價指標:準確性、權(quán)威性、時效性、經(jīng)濟性、易獲取性〕對信息的分類、整理、保存、創(chuàng)造性地利用等。信息平安及信息道德對于網(wǎng)絡(luò)平安和計算機犯罪的認識、對計算機病毒的防范行為等;繼承已有的知識成果,尊重知識產(chǎn)權(quán),不抄襲剽竊,培養(yǎng)學(xué)生用一定的信息倫理與道德準那么標準自身行為的能力;〔例如:不標注參考文獻〕IL是一種根本能力“21世紀的能力素質(zhì)〞的5個方面:根本學(xué)習(xí)技能〔指讀、寫、算〕信息素養(yǎng)創(chuàng)新思維能力人際交往與合作精神實踐能力——美國教育技術(shù)CEO論壇2001年第4季度報告IL是一種綜合能力信息素養(yǎng)需要諸多知識背景;信息素養(yǎng)需要信息技術(shù)的支持,信息技術(shù)是它的有力的工具;信息素養(yǎng)是一種信息能力;信息素養(yǎng)是一種了解、搜集、評價和利用信息的知識構(gòu)造。IL在中國的研究和實踐信息素養(yǎng)概念在20世紀90年代中期被介紹到中國國內(nèi)。1997年起,開場有論文發(fā)表。2002年8月,教育部高校圖書情報工作委員會第三次會議上,信息素養(yǎng)教育成為一個重要的討論議題。將以文獻檢索課為核心的高校圖書館用戶教育開展為信息素養(yǎng)教育,已在圖書館界達成共識。IL在中國的研究和實踐IL在我國的根底——信息用戶教育新生入館教育圖書館參觀與導(dǎo)讀——幫助讀者熟悉圖書館資源和各種效勞。專題講座與培訓(xùn)——幫助讀者掌握專門檢索工具的使用。文獻檢索與利用課——幫助學(xué)生學(xué)習(xí)和應(yīng)用檢索知識。國家教委在1982年發(fā)出正式文件,高校應(yīng)開設(shè)文獻檢索和利用課程第二節(jié)科技文獻的類型一、文獻的主要類型〔一〕按載體類型分:印刷型、縮微型、電子型、聲像型〔二〕按出版類型分:圖書、連續(xù)出版物、特種文獻〔三〕按加工深度分:一次、二次、三次(一)根據(jù)文獻的載體形式劃分印刷型縮微型電子型聲像型圖書連續(xù)出版物資料縮微平片縮微膠卷縮微膠片磁帶、磁盤光盤聯(lián)機網(wǎng)絡(luò)版錄音帶、錄像帶唱片、幻燈片電影膠卷印刷型文獻載體:紙張實例:教科書記錄手段:油印、石印、鉛印、膠印、復(fù)印特點:可直接閱讀,方便使用;但難于實現(xiàn)機械化和自動化;收藏文獻占用空間大。利用紙張為存儲介質(zhì),以手寫、印刷為記錄手段而產(chǎn)生的文獻。包括油印、鉛印、膠印、復(fù)印等印刷品及手稿。

縮微型文獻載體:感光材料實例:縮微平片、縮微膠片記錄手段:光學(xué)縮微技術(shù)特點:體積?。粌r格低;不能直接閱讀是以感光材料為存儲介質(zhì),利用縮微照相技術(shù)使文獻縮微化的文獻。

聲像型文獻載體:磁性材料、感光材料實例:錄像帶、幻燈片記錄手段:磁記錄、光學(xué)技術(shù)特點:直觀、生動、形象;成本高;不易檢索和更新。以磁性或感光材料為存儲介質(zhì),利用特定的設(shè)備及技術(shù),直接記錄聲音、圖像信息的文獻。

電子型文獻載體:磁性材料實例:磁盤、光盤記錄手段:計算機輸入特點:存儲密度高、速度快;易復(fù)制;本錢高;不能直接閱讀。以電子數(shù)據(jù)的方式將圖、文、聲、像等信息存儲在磁光介質(zhì)上,通過網(wǎng)絡(luò)通信、計算機或類似設(shè)備再現(xiàn)的信息資源。按出版形式及內(nèi)容的不同圖書連續(xù)出版物特種文獻科技報告會議文獻政府出版物專利文獻標準文獻產(chǎn)品資料學(xué)位論文期刊報紙(二)根據(jù)文獻的編輯出版形式劃分圖書的含義凡篇幅達48頁以上并構(gòu)一個書目單元的文獻稱為圖書。國際標準書號〔ISBN〕國際標準書號(ISBN)(InternationalStandardBookNumber)每一種正式出版的圖書的唯一標識代碼,是專門為識別圖書等文獻而設(shè)計的國際編號。例如:?信息檢索原理與方法教程?,趙巖碧主編,化學(xué)工業(yè)出版社,2005年3月出版。其ISBN號為:7-5025-6431-4ISBN7-5025-6431-4(舊號)ISBN978-7-5025-6431-5〔2007年后出幅員書采用的新號〕第一段:978是由國際物品編碼〔EAN·UCC〕系統(tǒng)專門提供給國際ISBN管理系統(tǒng)的產(chǎn)品標識編碼。第二段:7語區(qū)號,代表國家、地區(qū)、語種如0和1-英,2-法,3-德,4-日,5-俄,7-中,88-意大利,9971-新加坡第三段:5025出版社代號,由國家或地區(qū)ISBN中心分配;第四段:6431出幅員書號,由出版社按出版順序所給;第五段:校驗位期刊

期刊又稱雜志,它是指采用統(tǒng)一名稱定期或不定期出版的連續(xù)性出版物。國際標準刊號〔ISSN〕國際標準連續(xù)出版物號〔ISSN〕正式出版的期刊有ISSN代碼,即國際標準連續(xù)性出版物編號,是國際連續(xù)出版物數(shù)據(jù)系統(tǒng)國際中心為在該系統(tǒng)登記的連續(xù)出版物分配的號碼。采用ISSN編碼系統(tǒng)的出版物有期刊、會議錄等。如:?中國圖書館學(xué)報?國際標準刊號:ISSN1001—8867全長8位,前7位為刊名代號,末位為校驗位期刊的特點A、期刊以品種為單位形成知識流;B、報道文獻速度快,內(nèi)容新穎,能及時反映世界科技水平,但不如圖書成熟;C、品種多,數(shù)量大,覆蓋了人類所以知識領(lǐng)域及各學(xué)科專業(yè),具有很強的容納性。D、科技期刊是最重要的一次文獻。

核心期刊*少數(shù)刊載某一學(xué)科大量高質(zhì)量專業(yè)論文的期刊。*特點〔1〕刊載專業(yè)文獻密度高,信息含量高;〔2〕水平較高,代表本學(xué)科的最新開展水平;〔3〕出版相對穩(wěn)定,所載文獻壽命較長;〔4〕利用率和被引率較高。目前,許多單位核心期刊的判定是以?中文核心期刊要目總覽?為標準

是以報道新聞及評論為主,出版周期比期刊更短,多為活頁性連續(xù)出版物。其特點是內(nèi)容豐富、信息量大、出版迅速、發(fā)行量大、讀者眾多。報紙

科技報告

科技報告是科技工作者對科學(xué)、技術(shù)研究結(jié)果或研究進展的記錄??萍紙蟾娴奶攸c〔1〕反映新的科研成果迅速;〔2〕內(nèi)容多樣化;〔3〕質(zhì)量參差不齊;〔4〕保密性強;〔5〕每份報告獨立成冊,有連續(xù)編號。

會議文獻會議文獻是指在各種會議上宣讀、交流的論文、報告及其它有關(guān)文獻。

政府出版物政府出版物是指由政府機構(gòu)制作出版或由政府指定出版商出版的文獻。政府出版物的類型〔1〕行政性文件〔2〕科技文獻專利文獻專利文獻是指實行專利制度的國家申請、審批專利過程中所產(chǎn)生的專利申請書、說明書及官方文件或出版物。其中最重要的是專利說明書。標準文獻與標準化活動有關(guān)的一切文獻都稱為標準文獻。其主體是標準,還包括標準形成過程的各種檔案、宣傳推廣標準的手冊及其它出版物。標準是按規(guī)定程序制訂,經(jīng)權(quán)威機構(gòu)公認或主管部門批準的在特定范圍內(nèi)執(zhí)行的規(guī)格、規(guī)那么、技術(shù)要求等標準性文件。產(chǎn)品資料指廠商為推銷產(chǎn)品而印制的各種宣傳資料、技術(shù)資料。如公司介紹、產(chǎn)品目錄、樣本、說明書等,它反映廠家、公司及產(chǎn)品的有關(guān)信息,對產(chǎn)品采購,儀器設(shè)備的維護、使用及新產(chǎn)品開發(fā)具有重要價值。按文獻的加工深度分一次文獻二次文獻三次文獻〔三〕不同加工層次的文獻信息

一次文獻*作者以自己的研究成果為根底創(chuàng)作或撰寫,并通過某種渠道而公開的文獻;*對知識的第一次加工;具有創(chuàng)造性;*大多數(shù)期刊論文、科技報告、學(xué)位論文、會議文獻、專利文獻、技術(shù)檔案等。*對一次文獻進展?jié)饪s、整序及加工處理而成的具有報道和檢索作用的文獻;*對知識的第二次加工;有序化;提供一次文獻線索;*目錄、題錄、文摘等檢索工具。二次文獻*指從一次文獻中提取數(shù)據(jù)、事實和有關(guān)結(jié)論,并經(jīng)過綜合分析與重新組合而編寫的文獻。*對知識的再加工;提供文獻檢索;*綜述、專著;字詞典、百科全書三次文獻一次文獻是檢索的對象〔目標〕二次文獻是檢索的工具〔手段〕三次文獻是情報研究的成果〔檢索目標+檢索手段〕從檢索的角度來看一次、二次、三次文獻三者之間的關(guān)系從知識加工角度來看一次、二次、三次文獻三者之間的關(guān)系從一次文獻到二次文獻、三次文獻是一個由博到約、由分散到集中、由無組織到系統(tǒng)化的過程,也是科技文獻資源的層次構(gòu)造由無序走想有序、由一種有序構(gòu)造演變?yōu)榱硪环N完善的有序構(gòu)造的過程。第三節(jié)信息檢索與信息檢索工具一、信息檢索的定義及類型〔一〕信息檢索的定義廣義的信息檢索:是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)信息的過程和技術(shù)。全稱為“信息存儲與檢索〞。

狹義的信息檢索:指該過程的后半局部,即從信息集合中找出所需要的信息的過程,相當(dāng)于人們通常所說的信息查尋。人們多用“文獻檢索〞的概念,強調(diào)了檢索對象?!捕承畔z索的類型1、按檢索內(nèi)容劃分:文獻檢索、數(shù)據(jù)檢索、事實檢索2、按信息檢索手段劃為:手工檢索、計算機檢索3、按信息組織方式劃分:全文檢索、超文本檢索、超媒體檢索第四節(jié)信息檢索原理將文獻檢索標識與文獻存貯標識進展類比,二者假設(shè)取得一致〔即二者匹配〕,就可將文獻庫中符合檢索提問要求的文獻取出來。信息檢索的原理簡而言之檢索標識存貯標識匹配檢索命中將文獻檢索標識與文獻存貯標識進展類比,二者假設(shè)取得一致〔即二者匹配〕,就可將文獻庫中符合檢索提問要求的文獻取出來。原始文獻加工整理數(shù)據(jù)庫提問檢索輸出存儲檢索檢索過程分析檢索者檢索系統(tǒng)信息源〔大量信息〕充分標注〔檢索語言〕可檢索〔檢索技術(shù)、規(guī)那么等〕可顯示〔屏幕顯示或打印〕信息之間的連接等表達需求反響結(jié)果信息檢索的本質(zhì),實際上就是信息集合與需求集合的匹配與選擇。第五節(jié)信息檢索的方法和途徑〔一〕信息檢索語言檢索語言主要有:

1、分類語言:以學(xué)科體系為根底,將各種概念按學(xué)科性質(zhì)進展分類和系統(tǒng)排列,并用分類號予以編排組織成一個完整的體系。

2、主題語言:用詞語來表達各種概念,即用標準化或未標準化語言中的名詞、名詞性詞組或短語作為主題詞,來表達各種概念,將各種概念不管其相互關(guān)系,完全按字順排列。

3

、號碼語言:按文獻代碼,如專利號、標準號、報告號等的順序排檢。?中圖法?體系構(gòu)造:根本部類〔5個〕根本大類〔22個〕1.馬列、毛澤東思想:A馬列、毛澤東思想2.哲學(xué):B哲學(xué)3.社會科學(xué):C社會科學(xué)總論;D政治、法律;E軍事;F經(jīng)濟;G文化、科學(xué)、教育、體育;H語言、文字;I文學(xué);J藝術(shù);K歷史、地理4.自然科學(xué):N自然科學(xué)總論;O數(shù)理科學(xué)和化學(xué);P天文學(xué)、地球科學(xué);Q生物科學(xué);R醫(yī)學(xué)、衛(wèi)生;S農(nóng)業(yè)科學(xué);T工業(yè)技術(shù);U交通運輸;V航空、航天;X環(huán)境科學(xué)、勞動保護科學(xué)〔平安科學(xué)〕5.綜合性圖書:Z綜合性圖書?中圖法?22大類是根底,每一大類下根據(jù)學(xué)科的具體內(nèi)容層層細分為二級、三級、四級......類目,這逐級劃分下去就形成了等級清楚的科學(xué)系統(tǒng)。如:O一級類目數(shù)、理、化O1O3O4O6O7……二級類目數(shù)學(xué)力學(xué)物理化學(xué)晶體O11O12O13……三級類目古典數(shù)學(xué)初等數(shù)學(xué)高等數(shù)學(xué)O121

O122

O123O124四級類目算術(shù)

初等代數(shù)

初等幾何

三角中圖法全稱為“中國圖書館分類法〞所有圖書按中圖法編制成相應(yīng)的索書號進展排架什么是關(guān)鍵詞直接選用文獻中的自然語言作為根本的詞匯,出現(xiàn)在文獻標題〔篇名、章節(jié)名〕、摘要和正文中,能提醒和描述文獻主題內(nèi)容具有實質(zhì)意義的的那些詞語,且不加標準化處理?!捕澄墨I信息檢索方法常用法回溯法循環(huán)法常用法〔又稱工具法〕1.順查法:由遠及近,從后向前。如:某研究課題的最初產(chǎn)生年代〔1990〕了解開展過程從最初的年代〔1990〕開場,逐步往近期查2.倒查法:由近及遠,從前向后。一般查1-5年,重點:在近期文獻,只要查到根本滿足需要為止。3.抽查法:是抓住某學(xué)科開展迅速,研究成果發(fā)表較多的時期,進展重點檢索。前提:熟悉學(xué)科開展特點。指直接利用檢索工具〔系統(tǒng)〕檢索文獻信息的方法,這是文獻檢索中最常用的一種方法。回溯法〔引文法〕回溯法是指不利用一般的檢索工具,而是利用已經(jīng)掌握的文獻末尾所列的參考文獻,進展逐一地回溯查找“引文〞的一種最簡便的擴大情報來源的方法。它還可以從查到的“引文〞中再回溯查找“引文〞,像滾雪球一樣,依據(jù)文獻間的引用關(guān)系,獲得越來越多的內(nèi)容相關(guān)文獻。優(yōu)點:在沒有檢索工具或檢索工具不全的情況下能借助一些引文索引,述評或?qū)V膮⒖嘉墨I查找。缺點:查得的文獻不全面,比較陳舊。循環(huán)法〔又稱為分段法〕它是把上述兩種方法加以綜合運用的方法,既要利用檢索工具進展常規(guī)檢索,又要利用文獻后所附參考文獻進展回溯檢索,分期分段地交替使用這兩種方法?!踩澄墨I信息檢索途徑分類途徑主題途徑著者途徑其他途徑1.分類途徑

分類途徑是指按照文獻資料所屬學(xué)科〔專業(yè)〕類別進展檢索的途徑,它所依據(jù)的是檢索工具中的分類索引。分類途徑檢索文獻關(guān)鍵在于正確理解檢索工具的分類表,將待查工程劃分到相應(yīng)的類目中去。2.主題途徑主題途徑是指通過文獻資料的內(nèi)容主題進展檢索的途徑,它依據(jù)的是各種主題索引或關(guān)鍵詞索引,檢索者只要根據(jù)工程確定檢索詞〔主題詞或關(guān)鍵詞〕,便可以實施檢索。主題途徑檢索文獻關(guān)鍵在于分析工程、提煉主題概念,運用詞語來表達主題概念。主題途徑是一種主要的檢索途徑。3.著者途徑著者途徑是指根據(jù)文獻著者來查找文獻的途徑,它依據(jù)的是著者索引,包括個人著者索引和機關(guān)團體索引。4.其他途徑其他途徑包括利用檢索工具的各種專用索引來檢索的途徑。專用索引的種類很多,常見的有各種號碼索引〔如專利號、入藏號、報告號等〕,專用符號代碼索引〔如元素符號、分子式、構(gòu)造式等〕,專用名詞術(shù)語索引〔如地名、機構(gòu)名、商品名、生物屬名等〕。課堂討論題:找一些有關(guān)翻譯技巧的書刊,用館藏查詢的哪些途徑可以獲得?〔四〕文獻信息檢索步驟文獻信息檢索是根據(jù)課題的要求,利用檢索工具,按照一定的步驟和方法查找文獻信息的過程。完成這個過程一般需要經(jīng)過五個根本步驟:

1、分析課題與確定檢索要求2、選擇檢索方式與檢索工具3、確定檢索途徑與方法4、優(yōu)化檢索提問與策略5、整理檢索結(jié)果6、獲取原文第六節(jié)信息檢索常用技術(shù)及檢索效果評價一、信息檢索常用技術(shù)布爾邏輯檢索截詞檢索位置檢索字段限制檢索1、布爾邏輯檢索在計算機文獻檢索中,用戶的檢索需求是通過檢索提問式表達的,用邏輯算符將檢索詞組配構(gòu)成檢索提問式,計算機將根據(jù)提問式與系統(tǒng)中的記錄進展匹配,當(dāng)兩者相符時那么命中,并自動輸出該文獻記錄。布爾邏輯運算符:系統(tǒng)中采用的邏輯組配算符是布爾代數(shù)中的邏輯運算符AND/*〔與〕、OR/+〔或〕、NOT/—〔非〕?!?〕AND或*算符實現(xiàn)邏輯“與〞組配檢索時,命中信息同時含有兩個概念,專指性強。如:traffic

AND

control〔2〕OR或+算符實現(xiàn)邏輯“或〞組配〔3〕NOT或–算符實現(xiàn)邏輯“非〞組配檢索時,命中信息包含所有關(guān)于邏輯A或邏輯B或同時有A和B的,檢索范圍比AND擴大。如:

railway

OR

railroad命中信息包含邏輯A、不包含邏輯B或同時有A和B的,排除了不需要的檢索詞。如:fruit

NOT

apple

布爾邏輯算符優(yōu)先順序執(zhí)行優(yōu)先順序通常是:NOT>AND>OR。優(yōu)先處理算符---“〔〕〞。與布爾邏輯算符搭配使用調(diào)整邏輯運算符的運算順序,使某些算符優(yōu)先進展邏輯匹配。課堂討論題:試分析以下檢索內(nèi)容,利用布爾邏輯算符,構(gòu)建出相關(guān)的檢索式1、檢索數(shù)控機床的產(chǎn)品信息的相關(guān)文獻2、檢索計算機算法或計算機程序語言的相關(guān)文獻3、檢索除因特網(wǎng)之外的計算機相關(guān)文獻4、檢索工業(yè)模具設(shè)計與制造的相關(guān)文獻2、截詞檢索截詞是指將檢索詞在適當(dāng)?shù)牡胤浇財?,截詞檢索是用截斷詞的一個局部進展的檢索,但凡滿足這個截詞所有字符(串)的記錄,系統(tǒng)都為命中。截詞檢索主要是利用檢索詞的詞干或不完整的詞形進展檢索。截詞檢索在西文數(shù)據(jù)庫中廣泛使用。是在詞干后可能變化的位置加上截詞符號。檢索詞的單復(fù)數(shù)形式,同一詞英、美不同拼法,詞根一樣的詞都可用截詞檢索。這樣既可減少檢索詞的輸入量,又可擴大查找范圍,提高查全率。按截詞位置分:前截斷、后截斷、中間截斷、左右截斷;按截詞的字符數(shù)量分:有限截詞、無限截詞?!埃卡?、“*〞表示截詞的截斷符號,各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標準。①前截斷在檢索字符串前方〔左方〕截斷有限或無限的字母。如:輸入*chemistry可檢出:microchemistry〔微量化學(xué)〕 macrochemistry〔常量化學(xué)〕 abiochemistry(無機化學(xué))iatrochemistry〔化學(xué)療法〕……這種方法可以省略輸入各種詞頭有變化的檢索詞的麻煩。②后截斷在檢索字符串后〔右方〕截斷有限或無限的字母。如:librar*library,librarian,libraries……這種方法可以省略輸入各種詞尾有變化的檢索詞的麻煩。

主要用于

單復(fù)數(shù)檢索〔如Econom*:Economy,Economics,Economical……〕

詞根檢索〔buil*:building,built……〕

年代檢索〔199*:1990,1991……1999〕

等③中間截斷在檢索詞中間嵌入截斷符號,允許檢索詞中間有假設(shè)干形式的變化。如:輸入wom*n可檢出:woman,women輸入defen*e可檢出:defence(防衛(wèi)),defense……主要解決一些英美拼寫不同,單復(fù)數(shù)形式不同的詞的輸入。④左右截斷將檢索詞左右詞頭、詞尾局部同時截斷,檢索詞中間一致。如:輸入*biolog*可檢出:neurobiology〔神經(jīng)生物學(xué)〕neurobiologistmicrobiology〔微生物學(xué)〕microbiologist……適用于廣泛課題的資料檢索⑤有限截詞對詞干以外可以出現(xiàn)的字母數(shù)量進展限定。如:輸入computer??表示截斷處有0-2個字母變化,可檢出:computer,computers,……輸入stud???表示截斷處有0-3個字母變化,可檢出:study,studies,studied,student,……⑥無限截詞不限制被截斷的字符數(shù)量。在檢索詞后加一個“*〞,表示該詞后可加任意個字符。如:輸入educat*可檢出educate,educator,educators,educated,educating,education,……注意:使用無限截詞,所截詞根不能太短,否那么會輸出許多無關(guān)文獻,造成誤檢。

3、位置檢索通過位置運算符來規(guī)定和限制檢索詞之間的相對位置,彌補布爾邏輯運算符構(gòu)造某些提問式的缺乏,表達復(fù)雜專深的概念,從而提高檢索的專指度。位置算符通常只出現(xiàn)在英文數(shù)據(jù)庫中,多用于全文檢索。Dialog等一些大型檢索系統(tǒng)才支持位置算符。在檢索提問式中同時出現(xiàn)位置算符和邏輯算符時,執(zhí)行的先后順序為:先位置算符,后邏輯算符注:不同的機檢系統(tǒng),位置算符的功能及算符不同,也有的檢索系統(tǒng)不支持位置運算符,檢索之前應(yīng)該先看看數(shù)據(jù)庫的幫助信息。字段算符

F、L位置檢索相鄰位置算符

W、nW;

N、nN句子位置算符

S①相鄰位置算符:

WnW

W:with的縮寫 兩詞相鄰,詞序不變,中間不可插詞,但兩詞之間可有一個標點、連字符或空格。例:輸入CD(W)ROM將命中CDROM或CD-ROM

輸入solar(W)energy檢出solarenergynWnW:nword的縮寫

兩詞之間允許插入0-n個詞,詞序不變。例:communication(2W)satellite將檢索出含有communicationsatellite、communicationviasatellite、communicationonthesatellite的記錄NnNN:near的縮寫兩詞中間不可插詞〔但兩詞間可有一個標點,連字符或空格〕,允許詞序發(fā)生顛倒。例:輸入cross(N)section可檢出crosssection和sectioncross

nN:nnear的縮寫兩詞中間可插0~n個詞(兩詞間可有一個標點,連字符或空格),允許詞序發(fā)生顛倒。

例:輸入cotton(2N)processing可檢出cottonprocessing、processingofcotton、processingofEgyptiancotton②字段算符:F

F:field的縮寫兩詞必須出現(xiàn)在同一字段中(如篇名、文摘、敘詞等),詞序與詞量不限制。

如:輸入pollution(F)control

/AB檢出的結(jié)果中pollution和control同時出現(xiàn)在文摘(abstract)字段中

③句子位置算符:SS:Sentence的縮寫兩詞必須出現(xiàn)在同一句子或子字段中,詞序與插入詞量不受限制。

如:輸入computer(W)control(S)system可檢出文摘中含有“Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystemfortestinginnerwallsofpipes.〞這樣一句話的文獻記錄。

短語檢索字段檢索4、限制檢索①短語檢索將檢索詞用雙引號〞〞括起作為一個獨立運算單元,進展嚴格匹配,以提高檢索準確度。例:〞GlobalPositioningSystem〞(GPS,全球定位系統(tǒng))

只檢索出規(guī)定字段中包含完整詞組的記錄。②字段檢索為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現(xiàn)的字段,以提高檢索速度和查準率。如:riceinti〔表示只在題目字段中查找文獻〕

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論