第一講:信息檢索基礎(chǔ)_第1頁
第一講:信息檢索基礎(chǔ)_第2頁
第一講:信息檢索基礎(chǔ)_第3頁
第一講:信息檢索基礎(chǔ)_第4頁
第一講:信息檢索基礎(chǔ)_第5頁
已閱讀5頁,還剩110頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2014-03信息檢索與利用殷麗,QQ群:274827141《信息檢索與利用》

課程說明

2014.3本學(xué)期課程情況——學(xué)時(shí)學(xué)分1學(xué)分6周(3-9周),24學(xué)時(shí)(1學(xué)時(shí)=50分鐘)14學(xué)時(shí)6次課8學(xué)時(shí)上機(jī)考試時(shí)間4月15日中午課程情況——考核方式上機(jī)考試(一般1小時(shí))上機(jī)作業(yè)、大作業(yè)

20

平時(shí)成績(課堂作業(yè)、考勤等)10民族特招生成績給定根據(jù)相關(guān)文件,平時(shí)成績占50%70%30%課程情況——學(xué)生選課和退選試聽2次,第2周前可補(bǔ)選和退選補(bǔ)選:學(xué)生到學(xué)院或教務(wù)處申請(qǐng)退選:建議去學(xué)院處理,如名單未取消按缺考處理注意事項(xiàng)ftp賬戶/(右擊)登陸名和密碼nuaayinli

課件下載作業(yè)上傳上機(jī)和考試安排等/eol(和教務(wù)處密碼相同)請(qǐng)各班登記負(fù)責(zé)人姓名、電話7課程主要內(nèi)容第一講信息檢索概論第二講檢索語言與檢索技術(shù)第三講中文數(shù)據(jù)庫檢索與通用技巧第四講外文數(shù)據(jù)庫與網(wǎng)絡(luò)信息資源檢索第五講搜索引擎的使用第六講信息資源綜合利用與論文寫作我們的信息環(huán)境1、每個(gè)月GOOGLE發(fā)生超過27億次的查詢2、人們每天發(fā)送和接收的短信超過全球總?cè)丝?70.6億)目前每天大約出版3000本新書據(jù)統(tǒng)計(jì),一周泰晤士報(bào)的信息量,相當(dāng)于18世界一個(gè)普通人一生所獲得的信息量對(duì)于目前一個(gè)四年制的大學(xué)生來說,他們在第一年所學(xué)的東西,有一半在第三年就過時(shí)了職業(yè)發(fā)展變化現(xiàn)在十大高熱門的行業(yè),十年前還不存在:1、同聲傳譯,年薪30-40W2、3G工程師,年薪15-20W3、網(wǎng)絡(luò)媒體人才,10-12W4、物流師,10W5、系統(tǒng)集成工程師,10-20W6、環(huán)境工程師,8-10W7、精算師,12-15W8、報(bào)關(guān)員,10W9、中西醫(yī)師/醫(yī)藥銷售,6W10、注冊會(huì)計(jì)師,10W21世紀(jì)中國大學(xué)畢業(yè)生就業(yè)情況研究信息對(duì)人們的職業(yè)發(fā)展具有不可估量的價(jià)值,它是現(xiàn)代社會(huì)個(gè)人或組織賴以生存的基礎(chǔ)性資源,信息不僅是知識(shí)的載體,也是機(jī)遇的化身。信息隱含著許多機(jī)遇信號(hào),職業(yè)人員要想謀取理想的職業(yè)崗位,充分發(fā)揮職業(yè)才能,不僅取決于學(xué)識(shí)技術(shù)能力和社會(huì)經(jīng)濟(jì)需求等因素,也取決于求職者能否掌握足夠的職業(yè)信息。文獻(xiàn)檢索需要解決的問題……如何從信息的海洋中獲取我需要的知識(shí)?我們被信息的海洋包圍著,但是卻被知識(shí)餓死了!

素質(zhì)教育評(píng)價(jià)21世紀(jì)學(xué)生能力素養(yǎng)評(píng)價(jià)的五個(gè)方面:

基本學(xué)習(xí)技能(指讀、寫、算)

信息素養(yǎng)創(chuàng)新思維能力人際交往與合作精神實(shí)踐能力

——美國教育技術(shù)CEO論壇2001年第4季度報(bào)告信息素養(yǎng)信息素養(yǎng)包括:信息知識(shí)信息意識(shí)信息能力信息道德信息素養(yǎng)是一個(gè)內(nèi)容豐富的概念,他不僅包括利用信息工具和信息資源的能力,還包括選擇、獲取、識(shí)別信息,加工、處理、傳遞信息并創(chuàng)造信息的能力。信息道德定義:是指信息創(chuàng)造者、信息服務(wù)者、信息使用者在信息活動(dòng)中普遍認(rèn)同和共同遵守的符合社會(huì)一般要求的行為和倫理規(guī)范。當(dāng)人類進(jìn)入到信息社會(huì),特別是隨著以網(wǎng)絡(luò)為核心的信息技術(shù)的快速發(fā)展和普及以及信息資源的不斷擴(kuò)張,信息道德問題日益加劇,并成為阻礙社會(huì)健康發(fā)展的嚴(yán)重問題信息道德缺失的表現(xiàn)1、有意造成網(wǎng)絡(luò)交通混亂或擅自闖入網(wǎng)絡(luò)及其相連的系統(tǒng)2、商業(yè)性或欺騙性的利用大學(xué)計(jì)算機(jī)資源3、盜竊資料、設(shè)備或智力成果4、未經(jīng)許可查看他人文件5、在公共場合作出引起混亂或造成破壞的行為6、偽造電子郵件信息7、虛假醫(yī)療信息、虛假新聞信息8、……信息素養(yǎng)的特點(diǎn)1、信息素養(yǎng)具有知識(shí)性2、信息素養(yǎng)具有技能性3、信息素養(yǎng)具有創(chuàng)新性4、信息素養(yǎng)具有普及性5、信息素養(yǎng)具有操作性信息素養(yǎng)的評(píng)價(jià)標(biāo)準(zhǔn)1、識(shí)別信息需求,知道完整和準(zhǔn)確的信息是制定明智決策的基礎(chǔ)2、在信息需求的基礎(chǔ)上系統(tǒng)的提出問題的能力3、識(shí)別潛在信息源并制定成功檢索策略的能力4、檢索信息源的能力5、評(píng)價(jià)信息和信息源的能力6、為實(shí)際應(yīng)用組織信息,將信息整合到現(xiàn)有的知識(shí)體系中,并以最恰當(dāng)?shù)姆椒▊鬟f和交流的能力7、批判性的利用信息并解決問題的能力Page

22一、信息檢索的重要性(一)信息檢索可以避免重復(fù)研究、走彎路(二)信息檢索可以節(jié)省研究人員的時(shí)間和精力(三)信息檢索是獲取新知識(shí)的捷徑二、需要用到信息檢索的地方:完成課程作業(yè)、畢業(yè)設(shè)計(jì)科研論文寫作申請(qǐng)科研項(xiàng)目提出系統(tǒng)開發(fā)方案完成創(chuàng)業(yè)計(jì)劃書、風(fēng)險(xiǎn)投資計(jì)劃書提交開發(fā)項(xiàng)目企劃書……占有資料,掌握信息,提出方案第一講信息檢索概論一、信息相關(guān)概念二、信息檢索概念與原理三、信息源四、信息檢索途徑和方法五、信息檢索步驟六、信息檢索語言七、著錄信息識(shí)別

一、信息以及與信息相關(guān)的幾個(gè)概念1、信息的概念概念有很多,但至今沒有一個(gè)統(tǒng)一的概念廣義的信息:客觀世界中各種事物的存在方式和他們的運(yùn)動(dòng)狀態(tài)的反映狹義的信息:反映事物存在和運(yùn)動(dòng)的差異,能為某種目的帶來有用的、可以被理解的或被接受的消息和情況等信息的定義申農(nóng):信息是用來減少隨機(jī)不定性的東西。維納:信息是人們在適應(yīng)外部世界,并使這種適應(yīng)反作用于外部世界的過程中,同外部世界進(jìn)行互相交流的內(nèi)容的名稱?,F(xiàn)代通訊理論--信息論的創(chuàng)始人、影響人類社會(huì)進(jìn)程的科學(xué)家

美國數(shù)學(xué)家,控制論的創(chuàng)始人

自然信息:湖光山色風(fēng)云雷電生物信息:鳥語花香體溫升降社會(huì)信息:語言、文字、圖形符號(hào)機(jī)電信息:脈沖信號(hào)無線電波人類認(rèn)識(shí)世界的過程,實(shí)際上就是不斷從外界獲取信息、加工信息和傳遞信息的過程。信息、能源、材料被視為社會(huì)經(jīng)濟(jì)發(fā)展的三大支柱,是促進(jìn)社會(huì)經(jīng)濟(jì)發(fā)展的重要戰(zhàn)略資源。信息的基本屬性:普遍性和客觀性時(shí)效性中介性共享性知識(shí)知識(shí)是人們對(duì)客觀事物存在和運(yùn)動(dòng)規(guī)律的認(rèn)識(shí)。知識(shí)是建立在信息的基礎(chǔ)上經(jīng)過加工而形成的,是系統(tǒng)化、理論化的信息。

信息是知識(shí)的源泉和基礎(chǔ),知識(shí)是信息的升華?!掇o海》:信息對(duì)消息接受者來說是指預(yù)先不知道的報(bào)道。

知識(shí)的類型:“知事(Know-what)”“知因(Know-why)”“知道怎樣做的知識(shí)(Know-how)”“知道誰能提供知識(shí)(Know-who)”情報(bào)情報(bào)是特定對(duì)象為特定目的而搜集的有使用價(jià)值的知識(shí)或信息。知識(shí)性與信息性實(shí)用性:為了獲取實(shí)際效益或解決特定的問題。傳遞性:只有在傳遞、交流、運(yùn)動(dòng)過程中活化了的知識(shí)與信息才能成為情報(bào)。它是情報(bào)的本質(zhì)特征,情報(bào)傳遞效果直接影響其使用時(shí)效性:特定的情報(bào)只有在合適的時(shí)間內(nèi)傳遞和利用才會(huì)產(chǎn)生更大的效用。過時(shí)的情報(bào)就會(huì)成為失效情報(bào)。針對(duì)性:情報(bào)是針對(duì)特定用戶、特定需求提供的有使用價(jià)值的知識(shí)與信息,具有很強(qiáng)的針對(duì)性。文獻(xiàn)

凡屬于人類的知識(shí),用文字、圖形、符號(hào)、聲頻、視頻等手段記錄保存下來,并用以交流傳播的一切物質(zhì)形態(tài)的載體都統(tǒng)稱為“文獻(xiàn)”。

一切記錄有知識(shí)的載體。三要素:知識(shí):文獻(xiàn)的實(shí)質(zhì)內(nèi)容載體:文獻(xiàn)的外在形態(tài),如甲骨、青銅器、紙介型、膠片,磁帶,磁盤,光盤等記錄:將兩者聯(lián)系起來的重要手段知識(shí)、文獻(xiàn)、創(chuàng)新的知識(shí)的關(guān)系

知識(shí)文獻(xiàn)

創(chuàng)新的知識(shí)記錄傳遞應(yīng)用信息、知識(shí)、情報(bào)、文獻(xiàn)之間的關(guān)系圖知識(shí):是人類認(rèn)識(shí)世界的成果和結(jié)晶情報(bào):能為我們所用的知識(shí)和信息文獻(xiàn):記錄有知識(shí)的一切載體信息知識(shí)文獻(xiàn)情報(bào)二、信息檢索概念與原理信息檢索(InformationRetrieval):就是將信息(文獻(xiàn)信息)按一定的方式組織、存貯起來,并針對(duì)用戶的需要找出所需信息的過程。因此從廣義上講,信息檢索包含了信息的存貯和檢索兩個(gè)部分。信息檢索的類型文獻(xiàn)檢索:查找出用戶所需文獻(xiàn)的線索或原文的檢索。數(shù)據(jù)檢索:查找出用戶所需特定數(shù)據(jù)的檢索。事實(shí)檢索:以特定的事實(shí)為檢索對(duì)象的一種檢索。信息檢索原理三、信息源按文獻(xiàn)載體形式劃分按文獻(xiàn)信息加工深度劃分按出版形式劃分非文獻(xiàn)信息源1.按載體形態(tài)劃分:印刷型、縮微型、視聽型、電子型2.按加工級(jí)次劃分:一次文獻(xiàn)、二次文獻(xiàn)、三次文獻(xiàn)、零次文獻(xiàn)3.按出版形式分:圖書、期刊、報(bào)紙、科技報(bào)告、會(huì)議文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn),學(xué)位論文等。非文獻(xiàn)信息源:實(shí)物信息源,口頭信息源1、按文獻(xiàn)載體形態(tài)分類印刷型:也稱為紙介型(paper-based),傳統(tǒng)的文獻(xiàn)形式缺點(diǎn):存貯密度低,體積龐大,加上紙張的化學(xué)、物理特性,難于收藏保存。

縮微型(microform)以感光材料為載體的文獻(xiàn)記錄形式,有縮微膠片,縮微平片等.優(yōu)點(diǎn):體積小、存貯密度高,便于傳遞、保存可節(jié)省書庫面積達(dá)90%以上。缺點(diǎn):不能直接閱讀,必須借助閱讀機(jī)。

聲象(視聽)型(audio-visualform)

通過特定設(shè)備,將信息表現(xiàn)為聲音、圖像、影視及動(dòng)畫(sound,image,video&animation)等形式。

優(yōu)點(diǎn):直觀、形象電子型(electronicform)通過計(jì)算機(jī)對(duì)電子信息進(jìn)行存取處理。電子信息存于磁盤、磁帶或光盤等媒體中電子出版物,如電子圖書期刊,各種聯(lián)機(jī)信息庫,光盤數(shù)據(jù)庫,電子郵件等。2、按加工的深度分類:

一次文獻(xiàn)(原始文獻(xiàn)):指一切以本人的研究成果為基本素材而創(chuàng)作(或撰寫)的原始文獻(xiàn),是信息檢索的主要對(duì)象。

二次文獻(xiàn):(參考性文獻(xiàn))

對(duì)一次文獻(xiàn)進(jìn)行加工,歸納,簡化,將其組織成為系統(tǒng)的、便于查找的資料,也就是目錄,題錄,文摘,索引等檢索工具,以提供一次文獻(xiàn)的線索。三次文獻(xiàn)(工具書):

根據(jù)一定的需要與目的對(duì)一次文獻(xiàn)和二次文獻(xiàn)進(jìn)行綜合濃縮,提煉出來的成果,如百科全書詞典、年鑒、手冊等工具書。零次文獻(xiàn)(手稿)指未以公開形式進(jìn)入社會(huì)流通使用的實(shí)驗(yàn)記錄、會(huì)議記錄、論文草稿、文章草稿、未經(jīng)發(fā)表的名人手跡等。文獻(xiàn)結(jié)構(gòu)示意圖書目題錄索引文摘詞典名錄指南手冊年鑒綜述評(píng)述論文叢集百科全書二次文獻(xiàn)原始文獻(xiàn)(一次文獻(xiàn))三次文獻(xiàn)3、文獻(xiàn)信息源類型(出版形式劃分)1.圖書2.期刊3.報(bào)紙4.專利文獻(xiàn)5.標(biāo)準(zhǔn)文獻(xiàn)6.會(huì)議文獻(xiàn)7.學(xué)位論文8.科技報(bào)告9.技術(shù)文獻(xiàn)10.產(chǎn)品資料多種信息源的載體:

A網(wǎng)絡(luò)信息源

B數(shù)據(jù)庫四、信息檢索途徑和方法信息檢索途徑1.外表特征:題名途徑、責(zé)任者途徑、號(hào)碼途徑;2.內(nèi)容特征:分類途徑、主題途徑信息檢索方法順查法、倒查法、抽查法、引文法、綜合法(P22)五、信息檢索步驟1.分析檢索課題確定最終要獲得文獻(xiàn)源的相關(guān)信息出版形式(文獻(xiàn)類型)、文獻(xiàn)語種、年代范圍等。歸納特征線索2.選擇檢索工具檢索工具選擇恰當(dāng)與否,直接影響檢索結(jié)果。根據(jù)具體情況,要考慮以下因素:檢索工具報(bào)道文獻(xiàn)的學(xué)科專業(yè)范圍報(bào)道的文獻(xiàn)類型收錄文獻(xiàn)的語種提供的檢索途徑3.確定檢索途徑在利用檢索工具查找文獻(xiàn)時(shí),主要是利用檢索工具的各種索引,即通過各種檢索途徑來查找文獻(xiàn)線索。4.選擇檢索方法追溯法:利用文獻(xiàn)末尾所附的參考文獻(xiàn)線索進(jìn)行追溯查找的方法。工具法:利用各種檢索工具來查找文獻(xiàn)信息的方法。它又可分為順查法、倒查法和抽查法。綜合法:是前兩種方法的相互結(jié)合。5.優(yōu)化檢索策略依檢索結(jié)果的滿意度進(jìn)行調(diào)整。6.索取原始文獻(xiàn)根據(jù)文獻(xiàn)線索,查閱各種館藏目錄或聯(lián)合目錄、數(shù)據(jù)庫、搜索引擎等,去獲得文獻(xiàn)原文。六、信息檢索語言1、信息檢索語言概念信息檢索語言是用來描述文獻(xiàn)特征和表達(dá)信息提問,溝通信息存貯人員和信息檢索者雙方思想的一種人工語言。信息存貯過程——檢索標(biāo)識(shí)信息檢索過程——提問標(biāo)識(shí)。作用1、保證不同標(biāo)引人員表征文獻(xiàn)信息的一致性。2、使內(nèi)容相同及相關(guān)的文獻(xiàn)集中化。3、保證檢索提問與文獻(xiàn)信息標(biāo)引的一致性。4、保證檢索者按不同需求檢索文獻(xiàn)信息時(shí),都能獲得最高的查全率和查準(zhǔn)率。信息檢索語言類型示意圖信息檢索語言描寫文獻(xiàn)外部特征描寫文獻(xiàn)內(nèi)容特征分類語言體系分類語言組配分類語言混合分類語言題名語言著者語言號(hào)碼語言主題語言單元詞語言標(biāo)題詞語言關(guān)鍵詞語言敘詞語言按文獻(xiàn)出版特征外表特征語言書名/刊名著者/團(tuán)體著者出版事項(xiàng)出版日期出版者名稱編號(hào)引文內(nèi)容特征語言分類語言

各種分類法主題語言

敘詞標(biāo)題詞關(guān)鍵詞代碼語言分子式結(jié)構(gòu)式一)分類檢索語言分類檢索語言是指用分類號(hào)表達(dá)各種概念,并將各種概念以學(xué)科性質(zhì)為主加以劃分和系統(tǒng)排列的檢索語言。按編制方式可分為體系分類語言和組配分類語言,目前信息檢索采用的大多為體系分類語言。

體系分類語言是以科學(xué)分類為基礎(chǔ),運(yùn)用概念劃分的方法,把具有某種或某些共同屬性的事物集合劃分為一類,用概括該類事物所共有的本質(zhì)屬性的概念作為類目,并給出相應(yīng)的標(biāo)記符號(hào)作為分類號(hào)。體系分類語言集中體現(xiàn)了學(xué)科的系統(tǒng)性,反映事物的從屬、派生關(guān)系,從上至下、從總體到局部層層劃分、展開。國內(nèi)

《中國圖書館分類法》[中圖法]

《中國科學(xué)院圖書館圖書分類法》[科圖法]

《中國人民大學(xué)圖書館圖書分類法》[人大法]

《中國圖書分類法》臺(tái)灣賴永祥編訂國外

《杜威十進(jìn)分類法》[DDC]

《國會(huì)圖書館分類法》[LCC]《中圖法》采用“五分法”形成五大部類。依據(jù):首先是毛澤東關(guān)于知識(shí)分類的論述,即世界上的知識(shí)只有自然科學(xué)、社會(huì)科學(xué)和哲學(xué)三大部類;其次強(qiáng)調(diào)馬列主義的指導(dǎo)作用,將馬列主義、毛澤東思想經(jīng)典作家的著作及相關(guān)文獻(xiàn)獨(dú)立為一個(gè)基本部類;最后是由于文獻(xiàn)的特殊性,即存在一些內(nèi)容龐雜,無法具體歸入某一學(xué)科的文獻(xiàn),將其概括為“綜合性圖書”作為一個(gè)部類。在五大部類之下,層層細(xì)分,劃分出22個(gè)基本大類,分別為:見課本27頁索書號(hào)=分類號(hào)/種次號(hào)TN14/1005,TP303/1009,A81/1010,B848/1561,F712.4/1150,G0/1007分類語言優(yōu)點(diǎn)(1)分類語言是以學(xué)科劃分類目,符合人們認(rèn)識(shí)事物的規(guī)律和處理事物的習(xí)慣,容易被人們掌握和應(yīng)用。(2分類語言強(qiáng)調(diào)知識(shí)的系統(tǒng)性,方便人們按學(xué)科、專業(yè)系統(tǒng)檢索有關(guān)文獻(xiàn)資料,能夠達(dá)到族性檢索,可以獲得較高的查全率。(3)便于組織圖書館資料排架。分類語言的不足之處(1)檢索信息時(shí)首先必須了解課題的學(xué)科體系才能順利查找到相應(yīng)的類目,如果不熟悉學(xué)科體系,會(huì)有一定難度。(2)分類語言采用盡量列舉類目的方法,但受到類目數(shù)量的限制,缺乏專指性,查準(zhǔn)率不高。(3)由于分類表的結(jié)構(gòu)是固定的,不便于隨時(shí)修訂和增設(shè)新的類目。它總是落后于科學(xué)技術(shù)的發(fā)展,難于及時(shí)反映新興學(xué)科和邊緣學(xué)科的內(nèi)容。(4)分類語言采用分類號(hào)作為檢索標(biāo)識(shí),檢索文獻(xiàn)時(shí),需要將檢索文獻(xiàn)的主題內(nèi)容轉(zhuǎn)換成分類號(hào),轉(zhuǎn)換過程中,容易產(chǎn)生誤差,造成誤檢。①不適用于特性檢索,查準(zhǔn)率比主題詞低【實(shí)例】

多功能昆蟲鳴聲信號(hào)采集和分析系統(tǒng)及其在褐飛虱鳴聲研究中的應(yīng)用?【題解】

這類課題僅僅采用分類號(hào)無法準(zhǔn)確表達(dá)課題,用分類號(hào)只能粗略表達(dá),并且分到兩個(gè)類目,不易歸類,適宜用主題途徑檢索?!娟P(guān)鍵詞】:昆蟲insect鳴聲信號(hào)acousticsignal信號(hào)采集signalacquisition信號(hào)分析signalanalysis褐飛虱brownplanthopper水稻rice害蟲pest②不能適應(yīng)學(xué)科發(fā)展中的變化,難以反映新學(xué)科和新名詞術(shù)語【實(shí)例】食品風(fēng)險(xiǎn)分析風(fēng)險(xiǎn)分析的目標(biāo)在于保護(hù)消費(fèi)者的健康和促進(jìn)公平的食品貿(mào)易,在分類上暫時(shí)歸入[R155.5]食品衛(wèi)生與檢驗(yàn)和[TS201.6]食品安全與衛(wèi)生。沒有一個(gè)專門的“食品風(fēng)險(xiǎn)分析”分類號(hào)。③人的認(rèn)識(shí)不統(tǒng)一,往往造成分類不一致及排檢錯(cuò)誤,不易反映交叉學(xué)科。【實(shí)例】管理心理學(xué)心理學(xué)的一個(gè)分支,主要是研究企業(yè)中人的心理活動(dòng)規(guī)律,用科學(xué)的方法改進(jìn)管理工作,充分調(diào)動(dòng)人的積極性的一門學(xué)科。但是,人們很可能誤解為歸入管理學(xué)?!緦?shí)例】《新世紀(jì)英漢計(jì)算機(jī)詞典》如何歸類?一般讀者不知道分入計(jì)算機(jī)類TP3還是英語類H31。實(shí)際歸入計(jì)算機(jī)類TP3-61/19。二)主題檢索語言主題:論述的對(duì)象和研究的問題定義:以文獻(xiàn)信息內(nèi)容特征和科學(xué)概念的詞語為檢索標(biāo)識(shí),并按字順組織起來的一種檢索語言。直觀、專指性強(qiáng)、使用靈活、適合計(jì)算機(jī)檢索,使用最為頻繁。在現(xiàn)階段,按照選詞方式劃分,主要有標(biāo)題詞語言、單元詞語言、敘詞語特點(diǎn):直接用詞語來表達(dá)各種概念。它以詞匯規(guī)范化為基礎(chǔ),通過概念組配用以表達(dá)任何專指概念。直指性強(qiáng),專指度高,便于特性組配檢索。不必從知識(shí)體系的角度去判斷所需文獻(xiàn)屬于什么學(xué)科,只要根據(jù)課題研究對(duì)象、直接使用表征文獻(xiàn)內(nèi)容的主題詞查詢同一篇文獻(xiàn)可用多個(gè)主題詞標(biāo)引,擴(kuò)大了檢索途徑。

主題法檢索優(yōu)點(diǎn)使檢索具有直接性與直觀性;適合于從事物出發(fā)按專題進(jìn)行特性檢索缺點(diǎn):缺乏按學(xué)科進(jìn)行族性檢索的能力;缺乏表述專指度較高的復(fù)雜概念的能力;72敘詞語言:最有代表性的主題語言,由規(guī)范化的概念及其指代關(guān)系組成。敘詞表常用主題語言標(biāo)題詞語言:題目、摘要、原文中出現(xiàn)的,對(duì)表述文獻(xiàn)主題內(nèi)容有實(shí)質(zhì)意義的詞匯,是未經(jīng)規(guī)范化的自然語言詞匯。主題語言標(biāo)題詞語言單元詞語言敘詞語言敘詞語言(descriptor)以敘詞作為信息單元主題標(biāo)識(shí)和檢索的主題語言敘詞又稱描述詞或敘述詞,是指從信息的內(nèi)容中抽出的,以概念為基礎(chǔ),經(jīng)過優(yōu)化和規(guī)范化處理并具有概念組配和詞間語義關(guān)系顯示功能,用以表達(dá)文獻(xiàn)主題和檢索需求的名詞或術(shù)語。包含多個(gè)主題的文獻(xiàn)可以用多個(gè)敘詞進(jìn)行標(biāo)引。在檢索時(shí)可由多個(gè)敘詞形成任意合乎邏輯的組配,構(gòu)成多種組合方式。如有關(guān)汽車發(fā)動(dòng)機(jī)制造方面的文獻(xiàn),可用汽車、發(fā)動(dòng)機(jī)、制造三個(gè)敘詞來標(biāo)引。敘詞的這一優(yōu)點(diǎn)很適合于計(jì)算機(jī)檢索。74敘詞表(thesaurus):由敘詞按一定的規(guī)則編制而成的詞表。它是對(duì)文獻(xiàn)進(jìn)行主題標(biāo)引的依據(jù)。1959年美國杜邦公司編制了第一部敘詞表,其后,隨著計(jì)算機(jī)的應(yīng)用,敘詞表的編制迅速發(fā)展,敘詞語言成為受控信息組織和檢索的主要語言。國內(nèi)外敘詞表的數(shù)量不下千種,我國敘詞表已超130多種常見的敘詞表:《漢語主題詞表》、《中國分類主題詞表》、《教育分類敘詞表》、英國《科學(xué)文摘》的《INSPEC敘詞表》、《EIThesaurus敘詞表》、美國《政府報(bào)告和索引》的《NTIS敘詞表》、《ASM冶金詞表》等。敘詞表成為規(guī)范各學(xué)科或某一專業(yè)領(lǐng)域名詞術(shù)語的工具概念組配是敘詞語言的基本原理。概念組配與字面組配在形式上有時(shí)相同,有時(shí)不同;而從性質(zhì)上來看兩者區(qū)別是很大的。字面組配是詞的分析與組合(拆詞);概念組配是概念的分析與綜合(拆義)。例如:

字面組配模擬+控制-->模擬控制香蕉+蘋果-->香蕉蘋果

概念組配模擬+控制-->模擬控制香蕉味食品+蘋果-->香蕉蘋果76敘詞詞表中的關(guān)聯(lián)關(guān)系

Y(用)USE指引正式主題詞

D(代)UF指引非正式主題詞

S(屬)BT指引上位主題詞

F(分)NT指引下位主題詞

C(參)RT指引相關(guān)主題詞

Z(族)CC指引族首主題詞

(最上位詞)參照系統(tǒng)揭示主題詞之間關(guān)系《漢語主題詞表》是我國第一部大型的綜合性敘詞表,1980年正式出版,主表分為社會(huì)科學(xué)、自然科學(xué)和附表3卷。全表收錄主題詞108568個(gè),非正式主題詞17410個(gè)主題詞的語義性:主題詞之間存在的含義上的相互關(guān)系(同義關(guān)系、屬分關(guān)系、相關(guān)關(guān)系)同義關(guān)系論理學(xué)02H邏輯學(xué)02H

Y

邏輯學(xué)D

論理學(xué)

(正式主題詞)(非正式主題詞)屬分關(guān)系師范學(xué)校08E

F

幼兒師范學(xué)校(下位概念)

S

專業(yè)教育(上位概念)

Z

學(xué)校(族首詞概念)相關(guān)關(guān)系標(biāo)準(zhǔn)化20.P2D(款目主題詞范疇(分類)號(hào))

C

規(guī)格化通用化系列化(相關(guān)概念)標(biāo)題詞語言(subjectheading)是主題檢索語言中最早出現(xiàn)的一種語言。標(biāo)題詞:從自然語言中選取并經(jīng)過規(guī)范化處理的、表示事物概念的的詞、詞組或短語。代表:EI中《工程主題詞表》(簡稱SHE)電腦見(see)計(jì)算機(jī)局域網(wǎng)參見(seealso)計(jì)算機(jī)網(wǎng)絡(luò)

一種先組式的規(guī)范詞語言,即在檢索前已經(jīng)將概念之間的關(guān)系組配好。具有較好的通用性、直接性和專指性,但靈活性較差。常用的標(biāo)題詞表有《美國國會(huì)標(biāo)題詞表》(LibraryofCongressSubject)、《醫(yī)學(xué)主題詞表》(MedicalSubjectHeadings)。①用同義詞標(biāo)引導(dǎo)致漏檢。如“天線”的常用英文標(biāo)引詞有“antennas”和“aerials”。若想查全避免漏檢,則需將所有表達(dá)“天線”的詞匯作為同義詞進(jìn)行檢索;②多義詞標(biāo)引導(dǎo)致誤檢。如多義詞cell既可表示“細(xì)胞”,也可表示“電池”。當(dāng)用cell一詞查找有關(guān)細(xì)胞方面的文獻(xiàn)時(shí),檢出的電池類文獻(xiàn)即為誤檢。主題途徑的優(yōu)缺點(diǎn)優(yōu)點(diǎn):適合特性檢索,查準(zhǔn)率高

例如主題詞“C語言—程序設(shè)計(jì)”就比分類號(hào)TP312表達(dá)得更準(zhǔn)缺點(diǎn):通常不適合族性檢索,查全率比分類號(hào)低。由于很規(guī)范,非專業(yè)人士難以掌握

例如圖書《C++Builder5程序設(shè)計(jì)》應(yīng)該用“C語言—程序設(shè)計(jì)”作為主題詞。檢索大學(xué)教材,“大學(xué)”不能作為主題詞,應(yīng)該用“高等學(xué)?!弊鳛橹黝}詞。非專業(yè)人士不知道哪些詞匯能作為主題詞。用自由詞在篇名、文摘甚至全文中查找信息比用主題詞更有優(yōu)越性,直接、簡明,是科技人員易為接受、較為常用的一種方法。特別適合不懂得主題詞的一般用戶。在檢索網(wǎng)絡(luò)信息時(shí)一般使用自由詞?!精@取主題詞的技巧】

在圖書的版權(quán)頁可以找到主題詞和分類號(hào)碼或者在圖書館的館藏?cái)?shù)據(jù)找到主題詞。例如查找《C++Builder5程序設(shè)計(jì)》一書的版權(quán)頁可以找到主題詞是“C語言—程序設(shè)計(jì)”等84主題詞(或規(guī)范關(guān)鍵詞)與關(guān)鍵詞的區(qū)別——主題詞是經(jīng)過規(guī)范化處理后作為文獻(xiàn)標(biāo)識(shí)的;關(guān)鍵詞則是直接使用自然語言,較少規(guī)范化處理。

關(guān)鍵詞單車、自行車、腳踏車世貿(mào)組織、世界貿(mào)易組織自然資源、天然資源土豆、馬鈴薯、洋芋儲(chǔ)藏、儲(chǔ)存、收藏、保管發(fā)動(dòng)機(jī)、馬達(dá)信息檢索、情報(bào)檢索、文獻(xiàn)檢索自行車世界貿(mào)易組織自然資源馬鈴薯儲(chǔ)藏發(fā)動(dòng)機(jī)情報(bào)檢索主題詞或規(guī)范關(guān)鍵詞主題詞與關(guān)鍵詞的區(qū)別85主題詞的選詞原則為避免使用主題詞檢索可能造成的查全率低的問題,選擇準(zhǔn)確、規(guī)范的主題詞很關(guān)鍵。應(yīng)注意下列選詞原則①選擇事物名稱或過程名稱作為主題詞。例如“蘑菇保鮮技術(shù)”,其中“蘑菇”是事物的名稱,“保鮮”則是一種處理過程,這兩個(gè)詞均適合選擇作為主題詞。②避免使用泛指性詞。如上例中的“技術(shù)”一詞即屬于泛指詞,沒有任何專指度,不適合作主題詞。③適度專指性。檢索是一般選詞的專指度越強(qiáng),查準(zhǔn)率越高。但有些過于偏窄的詞不適合作為主題詞。如果出現(xiàn)沒有檢索結(jié)果的情況,應(yīng)放寬專指度。④保證選詞的通用性信息檢索最大的問題是……….誤檢漏檢總結(jié),分類語言與主題語言的異同分類語言主題語言以學(xué)科和專業(yè)集中文獻(xiàn)能將不同學(xué)科的信息集中到一起適宜族性檢索適宜特性檢索不利于新興學(xué)科、交叉學(xué)科和邊緣學(xué)科的檢索不利于新興學(xué)科檢索查準(zhǔn)率不高查全率不高相同點(diǎn):都是一種規(guī)范化的人工語言不同點(diǎn):三)其他分類語言1、自然語言1)關(guān)鍵詞語言:關(guān)鍵詞是指從文獻(xiàn)的篇名、文摘和正文中抽出的對(duì)表達(dá)文獻(xiàn)主題有實(shí)質(zhì)意義并在揭示和描述文獻(xiàn)主題內(nèi)容上起關(guān)鍵作用的詞和詞組。不經(jīng)過規(guī)范化處理;適用用于電子計(jì)算機(jī)自動(dòng)抽詞標(biāo)引,編制各種類型的關(guān)鍵詞索引。2)自然語言檢索2、引文語言七、信息著錄識(shí)別ProceedingsoftheInternationalConfere

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論