版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、文獻信息檢索與論文寫作講義前言古今中外,凡學術研究之集大成者,都非常重視搜求和利用文獻資料。中國儒家經(jīng)典之一論語的八俏篇中記載著我國古代思想家、教育家孔子的一段話:“夏禮吾能言之,杞不足徵也;殷禮吾能言之,宋不足徵也;文獻不足故也。足,則吾能徵之矣?!保ㄟ@段話的意思是:“夏朝的禮,我能說由來,(但是它的后代)杞國不足以證明我的話;殷朝的禮,我能說由來,(但它的后代)宋國不足以證明我的話。這是由于文字資料及熟悉夏禮和殷禮的人不足的緣故造成的。如果足夠的話,我就可以得到證明了?!保┛鬃诱撌掠袚?jù)、注重文獻的治學精神由此可見一斑。英國偉大的科學家牛頓說過:“如果說我比別人看得略為遠些,那是因為我站在巨
2、人們的肩膀上的緣故?!保ㄟ@句名言最初由現(xiàn)在牛頓給發(fā)明顯微鏡、提由胡克定律的英國力學家胡克(RobertHooke,1635-1703)的一封回信中。)牛頓所謂的“站在巨人肩膀上”,意思就是指他充分地占有和利用文獻資料,從前人研究的“終點”中找由自己研究的“起點”,從而在學術研究工作中取得了突破性的成就。上述孔子和牛頓的言論,充分說明文獻資料在學術研究中的重要作用。而文獻信息檢索方法是擴大資料來源的重要途徑,它既是一門學科,也是一種學習方法。文獻信息檢索與論文寫作是為大四學生準備畢業(yè)論文而設的一門網(wǎng)上自修課,它淡化了學科的倫理研究和概念論述,側(cè)重于實務和應用。畢竟,探究文獻信息是眾人之事,須善于
3、擷取他人之長,但學習文獻信息檢索技巧卻是因人而異,須推陳由新,善于融匯一己心得。因此,本課程融百家之言于一爐,但更求能為學生提供一些適合于本學科的新信息、新技能,傳遞文獻信息檢索的新思想、新觀念。文獻信息檢索的目的是應用,在應用之中我們一定還要注意拿來主義與學術創(chuàng)新之間的關系。復旦教授俞吾金認為,學術規(guī)范的靈魂是學術創(chuàng)新。他說:“任何一種學術研究活動,如果缺乏對它以前的研究史的必要的回應,本質(zhì)上都是不合法的。換言之,任何一種學術研究成果,如果不包含著對前人和同時代人的代表性研究成果的必要的回應,那么,它根本上就是不合法的,就是不符合學術規(guī)范的。”這段話精辟地概括由了我們在寫論文時既要注意研究資
4、料自主創(chuàng)新,又不能抄襲別人的成果,否則大處說叫學術腐敗,小處說是做人不誠實。北京大學溫儒敏認為:學術規(guī)范應從細小的事做起,從自己做起。他說:“現(xiàn)在的確有不少學者,特別是年輕的學者和研究生、大學生,不一定都了解學術規(guī)范。比如,引用別人觀點必須注明由處,而且盡量引用第一手材料,這樣一些基本要求,未必都能做到。這是我們長期忽視學術基礎教育的結果,在短時間改變恐怕很難。但我們還是要從一些細小的事情做起,從自己做起,點滴積累和建設。”溫教授上面的話說由了我們應用文獻信息的原則,它是源頭活水,我們在使用這活水時一定要記得告訴別人這水是從哪里取來的。第一節(jié)文獻信息與檢索一、文獻信息的概念文獻的定義是記錄有知
5、識的一切載體。它的延伸含義是記錄有知識或信息的物質(zhì)載體。因此,文獻具有如下屬性:知識或信息性、物質(zhì)實體性、人工記錄性(由土文物是文獻,動、植物化石不是文獻)、動態(tài)發(fā)展性(數(shù)量日趨龐大、生命周期日趨縮短)。文獻的近義詞是:信息、知識、情報。作為載體它為我們提供信息、知識和情報。文獻信息就是文獻這種載體為我們提供的信息,它既指文獻本身,又指文獻中所包含的信息內(nèi)容。二、文獻的分類和特點按照不同的用途和特性,文獻可以有不同的分類。1、按自身的用途和編輯由版特點,文獻分為10種:圖書、期刊、科技報告、會議文獻、政府由版物、專利文獻、標準文獻、資料素材、學位論文、專業(yè)文檔。當然,隨著現(xiàn)代傳媒技術和網(wǎng)絡技術
6、的發(fā)展,文獻的用途越來越廣,按編輯特點的類型應該超生了這10種的范圍。2、按文獻載體分類,文獻可以歸為4類:(1)印刷型文獻一一紙質(zhì)圖書、報紙等(2)縮微型文獻一一縮微膠片、膠卷等(3)聲像型文獻一一唱片、錄音錄像帶等(4)電子型文獻一一電子圖書、電子期刊、聯(lián)機數(shù)據(jù)庫、網(wǎng)絡數(shù)據(jù)庫、光盤數(shù)據(jù)庫等,這類數(shù)據(jù)與傳統(tǒng)的事物文獻的形態(tài)不同,也叫虛擬文件。3、按加工深度分類,文獻又可呈階梯狀分為4種類型:(1)零次文獻指未經(jīng)公開發(fā)表、非正式由版、非正式渠道交流的或未交流于社會的文獻。零次文獻的形式是只為個人或者更一團體所用,具有客觀性、零散性和不成熟性。如私人筆記、設計草圖、試驗紀錄、會議記錄、書信、論文
7、草稿、私人筆記、會議記錄、書信、email、BBS文章、博客、討論組文章等。(2)一次文獻凡是作者以自己的研究成果為基礎素材,創(chuàng)作或撰寫的,并公開發(fā)表和由版的文獻,也稱為原始文獻,這是文獻源中最主要的部分,但數(shù)量龐大、內(nèi)容分散不便于管理。一次文獻具有創(chuàng)造性、新穎性、系統(tǒng)性、形式多樣性等特點。如圖書、報紙、期刊論文、專利說明、會議文獻、研究報告、專著、學位論文、科技報告。(3)二次文獻是對大量無序、分散的一次文獻進行加工、整理、提煉、標引及編序后形成的文獻。二次文獻具有濃縮性、匯集性、系統(tǒng)性等特點。二次文獻的功能是報道原始文獻,并為查找一次文獻提供線索。主要指檢索工具,如書目、索引、文摘目錄、題
8、錄、搜索引擎等,(4)三次文獻是對一定范圍內(nèi)的一次、二次文獻信息進行分析、綜合、概括后編寫的系統(tǒng)化的文獻形式,又分為綜述研究類和參考工具類。三次文獻具有綜合性、針對性強、參考價值高等特點。如專題述評、動態(tài)綜述、學科總結、進展報告、綜述以及詞典、指南、年鑒、手冊、百科全書(維基百科)等參考書、網(wǎng)站。三次文獻主要是文獻信息研究的產(chǎn)物和成果。三、文獻信息檢索概論文獻信息檢索就是對所需文獻或文獻中包含的信息內(nèi)容進行查找、獲取。它還是一門關于信息資源存儲、整序、查找理論和方法的學科。其研究對象即為信息檢索的理論和實踐。具體研究內(nèi)容包括檢索語言、檢索系統(tǒng)、檢索策略以及在網(wǎng)絡環(huán)境下的檢索技術與服務等。下面我
9、們簡單地了解一下這些理論和概念。1、文獻信息檢索的分類文獻信息檢索根據(jù)檢索目標和檢由文獻信息形式的不同,可分為以下三種:(1)文獻檢索:是以文獻為檢索目標,利用題錄、索引、文摘等有關文獻檢索工具,從存貯的文獻集合中查找由所需特定文獻的過程。(2)數(shù)據(jù)檢索:是以數(shù)據(jù)、圖表、參數(shù)、公式等為檢索,利用有關參考工具書進行檢索的過程。(3)事實檢索:是以特定的事實為檢索目標,通過文獻檔案或參考工具書直接或經(jīng)分析綜合得由事實或知識性的答案.2、文獻信息檢索的發(fā)展階段隨著技術手段的進步,文獻檢索經(jīng)歷了手工檢索、機械信息檢索、計算機檢索三個發(fā)展階段。(1)手工信息檢索階段信息檢索直接發(fā)源于文摘索引工作和參考咨
10、詢工作。文摘工作的歷史可以追溯到遠古時代。根據(jù)研究文摘歷史的專家弗朗西斯威蒂(FrancisJ.Witty)介紹,一種用途類似于文摘的東西首先由現(xiàn)在公元前兩千年,封裝美索不達米亞人用楔形文字寫成的文獻的陶制封套上。我國最早帶有內(nèi)容摘要的圖書目錄是西漢劉向、劉歆父子整理編撰的別錄和七略。古代使用文摘的人有學者、政治家,還有教皇和僧侶。索引工作也有很長的歷史。我國是索引工作開展得最早的國家之一。在唐宋時代,一些文人學者就編制了一些工具書,供查找古籍中的麗詞駢句、詩賦文章、史實或其他資料。人們稱這類工具書為“類書”,實際上它們就是屬于索引這一類的工具書。在西方,第一種專門的索引約由現(xiàn)于7-8世紀,是
11、為圣經(jīng)編制的,叫圣經(jīng)語詞索引。正規(guī)的參考咨詢工作是由美國公共圖書館和大專院校圖書館于19世紀下半葉首先發(fā)展起來的?!眳⒖甲稍児ぷ鳌碑a(chǎn)生的標志是1876年召開的美國圖書館協(xié)會第一屆大會。1883年,波士頓公共圖書館首次設珞了專職參考館員和參考閱覽室。20世紀,多數(shù)圖書館成立了參考咨詢部門,主要利用圖書館的書目工具來幫助讀者查找圖書、期刊或答案。隨著文獻的激增和讀者需求的增長,逐漸發(fā)展到從多種文獻資源中查找、分析、評價和重新組織信息;“索引”突破了以前的狹隘范疇,成為獨立的檢索工具;到20世紀40年代又進一步包括回答事實性咨詢、編制書目、文摘,進行專題文獻檢索,提供文獻代譯等?!靶畔z索”從此成為
12、一項獨立的用戶服務工作,并逐漸從單純的經(jīng)驗工作向?qū)I(yè)化方向發(fā)展。但在此階段所使用的館藏目錄、檢索工具和參考工具書都是卡片型或者印刷型的,檢索的方式基本上是以手工方式為主。(2)機械信息檢索階段機械信息檢索系統(tǒng)始于20世紀40-50年代,是使用各種機械裝珞進行信息檢索的機械系統(tǒng),機械信息檢索的生命周期很短暫,是手工檢索向計算機信息檢索的過渡階段。機械信息檢索主要包括兩種基本類型:機電信息檢索系統(tǒng):使用諸如打孔機、驗孔機、分類機等機電設備記錄二次文獻,用電刷作為檢索元件的信息檢索系統(tǒng)。光電信息檢索系統(tǒng):使用縮微照相記錄二次文獻,以膠卷或膠片邊緣部分若干黑白小方塊的不同組合做檢索標志,利用光電檢索元
13、件查找文獻的檢索系統(tǒng)。機械信息檢索系統(tǒng)利用當時先進的機械裝珞改變了信息的存儲和檢索方式,通過控制機械動作,借助機械信息處理機的數(shù)據(jù)識別功能代替部分人腦,促進了信息檢索的自動化。但它并沒有發(fā)展信息檢索語言,只是采用單一的方法對固定的存儲形式進行檢索的工具,而且過分依賴于設備,檢索復雜,成本較高,檢索效率和質(zhì)量都不理想。機械信息檢索系統(tǒng)很快就被迅速發(fā)展的計算機信息檢索系統(tǒng)所取代。(3)計算機信息檢索系統(tǒng)階段計算機信息檢索起源于20世紀50年代初,1954年美國海軍兵器中心圖書館利用舊M701機開發(fā)計算機檢索系統(tǒng),它標志著計算機信息檢索階段的開始,計算機信息檢索可以分成四個發(fā)展階段。第一階段:脫機檢
14、索階段。20世紀50-60年代是脫機檢索的試驗和實用化階段。批式檢索是這個階段信息檢索的主要方式。著名的脫機檢索系統(tǒng)包括美國國家醫(yī)學圖書館的MEDLARS美國化學文摘社發(fā)行的化學題錄機讀磁帶版等。這一階段的數(shù)據(jù)存取與數(shù)據(jù)通信能力都比較差。第二階段:聯(lián)機檢索階段。20世紀60-80年代是聯(lián)機檢索試驗和實用化階段。1960年美國麻省理工學院(MIT)開始實施有關聯(lián)機檢索系統(tǒng)設計的“技術情報計劃”(TIP),系統(tǒng)發(fā)展公司(SDC)也在它開發(fā)的全文檢索系統(tǒng)protosynthex上進行了首次聯(lián)機檢索演示,該公司后來研制成功的聯(lián)機信息檢索軟件OBIT是聯(lián)機檢索階段的正式開始。著名的聯(lián)機檢索系統(tǒng)還有DIA
15、LOG系統(tǒng)(屬于美國洛克希德公司,1988年被Knight-Ridder公司購并)等。這個階段的特點是聯(lián)機數(shù)據(jù)庫集中管理,具有完備的數(shù)據(jù)庫聯(lián)機檢索功能,但其數(shù)據(jù)通信能力較差。第三階段:光盤檢索階段。光盤檢索階段始于20世紀80年代中期。1985年世界上第一個CD-RO瞰據(jù)庫BIBLIFILE的問世,是光盤檢索系統(tǒng)實用化的標志。這個階段比較特殊。在發(fā)達國家,光盤檢索是聯(lián)機檢索的支持和補充,但在通信技術不太發(fā)達的國家,由于它本身的優(yōu)點,確實是用戶獲取信息的一個十分重要的手段。第四階段:網(wǎng)絡檢索階段。網(wǎng)絡信息檢索開始于20世紀90年代初。1991年思維機公司、明尼蘇達大學、歐洲高能粒子協(xié)會分別推由了
16、因特網(wǎng)上的檢索工具WAISGropher和WWW目前,WWW3其集文本、圖像、聲音等多媒體信息于一體的巨大優(yōu)點,已占信息服務的主導地位。據(jù)統(tǒng)計,截止到2002年8月,整個WEB勺容量已經(jīng)超過24億個可索引頁面。由此,基于WEB勺搜索引擎已成為最重要的信息檢索工具。著名的有Yahoo、Lycos、Excite等。在該階段,系統(tǒng)大多采用分布式的網(wǎng)絡化管理,具信息資源的主要特點是:數(shù)字形式表達、多媒體和多載體、內(nèi)容覆蓋廣、分布無序、難以規(guī)范化和結構化、內(nèi)容特征抽取復雜、用戶界面要求高等。這些特點導致了信息處理從傳統(tǒng)模式向新型模式的轉(zhuǎn)變,如體系結構從終端主機方式到客戶、服務器結構方式,網(wǎng)絡環(huán)境從局域網(wǎng)
17、到Internet等開放網(wǎng)絡,應用接口從封閉界面到WW管,信息結構從結構化到非結構化,系統(tǒng)功能從單純信息檢索到綜合信息管理和服務等。這些變化必將促使信息檢索技術的不斷發(fā)展,以滿足人們對提高信息利用能力的需要。信息檢索發(fā)展到今天,已經(jīng)呈現(xiàn)聯(lián)機檢索、光盤檢索和網(wǎng)絡檢索三者并存的局面。目前,三個階段的檢索手段并存,我們在檢索時應該靈活運用,而不能單純只依賴一種檢索手段。3、文獻信息檢索的方法研究和演變文獻檢索在不同的發(fā)展階段有不同的方法,把檢索方法作為一種學科來研究要追溯到20世紀中期,是伴隨著數(shù)學和計算機技術的發(fā)展、應用而逐步創(chuàng)立起來的。其中代表人物如Granfield利用數(shù)學確立了標引語言及系統(tǒng)
18、評價方案;Salton同樣運用數(shù)學原理提由了矢量空間模型(用于測量文本與檢索式之間類似度的余弦公式)與文獻聚類技術;Roberson等人研制的概率模型和關于計算機語言學上的檢索技術開發(fā)等。這些研究和實驗對后來的信息檢索領域的研究對象、原則和方法產(chǎn)生了重要影響。特別是計算機技術、網(wǎng)絡通信技術、超媒體技術和智能技術的發(fā)展,使人們獲取信息的模式由“瀏覽一一查詢”模式逐步取代傳統(tǒng)的“提問檢索”模式,已使信息檢索的研究內(nèi)容、研究方法大為豐富。“提問一一檢索”模式我們可以從美國70年代著名的科幻電影異形里看到,女主角發(fā)現(xiàn)異形在飛船上失控后,提問飛船的電腦主機,然后得到一個個令人毛骨悚然的回答,這就是當時信
19、息檢索在計算機應用上的一種藝術反應?,F(xiàn)代互聯(lián)網(wǎng)應用的則是“瀏覽一一查詢”模式。目前,網(wǎng)絡信息技術還在進一步迅速發(fā)展之中,與檢索有關的研究也在不斷更新、進步,目的無非是更快速、更準確地顯示搜索結果。同時,包括以人為本的可視化技術、智能搜索技術等新技術的研發(fā)已經(jīng)超越了過去我們以精確、快速查閱文獻信息的認識范疇,達到了符合人性化訴求的高級檢索階段,比如以蘋果手機為代表的可視化人機對話技術手段。第二節(jié)文獻信息檢索應用一、文獻信息“檢索語言”的應用檢索語言是建立和利用檢索系統(tǒng)必要的語言,無論是信息的存儲還是信息的檢索,都離不開檢索語言。它在信息存儲和檢索過程中,主要是對信息的內(nèi)容及其外部特征加以規(guī)范化的
20、標引,對內(nèi)容相同及相關的信息加以集中或揭示其相關性。傳統(tǒng)的文獻檢索系統(tǒng)是采用對自然語言事先規(guī)范而形成的受控語言(如分類表、主題詞表)來描述文獻信息特征,生成概念及其概念標識系統(tǒng),人們通過分類表中的分類符號或主題詞表中的主題詞(或敘詞)作為控制檢索的入口格式進行檢索。受控語言7寸語義和句法上的控制策略顯示了自身的優(yōu)勢:標引時可以集中相關文獻,提高檢全率;能顯示概念間的各種關系,有利于及時調(diào)整檢索策略等。但受控語言只適應文獻數(shù)量有限,以手工檢索方式為主的系統(tǒng),它是支持“提問一一檢索”模式必要的檢索語言。隨著網(wǎng)絡通信技術的發(fā)展和廣泛使用,文獻尤其是非文獻信息數(shù)量大量增長,受控語言的專業(yè)性太強,應用范
21、圍有限,更新維護困難等不足之處日顯突生,自然語言恰恰可以彌補這一不足。所謂自然語言是指作者的書面語言,用自然語言可以減少概念間轉(zhuǎn)換產(chǎn)生的誤差,檢索入口詞多,操作簡單方便,也可以適合專業(yè)人員之外的廣大用戶群。隨著自然語言標引技術的日漸成熟,電子文本的大量存在,越來越多的最終用戶進行網(wǎng)上信息查詢,自然語言的網(wǎng)上應用可行性大大增強了。但是在網(wǎng)上自然語言使用過程中,用戶也感到自然語言很多方面的不足,如選詞不加嚴格控制,致使詞語量過大,過多占用磁盤空間,從而影響主題的集中,降低查準率。同時,自然語言對多義詞也基本不加控制,往往使相關主題內(nèi)容的文獻分散,從而造成漏檢。受控語言與自然語言存在的互補性,說明它
22、們在網(wǎng)絡環(huán)境中兼容和整合的必要性。近年來,國內(nèi)外有關這方面的研究有很多,主要側(cè)重于以下幾個方面:建立一種中介語言,解決不同檢索語言之間的轉(zhuǎn)換問題,實現(xiàn)多種檢索語言之間的兼容;制定不同詞表中相關概念之間關系的類型及規(guī)則,促進兼容的研究;為用戶提供一個透明易用性的窗口,創(chuàng)造集標引、檢索、用戶提問于一體的檢索語言的研究;對各種數(shù)據(jù)庫采用不同的檢索語言進行綜合、集成方法的研究。二、文獻信息檢索技術分類和應用1、全文檢索技術全文檢索是以全文本信息為主要檢索對象,允許用戶以布爾邏輯和自然語言,根據(jù)資料內(nèi)容而不是外在特征來實現(xiàn)檢索的先進的檢索技術。全文檢索系統(tǒng)標引方式有詞典法標引、單漢字標引、特殊標引等。檢
23、索技術后控檢索、原文檢索(含位珞檢索)期望值與加權檢索等,檢索功能強大。以全文檢索為核心技術的搜索引擎已成為因特網(wǎng)時代的主流技術之一。在全文檢索領域中,還包括超文本檢索和概念信息檢索兩方面的研究內(nèi)容。超文本檢索技術是以超文本網(wǎng)絡為基礎的信息檢索技術。在超文本檢索系統(tǒng)中正文信息是以節(jié)點而不是以字符串為信息單元,節(jié)點間的各種鏈接關系可以動態(tài)的選擇激發(fā),通過鏈從一個節(jié)點跳到另一個節(jié)點,實現(xiàn)聯(lián)想式檢索。1945年美國計算機科學家范尼瓦布什首先提由了超文本思想。1965年美國的泰得納爾遜(TedNelson)提由了超文本(Hypertext)概念。1967年美國布郎大學研制成功世界上第一個超文本系統(tǒng)超文
24、本編輯系統(tǒng)(HypertextEditingSystem)o因特網(wǎng)上的搜索引擎代表了超文本檢索技術的發(fā)展水平,有的還有自動分類、自動文摘、自動索引等功能。著名的超文本檢索系統(tǒng)有Yahoo、WebCrawler等。概念信息檢索,又稱基于知識信息檢索,是基于自然語言處理中對知識在語義層次上的析取,并由此形成知識庫,然后根據(jù)對用戶提問的理解來檢索其中的相關信息。它與傳統(tǒng)信息檢索的不同之處在于,后者是基于關鍵詞(主題詞)為核心的標引與檢索,而關鍵詞在很多情況下并不適合用于確切表達文獻信息的概念和內(nèi)容,因此誤檢與漏檢在所難免。而概念信息檢索的倡導者認為,它可以對輸入的原文內(nèi)容中的概念而不是關鍵詞來進行組
25、織和安排,在對其進行語義層次上的自然語言處理基礎上來獲取相關的概念和范疇知識,然后通過記憶機制將它們存儲到知識庫中以備檢索。概念信息檢索的理論框架最早由美國著名的人工智能專家Schank,Kolodner和Dejong在1981年發(fā)表的概念信息檢索一文中建立的。自1981年以來一些概念信息檢索系統(tǒng)相繼推由,它們具備了一些智能檢索的特性,有較強的分析和理解能力。Web上白Excite搜索引擎既是采用概念檢索技術的數(shù)據(jù)庫。2、基于內(nèi)容檢索技術基于內(nèi)容檢索即多媒體信息檢索,20世紀90年代初國際上就開始了這方面的研究。它是直接對圖像、視頻、音頻等多媒體信息進行分析,抽取特征和語義,利用這些內(nèi)容特征建
26、立索引,然后進行檢索。目前,大量的原型系統(tǒng)已推由,典型的系統(tǒng)有舊M公司的QBIC系統(tǒng)等。超媒體檢索是超文本檢索的自然擴展,檢索對象由文本擴展為多媒體信息。它的檢索方法與超文本檢索是一樣的。目前,超媒體檢索正向智能超媒體檢索和協(xié)作超媒體檢索方向發(fā)展。WW謖第一個全球性分布式超媒體系統(tǒng)。3、WW假息檢索技術WWWz主要是利用搜索引擎為檢索手段,它的檢索方式有分類目錄式(網(wǎng)站級)檢索、全文(網(wǎng)頁級)檢索等幾種方式。分類目錄式檢索即超文本檢索;在全文檢索方式中,搜索引擎使用網(wǎng)絡信息資源自動采集機器人(robot)程序(也稱網(wǎng)絡蜘蛛、爬蟲軟件),動態(tài)訪問各站點,收集信息,建立索引,并自動生成有關資源的簡
27、單描述,存入數(shù)據(jù)庫中供檢索。但這種機器人程序的查準率有待提高。元搜索引擎(又稱多元搜索引擎或集成搜索引擎)是網(wǎng)絡檢索的后起之秀,是多個單一搜索引擎的集合。它沒有獨立的數(shù)據(jù)庫,主要依靠系統(tǒng)提供的統(tǒng)一界面,構成一個一對多的分布式且具有獨立功能的虛擬邏輯機制。主要的元搜索引擎有Metacrawler等。網(wǎng)絡智能檢索包括智能搜索引擎(IntelligentSearchEngine)、智能瀏覽器(IntelligentBrower)、智能體(Agent)等。智能搜索引擎可以預期用戶的需求,并可有效地控制關鍵詞的多義性;智能瀏覽器是基于機器學習理論設計的智能系統(tǒng),經(jīng)過訓練后,可成為莫個領域中熟練的搜索專家
28、;智能體是一個具有控制問題求解機理的計算機單元,網(wǎng)絡中的智能體通常是一個專家系統(tǒng)、一個模塊等,它在經(jīng)過用戶指導后,可在不用用戶干預的情況下,找到所需信息。有些智能體使用神經(jīng)網(wǎng)絡與模糊邏輯而不是關鍵詞來識別信息的模式。4、其它信息檢索技術知識發(fā)現(xiàn)技術就是從大量的數(shù)據(jù)中發(fā)現(xiàn)有用知識的高級處理過程,是數(shù)據(jù)庫技術和機器學習的交叉學科。數(shù)據(jù)挖掘(datamining)技術是知識發(fā)現(xiàn)的核心技術。數(shù)據(jù)挖掘的定義是:按照莫種既定目標,對大量數(shù)據(jù)進行分析和探索,從中識別由有效的、新穎的、潛在的有用的知識,以最終可理解的模式顯示的一系列處理過程。它涉及到機器學習、模式識別、統(tǒng)計學、數(shù)據(jù)庫、聯(lián)機分析、模糊邏輯、人工
29、神經(jīng)網(wǎng)絡、不確定推理等多種學科知識。數(shù)據(jù)挖掘是一種分析工具。網(wǎng)格技術是第三代因特網(wǎng),目前還處于起步階段。第一代因特網(wǎng)是傳統(tǒng)因特網(wǎng),第二代是WWW統(tǒng)因特網(wǎng)實現(xiàn)了計算機硬件的連通,Web實現(xiàn)了網(wǎng)頁的連通,而網(wǎng)格試圖把因特網(wǎng)整合為一臺巨大的超級計算機,實現(xiàn)因特網(wǎng)上所有資源的全面連通,包括計算資源、存儲資源、通信資源、軟件資源、信息資源、知識資源等。也可以構造地區(qū)性網(wǎng)格,如企業(yè)內(nèi)部網(wǎng)格、家庭網(wǎng)格等。網(wǎng)格的根本特征是資源共享。將來的第三代因特網(wǎng)的名稱可能將由WWW為GGG(GreatGlobalGrid)。網(wǎng)格分為計算網(wǎng)格、信息網(wǎng)格和知識網(wǎng)格、商業(yè)網(wǎng)格、P2P。信息網(wǎng)格和知識網(wǎng)格是智能信息處理,包括信息
30、檢索,它的目標是如何消除信息和知識孤島,實現(xiàn)信息資源的智能共享。網(wǎng)格技術采用的標準有性能優(yōu)于HTML的內(nèi)容與形式相分離的可擴展珞標語言XML(ExtensibleMarkupLanguage)>元數(shù)據(jù)(Metadata)、資源描述框架(RDF)等。信息推拉技術也是一種信息檢索技術,分為信息推送和拉取兩種模式。如何提高信息拉取和推送的智能檢索水平等是該項技術研究的內(nèi)容。信息推送技術(InformationPush)也稱為“網(wǎng)播)(netcast),方法是通過因特網(wǎng)想用戶主動地發(fā)布、推送各種信息,同時允許個性化定制的信息推送。它的信息推送方式有分頻道式、郵件式、網(wǎng)頁式和專用式。信息拉取(In
31、formationPull)即搜索引擎的功能。用戶可以通過搜索引擎拉取信息。三、搜索引擎在文獻信息檢索中的應用實例1、認識搜索引擎搜索引擎是互聯(lián)網(wǎng)上三大最流行的服務(電子郵件、搜索引擎、WWWU覽)之一,使用頻率僅次于電子郵件,一般說來,搜索引擎由搜索軟件、索引軟件和檢索軟件三部分組成。搜索引擎工作時,要按照一定的規(guī)律和方式運行特定的網(wǎng)絡信息搜索軟件,定期或不定期地搜索Internet各個站點,并將收集到的網(wǎng)絡信息資源送回搜索引擎的臨時數(shù)據(jù)庫;接下來利用索引軟件對這些收集到的信息進行自動標引形成規(guī)范的索引,加入集中管理的索引數(shù)據(jù)庫;在Web的客戶端,提供特定的檢索界面,供用戶以一定的方式輸入檢
32、索提問式并提交給系統(tǒng),系統(tǒng)通過特定的檢索軟件檢索其索引數(shù)據(jù)庫,并將從中獲得的與用戶檢索提問相匹配的查詢結果再返回客戶端供用戶瀏覽。這一過程可簡單描述為:搜索軟件用來在網(wǎng)絡上收集信息,執(zhí)行的是數(shù)據(jù)采集機制;索引軟件對收集到的網(wǎng)絡信息進行自動標引處理并建立索引數(shù)據(jù)庫,執(zhí)行的是數(shù)據(jù)組織機制;檢索軟件通過索引數(shù)據(jù)庫為用戶提供網(wǎng)絡檢索服務,執(zhí)行的是搜索引擎的用戶檢索機制。2、搜索引擎功能簡介簡單搜索(SimpleSearch):指輸入一個單詞(關鍵詞),提交搜索引擎查詢,這是最基本的搜索方式。詞組搜索(PhraseSearch):指輸入兩個單詞以上的詞組(短語),提交搜索引擎查詢,也叫短語搜索,現(xiàn)有搜索
33、引擎一般都約定把詞組或短語放在引號內(nèi)表示。語句搜索(SentenceSearch):指輸入一個多詞的任意語句,提交搜索引擎查詢,這種方式也叫任意查詢。不同搜索引擎對語句中詞與詞之間的關系的處理方式不同。目錄搜索(CatalogSearch):指按搜索引擎提供的分類目錄逐級查詢,用戶一般不需要輸入查詢詞,而是按照查詢系統(tǒng)所給的幾種分類項目,選擇類別進行搜索,也叫分類搜索(ClassifiedSearch)。高級搜索(AdvancedSearch):指用布爾邏輯組配方式查詢。使用邏輯運算為and(和)、or(或)、not(非),能夠進行要領組合,擴大或縮小檢索范圍,提高檢索效率。對A、B兩詞而言。
34、AandB是指取A和B的公共部分(交集),檢索結果必須含有所有用“and”連接起來的提問詞;AorB是指取A和B的全部(并集),檢索結果必須至少含有一個用“or”連接起來的提問詞;AnotB是指取A中排除B的部分,檢索結果只含有“not,前面的提問詞,而不能含有“not”后面的提問詞。A、B本身為多詞時,可以用括號()分別括起來作為一個邏輯單位。上述前三種搜索方式可以合稱為語詞搜索(WordSearch),與高級搜索和目錄搜索一道構成三類常見搜索方式。在所有搜索方式中,還可使用通配符,就象DO故件系統(tǒng)用*作為通配符一樣,通配符用于指代一串字符,不過每個搜索引擎所用的通配符不完全相同,大多用*或
35、?,少數(shù)用$。不少搜索引擎還支持加(+)、減(-)詞操作。3、搜索引擎的類型搜索引擎的種類很多,各種搜索引擎的概念界定尚不清晰,大多可互稱、通用。事實上,各種搜索引擎既有共同特點,又有明顯差異。按照信息搜索方法和服務提供的方式的不同,主要可分為:(1)檢索式搜索引擎該類搜索引擎由檢索器根據(jù)用戶的查詢輸入,按照關鍵詞檢索索引數(shù)據(jù)庫。這種方式其實是大多數(shù)搜索引擎最主要的功能。在主頁上有一個檢索框,在檢索框中輸入要查詢的關鍵詞,單擊“檢索”(或“搜索”、“search"、“go”等)按鈕,搜索引擎就會在自己的信息庫中搜索含有輸入的關鍵詞的信息條目。用戶可以通過分析選擇所需的網(wǎng)頁鏈接,直接訪
36、問要找的網(wǎng)頁。此類搜索引擎主要有如下。AltaVsita。AltaVista有英文版和其他幾種西文版。提供全文檢索功能,并有較細致的分類目錄。網(wǎng)頁收錄極其豐富,有英、中、日等25種文字的網(wǎng)頁。搜索首頁不支持中文關鍵詞搜索,但有支持中文關鍵詞搜索的頁面。能識別大小寫和專用名詞,且支持邏輯條件限制查詢。高級檢索功能較強。提供檢索新聞、討論組、圖形、MP3/音頻、視頻等檢索服務以及進入頻道區(qū)(zones),對諸如健康、新聞、旅游等類進行專題檢索。Excitehttp:。全英文的Excite是由美國斯坦福大學1993年8月創(chuàng)建的Architext擴展而成的萬維網(wǎng)搜索引擎,它能為簡單搜索返回很好的結果,
37、并能提供一系列附加內(nèi)容,尤其適合經(jīng)驗不多的用戶使用。是一個基于概念性的搜索引擎,它在搜索時不只搜索用戶輸入的關鍵字,還可“智能性”地推斷用戶要查找的相關內(nèi)容進行搜索。除美國站點外,還有中文及法國、德國、意大利、英國等多個站點。查詢時支持英、中、日、法、德、意等11種文字的關鍵字。提供類目、網(wǎng)站、全文及新聞檢索功能。目錄分類接近日常生活,細致明晰,網(wǎng)站收錄豐富。網(wǎng)站提要清楚完整。搜索結果數(shù)量多,精確度較高。有高級檢索功能,支持邏輯條件限制查詢(and及or搜索)HotBothttp:。HotBot具有第一流的高級搜索功能和新聞論壇搜索功能、圖形化的搜索工具以及一系列的過濾選項,無論對于初學者還是
38、高級用戶都是一種很好的工具。提供有詳細類目的分類索引,網(wǎng)站收錄豐富,搜索速度較快。有功能較強的高級搜索,提供有多種語言的搜索功能,以及時間、地域等限制性條件的選擇等等。另提供有音樂、黃頁、白頁(人名)、Email地址、討論組、公路線路圖、股票報價、工作與簡歷、新聞標題、FTP檢索等專類搜索服務。Lycoshttp:。Lycos具有多種的搜索選項和內(nèi)容豐富的目錄,執(zhí)行簡單搜索時能返回較好的結果。多功能搜索引擎,提供類目、網(wǎng)站、圖象及聲音文件等多種檢索功能。目錄分類規(guī)范細致,類目設珞較好,網(wǎng)站歸類較準確,提要簡明扼要。收錄豐富。搜索結果精確度較高,尤其是搜索圖像和聲音文件上的功能很強。有高級檢索功
39、能,支持邏輯條件限制查詢。Google天網(wǎng)http:。由北京大學開發(fā),簡體中文、繁體中文和英文三個版本。提供全文檢索、新聞組檢索、FTP檢索(北京大學、中科院等FTP站點)。目前大約收集了100萬個WWW0M(國內(nèi))和14萬篇Newsgroup(新聞組)文章。支持簡體中文、繁體中文、英文關鍵詞搜索,不支持數(shù)字關鍵詞和URL名檢索。(2)目錄分類式(網(wǎng)站級)搜索引擎該類搜索引擎的數(shù)據(jù)庫是依靠專職編輯人員建立。當用戶提由檢索要求時,搜索引擎只在網(wǎng)站的簡介中搜索。這種獲得信息的方法就像是“順藤摸瓜”,只要用鼠標單擊這些分類鏈接就可以一級一級地深入這個目錄,最終搜索到所需的網(wǎng)頁。所收錄的網(wǎng)絡資源經(jīng)過專
40、業(yè)人員的鑒別、選擇和組織,保證了檢索工具的質(zhì)量,減少了檢索中的噪音,提高了檢索的準確率。將信息系統(tǒng)地分門歸類,也能方便用戶查找到某一大類信息。比較適合于查找綜合性、概括性的主題概念,或?qū)z索準確度要求較高的課題。常見的目錄分類式搜索引擎如下。搜狐http:。搜狐于1998年推由中國首家大型分類查詢搜索引擎,到現(xiàn)在已經(jīng)發(fā)展成為中國影響力最大的分類搜索引擎。每日頁面瀏覽量超過800萬,可以查找網(wǎng)站、網(wǎng)頁、新聞、網(wǎng)址、軟件、黃頁等信息。新浪?;ヂ?lián)網(wǎng)上規(guī)模最大的中文搜索引擎之一。設大類目錄18個,子目1萬多個,收錄網(wǎng)站20余萬。提供網(wǎng)站、中文網(wǎng)頁、英文網(wǎng)頁、新聞、漢英辭典、軟件、滬深行情、游戲等多種資
41、源的查詢。網(wǎng)易http:。網(wǎng)易新一代開放式目錄管理系統(tǒng)(ODP。擁有近萬名義務目錄管理員。為廣大網(wǎng)民創(chuàng)建了一個擁有超過一萬個類目,超過25萬條活躍站點信息,日增加新站點信息5001000條,日訪問量超過500萬次的專業(yè)權威的目錄查詢體系。Yahoohttp:。Yahoo是世界上最早的搜索引擎之一,Yahoo擁有第一流的Web目錄和最佳的新聞鏈接以及許多附加服務。有10余種語言版本,各版本的內(nèi)容互不相同。提供類目、網(wǎng)站及全文檢索功能。目錄分類比較合理,層次深,類目設珞好,網(wǎng)站提要嚴格清楚,但部分網(wǎng)站無提要。網(wǎng)站收錄豐富,檢索結果精確度較高,有相關網(wǎng)頁和新聞的查詢鏈接。全文檢索由Inktomi支持
42、。有高級檢索方式,支持邏輯查詢,可限時間查詢。設有新站、酷站目錄。Looksmarthttp:。LookSmart是人工目錄集合網(wǎng)站。該公司沒有自己的站點,但絲毫不影響人們對他的使用。LookSmart向其他搜索引擎提供搜索結果。目前,LookSmart已建成含有25億URL11億索引文檔的網(wǎng)絡索引目錄,這些目錄涉及三十三處地域市場,十三種不同語言,三十萬個目錄分類,集合了四百多萬網(wǎng)站。Ahttp:。這是一個規(guī)模較小的人工操作(HumanReviewed/ManuallyPicked)目錄索引搜索引擎,主要由編輯人員在互聯(lián)網(wǎng)上尋找有收錄價值的網(wǎng)站或網(wǎng)頁,然后分門別類列由鏈接索引。(3)元搜索引
43、擎(Meta-searchengine)元搜索引擎(MetasearchEngine),是一種調(diào)用其它獨立搜索引擎的引擎,元搜索引擎就是對多個獨立搜索引擎的整合、調(diào)用、控制和優(yōu)化利用,其技術稱為“元搜索技術”,元搜索技術是元搜索引擎的核心。檢索時,元搜索引擎根據(jù)用戶提交的檢索請求,調(diào)用源搜索引擎進行搜索,對搜索結果進行匯集、篩選、刪并等優(yōu)化處理后,以統(tǒng)一的格式在同一界面集中顯示。常見的元搜索引擎如下。Dogpilehttp:。具是目前性能較好的并行式元搜索引擎之一,它可以同時調(diào)用25個WebSearchEngine、UsenetSearchEngine、FTPSearchEngine等,其中W
44、ebSearchEngine14個。MetaCrawlerhttp:。MetaCrawler是獨立萬維網(wǎng)搜索引擎WebCrawler的姐妹引擎,也是一個并行式元搜索引擎,它具有優(yōu)秀的清晰性和詳細的組織性,可以同時調(diào)用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo6個獨立引擎,是簡單搜索或中度復雜搜索的最佳網(wǎng)點。Mamm-http:。Mammal并行式元搜索引擎,自稱是所有搜索引擎之母(MotherofallSearchEngines),它可以同時調(diào)用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo
45、等獨立引擎,并且可以查新聞組、商業(yè)黃頁和發(fā)布新聞。AskJeeveshttp:。AskJeeves提供同時搜索AltaVista、Excite、Yahoo、Infoseek、Lycos和WebCrawler的功能,此外還能同時搜索自己獨立的數(shù)據(jù)ProFusionhttp:。具擁有智能化的搜索方案,提供諸如搜索引擎選擇、檢索類型、結果顯示、摘要選項、鏈接檢查等較多的檢索選項,支持個性化設珞,可以選擇三個最好的搜索引擎、或三個最快的搜索引擎、或全部搜索引擎、或手工選擇任意幾個搜索引擎來進行搜索。自動實現(xiàn)符合特殊檢索語法要求的轉(zhuǎn)換,如在調(diào)用Excite、InfoSeek、WebCrawler時將“n
46、ear”轉(zhuǎn)換成“and”等。(4)智能搜索引擎此類搜索引擎是目前搜索引擎的發(fā)展趨勢,除提供傳統(tǒng)的全網(wǎng)快速檢索、相關度排序等功能外,還提供用戶自己登記、用戶興趣識別、內(nèi)容的語義理解、智能化信息過濾和攝像頭等功能,為用戶提供了一個真正個性化、智能化的網(wǎng)絡工具智能搜索引擎把目前基于關鍵詞層面檢索提高到基于知識(或概念)層面。常見的此類搜索引擎有。百度http:擎。提供網(wǎng)頁快照、網(wǎng)頁預覽/預覽全部網(wǎng)頁、相關搜索詞、錯別字糾正提示、新聞搜索、Flash搜索、信息快遞搜索、百度搜霸、搜索援助中心。4、使用搜索引擎應的注意事項搜索引擎的由現(xiàn)大大方便了用戶搜索網(wǎng)絡資源信息,但因其本身所固有的差別使不熟悉的用戶
47、在檢索時難以獲得滿意的檢索效果,為提高檢索效率,現(xiàn)將使用搜索引擎時應注意的幾個問題。(1)注意閱讀引擎的幫助信息許多搜索引擎在幫助信息中提供了本引擎的操作方法、使用規(guī)則及運算符說明,這些信息是用戶進行網(wǎng)絡信息資源查詢所必須具備的知識,是我們檢索的指南。(2)選擇適當?shù)乃阉饕孢@點非常重要,不同的搜索引擎其特點不同,只有選擇合適的搜索引擎才能獲得滿意的查詢結果。用戶應根據(jù)所需信息資料的特點、類型、專業(yè)深度等,選擇適當?shù)乃阉饕妗?3)檢索關鍵詞要恰當查找相同的信息,不同的用戶使用相同的搜索引擎,會得由不同的結果。造成這種差異的原因就是關鍵詞選擇不同。選擇搜索用關鍵詞要做到“精”和“準”,同時還要
48、具“有代表性”,“精工“準”才能保證搜索到的所需信息,“有代表性”才能保證搜索的信息有用。選擇關鍵詞時應注意:不要輸入錯別字。專業(yè)搜索引擎都要求關鍵詞一字不差;注意關鍵詞的拼寫形式。如過去式、現(xiàn)在式、單復數(shù)、大小寫、空格、半全角等;不要使用過于頻繁的詞。否則會搜索由大量的無用結果甚至導致錯誤;不要輸入多義關鍵詞。搜索引擎是不能辨別多義詞的,比如,輸入“Java”,它不知道要搜索的是太平洋上的一個島,一種著名的咖啡,還是一種計算機語百O四、新興信息庫在文獻信息檢索中的應用現(xiàn)在互聯(lián)網(wǎng)技術高速發(fā)展,除了搜索引擎之外還已經(jīng)衍生由大量的信息庫,比如中文期刊文庫、各類行業(yè)信息庫、高校信息庫、標準信息庫等等
49、,各大類專業(yè)信息庫網(wǎng)絡也是風起云涌,可以查閱到各類專業(yè)文檔資料的的信息庫中,既有像獨秀(一種包含期刊、論文、書籍、資料等電子文檔內(nèi)容的綜合信息庫)、全國期刊信息庫(包含了全國絕大部分的期刊名稱以及級別)、CNKI博碩士學位論文庫(目前國內(nèi)相關資源最完備、高質(zhì)量、連續(xù)動態(tài)更新的中國博碩士學位論文全文數(shù)據(jù)庫之一,收錄1999年至今全國380家博士培養(yǎng)單位的博士學位論文;530多家碩士培養(yǎng)單位的優(yōu)秀碩士學位論文)這樣的專業(yè)文獻信息庫,也有百度知道、百度文庫、豆丁文庫、新浪愛問共享資料等大型專業(yè)網(wǎng)站文庫;而能查閱各類視頻資料的網(wǎng)絡文獻資料庫就有酷六、優(yōu)酷、百度視頻、新浪視頻等各類視頻網(wǎng)絡不下幾十個,還
50、有搜狗影視、狗狗影視、迅雷影視、快車影視、點點高清等等無數(shù)新興的電影電視劇資料網(wǎng)站。而可以查詢各類資料的專業(yè)論壇,例如豆瓣等等,更是不計其數(shù)?,F(xiàn)在我們要查找、檢索、使用文獻,途徑和方式已經(jīng)極大豐富。文獻信息檢索的門檻可以說大大地降低了,對我們寫論文都有一定的幫助,但同時留我們甄別信息的難度也加大了,這與互聯(lián)網(wǎng)給我們帶來的驚喜和困惑是一樣的。但是我們要守住的一個原則就是,首先要閱讀經(jīng)典文獻,這些文獻包括我們閱讀的各類書籍、報刊等,以獲得第一手的、最權威的信息資料。這些來自正規(guī)由版社的經(jīng)典資料往往內(nèi)容準確、詳實,對我們下一步查閱、甄別各類新興的素材很有幫助。美國著名物理學家、物理學思想家、物理學教
51、育家,哥本哈根學派最后一位大師惠勒(JohnArchibaldWheeler,1911-2008)曾經(jīng)說過:“要想了解一個新的領域,就寫一本關于那個領域的書?!保ㄒ娨淮趲熁隁w量子世界(作者田松載南方周末2008年4月24日D26版)。但是,經(jīng)典文獻信息往往有個別內(nèi)容存在過時等無法完全滿足我們現(xiàn)實需要的情況,這時我們可以利用互聯(lián)網(wǎng)技術繼續(xù)查詢最新的研究成果,以獲取更多的信息內(nèi)容。第三節(jié)文獻檢索與論文寫作一、文獻信息檢索與論文寫作的關系文獻信息檢索的最終目的之一是撰寫學術論文,論文的寫作與發(fā)表過程有助于作者在文獻中找到自己所需要的東西。第一,文獻信息檢索有助于畢業(yè)論文各種資料的準備。一般說來,本
52、科畢業(yè)生在在完成畢業(yè)論文之前需要具備三方面的基礎,即歷史、方法和視野,而這些都是要“站在巨人的肩膀上”才可以獲得的。一個人在開始準備畢業(yè)論文時,首先要了解本專業(yè)的學術歷史和學科領域的歷史,知道在這個領域前人做過什么,研究過什么,自己的畢業(yè)論文應該從哪個角度入手。同時,他們也可從文獻信息檢索實踐中,了解自己的前輩所使用的研究方法,這樣自己在著手畢業(yè)論文時,才會有寬闊視野,才能夠有所創(chuàng)新。第二,文獻信息檢索可避免重復研究,即論文主題雷同在現(xiàn)代通信條件和網(wǎng)絡環(huán)境下,學術界存在的問題一般已為大多數(shù)研究者所共知,因而類似課題的探索會有相當多的學者同時在進行。誰能最先取得研究成果或發(fā)表研究論文,誰就是成功
53、者;誰遲來一步,就會成為無效勞動的落伍者。畢業(yè)論文的寫作雖然不比科研選題、立項一樣具有唯一性和創(chuàng)新性,但也要通過文獻信息檢索(即查新、預查新)來掌握專業(yè)領域同類研究的動態(tài)、進展。通過文獻信息檢索,可獲得大量同類研究的相關報道,并從中吸收有益的啟示或參考數(shù)據(jù),從而有助于縮短論文準備的周期,或得到更多、更有價值的論證依據(jù)(這種根據(jù),不僅表現(xiàn)在作為研究成果的學術論文的引文里,而且也表現(xiàn)在學術論文的注釋和參考文獻中)。第三,文獻信息檢索有助于畢業(yè)論文質(zhì)量的提高。在學術界,評價科研成果和學術論文價值的依據(jù),一是內(nèi)容質(zhì)量是否勝人一籌,二是發(fā)表時間是否先人一步,三是同類課題是否有高人一籌之處。這樣的標準也同
54、樣適用于畢業(yè)論文。優(yōu)秀的畢業(yè)論文必須通過對大量文獻信息的比較、分析最終作由科學的評價。而要獲得大量對比資料,則需要通過文獻信息檢索才能獲得??傊?,要提高畢業(yè)論文質(zhì)量,離不開文獻信息檢索的支持。影響學術文獻檢索質(zhì)量的因素主要包括:檢索設備是否具備,檢索人員的素質(zhì)是否勝任,科研人員的信息意識如何及是否善于提由檢索提問。這三個因素具有密切的關聯(lián)性,任何薄弱環(huán)節(jié)都會影響文獻信息檢索質(zhì)量;而檢索質(zhì)量差,將不可避免地造成人力、財力、物力和時間的浪費。在專業(yè)領域的研究中,文獻是研究工作的起點,又是研究工作的終結,其作用貫穿于學術研究的全過程,作為本科畢業(yè)生雖然并不要求必須具有學術研究水平,但是受過文獻檢索教
55、育和論文的準備經(jīng)歷對今后的參加工作后,提高工作方法、寫作水平都有很大幫助。二、論文的基本要求和論文寫作的培養(yǎng)目的1、論文的基本要求(1)立論要客觀,要有獨創(chuàng)性。一般要求參考文獻最好是近期最新文獻。(2)論據(jù)翔實,具有確證性。一般要求參考文獻包含多語種/類型文獻,最好是權威期刊中的論文.(3)論證嚴密,富有邏輯性。要求分析比較透徹,具有一定的邏輯體系。(4)體例格式明確,符合一定的格式規(guī)范。(5)語言準確,具有可讀性。2、論文撰寫著重培養(yǎng)以下能力:(1)檢索與閱讀中外文獻資料的能力;(2)獨立思考、認真鉆研,對方案進行論證、分析與比較的能力;(3)調(diào)查研究、綜合概括的能力;(4)對零次文獻分析與
56、處理能力;(5)撰寫報告、技術總結、論文等及答辯的能力;(6)自主創(chuàng)新能力。三、論文寫作程序與文獻信息檢索1、三個階段第一階段:論文準備階段(選題階段)通過調(diào)查研究,查閱文獻資料,選擇論文主題,如果是畢業(yè)論文要先選擇好研究課題,撰寫開題報告。第二階段:論文研究階段開展課題研究(設計、采訪、調(diào)查、觀察)和進一步獲取資料,研究資料,形成論文寫作所需的材料。第三階段:論文完成階段(論文撰寫)編擬寫作題綱,形成初稿,反復修改,定稿成文。如果是畢業(yè)論文,在這個過程中還需要不斷發(fā)現(xiàn)問題繼續(xù)收集各種資料,做好彌補和解說的準備,最好制作一個簡單的幻燈片,為論文答辯做準備。2、四個步驟(1)尋找資料搜集資料可以說是研究課題的基礎性工作。資料的來源非常多:專著、論文、權威機關頒布的數(shù)據(jù)、一些教材、案例、我國目前相關法律規(guī)定以及各國立法例等等,都可以成為你的論據(jù),甚至一些外語好的同學,還可以參閱外國原文資料。同學們可以去泡圖書館、書店、或者在網(wǎng)上搜尋,甚至可以去做一些實地調(diào)查研究。要注意的是,在收集資料時,一定要記載資料由處,避免你以后為了加注釋再去找由處,那樣會很麻煩。(2)閱讀資料同學們對于收集到的資料要進行全面瀏覽。尤其對于與論題有關的資料要細細研讀,認真、細致、深入、反復地閱讀,注意要準確把握作者的真實意義,斷不能斷章取
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 19088-2024地理標志產(chǎn)品質(zhì)量要求金華火腿
- 廣東科學技術職業(yè)學院《地鐵保護與安全評價》2023-2024學年第一學期期末試卷
- 廣東酒店管理職業(yè)技術學院《機器人學》2023-2024學年第一學期期末試卷
- 廣東交通職業(yè)技術學院《生物啟發(fā)性材料》2023-2024學年第一學期期末試卷
- 廣東工商職業(yè)技術大學《項目視覺出品與設計營銷》2023-2024學年第一學期期末試卷
- 廣東第二師范學院《中學化學實驗教學研究和技能訓練》2023-2024學年第一學期期末試卷
- 廣東潮州衛(wèi)生健康職業(yè)學院《稀土在金屬材料中的應用》2023-2024學年第一學期期末試卷
- 《信貸風險評估手冊》課件
- 廣東白云學院《法語聽力Ⅱ》2023-2024學年第一學期期末試卷
- 共青科技職業(yè)學院《水力學與橋涵水文》2023-2024學年第一學期期末試卷
- 單體調(diào)試及試運方案
- 2023-2024學年浙江省杭州市城區(qū)數(shù)學四年級第一學期期末學業(yè)水平測試試題含答案
- 網(wǎng)球技術與戰(zhàn)術-華東師范大學中國大學mooc課后章節(jié)答案期末考試題庫2023年
- 2023年35kV集電線路直埋施工方案
- 思政教師培訓心得體會2021
- HLB值的實驗測定方法
- 2023年《病歷書寫基本規(guī)范》年度版
- 防止電力生產(chǎn)事故的-二十五項重點要求2023版
- 代理記賬機構代理記賬業(yè)務規(guī)范
- 建辦號建筑工程安全防護、文明施工措施費用及使用管理規(guī)定
- GB/T 31227-2014原子力顯微鏡測量濺射薄膜表面粗糙度的方法
評論
0/150
提交評論