文獻(xiàn)計(jì)量學(xué)方法_第1頁
文獻(xiàn)計(jì)量學(xué)方法_第2頁
文獻(xiàn)計(jì)量學(xué)方法_第3頁
文獻(xiàn)計(jì)量學(xué)方法_第4頁
文獻(xiàn)計(jì)量學(xué)方法_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

文獻(xiàn)計(jì)量學(xué)方法第1頁,共30頁,2023年,2月20日,星期五內(nèi)容提要8.1概述8.2文獻(xiàn)計(jì)量學(xué)方法的基本原理及其應(yīng)用第2頁,共30頁,2023年,2月20日,星期五8.1概述第3頁,共30頁,2023年,2月20日,星期五文獻(xiàn)計(jì)量學(xué)的產(chǎn)生和發(fā)展值得關(guān)注的趨勢從文獻(xiàn)計(jì)量向信息計(jì)量發(fā)展文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、信息計(jì)量學(xué)的合流趨勢文獻(xiàn)計(jì)量研究手段的現(xiàn)代化趨勢重視文獻(xiàn)計(jì)量學(xué)在科技管理和決策中的應(yīng)用第4頁,共30頁,2023年,2月20日,星期五文獻(xiàn)計(jì)量學(xué)的研究對象和內(nèi)容文獻(xiàn)計(jì)量學(xué)的研究對象文獻(xiàn)及其內(nèi)容信息與文獻(xiàn)相關(guān)的指標(biāo)文獻(xiàn)計(jì)量學(xué)的研究內(nèi)容文獻(xiàn)計(jì)量學(xué)的基本理論文獻(xiàn)計(jì)量學(xué)的方法文獻(xiàn)計(jì)量學(xué)的應(yīng)用第5頁,共30頁,2023年,2月20日,星期五8.2文獻(xiàn)計(jì)量學(xué)方法

的基本原理及其應(yīng)用第6頁,共30頁,2023年,2月20日,星期五布拉德福定律及其應(yīng)用

英國文獻(xiàn)學(xué)家布拉德福提出了定量描述文獻(xiàn)序性結(jié)構(gòu)的經(jīng)驗(yàn)定律:“如果將科技期刊按其刊載某專業(yè)論文的數(shù)量的多少以遞減順序排列起來,則可以在這些期刊中區(qū)分出載文率最高的核心區(qū)和包含著與核心區(qū)同等數(shù)量論文的后繼幾區(qū)。此時,核心區(qū)和后繼各區(qū)中所含的期刊數(shù)成1:n:n2……的關(guān)系(n>1)。應(yīng)用:主要體現(xiàn)在文獻(xiàn)信息的搜集環(huán)節(jié)上。

也可用于研究某一學(xué)科發(fā)展的特點(diǎn)以及學(xué)科之間的交叉影響和相互滲透關(guān)系,并以此確定某些新學(xué)科的生長點(diǎn)。

第7頁,共30頁,2023年,2月20日,星期五布拉德福定律及其應(yīng)用

也可用于研究某一學(xué)科發(fā)展的特點(diǎn)以及學(xué)科之間的交叉影響和相互滲透關(guān)系,并以此確定某些新學(xué)科的生長點(diǎn)。

第8頁,共30頁,2023年,2月20日,星期五洛特卡定律及其應(yīng)用

洛特卡定律是揭示文獻(xiàn)著者與數(shù)量關(guān)系的基本定律,是為了評價科學(xué)工作者的貢獻(xiàn),由洛特卡于1926年提出的。洛特卡定律的數(shù)學(xué)表達(dá)式為:

f(x)=C/X2

≈0.6/X2

發(fā)表x篇論文的著者出現(xiàn)的頻率(在所統(tǒng)計(jì)的著者總數(shù)中所占的比例)

科學(xué)工作者發(fā)表的論文數(shù)量

C為常數(shù),C的極限值為0.6079

第9頁,共30頁,2023年,2月20日,星期五齊普夫定律及其應(yīng)用

美國哈佛大學(xué)語言學(xué)教授齊普夫于1935年提出齊普夫定律:在一篇足夠長的文章(5000字以上)中,如果我們以單詞詞頻的高低進(jìn)行等級排列(約定詞頻越高,則單詞的等級越高),詞頻最高的單詞等級為1,次之為2,再次之為3,……,則詞頻與等級之間存在著一次反比關(guān)系。f*r=C與樣本有關(guān)的常數(shù)某一單詞的詞頻該單詞的等級序號第10頁,共30頁,2023年,2月20日,星期五齊普夫定律及其應(yīng)用美國語言學(xué)家朱斯(M.Joos)提出了廣義的齊普夫定律數(shù)學(xué)公式:

F*rB=CB為與樣本有關(guān)的常數(shù)法國數(shù)學(xué)家芒代爾布羅(B.Mandelbrot)運(yùn)用信息論原理和概率論方法在式8-5的基礎(chǔ)上,進(jìn)一步提出了新的修正式:

F*(r+m)B=Cm為與樣本有關(guān)的常數(shù);

第11頁,共30頁,2023年,2月20日,星期五齊普夫定律的運(yùn)用實(shí)例電子郵件列表成員的相對價值。按照齊普夫定律,這種網(wǎng)絡(luò)的成員可以像齊普夫定律排列單詞那樣來排序——按照你收件箱當(dāng)中電子郵件的數(shù)量。每個人所發(fā)的電子郵件都會給你收件箱的總“價值”貢獻(xiàn)1/k,這里的k是指每個人的排名。第12頁,共30頁,2023年,2月20日,星期五引文分析及其應(yīng)用引文分析是運(yùn)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和邏輯學(xué)的方法對論文、專著等各種文獻(xiàn)的相互引用現(xiàn)象進(jìn)行分析,以揭示出其數(shù)量特征和內(nèi)在規(guī)律的一種研究方法。在進(jìn)行引文分析時,經(jīng)常采用的計(jì)量指標(biāo)有:引文率、被引用率、自引率、被自引率、影響因數(shù)、即年指標(biāo)、引文耦合強(qiáng)度、同被引強(qiáng)度等。第13頁,共30頁,2023年,2月20日,星期五內(nèi)容分析法內(nèi)容分析法(ContentAnalysis)是對文獻(xiàn)內(nèi)容進(jìn)行系統(tǒng)的定量分析的一種專門方法,其目的一般是弄清或測度文獻(xiàn)中本質(zhì)性的事實(shí)或趨勢。補(bǔ)充第14頁,共30頁,2023年,2月20日,星期五20世紀(jì)初,人們提出在一般性閱讀文獻(xiàn)獲得理解之外,采用半定量的統(tǒng)計(jì)方法對文獻(xiàn)的內(nèi)容進(jìn)行深入分析和解釋。二戰(zhàn)中,美國傳播學(xué)家拉斯韋爾等在進(jìn)行戰(zhàn)時軍事和政治信息分析中,以德國公開出版的報(bào)紙為分析對象,分析獲取法西斯政權(quán)重要軍政機(jī)密情報(bào),取得了出乎意料的成功,使內(nèi)容分析法顯示出實(shí)際效果。60年代,前蘇聯(lián)學(xué)者在社會科學(xué)研究中采用內(nèi)容分析法。60年代日本巧妙獲取大慶油田的相關(guān)情報(bào)。第15頁,共30頁,2023年,2月20日,星期五半定量分析方法。對大量樣本進(jìn)行特征識別的系統(tǒng)方法,具有統(tǒng)計(jì)性??梢越沂境鲭[性的內(nèi)容。是一種從公開資料中萃取秘密信息的方法。第16頁,共30頁,2023年,2月20日,星期五確定目的選擇樣本定義分析單元制定分析框架頻數(shù)統(tǒng)計(jì)結(jié)論匯總建立假設(shè)檢驗(yàn)假設(shè)內(nèi)容分析步驟框圖第17頁,共30頁,2023年,2月20日,星期五確定目的——必須首先明確。選擇樣本——力求樣本信息量大,有連續(xù)性,便于統(tǒng)計(jì)分析并盡可能是分析人員所熟悉的。第18頁,共30頁,2023年,2月20日,星期五分析單元——是內(nèi)容的“指示器”。一般先依據(jù)目的確定分析范疇,即確定符合目的要求的最一般的關(guān)鍵性概念。確定范疇時應(yīng)避免兩個極端:過大的范疇可能使分析結(jié)果表面化和簡單化;過細(xì)的范疇造成幾乎重復(fù)原文。范疇選擇之后,再明確相對應(yīng)的分析單元。分析單元是不再細(xì)分析測度單位。對文字對象,詞是最小的分析單元。此外,意義獨(dú)立的詞組、簡單句、段和意群甚至獨(dú)立的篇也可視作分析單元。在復(fù)雜的內(nèi)容分析中,可同時采用幾種分析單元。第19頁,共30頁,2023年,2月20日,星期五制定分析框架——體現(xiàn)分析思路和保證系統(tǒng)性的核心步驟。要求分析人員對問題本身和分析對象二者都有深透的認(rèn)識。其基本出發(fā)點(diǎn)是使分析單元的測度結(jié)果能反映和說明實(shí)質(zhì)性的問題。例如,用圖書館中通用的主題詞表作詞頻分析有時意義不大,原因在于通用的主題詞表并不是為分析專門問題而設(shè)計(jì)的。第20頁,共30頁,2023年,2月20日,星期五頻數(shù)統(tǒng)計(jì)——一種規(guī)范性的操作,包括計(jì)數(shù)和數(shù)據(jù)處理,需要通過大數(shù)量的統(tǒng)計(jì)反映統(tǒng)計(jì)意義上的相關(guān)性。在內(nèi)容分析中,最常用的是詞頻統(tǒng)計(jì)。結(jié)論匯總——在綜合統(tǒng)計(jì)結(jié)果和定性分析的基礎(chǔ)上,得出某些結(jié)論性的看法,同時指出所作的內(nèi)容分析的適用范圍或邊界。第21頁,共30頁,2023年,2月20日,星期五分析的核心是推理和比較。常見的有:趨勢比較——?dú)v史性縱向比較,著眼于同一事件在時間序列中的變化趨勢。不同內(nèi)容體比較——同一主題下,比較來源不同的信息內(nèi)容,從而得出結(jié)論。如各國對同一事件的反應(yīng)。這種比較是共時性的橫向比較。內(nèi)容內(nèi)比較——對同一文獻(xiàn)中不同主題的比較,以分析其相關(guān)性和差異。如比較某報(bào)紙對白人和黑人的不同用詞。帶標(biāo)準(zhǔn)的內(nèi)容比較——有一給定的標(biāo)準(zhǔn)作為比較尺度,對文獻(xiàn)內(nèi)容進(jìn)行相應(yīng)的比較。即事先確立某種評估標(biāo)準(zhǔn),在該標(biāo)準(zhǔn)下得出比較結(jié)果。分析方法第22頁,共30頁,2023年,2月20日,星期五內(nèi)容分析的類型第23頁,共30頁,2023年,2月20日,星期五賈尼斯(美國內(nèi)容分析專家)劃分法實(shí)用內(nèi)容分析——對某些主題詞或特定的詞匯進(jìn)行統(tǒng)計(jì)分析,并賦予不同的權(quán)重(如對不同的字體、版面位置、排名順序等),推斷其出現(xiàn)的原因和可能的后果。對報(bào)紙、新聞進(jìn)行內(nèi)容分析時,常屬該類型。語義內(nèi)容分析——針對文字的語義內(nèi)容,對特定詞匯作統(tǒng)計(jì)分析,統(tǒng)計(jì)不局限于字面。如二戰(zhàn)中統(tǒng)計(jì)“德國”出現(xiàn)的次數(shù)時,包括“第三帝國”、“納粹政府”、“希特勒當(dāng)局”等。符號媒介分析——只從字面上統(tǒng)計(jì)特定的符號(如某些主題詞)出現(xiàn)的頻率,不考慮語義,也不引入權(quán)重等,從中進(jìn)行內(nèi)容分析。如依據(jù)某社論中某詞出現(xiàn)的次數(shù)得出結(jié)論。指定分析:統(tǒng)計(jì)分析指定的人、事、物出現(xiàn)的頻次。歸因分析:統(tǒng)計(jì)分析相關(guān)特征的頻次。如分析某人物時統(tǒng)計(jì)其不誠實(shí)信息出現(xiàn)的次數(shù)。斷言分析:統(tǒng)計(jì)對某人、事、物作出反應(yīng)的有關(guān)信息次數(shù),以分析特定的主題(如對某項(xiàng)政策的反應(yīng))。第24頁,共30頁,2023年,2月20日,星期五按內(nèi)容分析采用的分析單元區(qū)分詞頻分析——文獻(xiàn)計(jì)量學(xué)研究的重要工具。包括主題詞詞頻分析和指示詞詞頻分析。篇幅分析——是以具有獨(dú)立意義的內(nèi)容篇幅作為分析單元,根據(jù)對有關(guān)內(nèi)容的比重結(jié)構(gòu)及數(shù)量變化等進(jìn)行分析和推測。內(nèi)容篇幅的統(tǒng)計(jì)以標(biāo)準(zhǔn)頁或單篇報(bào)道等作為單位。一般進(jìn)行篇幅分析的工作量是比較大的。如J.奈斯比特對美國社會發(fā)展趨勢的分析。第25頁,共30頁,2023年,2月20日,星期五主題詞詞頻分析:用主題詞作為分析單元,從統(tǒng)計(jì)所分析的對象中有關(guān)主題詞出現(xiàn)的頻次為基礎(chǔ)進(jìn)行分析和推斷。所用的主題詞取自圖書館的主題詞表或數(shù)據(jù)庫的敘詞表,因此是用現(xiàn)成的通用的高度規(guī)范的詞匯作為分析單元。使用這些詞,一方面比較可靠、方便,另一方面可能難以揭示一些特定的內(nèi)容,并要求熟悉文獻(xiàn)標(biāo)引和有關(guān)專業(yè)的知識。指示詞詞頻分析:用特定的指示詞作為分析單元,根據(jù)其頻次進(jìn)行分析判斷。指示詞是文獻(xiàn)內(nèi)容中能反映特定概念的實(shí)義詞,是依據(jù)具體的分析對象和分析目標(biāo)專門選定的,是非標(biāo)準(zhǔn)、非規(guī)范化的。優(yōu)點(diǎn)是有可能滿足特定的分析需要,較為靈活,便于解決一些專門性的問題。但無法利用現(xiàn)成的規(guī)范的文獻(xiàn)標(biāo)引,要在所選定的指示詞的基礎(chǔ)上專門建立有關(guān)的數(shù)據(jù)庫,因此往往工作量要大得多。第26頁,共30頁,2023年,2月20日,星期五內(nèi)容分析法局限——

文獻(xiàn)需具備兩個條件:形式化原則,即能從文獻(xiàn)中抽出便于可靠統(tǒng)計(jì)的、具有語義特征的分析單元。統(tǒng)計(jì)原則,即要有一定數(shù)量的文獻(xiàn)。方法的背景是歸納法。即不可能超越和脫離所分析的文獻(xiàn)。不是一種發(fā)揮想象的開放式方法。方法實(shí)施的工作量大,投入時間較長。特別是長期跟蹤或大范圍掃描的內(nèi)容分析工作,對人力和時間的要求更加突出,需要計(jì)算機(jī)輔助分析。第27頁,共30頁,2023年,2月20日,星期五供詞:“我的小冊子里的全部材料都是從德國公開報(bào)刊上得來的!”內(nèi)容分析法案例——

二戰(zhàn)期間,僑居瑞士的德國新聞記者伯爾托爾德·雅各布編寫的一本反映德軍168位軍事指揮官簡歷的172頁的小冊子事件。第28頁,共30頁,2023年,2月20日,星期五內(nèi)容分析法案例——

奈斯比特《大趨勢——改變我們生活的十個新趨熱》“《趨勢報(bào)告》的工作人員每月不斷地監(jiān)視6000種地方報(bào)紙……經(jīng)過12年這樣仔細(xì)地監(jiān)視地方事件,我已經(jīng)逐漸能清楚地辨別出我們正在對美國進(jìn)行結(jié)構(gòu)重組的方向?!薄嗡贡忍氐?9頁,共30頁,2023年,2月20日,星期五分析樣本——凡10萬人口以上的城市的所有的州政府的地方報(bào)紙均作為分析的對象,并考慮報(bào)紙質(zhì)量和代表性。約6000種地方報(bào)紙。分析的框架——一級共10個,即教育、就業(yè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論