版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
信息資源分布第一頁,共六十六頁,2022年,8月28日2023/1/181第二章信息資源分布§2.1信息資源的集中與分散規(guī)律§2.2信息資源隨時(shí)間的分布規(guī)律§2.3信息資源在空間上的分布規(guī)律第二頁,共六十六頁,2022年,8月28日2023/1/182§2.1信息資源的集中與分散規(guī)律2.1.1信息資源分布的馬太效應(yīng)2.1.2布拉德福定律2.1.3齊夫定律2.1.4洛特卡定律2.1.5普賴斯定律第三頁,共六十六頁,2022年,8月28日2023/1/183§2.1信息資源的集中與分散規(guī)律2.1.1信息資源分布的馬太效應(yīng)馬太效應(yīng):R·默頓(美國)引用圣經(jīng)《新約全書·馬太福音》中的一段話“……誰若有,就給他,并不斷增加;而誰沒有,則已有的都要被奪走”。信息資源產(chǎn)生和分布中的馬太效應(yīng)少數(shù)出版社成為某類圖書的權(quán)威出版機(jī)構(gòu)核心期刊的形成少數(shù)作者成為某一領(lǐng)域的核心作者少數(shù)網(wǎng)站集中了大量用戶傳遞功能強(qiáng)的詞匯被經(jīng)常引用這種信息分布的“富集”與“貧集”的現(xiàn)象是人類社會(huì)特有的選擇機(jī)制支配的結(jié)果。第四頁,共六十六頁,2022年,8月28日2023/1/184§2.1信息資源的集中與分散規(guī)律由馬太效應(yīng)引起的信息富集分布表現(xiàn)為核心趨勢(shì)和集中取向。核心趨勢(shì):是信息生產(chǎn)主體的主動(dòng)期望與采取實(shí)際步驟的結(jié)果。如高產(chǎn)作者群體的形成、期刊信息密度增大、高頻詞匯的確立等集中取向:主要是社會(huì)選擇和影響的結(jié)果,信息生產(chǎn)者基本上處于被動(dòng)狀態(tài)。如一篇論文多次被引、一個(gè)網(wǎng)站被眾多用戶點(diǎn)擊等。第五頁,共六十六頁,2022年,8月28日2023/1/185§2.1信息資源的集中與分散規(guī)律信息分布富集現(xiàn)象的積極意義:突出重點(diǎn)、摒棄平均,為信息源的選擇、獲取、評(píng)價(jià)和利用提供依據(jù),降低信息管理成本,提高信息利用效益。馬太效應(yīng)的不足:馬太效應(yīng)描述的信息資源的優(yōu)勢(shì)和劣勢(shì)過度積累,容易使信息工作者按簡單的優(yōu)劣進(jìn)行信息的選擇、評(píng)價(jià)、傳播和利用,因循守舊,不思進(jìn)取。所形成的信息分布富集優(yōu)勢(shì)僅僅是表面的、外在的。核心信息源是馬太效應(yīng)優(yōu)勢(shì)積累的結(jié)果,但過分注重核心信息源,會(huì)忽略分布在其他信息源中有價(jià)值的信息。馬太效應(yīng)青睞名人、拒絕新人的習(xí)慣勢(shì)力限制了新思想、新知識(shí)和新信息的產(chǎn)生及傳播。第六頁,共六十六頁,2022年,8月28日2023/1/186§2.1信息資源的集中與分散規(guī)律2.1.2布拉德福定律信息資源的離散分布是信息資源的重要屬性,它表現(xiàn)為信息的內(nèi)容單元以不同方式從不同角度分布于各種載體中,信息資源的離散分布具有復(fù)雜的機(jī)理,本質(zhì)上是由信息的生產(chǎn)和利用決定的。產(chǎn)生背景:一門學(xué)科的論文分散在其他學(xué)科的期刊雜志上屢見不鮮。根據(jù)科學(xué)統(tǒng)一性原則,每一學(xué)科都或多或少地與其他任何一門學(xué)科相關(guān)聯(lián)。第七頁,共六十六頁,2022年,8月28日2023/1/187§2.1信息資源的集中與分散規(guī)律2.1.2布拉德福定律英國著名文獻(xiàn)信息學(xué)家布拉德福發(fā)現(xiàn),某一學(xué)科領(lǐng)域中的相關(guān)論文在期刊中的分布是不均勻的,而且具有明顯的集中與分散規(guī)律。他在長期的觀察和統(tǒng)計(jì)基礎(chǔ)之上,提出了有名的“布拉德福分散定律”(Bradford’sLawofScattering),簡稱為布拉德福定律或布氏定律:“如果將科學(xué)期刊按其刊載某個(gè)學(xué)科主題的論文數(shù)量,以遞減順序排列起來,就可以在所有這些期刊中區(qū)分出載文率最高的‘核心’部分和包含著與核心部分同等數(shù)量論文的隨后幾區(qū),這時(shí)核心區(qū)和后繼各區(qū)中所含的期刊數(shù)成1∶a∶a2的關(guān)系(a>1)?!边@就是布拉德福定律的區(qū)域表述形式。設(shè)第一區(qū)(核心區(qū))所涉及的文章n1種期刊;第二區(qū)(相關(guān)區(qū))包括n2種期刊;第三區(qū)(外圍區(qū))包括的n3種期刊。那么,3個(gè)區(qū)中的期刊數(shù)量成下列關(guān)系:
n1:n2:n3=1:a:a2(a>1)
式中:a—布拉德福常數(shù),或稱比例系數(shù)。
第八頁,共六十六頁,2022年,8月28日2023/1/188§2.1信息資源的集中與分散規(guī)律兩個(gè)學(xué)科的期刊分區(qū)表:(1)將刊物按刊載相關(guān)主題文章的載文量多少的遞減順序排列(2)將表中的科學(xué)期刊按其登載論文數(shù)量的大小,期刊分為包含同等數(shù)量論文的三個(gè)區(qū)。相繼各區(qū)的期刊數(shù)成等比數(shù)列其中:9:59:258≈1:5:25第九頁,共六十六頁,2022年,8月28日2023/1/189§2.1信息資源的集中與分散規(guī)律布拉德福定律的圖形描述:如果橫坐標(biāo)取期刊按載文量遞減排列時(shí)的順序號(hào)n的對(duì)數(shù),縱坐標(biāo)取1至n號(hào)期刊所載論文的累積數(shù),我們將繪制出的曲線稱為布拉德福分散曲線。布拉德福分散曲線由三部分構(gòu)成,先是一段上升的曲線AC,然后是一段直線CB,最后是一段上升的曲線BD。第十頁,共六十六頁,2022年,8月28日2023/1/1810§2.1信息資源的集中與分散規(guī)律布拉德福分散曲線R(n)CBDNlgnR(N’)COAR(N)n1R(n1)N’布魯克斯用下述模式來表示布拉德福定律:R(n)=αnβ(曲線部分)(1≤n≤C)(2-1)R(n)=klg(n/s)(直線部分)(C≤n≤N)(2-2)曲線上BD部分只是近似地滿足(2-2)式。論文累積數(shù)期刊累積數(shù)的對(duì)數(shù)第十一頁,共六十六頁,2022年,8月28日2023/1/1811在式中:R(n)——相關(guān)論文累積數(shù)。n——雜志等級(jí)排列的序號(hào)(級(jí))。α——第一級(jí)雜志中的相關(guān)文章數(shù)R(1)。也就是載文章最高的雜志中的相關(guān)文章數(shù)。C——“核心區(qū)”中的雜志數(shù)量。N——等級(jí)排列的雜志總數(shù)。k,s——待定參數(shù),k等于分布曲線中直線部分的斜率,可用實(shí)驗(yàn)方法求得。當(dāng)N足夠大時(shí),k≈N。β——參數(shù),與收藏的雜志(核心中雜志)數(shù)量有關(guān),大小等于分布圖中曲線部分的曲率,β總小于1。式(2-1)和(2-2)就是布拉德福定律的圖形表述形式?!?.1信息資源的集中與分散規(guī)律第十二頁,共六十六頁,2022年,8月28日2023/1/1812以應(yīng)用物理學(xué)期刊為例:§2.1信息資源的集中與分散規(guī)律第十三頁,共六十六頁,2022年,8月28日2023/1/1813§2.1信息資源的集中與分散規(guī)律布拉德福分散曲線:第十四頁,共六十六頁,2022年,8月28日2023/1/1814§2.1信息資源的集中與分散規(guī)律布拉德福定律的數(shù)學(xué)描述令m1,m2,m3為一、二、三各區(qū)中的論文數(shù)量,p1,p2,p3為對(duì)應(yīng)區(qū)的雜志數(shù)量,r1,r2,r3為各區(qū)每種雜志的平均論文數(shù)量,則有:
r1=m1/p1,r2=m2/p2,r3=m3/p3劃分區(qū)域使得:r1p1=r2p2=r3p3=m1p2/p1=r1/r2=a1p3/p2=r2/r3=a2
令a1=a2=a,
則p2=a1p1,p3=a2p2=a1a2p1
于是p1:p2:p3=1:a:a2…………(2-3)第十五頁,共六十六頁,2022年,8月28日2023/1/1815§2.1信息資源的集中與分散規(guī)律布氏定律的維克利解釋將雜志分區(qū)的數(shù)目推廣到n>3的普遍情形。設(shè)將載有某一學(xué)科相關(guān)論文的雜志分為m個(gè)區(qū),使每一區(qū)的論文數(shù)量相等,各區(qū)中期刊的數(shù)量n1,n2,n3,…,nm有如下關(guān)系:
T1:T2:T3:…:Tm=1:b:b2:…:bm-1…………(2-4)其中:b為維氏分布系數(shù)
Ti=ni(i=1,2,…,m)為前i個(gè)區(qū)的雜志數(shù)量
Tm=n1+n2+n3+…+nm=N,N為雜志總數(shù)第十六頁,共六十六頁,2022年,8月28日2023/1/1816§2.1信息資源的集中與分散規(guī)律布拉德福定律的兩個(gè)基本要點(diǎn):一是頻次等級(jí)排序,形成主體來源(期刊)的有序目錄;二是確定相關(guān)論文在主體來源中的分布規(guī)律。布拉德福定律的具體方法則包括區(qū)域分析和圖形描述,雖然兩者數(shù)值并不相等,但所揭示的都是論文在期刊中的分散規(guī)律。20世紀(jì)60年代,人們從不同的角度和側(cè)面提出了許多經(jīng)驗(yàn)分布公式和理論模型,使布拉德福定律取得了很大發(fā)展,但也存在很多問題。對(duì)布拉德福定律進(jìn)行嚴(yán)格檢驗(yàn),比較各公式的優(yōu)劣,尋找更為規(guī)范的精確的數(shù)學(xué)模型;其次要深入研究布氏分布的機(jī)理,尋找科學(xué)的統(tǒng)一的理論解釋;再次,進(jìn)一步分析和研究其適用條件及局限性,大力開展應(yīng)用研究。布拉德福定律主要揭示的是宏觀層次的信息(文獻(xiàn))離散分布,而對(duì)于微觀層次的信息(內(nèi)容單元)分布的研究基本上是空白。第十七頁,共六十六頁,2022年,8月28日2023/1/1817§2.1信息資源的集中與分散規(guī)律2.1.3齊夫定律齊夫定律的研究內(nèi)容任何文集或文獻(xiàn)中不同詞匯的使用有什么特點(diǎn)?它們?cè)谖墨I(xiàn)中出現(xiàn)的頻次有沒有一定的規(guī)律?如果有規(guī)律,其表現(xiàn)形式應(yīng)當(dāng)是怎樣的?齊夫定律正是要回答這個(gè)問題。齊夫定律的表述如果將一篇較長文章(約5000字以上)中每個(gè)詞按其出現(xiàn)頻次遞減排列起來(高頻詞在前,低頻詞在后),并用自然數(shù)給這些詞編上等級(jí)序號(hào),出現(xiàn)頻次最高的為1級(jí),其次為2級(jí)……這樣一直到D級(jí),如果用f表示詞在文章中出現(xiàn)的頻次,用r表示詞的等級(jí)序號(hào),則有:
fr=c…………(2-5)
式中c為常數(shù)。上式稱為齊夫定律。第十八頁,共六十六頁,2022年,8月28日2023/1/1818§2.1信息資源的集中與分散規(guī)律詞頻分布示例rfLgrLgf140000.9922000.695.3031331.104.8941001.384.605801.614.386661.794.197581.944.068502.083.919442.203.7810402.303.69第十九頁,共六十六頁,2022年,8月28日2023/1/1819§2.1信息資源的集中與分散規(guī)律齊夫詞頻分布曲線:如果建立f與r的直角坐標(biāo)系,用橫坐標(biāo)表示詞的等級(jí)序號(hào),縱坐標(biāo)表示出現(xiàn)頻次,就得到一條雙曲線。f25020015010050300r132564第二十頁,共六十六頁,2022年,8月28日2023/1/1820§2.1信息資源的集中與分散規(guī)律
齊夫定律的對(duì)數(shù)曲線:如果等級(jí)r與頻次f都取對(duì)數(shù),則雙曲線變成一條直線。與之等價(jià)的數(shù)學(xué)表達(dá)式為:
lgr+lgf=lgc圖中的虛線表示理想化形式。齊夫定律的修正:一般地,斜率為b的任一直線可表示為:
blgr+lgf=lgc這一直線由圖中的實(shí)線表示。如果將其改寫成(2-5)式的形式就得:
frb=c…(2-6)
取b=1,(2-6)式與(2-5)式相同,因此可以將(2-6)式看做是對(duì)齊夫定律的修正。LgfLgr第二十一頁,共六十六頁,2022年,8月28日2023/1/1821§2.1信息資源的集中與分散規(guī)律齊夫分布的其他形式齊夫定律是一個(gè)純粹的經(jīng)驗(yàn)定律,僅僅使用了一般的統(tǒng)計(jì)方法,其過于簡單的形式和結(jié)論對(duì)于出現(xiàn)頻次特別高的詞和特別低的詞都不能完全滿足。其適用范圍具有一定的局限。朱斯雙參數(shù)等級(jí)分布:美國學(xué)者朱斯指出,在(2-6)式中,不僅c應(yīng)當(dāng)是參數(shù),而且b并不總是等于1,也是一個(gè)參數(shù),齊夫定律可更為一般地表示為:
f(r)=cr-b…………(2-7)式中,b>0,c>0,對(duì)于r=1,2,…,n,式(2-7)就是朱斯的雙參數(shù)等級(jí)分布定律。f(r)表示r位詞出現(xiàn)的頻率(或概率)。第二十二頁,共六十六頁,2022年,8月28日2023/1/1822§2.1信息資源的集中與分散規(guī)律曼德爾布羅三參數(shù)分布:數(shù)學(xué)家曼德爾布羅運(yùn)用信息論原理和概率論方法來研究詞頻分布,用三參數(shù)修正了齊夫定律,使齊夫定律更具有一般性和普遍意義。曼德爾布羅將詞(包括字母間的空格)看做有一定順序的字母序列,并將語言和利用模擬或數(shù)學(xué)公式表達(dá)形式的編碼加以比較。設(shè)r為詞的順序,f(r)為第r個(gè)詞的頻率,m(r)為第r個(gè)詞的詞長。這時(shí)平均詞長為:
L=Σf(r)m(r)當(dāng)給定的熵值最小或當(dāng)L最小時(shí),應(yīng)有:
H=-Σf(r)lgf(r)=常數(shù),以及Σf(r)=1。根據(jù)這些條件,曼德爾布羅從理論上提出了三參數(shù)分布公式:
f(r)=c(r+a)-b………(2-8)第二十三頁,共六十六頁,2022年,8月28日2023/1/1823§2.1信息資源的集中與分散規(guī)律(2-8)式中,0≤a<1,b>0,c>0。a,b,c為參數(shù),具有如下意義:①參數(shù)c與出現(xiàn)概率最高的詞的概率大小相關(guān)或者說與f(1)有關(guān)。當(dāng)a=0,b=1時(shí),c=f(1)。②參數(shù)b與高頻詞數(shù)量的多少有關(guān),對(duì)于r<50的高頻詞,b是r的非減函數(shù),隨著r的增大,參數(shù)b并不減少。③參數(shù)a與詞的數(shù)量n有關(guān),由于a的選擇自由較大,此公式更為靈活,更能夠在各種條件下與測(cè)定的統(tǒng)計(jì)數(shù)據(jù)擬合。第二十四頁,共六十六頁,2022年,8月28日2023/1/1824§2.1信息資源的集中與分散規(guī)律
齊夫定律和朱斯的修正式可以看作曼德爾布羅的特例。齊夫定律是對(duì)自然語言詞匯統(tǒng)計(jì)所得到的規(guī)律。研究表明,人工語言及人工語言語詞構(gòu)成的集合同樣滿足齊夫定律。齊夫定律具有廣泛的應(yīng)用,在信息系統(tǒng)建設(shè)、詞表管理和控制、自動(dòng)標(biāo)引、信息存貯與檢索方面都取得了許多應(yīng)用成果。通過詞頻分布來揭示信息的分布規(guī)律則是齊夫定律在理論上的重要開拓。第二十五頁,共六十六頁,2022年,8月28日2023/1/1825§2.1信息資源的集中與分散規(guī)律2.1.4洛特卡定律洛特卡定律是關(guān)于信息生產(chǎn)者分布的規(guī)律。信息生產(chǎn)者在信息生產(chǎn)過程和生產(chǎn)結(jié)構(gòu)中呈現(xiàn)何種規(guī)律?這種規(guī)律對(duì)信息資料分布有何影響?1926年,統(tǒng)計(jì)學(xué)家洛特卡經(jīng)過大量統(tǒng)計(jì)和研究,在美國著名的學(xué)術(shù)刊物《華盛頓科學(xué)院學(xué)報(bào)》上發(fā)表了一篇題名為“科學(xué)生產(chǎn)率的頻率分布”的論文,旨在通過對(duì)發(fā)表論著的統(tǒng)計(jì)來探明科技工作者的生產(chǎn)能力及對(duì)科技進(jìn)步和社會(huì)發(fā)展所作的貢獻(xiàn)。第二十六頁,共六十六頁,2022年,8月28日2023/1/1826§2.1信息資源的集中與分散規(guī)律洛特卡選擇美國《化學(xué)文摘》和德國奧爾巴赫《物理學(xué)史一覽表》為數(shù)據(jù)源研究科技工作的論著數(shù)量分布。他統(tǒng)計(jì)分析了《化學(xué)文摘》1907~1916年10年累積索引中的部分作者,即姓氏以字母A和B開頭的6891位作者。分別列出發(fā)表過1篇、2篇,一直到346篇論文的人數(shù)?!段锢韺W(xué)史一覽表》包括了1900年前物理學(xué)領(lǐng)域內(nèi)出現(xiàn)的1325位物理學(xué)家及其論著,取其全部數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。第二十七頁,共六十六頁,2022年,8月28日2023/1/1827§2.1信息資源的集中與分散規(guī)律
洛特卡定律的圖形描述:洛特卡以論文數(shù)(x)和作者數(shù)(yx)的對(duì)數(shù)為橫坐標(biāo)和縱坐標(biāo)(即lgx和lgyx)作圖,兩組數(shù)據(jù)都是直線(如圖所示)。圖中虛線表示《化學(xué)文摘》數(shù)據(jù),實(shí)線代表《物理學(xué)史一覽表》的數(shù)據(jù)。用最小二乘法計(jì)算擬合直線的斜率,近似為-2。LogyxLogx10532151253010020第二十八頁,共六十六頁,2022年,8月28日2023/1/1828§2.1信息資源的集中與分散規(guī)律洛特卡定律的數(shù)學(xué)描述:根據(jù)洛特卡分析,在論文數(shù)x和作者數(shù)yx之間存在下列關(guān)系:xnyx=c……………(2-9)
式中,yx
是發(fā)表了論文x篇的作者數(shù),n和c是對(duì)應(yīng)于這一典型數(shù)據(jù)集合而估計(jì)出來的兩個(gè)常數(shù),n的數(shù)值在2上下波動(dòng)。具體到洛特卡統(tǒng)計(jì)的實(shí)例,指數(shù)n近似為2.0,則:
yx=c/x2……………(2-10)
通過變換得到:
=……………(2-11)第二十九頁,共六十六頁,2022年,8月28日2023/1/1829令f(yx)=,實(shí)際表示寫x篇論文的作者出現(xiàn)的頻率,C=,表示作者取樣總數(shù)的比例,這樣式(2-11)可以寫成:
f(yx)=……………(2-12)此即為平方反比分布。兩邊求累計(jì)和得:1==§2.1信息資源的集中與分散規(guī)律第三十頁,共六十六頁,2022年,8月28日2023/1/1830§2.1信息資源的集中與分散規(guī)律即:=1根據(jù)黎曼函數(shù)的計(jì)算方法可知:
C*2/6=1
于是,C=6/2=0.6079第三十一頁,共六十六頁,2022年,8月28日2023/1/1831根據(jù)平方反比分布,所有撰寫一篇論文的著者的比例剛剛超過60%。《物理學(xué)史一覽表》數(shù)據(jù)中,共有1325位作者,寫一篇論文的為784人,占總數(shù)的59.2%《化學(xué)文摘》中,姓氏以A開頭的作者共1524人,寫一篇論文的為890人,占57.7%。洛特卡定律是對(duì)兩組數(shù)據(jù)統(tǒng)計(jì)的推廣、是對(duì)信息生產(chǎn)的一般理論估計(jì),而不是一個(gè)精確的統(tǒng)計(jì)分布,因而有其局限性。在洛特卡之后,許多學(xué)者采用不同的工具進(jìn)行了數(shù)據(jù)研究,獲得了與洛特卡定律相同的結(jié)論,只是n和c是更為一般的參數(shù)而不是常數(shù)?!?.1信息資源的集中與分散規(guī)律第三十二頁,共六十六頁,2022年,8月28日2023/1/1832§2.1信息資源的集中與分散規(guī)律2.1.5普賴斯定律受洛特卡定律的啟示,普賴斯提出了核心生產(chǎn)者分布的“平方根定律”。即在某一特定領(lǐng)域中,全部論文的半數(shù)是由該領(lǐng)域中全部作者的平方根的那些人撰寫的。該定律可表示為:
=(2-13)
式中,n(x)為撰寫x篇論文的作者數(shù);I=nmax為該學(xué)科規(guī)定時(shí)期內(nèi)最高產(chǎn)作者發(fā)表的論文數(shù);N為該學(xué)科領(lǐng)域全部作者總數(shù)。m可由下式確定:=(2-14)第三十三頁,共六十六頁,2022年,8月28日2023/1/1833§2.1信息資源的集中與分散規(guī)律如果規(guī)定發(fā)表了n篇論文的作者人數(shù)為a(n),則發(fā)表n≤N≤n’篇論文的作者人數(shù)為:A(n-n’)=a(n)+a(n+1)+…+a(n’)
=……………(2-15)a(n)名作者一共發(fā)表的論文為p(n)=n·a(n)同理,發(fā)表了n≤N≤n’篇論文的作者總共發(fā)表的論文數(shù)為:P(N)=P(n-n’)=na(n)+(n+1)a(n+1)+…+n’a(n’)
=……………(2-16)
第三十四頁,共六十六頁,2022年,8月28日2023/1/1834§2.1信息資源的集中與分散規(guī)律若P(1→nmax)/2=P(m→nmax)=P(1→m),則有:
=(2-17)其中,a(n)=,a(n)是頻數(shù)。因此,P(1→n)=由調(diào)和級(jí)數(shù)和的公式可得:P(1→n)=c(lnn+0.577+…+εn)第三十五頁,共六十六頁,2022年,8月28日2023/1/1835§2.1信息資源的集中與分散規(guī)律
化簡得,m=0.749(nmax)1/2
式子表明,撰寫0.749(nmax)1/2篇以上論文的作者所發(fā)表的論文數(shù)等于論文總數(shù)的一半。高產(chǎn)作者中一位最低產(chǎn)的作者發(fā)表的論文數(shù)量,等于最高產(chǎn)作者所發(fā)表論文數(shù)的平方根的0.749倍。另一方面,
K===
這個(gè)式子表明了高產(chǎn)作者人數(shù)同全體作者人數(shù)的比例關(guān)系。第三十六頁,共六十六頁,2022年,8月28日2023/1/1836§2.1信息資源的集中與分散規(guī)律
普賴斯定律僅僅是在洛特卡定律基礎(chǔ)上提出的一種假說構(gòu)想,洛特卡定律中指數(shù)n不等于2的情況同樣影響著普賴斯定律。普賴斯定律的意義在于它簡潔地描述了信息按生產(chǎn)者能力的分布情況。洛特卡定律、普賴斯定律和其他一些描述文獻(xiàn)信息生產(chǎn)者分布的規(guī)律都揭示了少數(shù)信息生產(chǎn)者生產(chǎn)了大量信息的規(guī)律和特點(diǎn)。第三十七頁,共六十六頁,2022年,8月28日2023/1/1837§2.2信息隨時(shí)間的分布規(guī)律2.2.1指數(shù)增長律1.普賴斯曲線2.生長曲線2.2.2逐漸過時(shí)率第三十八頁,共六十六頁,2022年,8月28日2023/1/1838§2.2信息隨時(shí)間的分布規(guī)律研究信息在時(shí)間軸上的動(dòng)態(tài)分布規(guī)律可以揭示信息資源的增長與老化,把握信息量的變化,對(duì)信息實(shí)施動(dòng)態(tài)管理。隨著社會(huì)經(jīng)濟(jì)和科學(xué)技術(shù)的高度發(fā)展,信息的爆炸式增長不斷影響著人們對(duì)信息的利用和吸收,描述信息的增長規(guī)律成為學(xué)術(shù)界和實(shí)際工作者關(guān)注的重要課題。第三十九頁,共六十六頁,2022年,8月28日2023/1/1839§2.2信息隨時(shí)間的分布規(guī)律2.2.1指數(shù)增長律1、普賴斯曲線(1)研究對(duì)象和研究方法
1944年,F(xiàn).賴德就對(duì)美國大學(xué)圖書館藏書作了調(diào)查統(tǒng)計(jì),他以豐富的數(shù)據(jù)證明,全美主要大學(xué)圖書館的藏書平均每16年遞增1倍。繼賴德之后,普賴斯對(duì)信息的爆炸式增長進(jìn)行了深入研究。1665年在法國創(chuàng)辦了第一本期刊,1750年增加至10種,1800年增至100種,1850年為1,000種,1900年為10,000種,目前已近10萬種,幾乎是每50年增加10倍。其次,根據(jù)《化學(xué)文摘》、《生物學(xué)文摘》、《科學(xué)文摘》近幾十年的數(shù)據(jù),也可發(fā)現(xiàn)同樣的增長趨勢(shì)。第四十頁,共六十六頁,2022年,8月28日2023/1/1840§2.2信息隨時(shí)間的分布規(guī)律F(t)1001019001950t1665100001000180017501850普賴斯曲線如果以文獻(xiàn)量為縱軸,以歷史年代為橫軸,把各不同年代的文獻(xiàn)量在坐標(biāo)圖上逐點(diǎn)描繪出來,然后以一光滑曲線連接各點(diǎn),則可十分近似地表征文獻(xiàn)隨時(shí)間增長的規(guī)律。第四十一頁,共六十六頁,2022年,8月28日2023/1/1841§2.2信息隨時(shí)間的分布規(guī)律(2)普賴斯曲線的描述通過對(duì)曲線分析,普賴斯最先注意到文獻(xiàn)增長與時(shí)間成指數(shù)函數(shù)關(guān)系。如果用F(t)表示時(shí)刻t的文獻(xiàn)量,則指數(shù)定律可表為下式:
F(t)=aebt…(2-22)
式中:a是統(tǒng)計(jì)的初始時(shí)刻(t=0)的文獻(xiàn)量;
e=2.718;
b表示持續(xù)增長率。人們還常常用文獻(xiàn)量翻一倍的時(shí)間來衡量文獻(xiàn)的增長速度,即
t′=(ln2)/b……(2-23)
式中:t′為文獻(xiàn)量翻倍時(shí)間,b為持續(xù)增長率。第四十二頁,共六十六頁,2022年,8月28日2023/1/1842§2.2信息隨時(shí)間的分布規(guī)律(3)普賴斯曲線的實(shí)例說明例如,在某一初始時(shí)刻,文獻(xiàn)量a=10000件,增長率為10%,那么10年后文獻(xiàn)量將是:
F(10)=10
000
e0.1*10
=27
183(件)100年以后的文獻(xiàn)量將是:
F(100)=10
000
e0.1*100
=220
264
660(件)文獻(xiàn)量翻一倍的時(shí)間是:
t′=
ln
2/0.1=0.693/0.1=6.93(年)從統(tǒng)計(jì)實(shí)例、對(duì)1952~1982年間世界圖書增長情況和1907~1977年世界化學(xué)論文數(shù)量的統(tǒng)計(jì)分析來看,文獻(xiàn)的指數(shù)增長定律具有一定程度的正確性和普遍性,并獲得了學(xué)術(shù)界承認(rèn)。第四十三頁,共六十六頁,2022年,8月28日2023/1/1843§2.2信息隨時(shí)間的分布規(guī)律(4)普賴斯曲線的內(nèi)在機(jī)理文獻(xiàn)信息(或者信息)指數(shù)增長的內(nèi)在原因是由于社會(huì)信息流的傳播和影響的結(jié)果。人們接受新思想、新信息的概率會(huì)隨著時(shí)間的推移而增大。這是因?yàn)檎莆招滤枷牒托滦畔⒌娜藬?shù)本身是按指數(shù)增加的,他們必然要從事知識(shí)信息的生產(chǎn)和傳播,這就必然引致信息量指數(shù)增長。如果一個(gè)人接受新思想、新信息的概率隨時(shí)間按固定比例增大,則有:
解此方程得:
lnN=bt+C,則:N=ecebt
令ec=a,則N=aebt,正好與(2-22)式相同。第四十四頁,共六十六頁,2022年,8月28日2023/1/1844§2.2信息隨時(shí)間的分布規(guī)律(5)普賴斯曲線的修正實(shí)際的統(tǒng)計(jì)發(fā)現(xiàn),不同時(shí)期、不同級(jí)別、不同質(zhì)量、不同學(xué)科領(lǐng)域的文獻(xiàn)信息增長態(tài)勢(shì)是不一樣的。勒希爾考察了不同質(zhì)量級(jí)別的文獻(xiàn)增長狀況,發(fā)現(xiàn)它們的增長速度差別很大。勒希爾認(rèn)為,文獻(xiàn)的數(shù)量與其質(zhì)量有關(guān)。他定義λ(0≤λ≤1)為文獻(xiàn)的質(zhì)量級(jí)別,則不同級(jí)別上的文獻(xiàn)量為[F(t)]λ。他給λ的具體值如下:
λ=1:至少是一般文獻(xiàn)(實(shí)際代表所有文獻(xiàn))λ=3/4:至少是有意義的文獻(xiàn)
λ=1/2:至少是重要的文獻(xiàn)
λ=1/4:至少是非常重要的文獻(xiàn)
λ=0:第一流的文獻(xiàn),文獻(xiàn)數(shù)量為lnF(t)。第四十五頁,共六十六頁,2022年,8月28日2023/1/1845§2.2信息隨時(shí)間的分布規(guī)律如果文獻(xiàn)總數(shù)為100萬件,根據(jù)勒希爾定義的質(zhì)量級(jí)別,則有:
1000000:至少是一般文獻(xiàn)(即文獻(xiàn)總數(shù))
31623:至少是有意義的文獻(xiàn)
1000:至少是重要的文獻(xiàn)
32:至少是非常重要的文獻(xiàn)
14:第一流的文獻(xiàn)如果文獻(xiàn)量翻倍時(shí)間為t′,那么質(zhì)量為λ級(jí)的文獻(xiàn)數(shù)量翻倍時(shí)間將是t′/λ。于是當(dāng)人們力圖提高文獻(xiàn)質(zhì)量時(shí),指數(shù)增長減慢,對(duì)于第一流的文獻(xiàn)(λ=0),指數(shù)增長規(guī)律完全破壞,并且每一周期僅有一常數(shù)增量。在這種情況下,文獻(xiàn)的增長函數(shù)是線性的,即:第四十六頁,共六十六頁,2022年,8月28日2023/1/1846§2.2信息隨時(shí)間的分布規(guī)律對(duì)于前述例子,b=0.1,文獻(xiàn)總量翻一倍的時(shí)間為6.93年,那么對(duì)各個(gè)質(zhì)量級(jí)別的文獻(xiàn)而言,文獻(xiàn)量對(duì)應(yīng)的翻倍時(shí)間是:
9.24年——至少是有意義的文獻(xiàn)(λ=3/4)
13.86年——至少是重要的文獻(xiàn)(λ=1/2)
27.72年——至少是非常重要的文獻(xiàn)(λ=1/4)
對(duì)于第一流的文獻(xiàn)(λ=0):
第四十七頁,共六十六頁,2022年,8月28日2023/1/1847§2.2信息隨時(shí)間的分布規(guī)律2、生長曲線(1)生長曲線的描述
普賴斯指出,考慮物質(zhì)的、經(jīng)濟(jì)的、智力的及時(shí)間的影響和限制,文獻(xiàn)信息的增長更趨近于生物的生長曲線(LogisticCurve),即最初生長或繁殖很快,隨著時(shí)間推移,其生長速度越來越慢,以致幾乎不增加了。其方程為:
F(t)=k/(1+ae-kbt)…………(2-25)式中:F(t)代表時(shí)刻t的文獻(xiàn)量,k為文獻(xiàn)增長的最大值。第四十八頁,共六十六頁,2022年,8月28日2023/1/1848§2.2信息隨時(shí)間的分布規(guī)律生長曲線生長曲線表明,在文獻(xiàn)增長的初始階段,它是符合指數(shù)增長規(guī)律的,但它不能始終保持指數(shù)增長的勢(shì)頭,當(dāng)文獻(xiàn)增至最大值的一半時(shí),增長率開始變小,最后緩慢增長,并以k為其極限。F(t)tK/2(lna)/kb第四十九頁,共六十六頁,2022年,8月28日2023/1/1849§2.2信息隨時(shí)間的分布規(guī)律(2)生長曲線的應(yīng)用生長曲線在描述科學(xué)文獻(xiàn)增長規(guī)律時(shí),取得了一定成功。如果單獨(dú)就某一具體學(xué)科領(lǐng)域內(nèi)文獻(xiàn)的增長而言,生長曲線極好地描述了它們的增長規(guī)律。一般來說,在不同的階段科學(xué)文獻(xiàn)增長的態(tài)勢(shì)是不同的。學(xué)科處于誕生和發(fā)展階段,文獻(xiàn)量指數(shù)增長,文獻(xiàn)的壽命較短。學(xué)科進(jìn)入相對(duì)成熟階段,文獻(xiàn)增長就不能總保持原有的指數(shù)速率,增長率變小,曲線變得平緩,文獻(xiàn)壽命相對(duì)變長。某一知識(shí)領(lǐng)域的研究取得重大進(jìn)展后進(jìn)入相對(duì)成熟的階段。內(nèi)容上更新的文獻(xiàn)又將進(jìn)入一個(gè)新的急劇增長時(shí)期(如指數(shù)增長)。然后又進(jìn)入一個(gè)穩(wěn)定時(shí)期。第五十頁,共六十六頁,2022年,8月28日2023/1/1850§2.2信息隨時(shí)間的分布規(guī)律文獻(xiàn)的增長往往會(huì)出現(xiàn)幾個(gè)急劇增長時(shí)期和幾個(gè)相對(duì)穩(wěn)定時(shí)期,呈現(xiàn)出錯(cuò)綜復(fù)雜的格局。一般說來,對(duì)不同的領(lǐng)域,描述其文獻(xiàn)增長的生長曲線中各個(gè)常數(shù)(a,b和k)也是不相同的。但生長曲線仍有其局限,由(2-25)式可知,當(dāng)t→+∞時(shí),
F(t)
→k,這表明當(dāng)科學(xué)發(fā)展到一定階段時(shí),文獻(xiàn)的增長率為零,而文獻(xiàn)總量達(dá)到了不可逾越的最大值。這意味著某個(gè)年代之后,再也沒有新的文獻(xiàn)產(chǎn)生,這顯然是不符合實(shí)際的。
第五十一頁,共六十六頁,2022年,8月28日2023/1/1851§2.2信息隨時(shí)間的分布規(guī)律(3)普賴斯曲線與生長曲線的局限性利用指數(shù)曲線和生長曲線來研究文獻(xiàn)增長、預(yù)測(cè)未來文獻(xiàn)總量必然會(huì)有局限。這是因?yàn)椋簩W(xué)科差異性:指數(shù)增長定律的產(chǎn)生,首先是普賴斯分析研究物理學(xué)文獻(xiàn)數(shù)量的增長時(shí)提出的,然后把這一結(jié)果擴(kuò)大到科學(xué)期刊和其他類型的出版物上,繪制了普賴斯曲線。把對(duì)文獻(xiàn)某一方面、某一歷史階段的研究成果,推廣到文獻(xiàn)的全部領(lǐng)域,根據(jù)是不充分的。缺乏系統(tǒng)分析:利用上述二曲線對(duì)文獻(xiàn)增長所作的預(yù)測(cè),依據(jù)的是預(yù)測(cè)學(xué)中的趨勢(shì)外推法。文獻(xiàn)作為傳播信息這一復(fù)雜系統(tǒng)中的子系統(tǒng),其增長規(guī)律受到許多因素的影響和制約,只有利用系統(tǒng)論的觀點(diǎn)對(duì)其作系統(tǒng)分析,才能得到比較符合實(shí)際的結(jié)果。第五十二頁,共六十六頁,2022年,8月28日2023/1/1852§2.2信息隨時(shí)間的分布規(guī)律2.2.2逐漸過時(shí)率1、文獻(xiàn)老化的表現(xiàn)文獻(xiàn)中所含信息仍然有用,但現(xiàn)在已被包含在更新的其他論著中;文獻(xiàn)中信息仍舊有用,但現(xiàn)在正處于一個(gè)人們對(duì)其興趣下降的學(xué)科;文獻(xiàn)中的信息仍舊有用,但為后來的著作所超越;信息不再有用。2、文獻(xiàn)老化的衡量標(biāo)準(zhǔn)文獻(xiàn)半衰期:某學(xué)科領(lǐng)域現(xiàn)在尚在利用的全部文獻(xiàn)中的一半是在多長一段時(shí)間內(nèi)發(fā)表的。普賴斯指數(shù):即某一學(xué)科領(lǐng)域內(nèi),對(duì)發(fā)表年限不超過5年的文獻(xiàn)的引用次數(shù)與總的引用次數(shù)之比值。一般來說,普賴斯指數(shù)越大,半衰期就越小,文獻(xiàn)老化的速度越快。第五十三頁,共六十六頁,2022年,8月28日2023/1/1853§2.2信息隨時(shí)間的分布規(guī)律3、文獻(xiàn)信息老化曲線用縱坐標(biāo)表示現(xiàn)在正被利用(引證)的文獻(xiàn)的被引量,橫坐標(biāo)表示時(shí)間,我們可以繪制出文獻(xiàn)的老化曲線。相應(yīng)的方程可表示為:
C(t)=ke-at…………(2-26)式中:C(t)表示發(fā)表了t年的文獻(xiàn)的被引次數(shù),k是常數(shù),隨學(xué)科不同而異,a為老化率。被引證次數(shù)C(t)0.5出版年齡tt1t2t3第五十四頁,共六十六頁,2022年,8月28日2023/1/1854§2.2信息隨時(shí)間的分布規(guī)律4、文獻(xiàn)信息老化的影響因素文獻(xiàn)增長。文獻(xiàn)的增長和老化是一個(gè)事物的兩個(gè)方面,它們從不同的側(cè)面來描述科學(xué)的發(fā)展,闡明科學(xué)知識(shí)的修正率。因此,文獻(xiàn)的老化,首先是與文獻(xiàn)的增長聯(lián)系在一起的。
學(xué)科差異。世界上93%~98%的科學(xué)雜志引用壽命為20年左右,但并不是所有這些學(xué)科的文獻(xiàn)老化速率都大體一致,相反,彼此之間差異甚大。學(xué)科發(fā)展階段的差異。即使是同一學(xué)科,不同的時(shí)期或階段,文獻(xiàn)的半衰期不盡完全相同。信息環(huán)境和需求。不同信息用戶對(duì)文獻(xiàn)的需求是不同的,因而信息利用者的需求及所處的信息環(huán)境的研究十分必要。第五十五頁,共六十六頁,2022年,8月28日2023/1/1855§2.3信息資源在空間上的分布2.3.1信息的擴(kuò)散與分布1.信息擴(kuò)散的多向?qū)ΨQ性2.信息傳遞的密度遞減法則2.3.2文獻(xiàn)信息資源分布格局第五十六頁,共六十六頁,2022年,8月28日2023/1/1856§2.3信息資源在空間上的分布2.3.1信息的擴(kuò)散與分布1、信息擴(kuò)散的多向?qū)ΨQ性信息擴(kuò)散的多向?qū)ΨQ性是指信息在傳遞或擴(kuò)散過程中,如果信息源S所處的外圍介質(zhì)(包括自然介質(zhì)、社會(huì)介質(zhì))是同質(zhì)均勻分布的話,則S的信息傳遞就成一種各向?qū)ΨQ結(jié)構(gòu)。多向?qū)ΨQ的形式:傳遞速度對(duì)稱:信息自信源出發(fā)經(jīng)歷相同的時(shí)間,其傳播的距離相同。傳遞內(nèi)容對(duì)稱:信息向各個(gè)方向傳遞時(shí),只要信息提供者發(fā)出的信息是相同的內(nèi)容,則傳向各方的信息內(nèi)容是一樣的;傳遞空間(或距離)對(duì)稱:主要指社會(huì)空間的一致;傳遞的信息強(qiáng)度對(duì)稱:信息沿各個(gè)方向上單位時(shí)間所傳遞的信息量或是每次傳遞時(shí)信息在各個(gè)傳遞方向上的數(shù)量特征是相同的。第五十七頁,共六十六頁,2022年,8月28日2023/1/1857§2.3信息資源在空間上的分布多向?qū)ΨQ性原則的適用條件是同質(zhì)均勻分布的外部介質(zhì),當(dāng)這一條件不成立時(shí),也就導(dǎo)出了一些新的信息擴(kuò)散規(guī)律。這就是多向?qū)ΨQ的引申原則,具體包括:①信息傳遞的拓?fù)湓瓌t(信息棧拓?fù)鋱D)拓?fù)湓瓌t是指信息從S傳遞至R時(shí),如果是均勻介質(zhì)環(huán)境,則S—R是最直接、最快速的傳遞。但若是非均勻介質(zhì)條件下,S—R信息流就要出現(xiàn)拓?fù)渥儞Q,即在傳遞過程中會(huì)出現(xiàn)種種“信息?!眮韨鬟f信息,因?yàn)樾畔⒔橘|(zhì)的每一次改變都要經(jīng)過一次轉(zhuǎn)換,都要經(jīng)過“信息棧”予以變換。第五十八頁,共六十六頁,2022年,8月28日2023/1/1858§2.3信息資源在空間上的分布信息棧拓?fù)鋱D
S
R
均勻介質(zhì)
S
R
第五十九頁,共六十六頁,2022年,8月28日2023/1/1859§2.3信息資源在空間上的分布②多路傳遞法則多路傳遞法則,又稱多通道原則,它是指在S至R的信息傳遞過程中,除了S與R的直接溝通之外,還可以通過其他的通道,經(jīng)過或不經(jīng)過信息棧而將信息傳遞給接受者R。多路傳遞法則的理論基礎(chǔ):
a.信息是可以分享的;
b.信息是可以分棧傳遞的。第六十頁,共六十六頁,2022年,8月28日2023/1/1860§2.3信息資源在空間上的分布2.信息傳遞的密度遞減法則信息傳遞涉及到時(shí)間和空間兩個(gè)方面,因此,衰減也就發(fā)生在這兩個(gè)方面。從空間方面來說,設(shè)S為信息源,并設(shè)其在t時(shí)刻以聲音向外傳遞信息。信息是以各向?qū)ΨQ形式發(fā)送的,呈圓周對(duì)稱形狀。如果以聲音的壓強(qiáng)為信息特征,顯然,壓強(qiáng)大,則信息被感受的可能性就
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 協(xié)議離婚的協(xié)議書范本10篇
- 2023安全生產(chǎn)責(zé)任協(xié)議書七篇
- 萬能模板賠償協(xié)議書范本10篇
- 機(jī)械基礎(chǔ) 課件 模塊六任務(wù)二 鏈傳動(dòng)
- 中醫(yī)藥基礎(chǔ)專題知識(shí)宣教
- (立項(xiàng)備案申請(qǐng)模板)超薄金剛石項(xiàng)目可行性研究報(bào)告參考范文
- (安全生產(chǎn))選礦廠安全生產(chǎn)標(biāo)準(zhǔn)化自評(píng)報(bào)告
- (2024)酒文化創(chuàng)意產(chǎn)業(yè)園建設(shè)項(xiàng)目可行性研究報(bào)告(一)
- 清明節(jié)緬懷先烈主題班會(huì)71
- 2023年薄板木船項(xiàng)目籌資方案
- 【基于抖音短視頻的營銷策略分析文獻(xiàn)綜述2800字(論文)】
- 2021-2022學(xué)年度西城區(qū)五年級(jí)上冊(cè)英語期末考試試題
- 《組織行為學(xué)》(本)形考任務(wù)1-4
- 廣東省廣州市白云區(qū)2022-2023學(xué)年九年級(jí)上學(xué)期期末語文試題
- 劇本-進(jìn)入黑夜的漫長旅程
- DB43-T 958.3-2023 實(shí)驗(yàn)用小型豬 第3部分:配合飼料
- 化肥購銷合同范本正規(guī)范本(通用版)
- 健康管理專業(yè)職業(yè)生涯規(guī)劃書
- 外墻巖棉板施工方案
- 吊裝葫蘆施工方案
- 自動(dòng)化設(shè)備調(diào)試規(guī)范
評(píng)論
0/150
提交評(píng)論