基于共詞分析的檔案學(xué)關(guān)鍵詞規(guī)范化研究_第1頁
基于共詞分析的檔案學(xué)關(guān)鍵詞規(guī)范化研究_第2頁
基于共詞分析的檔案學(xué)關(guān)鍵詞規(guī)范化研究_第3頁
基于共詞分析的檔案學(xué)關(guān)鍵詞規(guī)范化研究_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于共詞分析的檔案學(xué)關(guān)鍵詞規(guī)范化研究基于共詞分析的檔案學(xué)關(guān)鍵詞標(biāo)準(zhǔn)化研究

共詞分析是文獻(xiàn)研究中常用的內(nèi)容分析辦法。它以任意兩個(gè)詞在同一篇文章中出現(xiàn)的次數(shù)為依據(jù),進(jìn)行聚類分析,得出詞與詞之間的遠(yuǎn)近關(guān)系,反映隱藏在這種遠(yuǎn)近關(guān)系背后的學(xué)科研究方向和主題結(jié)構(gòu)的變化。共詞分析法于20世紀(jì)70年代由法國文獻(xiàn)計(jì)量學(xué)家提出,經(jīng)過幾十年的開展,已經(jīng)被廣泛應(yīng)用于多個(gè)領(lǐng)域研究。

共詞分析的根底是標(biāo)準(zhǔn)的關(guān)鍵詞。我們發(fā)現(xiàn),僅從共詞分析的角度來看,關(guān)鍵詞標(biāo)注尚欠標(biāo)準(zhǔn)。如無改觀,進(jìn)行共詞分析時(shí),在數(shù)據(jù)源上便出現(xiàn)偏差,研究結(jié)果勢(shì)必會(huì)與事實(shí)不符。文章的探討重點(diǎn),便是如何解決這一問題。

一、相關(guān)概念

〔一〕共詞分析

共詞分析是在大量文獻(xiàn)中兩兩統(tǒng)計(jì)、共同出現(xiàn)的關(guān)鍵詞,用統(tǒng)計(jì)數(shù)據(jù)來分析詞與詞之間的關(guān)聯(lián)強(qiáng)度,并用結(jié)構(gòu)圖將這種關(guān)系形象直觀地展示出來。同一篇文獻(xiàn)中兩個(gè)關(guān)鍵詞出現(xiàn)的次數(shù)越多,使可認(rèn)為其關(guān)系越密切。由此可以分析所在研究領(lǐng)域的研究熱點(diǎn),該領(lǐng)域各學(xué)科的開展過程、特點(diǎn)等。

共詞分析大體可分為六個(gè)步驟。其一,確定分析的問題;其二,選取分析的詞聚集合,如主題詞或關(guān)鍵詞;其三,篩選出高頻詞,即共現(xiàn)頻次高的詞;其四,統(tǒng)計(jì)詞匯共現(xiàn)的頻率,構(gòu)建共詞矩陣;其五,分析共詞矩陣的特征;其六,得出研究結(jié)論。關(guān)鍵詞架起文獻(xiàn)數(shù)據(jù)和可視化分析的橋梁,如何準(zhǔn)確、完整地選取關(guān)鍵詞,便是成功進(jìn)行共詞分析的重要前提。正確的共詞分析研究結(jié)果,能為我們提供良好的決策參考,是判斷未來學(xué)科開展方向的依據(jù)。

〔二〕關(guān)鍵詞

二、實(shí)證研究

本實(shí)證研究以檔案學(xué)領(lǐng)域的研究熱點(diǎn)為主題,通過比擬研究法,表明關(guān)鍵詞標(biāo)引標(biāo)準(zhǔn)化在共詞分析,乃至整個(gè)文獻(xiàn)分析領(lǐng)域的重要性。

〔一〕數(shù)據(jù)來源

中國知網(wǎng)〔ChinaNationalKnowledgeInfrastructure,中國國家知識(shí)根底設(shè)施,簡(jiǎn)稱CNKI〕與維普、萬方并稱我國三大中文數(shù)據(jù)庫系統(tǒng)。中國知網(wǎng)CNKI以收錄文獻(xiàn)種類多、數(shù)量大,位居三大中文數(shù)據(jù)庫之首。作為知識(shí)資源傳播共享平臺(tái),中國知網(wǎng)獲得99%的核心期刊、重要評(píng)價(jià)性數(shù)據(jù)庫來源期刊授權(quán),文獻(xiàn)內(nèi)容涵蓋文史哲、項(xiàng)目科技、信息科技等十大領(lǐng)域。本文數(shù)據(jù)取自CNKI,采用1979年至2022年數(shù)據(jù),即在“學(xué)科領(lǐng)域〞中檢索“檔案學(xué)〞,默認(rèn)其他條件,于2022年5月8日檢索到檔案學(xué)研究領(lǐng)域的相關(guān)文獻(xiàn)25990篇。

〔二〕研究辦法

從CNKI下載格式為Refworks的文獻(xiàn)題錄。使用文本整理器和Editplus對(duì)文獻(xiàn)題錄進(jìn)行去噪處理,形成BibExcel可以辨認(rèn)處理的文本格式,用BibExcel統(tǒng)計(jì)詞頻,再利用CiteSpaceШ進(jìn)行聚類分析,繪制可視化圖譜。

〔三〕數(shù)據(jù)檢驗(yàn)

在Bibexcel中以DE為統(tǒng)計(jì)標(biāo)簽,統(tǒng)計(jì)得到檔案學(xué)領(lǐng)域論文關(guān)鍵詞共計(jì)36618個(gè),關(guān)鍵詞累計(jì)出現(xiàn)頻次為176382次,平均頻次為4.82次/個(gè)。統(tǒng)計(jì)分析中發(fā)現(xiàn)關(guān)鍵詞存在問題如下:

1.詞義混用

因?yàn)樽髡哂迷~習(xí)慣不同,不同作者存在關(guān)鍵詞差別,差別主要體現(xiàn)在同義詞、近義詞、縮寫詞等的運(yùn)用上,如“檔案管理〞、“檔案工作〞、“檔案事業(yè)〞等。這些表述各異的關(guān)鍵詞雖意義相同,但共詞分析卻不能共現(xiàn),造成關(guān)鍵詞零星瑣碎,詞頻降低。應(yīng)對(duì)措施是在詞頻統(tǒng)計(jì)前,進(jìn)行標(biāo)準(zhǔn)化處理,如把“檔案數(shù)字化〞、“數(shù)字化檔案〞、“數(shù)字化工作〞等統(tǒng)一表述為“數(shù)字檔案〞。

2.達(dá)意寬泛

有的關(guān)鍵詞存在達(dá)意寬泛?jiǎn)栴},如表1所示。這些關(guān)鍵詞不僅不能表明研究主題,相反倒增加了共詞矩陣的維數(shù),使其過于繁瑣,給后續(xù)數(shù)據(jù)統(tǒng)計(jì)分析帶來噪音干擾。在此,我們把這類關(guān)鍵詞視同是無關(guān)關(guān)鍵詞,果決刪除。

3.分類不當(dāng)

分類不當(dāng)又可以分為分類不細(xì)和分類過細(xì)。

〔1〕分類不細(xì)。如關(guān)鍵詞“檔案學(xué)研究〞,單從詞義理解,無從知道文章是研究檔案學(xué)的根底理論與開展,還是研究檔案信息資源的開發(fā)與利用,亦或是研究檔案愛護(hù)技術(shù)。理解有歧義,概念不清,分析便有偏差。我們要根據(jù)文獻(xiàn)“題名〞和“摘要〞,研讀文獻(xiàn)內(nèi)容,對(duì)這類關(guān)鍵詞進(jìn)行修正,力求具體、到位,如把“檔案學(xué)研究〞細(xì)化為“檔案理論〞、“檔案利用〞或“檔案愛護(hù)〞。

〔2〕分類過細(xì)。如研究對(duì)象為國內(nèi)外檔案,“文書檔案〞、“科技檔案〞、“人事檔案〞、“數(shù)字檔案〞、“高校檔案〞、“教學(xué)檔案〞、“職專檔案〞、“教學(xué)檔案〞、“基建檔案〞等關(guān)鍵詞,在做關(guān)鍵詞共現(xiàn)研究時(shí)會(huì)因其頻次過低而不得進(jìn)入研究視野。因而,在做相關(guān)研究時(shí),需下功夫調(diào)整關(guān)鍵詞,如添加上位詞“實(shí)體檔案〞、“數(shù)字檔案〞等。

〔四〕數(shù)據(jù)分析

我們抽取頻次為300以上的高頻關(guān)鍵詞,建成表2,此表印證了關(guān)鍵詞標(biāo)引普遍存在的問題。一是研究主題相同的關(guān)鍵詞重復(fù)出現(xiàn),如“檔案數(shù)字化〞、“數(shù)字檔案〞、“數(shù)字化檔案〞;“數(shù)字化〞、“數(shù)字化工作〞等。二是語意相近的關(guān)鍵詞頻繁出現(xiàn),如“檔案利用〞、“開發(fā)利用〞;“現(xiàn)代化管理〞、“檔案管理現(xiàn)代化〞等。三是達(dá)意寬泛的關(guān)鍵詞屢見不鮮,如“檔案〞、“建設(shè)〞、“管理〞等。表3集中匯總了表2出現(xiàn)的問題關(guān)鍵詞的詞頻。

共詞分析所取的關(guān)鍵詞不倡議過多,否那么會(huì)生成高維矩陣,導(dǎo)致數(shù)據(jù)處理繁瑣。聚類分析中如果選取300頻次以上的高頻詞分析其共現(xiàn)情況,由于上述三類問題關(guān)鍵詞的存在,勢(shì)必會(huì)擠掉其他有研究意義的關(guān)鍵詞,造成數(shù)據(jù)源偏頗,數(shù)據(jù)分析失誤。

根據(jù)文章提出的對(duì)關(guān)鍵詞標(biāo)準(zhǔn)化處理的原那么和辦法,對(duì)關(guān)鍵詞作了刪除、整合、增補(bǔ)等標(biāo)準(zhǔn)化操作,得到如圖2所示基于關(guān)鍵詞共現(xiàn)的多維聚類圖。

依據(jù)CiteSpaceШ聚類分析結(jié)果,我們直觀地將檔案學(xué)研究主題分成了9類:檔案事業(yè)研究、檔案信息研究、事業(yè)單位研究、檔案資料研究、檔案館工作研究、現(xiàn)行文件研究、文書工作研究、檔案專業(yè)研究、情報(bào)工作者研究。如需詳細(xì)了解各類研究?jī)?nèi)容以及未來開展趨勢(shì),還要對(duì)以上聚類結(jié)果做進(jìn)一步研究分析。

三、標(biāo)準(zhǔn)關(guān)鍵詞

〔一〕標(biāo)準(zhǔn)原那么

真實(shí)。標(biāo)準(zhǔn)的關(guān)鍵詞首先要具有真實(shí)性,真實(shí)體現(xiàn)文獻(xiàn)的內(nèi)容,真實(shí)反映作者的立意和結(jié)論。這既是對(duì)文獻(xiàn)和作者的尊重,也是研究人員應(yīng)遵守的最根本的行為原那么。

準(zhǔn)確。進(jìn)行有效共詞分析的關(guān)鍵詞一定要準(zhǔn)確,這樣才能有效反映它們之間的相關(guān)性。因此,關(guān)鍵詞應(yīng)準(zhǔn)確敘述作者的研究成果、文獻(xiàn)的本質(zhì)特征。

專業(yè)。標(biāo)準(zhǔn)關(guān)鍵詞標(biāo)引需要研究人員具有相應(yīng)的專業(yè)知識(shí),了解研究領(lǐng)域的現(xiàn)狀,熟悉常用的研究辦法,掌握一般的研究步驟。有能力從文獻(xiàn)題名、關(guān)鍵詞以及摘要中文獻(xiàn)的核心內(nèi)容,準(zhǔn)確增刪核準(zhǔn)關(guān)鍵詞,具備標(biāo)準(zhǔn)關(guān)鍵詞的專業(yè)素養(yǎng)。

價(jià)值。關(guān)鍵詞的標(biāo)注一般包括參考文獻(xiàn)題名、摘要,因本題名摘要是標(biāo)準(zhǔn)關(guān)鍵詞重要的信息源,要從當(dāng)選取有價(jià)值的信息,形成關(guān)鍵詞。共詞分析需要的是這樣的關(guān)鍵詞,它不僅體現(xiàn)了文獻(xiàn)的研究對(duì)象、研究?jī)?nèi)容、研究辦法,還要包括研究過程、研究結(jié)論等信息。

〔二〕明確辦法

審讀。關(guān)鍵詞標(biāo)引的第一步是審讀文獻(xiàn)。要依據(jù)文獻(xiàn)標(biāo)題、摘要、引言、結(jié)論,繼而瀏覽全文。要分析文獻(xiàn)主題提煉關(guān)鍵詞。

抽詞。中國科協(xié)?關(guān)于在學(xué)術(shù)論文中標(biāo)準(zhǔn)關(guān)鍵詞選擇的決定〔試行〕》指出關(guān)鍵詞一般按下列順序抽?。阂皇茄芯克鶎俣?jí)學(xué)科名稱,示例圖書情報(bào)、檔案管理的二級(jí)學(xué)科圖書館學(xué)、情報(bào)學(xué)、檔案學(xué)等。二是研究成果名稱或假設(shè)干個(gè)成果的總類別名稱。三是其他有利于檢索和文獻(xiàn)利用的關(guān)鍵詞。

標(biāo)準(zhǔn)。關(guān)鍵詞的選取要標(biāo)準(zhǔn),一是對(duì)照國家規(guī)范?學(xué)科分類與代碼》等詞表,選取關(guān)鍵詞;二是選擇新學(xué)科、新術(shù)語為關(guān)鍵詞,可通過CNKI數(shù)據(jù)庫檢索,網(wǎng)絡(luò)搜索引擎查找,選用檢索概率相對(duì)大的自由詞。

審校。審校的目的主要檢查文獻(xiàn)關(guān)鍵詞的提煉是否真實(shí)全面準(zhǔn)確,有無遺漏關(guān)鍵詞,是否隨意選用通用詞。二是標(biāo)引順序是否正確,是否為上位詞在前,下位詞在后,是否是反映論文研究目的、對(duì)象、范圍、辦法、過程的關(guān)鍵詞在前,反映研究結(jié)果、意義等的關(guān)鍵詞在后。

〔三〕相關(guān)倡議

檔案學(xué)研究的根底工作的重要組成局部是關(guān)鍵詞標(biāo)引。它是檔案學(xué)文獻(xiàn)獲得的根本伎倆,其工作量之大,需要從作者到雜志審編人員,到圖書館關(guān)鍵詞標(biāo)引工作人員都要高度重視,要從細(xì)微入手,著眼大局,齊心協(xié)力來完成。

重視標(biāo)引工作。關(guān)鍵詞能夠揭示文獻(xiàn)內(nèi)容。標(biāo)引質(zhì)量的好壞,直接影響到學(xué)術(shù)成果能否有效利用和廣泛傳播。因此,從作者到審編,再到圖書館工作人員要對(duì)關(guān)鍵詞標(biāo)引工作充沛重視,并落實(shí)到具體行動(dòng)上,眾志成城,提高關(guān)鍵詞標(biāo)引的標(biāo)準(zhǔn)性和統(tǒng)一性。

提高人員素質(zhì)。關(guān)鍵詞標(biāo)引工作業(yè)務(wù)性強(qiáng),科研工作人員不僅要有檔案學(xué)專業(yè)知識(shí),還要有百科知識(shí)素養(yǎng)。這就要求我們不斷探索積累經(jīng)驗(yàn),增進(jìn)學(xué)習(xí)交流,強(qiáng)化業(yè)務(wù)素質(zhì),以認(rèn)真負(fù)責(zé)的工作態(tài)度,根據(jù)檔案學(xué)界公認(rèn)的標(biāo)引規(guī)范,做到不漏標(biāo),不過度標(biāo)引。

加強(qiáng)標(biāo)引管理。把關(guān)鍵詞標(biāo)引工作納入科研及其相關(guān)管理的常規(guī)工作中去。穩(wěn)定標(biāo)引人員隊(duì)伍,實(shí)施標(biāo)引工作量化管理,定期對(duì)其進(jìn)行總結(jié)分析,并舉辦專題討論會(huì)推廣經(jīng)驗(yàn),完善關(guān)鍵詞標(biāo)引工作規(guī)那么。

標(biāo)準(zhǔn)標(biāo)引操作。認(rèn)真收集整理新增關(guān)鍵詞,在充沛討論的根底上,邀請(qǐng)相關(guān)專家鑒定,完善?學(xué)科分類與代碼》及?漢語主題詞表》,增加檔案研究領(lǐng)域中的新專業(yè)詞匯,修訂完善

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論