![檔案數(shù)字化建設(shè)實施方案_第1頁](http://file4.renrendoc.com/view/c3f938916093255eb0cc29d783f9c148/c3f938916093255eb0cc29d783f9c1481.gif)
![檔案數(shù)字化建設(shè)實施方案_第2頁](http://file4.renrendoc.com/view/c3f938916093255eb0cc29d783f9c148/c3f938916093255eb0cc29d783f9c1482.gif)
![檔案數(shù)字化建設(shè)實施方案_第3頁](http://file4.renrendoc.com/view/c3f938916093255eb0cc29d783f9c148/c3f938916093255eb0cc29d783f9c1483.gif)
![檔案數(shù)字化建設(shè)實施方案_第4頁](http://file4.renrendoc.com/view/c3f938916093255eb0cc29d783f9c148/c3f938916093255eb0cc29d783f9c1484.gif)
![檔案數(shù)字化建設(shè)實施方案_第5頁](http://file4.renrendoc.com/view/c3f938916093255eb0cc29d783f9c148/c3f938916093255eb0cc29d783f9c1485.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
檔案數(shù)字化建設(shè)實施方案
第1篇:檔案數(shù)字化方案制定與實施
檔案數(shù)字化方案制定與實施
館藏傳統(tǒng)載體檔案數(shù)字化的問題,許多地方檔案館進行了實踐,積累了一定的經(jīng)驗,對全國檔案數(shù)字化建設(shè)起到了推動作用。但是,總結(jié)以前我國檔案數(shù)字化建設(shè)的不足和失誤,往往不是信息技術(shù)支持不夠,而是絕大多數(shù)都知道搞數(shù)字化,但檔案數(shù)字化目的是利用的主題不突出,忽略檔案開放鑒定與數(shù)字化檔案利用的邏輯關(guān)系,對先剔除無用檔案后開展數(shù)字化的思路不明確,沒很好研究檔案數(shù)字化的整體效果就大張旗鼓地做起來了。進而出現(xiàn)數(shù)字化目錄數(shù)據(jù)和全文數(shù)據(jù)不對應(yīng)、找不著或不好用等問題不少,檔案數(shù)字化的量雖多,但能上網(wǎng)利用或者說能上互聯(lián)網(wǎng)利用的很少,數(shù)字化返工的現(xiàn)象比較突出,使有限的資金投入并沒有體現(xiàn)在數(shù)字化檔案的利用效益上,這一點已引起檔案系統(tǒng)管理和技術(shù)高層領(lǐng)導(dǎo)的重視,許多實踐工作者已開始進行有益的探索。
面對網(wǎng)絡(luò)時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數(shù)字化需要解決的一系列問題,長春市檔案館與中國人民大學(xué)信息資源管理學(xué)院共同承擔了國家檔案局科技項目《檔案數(shù)字化方案研究》。該項目經(jīng)過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數(shù)字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數(shù)字化指導(dǎo)思想與原則
檔案數(shù)字化指導(dǎo)思想是:以需求為導(dǎo)向,以利用為目的,充分利用計算機軟硬件功能,最大限度發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,保護館藏檔案原件完好,保證數(shù)字化檔案真實準確,更好地發(fā)揮檔案信息資源的作用。
檔案數(shù)字化原則是:遵循重要檔案數(shù)字化的價值性原則、常用檔案數(shù)字化的實用性原則、開放檔案數(shù)字化的開放性原則、褪跡檔案數(shù)字化的搶救性原則,解密檔案數(shù)字化的及時性原則,目錄數(shù)字化與全文數(shù)字化分步的時效性原則,檔案數(shù)字化加工與利用同步的一致性原則。
二、明確檔案數(shù)字化策略
(一)需求導(dǎo)向,急用先上策略
1.需求導(dǎo)向策略
社會需求對檔案利用的影響應(yīng)該是檔案工作者特別關(guān)注的問題。我們用統(tǒng)計數(shù)字加以分析。
(1)隨著編史修志工作納入各地工作規(guī)劃,1986年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的69%。隨著編史修志階段性高潮過去,2003年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的28%。下降41個百分點。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年)(2)隨著社會保障制度的建立和國有企業(yè)改革的深入,長春市檔案館查閱工人調(diào)配檔案卷數(shù)占利用總卷數(shù)的百分比,由2002年的1%增加到2004年的占利用總卷數(shù)的68%。(此數(shù)據(jù)來自長春市檔案館利用統(tǒng)計數(shù)據(jù)庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現(xiàn)了兩個轉(zhuǎn)變,服務(wù)重點由政治領(lǐng)域轉(zhuǎn)變?yōu)榻?jīng)濟領(lǐng)域,服務(wù)對象由機關(guān)干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態(tài)觀念研究當前與長遠社會對檔案的需求,并指導(dǎo)檔案數(shù)字化與利用服務(wù)工程實踐應(yīng)該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數(shù)量眾多。但并不是所有檔案都在現(xiàn)實中利用,有相當大一部分多年不用。2004年全國省(區(qū)、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當?shù)攸h委、政府全宗利用率高是一般規(guī)律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統(tǒng)計情況和發(fā)展趨勢確定數(shù)字化的先后順序是科學(xué)的選擇,利用優(yōu)化理論進行檔案數(shù)字化篩選,快速反應(yīng),突擊完成急用檔案數(shù)字化任務(wù),能夠達到更好地發(fā)揮檔案作用的目的,實現(xiàn)即時投入使用的預(yù)期。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年報)
(二)本級為主,分步實施策略
(1)本級為主策略
根據(jù)檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數(shù)是本級機關(guān)形成的,一般都占50%以上,這部分檔案自然是當?shù)貦n案館數(shù)字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復(fù)是必要的,這些紙質(zhì)文件來源一般都是上級機關(guān)統(tǒng)一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數(shù)字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數(shù)字化,不如國家檔案局著手進行檔案全文數(shù)字化和開放鑒定分工、協(xié)作,向館際共建、共享已有鑒定和數(shù)字化成果的方向發(fā)展。地方檔案館堅持本級為主的原則,根據(jù)需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數(shù)字化,以滿足當前工作的急需,盡量減少檔案館多層的重復(fù)勞動。
(2)分步實施策略
館藏檔案數(shù)字化不可能一步到位,而且檔案室進館范圍檔案陸續(xù)進館,進館范圍檔案實施檔案數(shù)字化館室共建、共贏、共享的策略非常重要。在具體實施過程中,文件級目錄數(shù)據(jù)庫建設(shè)是最基礎(chǔ)性的工作,是第一位需要建全的,但并一定是文件級目錄數(shù)據(jù)庫建成后再建其它數(shù)據(jù)庫。專題數(shù)據(jù)庫建設(shè)是根據(jù)現(xiàn)實需要而適時建立。全文數(shù)據(jù)庫建設(shè)是滿足信息檢索需要而必須加快建設(shè)的數(shù)據(jù)庫。
(三)剔除無用,避免浪費策略
1.剔除無用策略
地方檔案館館藏現(xiàn)行檔案主要來自于機關(guān)各個立檔單位,其檔案文件進館的決定權(quán)掌握在立檔單位文檔人員手里,加之國家檔案保管期限表幾經(jīng)修改和許多條款至今還比較籠統(tǒng),所以,不該歸檔的、不該進館的、文件重復(fù)的檔案進館頗多。特別是建國超過50年以后,半數(shù)左右長期保管的檔案逐年超過保管期的最上限,這些檔案實際上絕大多數(shù)已失去保存和利用的價值,但它們?nèi)哉紦?jù)著檔案管理的各種資源。
2.避免浪費策略
面對數(shù)字化方法的選擇,剔除無用,避免浪費應(yīng)該是一種長久策略,把大量失去保存價值的檔案先剔除,避免把無用檔案數(shù)字化,再造數(shù)字化垃圾。
三、優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線
檔案數(shù)字化建設(shè)周期長,信息技術(shù)又處在快速發(fā)展之中,各個檔案館數(shù)字化基礎(chǔ)和條件不同。從本館實際出發(fā),優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線特別重要。
(一)計算機新技術(shù)與檔案數(shù)字化業(yè)務(wù)的有機結(jié)合
信息技術(shù)的發(fā)展給檔案數(shù)字化效率和質(zhì)量的提高帶來深刻的影響,本著技術(shù)為需求服務(wù)的理念,無論是利用哪一種檔案管理系統(tǒng),都要適應(yīng)檔案數(shù)字化流程重組和再造需要,適時進行軟件升級,通過軟件升級固化技術(shù)與流程重組與創(chuàng)新,使檔案數(shù)字化的效果更好。同時,設(shè)計符合國家標準與適應(yīng)自身需要的數(shù)據(jù)庫結(jié)構(gòu),使檔案數(shù)字化的過程優(yōu)化,數(shù)字化檔案的利用快捷。
(二)檔案鑒定與數(shù)字化同步
鑒定與數(shù)字化同步的目的是加快數(shù)字化檔案信息的利用。在計算機網(wǎng)絡(luò)環(huán)境下同步進行檔案鑒定與數(shù)字化工作是發(fā)展趨勢。這種檔案鑒定是以剔除無用檔案為前提,以鑒定檔案開放為主,按需求篩選全文數(shù)字化檔案,為適時提供數(shù)字化檔案信息服務(wù)打基礎(chǔ)的過程。
(三)檔案數(shù)字化與上網(wǎng)利用同步
數(shù)字化檔案分開放與不開放兩種。在計算機網(wǎng)絡(luò)環(huán)境中,在確定檔案開放與不開放的同時,開放檔案即上互聯(lián)網(wǎng)。開放與不開放檔案數(shù)據(jù)在局域網(wǎng)中即時使用。
檔案數(shù)字化及管理流程重組不可能一次到位,它是一個管理思想不斷地變化的過程,適時把新技術(shù)和新理念納入進去是非常重要的。
四、細化檔案數(shù)字化操作方法
實踐證明,在計算機網(wǎng)絡(luò)環(huán)境下,檔案數(shù)字化和利用服務(wù)工程以建立流水作業(yè)線,提高工作效率和效益為最佳方式。
(一)優(yōu)化配置各種資源
檔案數(shù)字化建設(shè)需要投入,特別是建設(shè)初期軟硬件配置投入較大,建成后也要保持一定的運行成本。地方檔案館在具備一定檔案數(shù)字化條件的基礎(chǔ)上,要按照成本效益最大化理論,根據(jù)不同的情況,進行檔案專業(yè)人員和數(shù)字化技工人員、計算機和掃描設(shè)備的合理搭配,優(yōu)化檔案數(shù)字化各種資源配置,提高檔案數(shù)字化建設(shè)的投入產(chǎn)出比,構(gòu)建檔案數(shù)字化投入小產(chǎn)出大的新模式。
1.計算機網(wǎng)絡(luò)環(huán)境下檔案數(shù)字化與利用服務(wù)工程流水線資源配置案例
(二)首先建立文件級目錄數(shù)據(jù)庫
滿足一般檢索和管理的需要,建好檔案文件級目錄數(shù)據(jù)庫。目前,絕大多數(shù)綜合檔案館,由于沒有實現(xiàn)全部檔案的文件級目錄機檢,查找檔案不快、不準、不全的問題普遍存在。另外,檔案的統(tǒng)計單位主要是卷和延長米,而檔案的最小單位是文件的件數(shù),以件為單位的底數(shù)不清是普遍存在的問題。所以,把文件級目錄數(shù)據(jù)庫建設(shè)作為一項基礎(chǔ)性工作,在提高檔案的查全率、查準率的同時,利用計算機實現(xiàn)檔案以件數(shù)為基本單位的管理是非常必要的。
1.高度重視文件級目錄數(shù)據(jù)錄入的前期處理。檔案館的案卷來自各個立檔單位,案卷是由文檔人員在檔案局業(yè)務(wù)人員指導(dǎo)下形成的。但是,由于文檔人員變動頻繁、檔案業(yè)務(wù)指導(dǎo)面多線長,案卷質(zhì)量難以適應(yīng)計算機精確管理的需要,加之個別文件形成時的先天不足,給文件級目錄數(shù)據(jù)庫建設(shè)帶來許多麻煩。實踐證明,進行文件級目錄錄入的前期處理,拋開原有的文件目錄,按卷內(nèi)實有文件一一錄入,把題名不反映主題、目錄與實體不符等一系列問題一并處理是非常必要的。
2.科學(xué)合理地設(shè)計數(shù)據(jù)庫結(jié)構(gòu)。文件級目錄數(shù)據(jù)庫結(jié)構(gòu)包含三方面功能為最佳。一是符合國家有關(guān)標準及實際情況,文件題名、責任者等滿足文件檢索需要的字段。二是存毀、開放、掃描等數(shù)字化加工階段利用的字段。三是數(shù)據(jù)錄入、校對、鑒定、審查等標明責任的字段。
3.數(shù)據(jù)質(zhì)量是數(shù)據(jù)庫的生命。建立在計算機環(huán)境下,以上網(wǎng)公開利用為根本目的文件級目錄數(shù)據(jù)庫,與紙質(zhì)文件目錄有本質(zhì)的區(qū)別。紙質(zhì)文件目錄有問題只有檔案館內(nèi)部少數(shù)人知道,利用者并不清楚。但是,文件級目錄數(shù)據(jù)庫進入網(wǎng)絡(luò),特別是向社會公開的部分,對數(shù)據(jù)庫的質(zhì)量要求是相當高的,數(shù)據(jù)質(zhì)量也是當前制約許多數(shù)據(jù)上網(wǎng)利用的瓶頸之一。
(三)適時建立專題數(shù)據(jù)庫
滿足特殊檢索需要,適時建立檔案專題數(shù)據(jù)庫。館藏檔案僅靠文件級目錄數(shù)據(jù)庫是不可能解決全部檢索問題的。隨著客觀需要的變化,對某一專題檔案有集中利用的需求是經(jīng)常發(fā)生的,突擊建立專題數(shù)據(jù)庫,滿足社會需求,是檔案館與時俱進的突破口,也是充分發(fā)揮檔案作用的最佳時機。主要把握三個方面:一是根據(jù)館藏檔案內(nèi)容確定專題數(shù)據(jù)庫的總體布局。二是按需求分期建立專題數(shù)據(jù)庫。三是根據(jù)文件內(nèi)容和檢索需要分別設(shè)立不同的專題數(shù)據(jù)庫結(jié)構(gòu)。
(四)優(yōu)選建立全文數(shù)據(jù)庫
滿足信息檢索的需要,建立檔案全文數(shù)據(jù)庫。按照國家檔案局提出的重點的、利用頻繁的檔案首先實現(xiàn)全文數(shù)字化的要求,按照“二八”定律,即以20%的努力達到80%的效果,通過多年檔案利用統(tǒng)計數(shù)據(jù)分析,優(yōu)先全文數(shù)字化檔案的全宗、年代。在網(wǎng)絡(luò)中、在文件級目錄的基礎(chǔ)上同步進行檔案存毀、開放、數(shù)字化鑒定與篩選,進而形成與文件級目錄一一對應(yīng)的全文數(shù)據(jù)庫,并確保數(shù)字化檔案的真實、準確。
(五)檔案數(shù)據(jù)庫的管理
為了檔案數(shù)字化與利用同步和數(shù)據(jù)安全管理的需要,檔案數(shù)據(jù)庫分在建數(shù)據(jù)庫和成果數(shù)據(jù)庫兩大類。
1.在建數(shù)據(jù)庫的設(shè)立。在建數(shù)據(jù)庫是為了數(shù)字化加工所設(shè)立的動態(tài)庫,是數(shù)據(jù)不斷變化的數(shù)據(jù)庫。例如,設(shè)立文件級目錄數(shù)據(jù)錄入庫,它是每個錄入人員都分配給操作權(quán)限的動態(tài)庫,屬于在建數(shù)據(jù)庫。而完成的文件級目錄數(shù)據(jù)庫則是成果庫。但是,在鑒定及全文數(shù)字化加工過程中它又成為全文數(shù)字化加工在建數(shù)據(jù)庫。
2.成果數(shù)據(jù)庫的使用。成果數(shù)據(jù)庫只分配使用權(quán)限,只有特殊需要時經(jīng)批準才分配數(shù)據(jù)改變的操作權(quán)限。
3.數(shù)據(jù)的管理與監(jiān)督
建立技術(shù)負責人、超級管理員、數(shù)據(jù)管理員連鎖責任制,實行審批者沒有數(shù)據(jù)操作權(quán),超級管理員只允許分配權(quán)限不允許使用數(shù)據(jù)操作權(quán),數(shù)據(jù)管理員只有需要時經(jīng)批準使用數(shù)據(jù)操作權(quán),用后即刻收回。給予單位領(lǐng)導(dǎo)和相關(guān)中層干部全部數(shù)據(jù)的查看權(quán),每天24小時可以時時對數(shù)據(jù)質(zhì)量進行監(jiān)督,形成數(shù)據(jù)管理監(jiān)督新機制。
(六)數(shù)字化檔案利用服務(wù)工程
數(shù)字化檔案利用服務(wù)工程是以搞活數(shù)字化檔案利用的目的,以局域網(wǎng)、政務(wù)網(wǎng)、互聯(lián)網(wǎng)為平臺,通過建立數(shù)據(jù)安全管理制度、網(wǎng)絡(luò)安全運行制度和具有法律責任的網(wǎng)管、數(shù)據(jù)管理員、數(shù)字化加工人員、提供利用人員連鎖責任制,環(huán)環(huán)相扣,從措施上保證數(shù)字化檔案的準確。通過防火墻、CA認證、數(shù)字水印、電子簽章、權(quán)限控制等計算機新技術(shù),從技術(shù)上保證數(shù)據(jù)的安全,利用網(wǎng)絡(luò)實現(xiàn)檔案的法律效力,實現(xiàn)遠程為利用者提供快捷、準確數(shù)字化檔案的目標。
1.在局域網(wǎng)上應(yīng)用
在局域網(wǎng)內(nèi),檔案在建和成果數(shù)據(jù)庫所有接待人員都有檢索權(quán)限,對只進行目錄數(shù)字化的檔案實行現(xiàn)用現(xiàn)掃描全文的方法使之達到已全文數(shù)字化的檔案一樣效果,利用網(wǎng)絡(luò)技術(shù)實現(xiàn)數(shù)字化檔案利用替代檔案原件利用、計算機打印件替代復(fù)印機復(fù)印件、電子簽章替代手工蓋章、接待人員和利用者不接觸檔案原件的目標。從而起到了運用數(shù)字檔案高效利用、保護原件的作用。并積累了利用者憑加蓋電子簽章的數(shù)字檔案打印件辦理社會保險的成功案例,其數(shù)字化檔案的法律效力得到認可,為檔案館參與電子政務(wù)開辟了新途徑。
2.在互聯(lián)網(wǎng)上應(yīng)用
利用檔案網(wǎng)站,通過CA證書等安全手段,不但實現(xiàn)了領(lǐng)導(dǎo)遠程數(shù)據(jù)上傳的審批,主要是開展開放檔案遠程查詢、下載、打印。特別是把CA證書發(fā)給立檔單位或使用單位檔案室,為CA用戶遠程提供檔案證明和數(shù)字化檔案法律效力的體現(xiàn),減少異地現(xiàn)場查詢的不便,使檔案館參與電子政務(wù)成為現(xiàn)實。
五、加強檔案數(shù)字化工作的行政管理
檔案數(shù)字化涉及檔案館內(nèi)部許多部門,加強組織管理工作顯得十分重要,“三分技術(shù)七分管理”同樣適合檔案數(shù)字化與利用服務(wù)工程。各個檔案館涉及檔案數(shù)字化加工和利用的內(nèi)部組織機構(gòu)設(shè)置不盡相同,但應(yīng)按照效率優(yōu)先的原則,在計算機環(huán)境下,把數(shù)據(jù)錄入、鑒定、數(shù)字化加工、整理、數(shù)字化檔案利用形成一個流水線,打破內(nèi)部行政分工界限是發(fā)展趨勢。無論是采取那種組織形式,優(yōu)化人員組合重新分工在所難免,各個檔案館在組織實施方面有所不同是必然的。
1.加強計劃管理
檔案數(shù)字化建設(shè)是一項復(fù)雜的系統(tǒng)工程,針對實際的調(diào)研和論證,運用科學(xué)方法預(yù)測,制定科學(xué)配置各種資源進行檔案數(shù)字化的總體規(guī)劃和年度專項計劃,通過計劃謀求管理系統(tǒng)的外部環(huán)境、內(nèi)部條件、決策目標三者在動態(tài)上的平衡,實現(xiàn)管理決策所制定的各項目標。
2.強化組織實施
實施是一個復(fù)雜的活動過程,檔案數(shù)字化建設(shè)又是一項全新的工作,技術(shù)含量高,涉及到許多因素,在實施過程中會出現(xiàn)各種各樣的矛盾和困難,會遇到來自各方面的干擾,實施特別強調(diào)解決問題的及時性。通過創(chuàng)新行政管理與技術(shù)管理相互作用的新機制,實施有效的組織、指揮、協(xié)調(diào)、激勵工作,保證檔案數(shù)字化的計劃目標的順利實現(xiàn)。
3.增強管理的技術(shù)含量
檔案數(shù)字化的建設(shè)過程貴在控制,重在管理。利用計算機進行檔案數(shù)字化,任何一個邏輯錯誤,都會給數(shù)據(jù)的管理和使用帶來麻煩或隱患。在互聯(lián)網(wǎng)上公開不真實、不準確的檔案,將在世界范圍內(nèi)產(chǎn)生不良影響。特別是在網(wǎng)絡(luò)環(huán)境下的流水作業(yè),上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要,這必然要求行政、技術(shù)、質(zhì)量管理的網(wǎng)絡(luò)化。實踐證明,建立數(shù)字化進度數(shù)據(jù)庫、數(shù)字化質(zhì)量反饋庫、檔案利用登記數(shù)據(jù)庫,給局館領(lǐng)導(dǎo)和相關(guān)人員分配使用權(quán)限,通過技術(shù)手段將全面質(zhì)量管理思想引入檔案數(shù)字化建設(shè),實現(xiàn)全程管理、適時控制,達到強化數(shù)字化檔案質(zhì)量保證體系的目的。檔案數(shù)字化與利用服務(wù)工程是一項長期的任務(wù),需要從理論上解決的問題很多,需要在實踐中探索的問題也不少,我們將繼續(xù)深化研究與實踐。
第2篇:檔案數(shù)字化方案制定與實施
關(guān)于檔案數(shù)字化的實踐與思考
當前,我國信息化發(fā)展戰(zhàn)略的實施,電子政務(wù)的推進,為我國檔案事業(yè)發(fā)展提供了難得的機遇。加強檔案信息化建設(shè)是檔案事業(yè)適應(yīng)時代和社會發(fā)展的必然選擇,是加速檔案管理現(xiàn)代化的客觀要求,是提高檔案服務(wù)水平的必由之路,勢在必行。對此,作為管理和擁有大量產(chǎn)權(quán)產(chǎn)籍信息資源的房產(chǎn)檔案部門,為更好地適應(yīng)形勢發(fā)展的要求,我們著眼未來,運用數(shù)字化、信息化技術(shù),對檔案數(shù)字化進行了有益的實踐與探索。
一、檔案數(shù)字化的意義
1、檔案數(shù)字化的含義
檔案數(shù)字化是指利用計算機技術(shù)、掃描技術(shù)、數(shù)字成像技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)等高新技術(shù)把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲、網(wǎng)絡(luò)化的形式互相聯(lián)結(jié),利用計算機系統(tǒng)進行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享,是檔案信息化建設(shè)的重要內(nèi)容。目前,大多數(shù)檔案館保存的檔案信息形態(tài)主要以紙質(zhì)、縮微膠片和底片等載體形式存在,只適應(yīng)于傳統(tǒng)的管理與傳播方式,即實施手工管理和以點到點的傳播,即便是經(jīng)過編研等初步加工,編輯印發(fā)檔案資料,實現(xiàn)以點到面的傳播,其覆蓋面也還是太小,很難達到社會化程度。檔案信息資源的經(jīng)濟價值和社會價值也難以充分實現(xiàn),更難適應(yīng)當代“數(shù)字化生存”的形勢。檔案原件數(shù)字化,對檔案信息的現(xiàn)代化管理、使用和傳播等都具有很重要的作用。
2、檔案數(shù)字化的主要內(nèi)容
①檔案目錄信息的數(shù)字化,建立檔案目錄數(shù)據(jù)庫。
②載體檔案的數(shù)字化,如紙質(zhì)檔案、照片檔案及錄音錄像檔案等的數(shù)字化,建立檔案影像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫。
3、檔案數(shù)字化的主要作用
①檔案數(shù)字化是檔案信息化建設(shè)重要內(nèi)容。檔案信息化建設(shè)的核心是資源建設(shè)。資源建設(shè)包括兩大方面任務(wù):一是現(xiàn)有館藏檔案的目錄數(shù)據(jù)庫建設(shè)和館藏重要紙質(zhì)檔案和照片、錄音、錄像檔案的數(shù)字化;二是現(xiàn)行電子文件歸檔與電子檔案管理。
②檔案數(shù)字化能有效地保護檔案原件。⑴、代替原件使用,保護檔案原件。⑵、數(shù)字化副本異地保存,輸出磁盤、磁帶供永久保存。這樣可使這些檔案資料在出現(xiàn)天災(zāi)人禍的情況下不致于遭到毀滅性的破壞。⑶、恢復(fù)檔案材料模糊褪變的字跡及對污損殘缺照片檔案的修復(fù)。
③檔案數(shù)字化能改善檔案的利用方式。⑴不再受“孤本”的限制,一份文件可以同時提供給所有需要它的人共享。⑵數(shù)字影像文件可以通過計算機局域網(wǎng)或者廣域網(wǎng)進行異地傳輸,使異地調(diào)閱利用成為可能。擴大了檔案的利用空間,讓更多的人們來了解檔案,利用檔案。⑶“時間”不再受限制,利用者可以隨時使用自己需要的文件。檔案數(shù)字化以后,將已開放的檔案上網(wǎng),這樣所有利用者就可以在任何時間上網(wǎng)利用檔案信息資源。④檔案數(shù)字化是傳統(tǒng)檔案館走向數(shù)字檔案館的必經(jīng)之路。數(shù)字檔案館無疑是21世紀各級各類檔案館的發(fā)展方向。盡管當前它的具體組成結(jié)構(gòu)、組織管理模式還處于探索之中,可其“館藏”的數(shù)字化特征是肯定的,傳統(tǒng)檔案的數(shù)字化將是其“館藏”的重要組成部分。
二、檔案數(shù)字化的實踐
1、檔案數(shù)字化工作回顧
為了加快實現(xiàn)檔案的現(xiàn)代化管理,方便檢索和提供利用,我館多年來花大力氣致力于檔案信息庫建設(shè)和檔案的數(shù)字化工作。1993年,我館購置微機,獨立開發(fā)人事檔案管理系統(tǒng),開始檔案數(shù)字化的工作,使得全局職工基本情況在電腦中一覽無遺,工資情況也能被系統(tǒng)所顯示。1998年開發(fā)文書檔案管理軟件,利用電腦管理文書檔案目錄。經(jīng)過這些年的努力工作,我們將館藏所有文書檔案、人事檔案全部錄入電腦,并實現(xiàn)了電腦查詢,極大方便了檔案管理。2002年,我館與市房地產(chǎn)產(chǎn)權(quán)處合并,而產(chǎn)權(quán)處在1995年,開發(fā)出產(chǎn)權(quán)產(chǎn)籍管理軟件,房產(chǎn)交易辦證實現(xiàn)電腦化辦公,并在實踐中不斷完善程序,將絕大部分產(chǎn)權(quán)產(chǎn)籍檔案錄入電腦,為全市房產(chǎn)發(fā)證加快了辦事流程,減少了出現(xiàn)錯誤的幾率。
2、實施檔案數(shù)字化工程的必要性
首先,大力推進國民經(jīng)濟和社會信息化,以信息化帶動工業(yè)化,實現(xiàn)社會生產(chǎn)力的跨越式發(fā)展,是黨中央抓住信息化這一機遇,在黨的十五屆五中全會作出的戰(zhàn)略決策。為了適應(yīng)國家信息化建設(shè)和檔案事業(yè)發(fā)展要求,2002年11月25日,國家檔案局制定下發(fā)了《全國檔案信息化建設(shè)實施綱要》,指出了“十五”期間檔案信息化建設(shè)的指導(dǎo)思想、目標與主要任務(wù)。
其次,隨著城市建設(shè)的快速發(fā)展,老百姓購房辦證數(shù)量的激增,為保障盡可能縮短老百姓辦理權(quán)證時間,不出現(xiàn)發(fā)證錯誤和重復(fù)發(fā)證,傳統(tǒng)管理根本不能滿足要求。
最后,2002年10月隨著市房地產(chǎn)檔案館與市產(chǎn)權(quán)監(jiān)督管理處的合并,檔案管理工作出現(xiàn)了新的局面。湘潭市產(chǎn)權(quán)監(jiān)督管理處開始建設(shè)湘潭市首個GIS系統(tǒng)——湘潭市房地產(chǎn)GIS系統(tǒng),該系統(tǒng)最基礎(chǔ)的工作也是最重要的工作是檔案數(shù)字化工作(或稱檔案數(shù)據(jù)導(dǎo)入工作),只有保證檔案數(shù)字化才能保障房地產(chǎn)GIS系統(tǒng)的基礎(chǔ)的牢靠。
3、檔案數(shù)字化工程的定位
產(chǎn)權(quán)產(chǎn)籍檔案數(shù)字化工程是湘潭市房產(chǎn)局房地產(chǎn)GIS系統(tǒng)的子項目,旨在將海量產(chǎn)權(quán)產(chǎn)籍檔案信息化、數(shù)字化,實現(xiàn)房地產(chǎn)GIS系統(tǒng)底層數(shù)據(jù)的全數(shù)字化,并通過建立后的系統(tǒng)實現(xiàn)“以圖管房”,減少辦證錯誤,提高辦證時效,并通過GIS系統(tǒng)數(shù)據(jù)統(tǒng)計,向各職能管理部門和政府宏觀調(diào)控部門提供數(shù)字化的檔案信息及較為精確的統(tǒng)計報告,更好地為城市建設(shè)和房地產(chǎn)市場管理服務(wù)。
4、檔案數(shù)字化工程需求分析需處理量:A、產(chǎn)權(quán)檔案:館藏產(chǎn)權(quán)檔案共計35萬多卷。B、房產(chǎn)抵押、擔保、司法查封檔案:房產(chǎn)抵押檔案12900余卷,擔保檔案2050余卷,司法查封檔案1500余卷。C、正常業(yè)務(wù):2003年9月1日之后的所有正常業(yè)務(wù)檔案。
處理措施:劃分時間線2003年9月1日,區(qū)分處理方式。時間線之前的檔案將其檔案實體整理與裝訂,各類檔案詳細錄入相關(guān)頁面數(shù)據(jù),檔案原件通過數(shù)字照相技術(shù)掃描;時間線之后的檔案,按照新開發(fā)的正常辦證流程來實現(xiàn)數(shù)字化。
5、檔案數(shù)字化工程的內(nèi)容
將所有各類檔案進行規(guī)范整理,然后,分成檔案鑒定、檔案掃描、檔案導(dǎo)入三個大的環(huán)節(jié),11個小環(huán)節(jié)分類錄入服務(wù)器數(shù)據(jù)庫。不僅僅將檔案原件掃描生成圖片存儲,并將檔案原件上記載的55項相關(guān)重要業(yè)務(wù)數(shù)據(jù)真實、準確的錄入數(shù)據(jù)庫。
6、檔案數(shù)字化工程實施情況
需求分析與設(shè)備考察階段:調(diào)查分析館藏情況,包括檔案的類型、載體形態(tài)與狀態(tài)、館藏數(shù)量等基本情況。根據(jù)館藏情況制訂檔案數(shù)字化的科學(xué)規(guī)劃,確定項目需求,根據(jù)需求考察當前各種高速掃描系統(tǒng)的集成解決方案。在設(shè)備考察階段我們特別注意這么幾個問題:A、檔案數(shù)字化設(shè)備配置計劃的成套性。B、檔案數(shù)字化設(shè)備的配套性,也就是文檔掃描儀和數(shù)字照相機優(yōu)缺點對比,通過不斷的實踐,我們覺得數(shù)字照相機更加適應(yīng)我們的工作。C、檔案數(shù)字化項目硬件與軟件的集成性。D、檔案數(shù)字化方案與我館需求的適應(yīng)性??傊紤]到檔案信息數(shù)字化要經(jīng)過一個較長的過程,因此我們從實際需要和長遠打算出發(fā),力求確保電腦、照相機、操作人員等設(shè)施人員數(shù)量的成龍配套,使其具有較強的支撐能力和擴展能力。
系統(tǒng)實驗階段:2002年底,項目開始立項。組織業(yè)務(wù)、技術(shù)骨干遠赴深圳、上海、黑龍江佳木斯市等地實踐考察,2003年6月,正式成立房地產(chǎn)GIS系統(tǒng)領(lǐng)導(dǎo)小組、數(shù)據(jù)導(dǎo)入小組,調(diào)集相關(guān)業(yè)務(wù)、技術(shù)精英加入團隊,正式開始實驗階段的工作,新購進了12臺電腦微機,4臺佳能數(shù)碼相機,4臺EPSON激光打印機,一臺工作站服務(wù)器,設(shè)備安裝調(diào)試完畢。通過前期和軟件公司合作,共同開發(fā)我們所需要的軟件。探索檔案數(shù)字化工作在快速系統(tǒng)下,檔案前期整理、檔案掃描、質(zhì)量檢查、掃描文件管理、后期整理等全過程的協(xié)調(diào)配合問題,并探討在高速系統(tǒng)下如何解決某些技術(shù)問題。經(jīng)過近一年的測試,我們對整體系統(tǒng)流程和配套軟件、數(shù)據(jù)庫的性能有更進一步的了解,在項目的運作模式和系統(tǒng)管理等方面積累了一定的經(jīng)驗,同時,也鍛煉了一支技術(shù)過硬的隊伍,為系統(tǒng)的正式運行打下了基礎(chǔ)。
項目實施階段:本項目是一個長期、流程化運作的系統(tǒng),從建立開始就必須確保能長期高速、穩(wěn)定運行。在系統(tǒng)的開發(fā)與研究方面有一個時間周期,現(xiàn)把工作計劃分為以下幾個階段:
①、系統(tǒng)總體方案框架設(shè)計:
2002年12月—2003年6月,完成系統(tǒng)總體框架,生成詳細可行性分析報告,及相關(guān)配套業(yè)務(wù)標準、各類管理制度。②、系統(tǒng)建立:
2003年6月—2003年10月,系統(tǒng)建立,包括:硬件配置及軟件的開發(fā)。③、系統(tǒng)試運行:
2003年10月—2004年2月。④、系統(tǒng)正式運行:
2004年2月起,系統(tǒng)正式運行,同學(xué)校簽訂合作框架協(xié)議,調(diào)集員工和學(xué)生共100多人,經(jīng)過一段時間的業(yè)務(wù)及技能培訓(xùn),參與系統(tǒng)的正式運行,在運行中不斷完善升級。
三、對檔案數(shù)字化的思考
1、提高認識,統(tǒng)籌規(guī)劃
首先必須在思想上充分認識檔案信息資源的重要意義,在當今信息公開程度越來越高的形勢下,檔案的文化性質(zhì)和社會性質(zhì)逐步強化,利用的范圍和對象將逐步擴大。在這個信息時代,只有當檔案信息資源在社會主義現(xiàn)代化建設(shè)中發(fā)揮重要作用時,檔案和檔案工作的意義和價值才能充分地全面地展現(xiàn)出來。
其次,作好統(tǒng)籌規(guī)劃。將大量的檔案數(shù)字化,是一個龐大的系統(tǒng)工程。首先要做好館藏情況的調(diào)查,包括檔案的類型、載體形態(tài)與狀態(tài)、館藏數(shù)量、檔案信息利用等基本情況。根據(jù)館藏情況制訂檔案數(shù)字化的科學(xué)規(guī)劃,包括服務(wù)器、電腦、掃描設(shè)備等硬件的購置計劃和數(shù)字化處理規(guī)劃。檔案數(shù)字化實施處理規(guī)劃應(yīng)貫徹“突出重點,分步進行”的原則,對館藏重點和利用率高的檔案先行數(shù)字化,早日滿足大多數(shù)利用者的需求。
最后,檔案數(shù)字化是一項費時較長的工程,在大規(guī)模、流程化的數(shù)字化過程中,所有檔案原件都需從檔案庫房分批大量取出,一定要保障檔案原件的完整,不允許出現(xiàn)損毀和遺失的現(xiàn)象。
2、加強基礎(chǔ)工作,認真做好檔案數(shù)字化
①、檔案數(shù)字化必須有所選擇。針對館藏“浩瀚”的檔案資源,不加選擇地全部數(shù)字化是不可能的、也是不必要的。我們應(yīng)該根據(jù)一定的原則確定哪些館藏檔案原件應(yīng)該數(shù)字化、哪些檔案原件中哪些頁不需要數(shù)字化。
②、做好數(shù)字化時掃描參數(shù)的優(yōu)化設(shè)置。掃描系統(tǒng)掃描參數(shù)的選擇和確定對掃描數(shù)字影像質(zhì)量有著較大影響,其中掃描分辨率直接關(guān)系到掃描文件的清晰度和還原效果。我們在選擇分辨率時應(yīng)根據(jù)實際需要綜合考慮,包括掃描文件的可閱讀性、存儲空間、輸出打印質(zhì)量等。
③、做好檔案數(shù)字化的全程控制。在檔案數(shù)字化過程中,要注重全面的質(zhì)量檢查,加強數(shù)據(jù)的質(zhì)量控制。質(zhì)量檢查應(yīng)包括以下幾方面內(nèi)容:A、數(shù)字化前的檔案整理檢查。要進行數(shù)字化的檔案原件必須完整、排序正確,對折損嚴重影響掃描質(zhì)量的原件應(yīng)預(yù)先修整。B、數(shù)字化中的人員業(yè)務(wù)培訓(xùn)。數(shù)字化工作是需要人來完成的,人員業(yè)務(wù)培訓(xùn)不過關(guān),直接導(dǎo)致返工,間接導(dǎo)致成本的增加,時間段的延長。C、數(shù)字化后的數(shù)據(jù)質(zhì)量、圖像質(zhì)量檢查。錄入后的檔案信息要做到非常高的正確率,掃描后的文件圖像應(yīng)保持檔案的原貌,字跡清楚不失真,無錯掃、漏掃,對文件圖像質(zhì)量有問題的應(yīng)重新掃描。
3、開展檔案數(shù)字化問題的研究,及時解決數(shù)字化進程中的疑難問題。
檔案數(shù)字化是檔案工作中的一項新內(nèi)容,不可避免地會遇到一些新情況、新問題。比如,數(shù)字化檔案信息壓縮及存儲的關(guān)鍵技術(shù)問題;業(yè)務(wù)形態(tài)于現(xiàn)有技術(shù)手段相抵觸;數(shù)字化檔案信息安全、保密技術(shù)問題;數(shù)字化檔案信息的訪問形式與安全控制問題;數(shù)字化檔案信息知識產(chǎn)權(quán)問題;數(shù)字化檔案信息的法律地位問題。針對這些新情況、新問題,應(yīng)在抓檔案原件數(shù)字化工作的同時,組織力量開展檔案數(shù)字化問題的研究,及時解決工作中的一些業(yè)務(wù)問題和相關(guān)技術(shù)性問題,同時澄清和統(tǒng)一思想認識,確保檔案數(shù)字化工作的順利開展。另外,必須加強檔案數(shù)字化和數(shù)字化檔案信息管理人才的培養(yǎng)。只懂得計算機技術(shù)或只懂得紙質(zhì)等載體檔案管理知識的人無法勝任此項工作,所以應(yīng)加強這方面技術(shù)人員的培養(yǎng)。
第16屆國際檔案大會剛剛閉幕,此次會議的主題是:“檔案、管理與發(fā)展:描述未來社會”。我們應(yīng)不斷學(xué)習(xí)最先進的檔案管理模式,不斷走出去看看,開拓眼界,才能跟上時代發(fā)展的主旋律。
國土房管檔案館檔案影像管理系統(tǒng)
一、需求分析
----國土房管檔案影像管理系統(tǒng),其核心是完成紙面檔案的影像化管理工作,將傳統(tǒng)的紙面文檔管理轉(zhuǎn)變?yōu)閷τ跋裎臋n的管理,將傳統(tǒng)的對紙面文檔的數(shù)據(jù)索引方式轉(zhuǎn)變?yōu)槊鎸τ跋裎臋n進行索引的方式,從而為業(yè)務(wù)的開展提供足夠的、快速的信息保障,進而為提高工作效率打下堅實基礎(chǔ)。
----系統(tǒng)要求:分別成立專職的掃描工作點、索引工作點、查詢工作點。掃描工作點主要進行集中的掃描工作,開展索引前紙面文件的預(yù)處理;索引工作點主要完成索引數(shù)據(jù)的錄入,數(shù)據(jù)入庫、生成相關(guān)業(yè)務(wù)報表、建立影像文檔庫等工作;查詢工作點可以是本單位內(nèi)局域網(wǎng)上的任意多個工作站。
----以下對已掌握的需求要點分別進行分析,以及提出解決建議:
1、檔案科目分類
需求:檔案業(yè)務(wù)單式種類較多、分類查詢方式也較多樣系統(tǒng)要求:軟件在分類、錄入上應(yīng)當實現(xiàn)簡便、快捷。
2、檔案規(guī)格、尺寸
需求:雖然檔案的尺寸、規(guī)格基本相同,但考慮到可能要涉及到的附件紙張規(guī)格有不同規(guī)格和紙張質(zhì)量(薄厚),這對掃描儀應(yīng)當有著較高的要求。系統(tǒng)要求:采用能夠?qū)崿F(xiàn)多種規(guī)格尺寸的檔案、檔案可以實現(xiàn)同時掃描的設(shè)備,不必對規(guī)格、尺寸做任何限制和要求。
3、檔案處理手續(xù)
在處理電子文檔過程中,所有的檔案都要按照類別、順序號排列,但是如有缺漏要立即發(fā)驗,保證文檔的完整。原始檔案和影印件要準確無誤的保存起來。
系統(tǒng)要求:系統(tǒng)工作流程定義時,避免流程的逆轉(zhuǎn),要求圖像掃描和處理時要準確無誤,不能存在糾偏變形、遺失檔案和要素等問題。
4、檔案、檔案要素
需求:檔案的數(shù)量和格式不具有絕對固定性,不定期的會增加一些檔案,檔案的格式也存在變更的可能性。
系統(tǒng)要求:軟件可根據(jù)檔案數(shù)量、種類和要素的變化,可以自定義檔案和要素。
5、檔案紙張
需求:檔案的紙張的質(zhì)量差別雖然不是很大,但要保證原始檔案的完整性;另外,有的手寫體和印刷體字跡不很清晰。
系統(tǒng)要求:不能撕壞紙張;必須能夠?qū)ψ舟E進行增強;掃描是能夠自動識別紙張的薄厚,對于一部分年久的紙面文檔,應(yīng)采用平板掃描的方式進行處理。
6、檔案的信息處理:
系統(tǒng)要求:歷史檔案處理,需要采用兩臺高端的掃描儀、2臺中端自動進紙掃描儀,5臺平板掃描,多臺數(shù)碼照相機,掃描時需人手做前期整理工作,以及后期的檔案歸檔工作。完成所有的歷史檔案的處理需要準備不低于1.3T的存貯空間。
7、掃描方式
需求:檔案的掃描不進行分散掃描,分散掃描會造成各口工作人員的工作效率的極大下降,并且掃描后的文檔較為混亂,不利于后續(xù)的索引工作。
系統(tǒng)要求:在減少硬件投入的情況下,有利于提高工作效率,減少掃描的工作環(huán)節(jié)和更有效地進行質(zhì)量控制,掃描之前應(yīng)對被掃描的檔案進行歸類整理,以方便掃描,掃描過后由QA進行質(zhì)量檢查。
8、正確索引
需求:要求寫入數(shù)據(jù)庫的索引數(shù)據(jù)要確保正確。
系統(tǒng)要求:為了確保索引相關(guān)信息被正確入庫,可靈活采用一次錄入,二次較對,或操作人員兩次錄入的工作方式,系統(tǒng)自動校對。
9、影像文檔及數(shù)據(jù)安全
需求:檔案管理部門所涉及的檔案,對安全性及其保密性有很高的要求。系統(tǒng)要求:可對影像化的檔案資料進行加密。
10、影像文檔的查詢
需求:按一定的權(quán)限要求進行系統(tǒng)設(shè)置,完成查詢的需求。
系統(tǒng)要求:采用安裝客戶端的方式,按一定的權(quán)限要求進行系統(tǒng)設(shè)置,完成查詢的需求。
11、備份歸檔
需求:國土房管檔案影像管理系統(tǒng)要求提供可靠的數(shù)據(jù)存儲與備份。
系統(tǒng)要求:按現(xiàn)有的數(shù)據(jù)量以及計劃中的投資,可以采取大容量存儲設(shè)備磁盤陣列和磁帶機作近線備份的方式保存數(shù)據(jù)。
12、查詢響應(yīng)速度
需求:系統(tǒng)查詢速度需要考慮多用戶、多數(shù)據(jù)時系統(tǒng)要能達到較佳的響應(yīng)速度。
系統(tǒng)要求:影響系統(tǒng)查詢速度的因素主要有三個:網(wǎng)絡(luò)帶寬、影像文件大小及并發(fā)用戶的數(shù)量。所以影像文件的調(diào)閱速度基本上由周邊網(wǎng)絡(luò)設(shè)備設(shè)決定。
二、解決方案
1、目標
----國土房管檔案影像管理系統(tǒng)擔負著檔案的管理的任務(wù),是一個專職處理檔案的職能部門,通過為國土房管檔案影像管理系統(tǒng)建立檔案影像管理系統(tǒng),引入新一代的文件管理技術(shù),為國土房管檔案影像管理系統(tǒng)建立原始檔案的影像檔案庫,以達到加強原始檔案的管理、提高管理效率、降低管理成本、實現(xiàn)資料的快速查詢及共享的目的。
2、概述
----信息行業(yè)作為知識經(jīng)濟時代的核心產(chǎn)業(yè)之一,近年來一直以驚人的速度在不斷發(fā)展,而以紙面文件作為媒介的各種信息資料也呈爆炸性增長。如何有效管理這些信息資料,不斷提高信息的使用效率,已經(jīng)成為一個重要課題。
3、現(xiàn)狀
----國土房管檔案影像管理系統(tǒng)的在日常業(yè)務(wù)中,會產(chǎn)生大量檔案,檔案多以紙面文檔的方式產(chǎn)生,以傳統(tǒng)的數(shù)據(jù)處理方式進行處理,紙面檔案每天都在大量地產(chǎn)生,再加上歷史遺留文檔,數(shù)量是非常驚人的,其中所涉及的信息數(shù)量也非常龐大。對于這些檔案及信息,如何進行分類、保存和歸檔,錄入、高效的查詢,一直是一件非常棘手的事情。在傳統(tǒng)模式下,總是被以下幾個難題所困擾:
●檢索、查詢和日常管理麻煩,工作效率不高;●紙面文檔不好保存,很容易被損壞或弄污;●管理效率低下,管理成本居高不下;●檔案調(diào)閱及信息利用效率較低;
●工作低效率、高成本;
----從以上的介紹,不難看僅僅用手工進行紙面檔案的管理有很大局限性,在信息技術(shù)飛速發(fā)展的今天,也越來越不合時宜了。如何利用最新科技,完成紙面檔案的電子化管理工作已經(jīng)成為當務(wù)之急。
4、影像技術(shù)簡介
電子影像是指各類文檔的電子照片。
----影像技術(shù)是指將各種文檔制作成電子照片,使這些文檔的采集、分發(fā)、使用、管理、存儲完全電子化的相關(guān)技術(shù),而傳統(tǒng)的電子化技術(shù)是把文檔上的信息制作成電子數(shù)據(jù),把文檔的流轉(zhuǎn)和處理轉(zhuǎn)化為數(shù)據(jù)的流轉(zhuǎn)和處理。
----影像系統(tǒng)是指對經(jīng)影像化處理的文檔完成數(shù)據(jù)錄入、查詢、調(diào)閱、批改、存儲等功能的一整套解決方案,通過方案的實施能有效的解決傳統(tǒng)手工紙面文檔管理所無法解決的難題,具體有以下幾方面:
●原始文檔電子影像化備份;●可靠安全的數(shù)據(jù)管理;
●文檔“影像原件”的高效查詢;
●在減少工作難度的同時,進一步推進管理工作的規(guī)范化。
----文檔影像化作為一種先進的信息管理手段,一經(jīng)采用,必將大大提高紙面文檔及數(shù)據(jù)的管理效率,降低成本,改進服務(wù),提高信息利用率。影像技術(shù)應(yīng)用的可以分不同階段開展●初級階段:影像化存檔:完成文檔影像化工作及影像文件查詢不涉及工作流技術(shù)
不涉及業(yè)務(wù)過程
●深化階段:影像化業(yè)務(wù)處理:工作流技術(shù)與影像技術(shù)結(jié)合融入業(yè)務(wù)處理過程從后臺走向前臺
三、詳細的技術(shù)方案設(shè)計
1、工作流程設(shè)計
注:當有以下情況發(fā)生時,工作流程按以下的規(guī)定進行:
A.掃描QA時發(fā)現(xiàn)漏掃、誤掃、掃描質(zhì)量太差:重新掃描。B.索引時發(fā)現(xiàn)漏掃、誤掃、掃描質(zhì)量太差:重新掃描。
C.自動校對時發(fā)現(xiàn)有誤:取有誤的輸入數(shù)據(jù)對照文件重新修改,計入日志,生成相應(yīng)報表。
接收檔案
對所接收的紙質(zhì)文件,根據(jù)一定的規(guī)則按類別、按份數(shù)完成文檔的第一次整理工作。確立批次
以加入標識紙的方式,對每一份檔案進行分隔;以一定的份數(shù)為一批,系統(tǒng)將自動生成批次號(注:也可以采用條碼自動識別的方式進行分頁及生成流水號,但采用條碼方式需要加大軟、硬件的投入。)
2、掃描中高速掃描
系統(tǒng)采用PANASONIC高速掃描儀KV-SS905CCN2臺、中速掃描儀KV-S7065CCN2臺,以每個批次為單位,放入掃描儀的自動進紙進行掃描。掃描時,自動生成檔案的分類、分頁。
3、影像處理
掃描質(zhì)檢
檢查掃描的電子影像文件是否有漏掃、誤掃和掃描質(zhì)量欠佳等,以保證掃描輸出高質(zhì)量的電子影像文件。
進行掃描質(zhì)檢時可以采取掃描完后,在掃描工作站上進行掃描的電子影像文件進行質(zhì)檢。掃描補漏
對于有質(zhì)量問題的影像文件建議全批重掃以減少操作復(fù)雜性,個別情況下可以用平板掃描儀、數(shù)碼照相機對那些漏掃、誤掃和掃描質(zhì)量欠佳的文件進行追加掃描。
4、原始檔案裝訂入庫
在對掃描后的電子影像文件檢查無誤,將原始檔案采用常用的檔案管理方式裝訂及入庫。
5、索引
在索引時可采用一人兩次錄入,系統(tǒng)自動較對,對系統(tǒng)較對不一致的數(shù)據(jù),進行校驗及錄入。
6、數(shù)據(jù)歸檔接收數(shù)據(jù)及相應(yīng)的報表,數(shù)據(jù)分別供業(yè)務(wù)數(shù)據(jù)庫使用及影像文檔庫使用。
7、歸檔備份
本系統(tǒng)采用一臺服務(wù)器、一個專用磁盤陣列對索引文件、影像文件進行備份;在進行索引文件備份可以采用定時備份或定容量備份,還可以采用不定時備份,這樣影像文件服務(wù)器遭到災(zāi)難性破壞,可以直接將所備份的索引文件恢復(fù)。
8、檢索、查詢、管理影像文件
在對影像文件進行查詢時,基于本系統(tǒng)的在局域網(wǎng)里的查詢,采用安裝工作站軟件的方式,生成查詢?nèi)罩尽?系統(tǒng)結(jié)構(gòu)及配置
四、系統(tǒng)結(jié)構(gòu)
系統(tǒng)結(jié)構(gòu)如下圖所示:
系統(tǒng)功能
我們設(shè)計的解決方案,由以下幾個子系統(tǒng)功能組成:高速掃描
由高速掃描軟件提供高速掃描圖像資料的功能,把客戶的原始資料轉(zhuǎn)換為電子影像資料。由高速掃描員使用。把保存的數(shù)據(jù)送到質(zhì)量檢驗工序。質(zhì)量檢驗及數(shù)據(jù)錄入
影像質(zhì)量檢驗與部分索引錄入是把影像質(zhì)量有問題和數(shù)據(jù)不正確的影像資料找出來,由質(zhì)檢員使用。索引的資料將會分別放在影像庫中及數(shù)據(jù)庫之中。系統(tǒng)管理
本系統(tǒng)提供的維護和生產(chǎn)情況查詢功能,由系統(tǒng)管理員使用。
安全管理
本系統(tǒng)分系統(tǒng)管理員、高速掃描員、質(zhì)檢員和查詢客戶。其中系統(tǒng)管理員負責整個系統(tǒng)的管理,擁有系統(tǒng)的所有權(quán)限。高速掃描員、質(zhì)檢員有相對應(yīng)的工序使用權(quán)。而查詢客戶只擁有影像資料的查詢權(quán)。
生產(chǎn)日志查詢
可統(tǒng)計和查詢在各工序間的未處理資料情況;可統(tǒng)計和查詢資料保存到影像數(shù)據(jù)庫的情況。出錯處理
如果在使用過程中發(fā)現(xiàn)索引信息有誤,系統(tǒng)管理員可以刪除錯誤紀錄,調(diào)出相應(yīng)存放地中的資料重新掃描并建立索引。
影像查詢
本系統(tǒng)提供資料影像查詢功能,使業(yè)務(wù)人員可以通過EZDOC影像管理系統(tǒng)隨時查找需要的影像數(shù)據(jù),查詢相應(yīng)的影像文件;影像文件在查看時可以有放大、縮小、旋轉(zhuǎn)、打印的功能;記錄查詢?nèi)罩?。校驗功?/p>
系統(tǒng)可以與其它系統(tǒng)的有機聯(lián)接,可以自動與業(yè)務(wù)系統(tǒng)提供之數(shù)據(jù)進行對比。數(shù)據(jù)備份
數(shù)據(jù)備份分為兩個部分:影像文件索引信息數(shù)據(jù)庫備份、影像文件備份。對于影像文件索引信息數(shù)據(jù)庫的備份,電子檔案管理系統(tǒng)不再另外提供備份功能,而是直接使用數(shù)據(jù)庫管理系統(tǒng)的備份、恢復(fù)功能,保證數(shù)據(jù)庫的完整性、有效性、可恢復(fù)性。
有關(guān)影像文件的備份:電子檔案影像索引之后,首先存儲于影像文件服務(wù)器,然后,系統(tǒng)自動完成備分機的備份任務(wù)。5.3.2系統(tǒng)特點
無業(yè)務(wù)流程的逆轉(zhuǎn)
國土房管檔案影像管理系統(tǒng)要求:“準確”、“迅速”、“安全”、“方便”。自然,在業(yè)務(wù)流程中盡可能避免業(yè)務(wù)流程逆轉(zhuǎn),也就是說:在影像掃描的過程中盡可能避免檔案重新掃描、檔案漏掃等問題。流程的逆轉(zhuǎn)會增加數(shù)據(jù)錯誤的可能,流程逆轉(zhuǎn)的環(huán)節(jié)越多錯誤可能性越大。用戶可以自定義檔案分類
檔案種類繁雜,而且檔案種類、檔案要素并不固定,而且可能發(fā)生變化,如果系統(tǒng)將檔案類別做成固定方式,則無法適合業(yè)務(wù)的發(fā)展。于是,我們在系統(tǒng)中為用戶提供了一個開放式接口,可以讓客戶按照自己的方式增加、修改一些檔案分類和檔案要素。——不用編程,全部通過鼠標即可完成。
用戶可選擇當前掃描、輸入的文檔類型
雖然,每天處理的檔案的種類和數(shù)量較大,但并不是每種檔案都有——通常數(shù)量大的主要分布在大業(yè)務(wù)上,有些檔案通常幾天出現(xiàn)一次。如果每天都要建立所有的分類,這將消耗不必要的存儲空間。因此,我們提供了對當前要掃描檔案類別的選擇功能,客戶可以根據(jù)當前業(yè)務(wù)情況進行選擇。
用戶可以自己確定檔案的要素
據(jù)上所述,我們的檔案類別差異很大,而且不定期在發(fā)生著變化,那么,檔案的數(shù)據(jù)要素也在發(fā)生著變化,為了讓客戶更好的適應(yīng)這種變化,我們提供一個開放式檔案要素設(shè)定??梢愿鶕?jù)具體的檔案設(shè)置、更改某些要素。多種安全保護模式
軟件登錄是采用密碼方式。
數(shù)據(jù)庫系統(tǒng)及影像文件也做了加密工作,防止他人修改影像數(shù)據(jù)和數(shù)據(jù)庫數(shù)據(jù)。
質(zhì)量控制
在掃描過程中若出現(xiàn)漏掃、誤掃或影像質(zhì)量不好的問題,通過有效的工作日志的管理,解決以上問題。
檔案數(shù)字化方案研究
課題組
《檔案數(shù)字化方案研究》項目對檔案數(shù)字化優(yōu)化策略與原則、技術(shù)路線與支持、流程重組與再造、操作方法與步驟進行了全面的研究,達到了檔案數(shù)字化全過程優(yōu)化和管理系統(tǒng)整體優(yōu)化的目的,形成了完整的檔案數(shù)字化方案和成功的實踐案例。國家檔案局組織的專家鑒定委員會結(jié)論是:“該項目基于長春市檔案館以檔案利用為導(dǎo)向、漸進性的檔案數(shù)字化實踐,提出了檔案數(shù)字化工作的指導(dǎo)思想、優(yōu)化原則和優(yōu)化策略,符合國情,符合現(xiàn)代管理理念,對全國各檔案館的相關(guān)工作具有較大的參考價值;注重檔案數(shù)字化工作與檔案數(shù)據(jù)庫建設(shè)、檔案信息網(wǎng)絡(luò)開發(fā)的有機銜接,提出了系統(tǒng)優(yōu)化的技術(shù)路線,規(guī)劃設(shè)計了檔案鑒定與數(shù)字化同步、檔案數(shù)字化與上網(wǎng)利用同步、多種檔案數(shù)據(jù)庫建設(shè)同步的流程,并成功地付諸實踐,實現(xiàn)了檔案數(shù)字化與上網(wǎng)利用的低成本、高效率、高效益。同時,運用CA認證、數(shù)字水印、電子簽章等技術(shù),為網(wǎng)上檔案信息資源安全、準確利用提供了技術(shù)保證,也為檔案管理部門提供了很好的實踐模式”。該項目獲國家檔案局2006年優(yōu)秀科技成果二等獎的同時,長春市檔案館被國務(wù)院信息化工作辦公室和國家檔案局確定為傳統(tǒng)載體檔案數(shù)字化試點單位。一.檔案數(shù)字化的指導(dǎo)思想
以優(yōu)化理論為指導(dǎo),以用戶需求為導(dǎo)向,以利用檔案為目的,充分應(yīng)用計算機軟硬件功能,最大限度地發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,兼顧保護檔案原件的要求,保證數(shù)字化檔案的真實可靠,更好地發(fā)揮檔案信息資源的作用。
二、檔案數(shù)字化的優(yōu)化原則
實用性原則:針對館藏檔案具備重復(fù)利用和緊急利用兩大特點,急用、常用檔案優(yōu)先數(shù)字化是檔案數(shù)字化的首選。開放性原則:互聯(lián)網(wǎng)給檔案信息資源共享提供了超越時空的條件,國家民主政治建設(shè)和政府信息公開催促檔案解密和開放,開放檔案及時數(shù)字化是實現(xiàn)其社會共享的前提。價值性原則:重要檔案優(yōu)先數(shù)字化具有檔案利用和檔案保護雙重意義,是網(wǎng)絡(luò)時代更好實現(xiàn)檔案價值的客觀需要。搶救性原則:計算機存儲給檔案搶救開辟了了新的途徑,檔案數(shù)字化是保護瀕危檔案原件最經(jīng)濟和便捷的方法。
時效性原則:檔案數(shù)字化加工與數(shù)字化檔案利用同步實現(xiàn),是充分利用計算機網(wǎng)絡(luò)技術(shù),更好、更快地實現(xiàn)檔案數(shù)字化效益的最佳途徑。
三、檔案數(shù)字化的優(yōu)化策略
需求導(dǎo)向策略:社會需求是制定和調(diào)整檔案數(shù)字化工作策略的“風向標”。匯集多年檔案利用情況統(tǒng)計,把利用頻繁檔案的進行綜合分析,科學(xué)地圈定優(yōu)先檔案數(shù)字化的范圍。并建立快速反應(yīng)機制,執(zhí)行常用檔案繼續(xù)做與急用檔案突擊做的計劃,達到數(shù)字化檔案利用即時見效的目的。
本級為主策略:地方檔案館保存的本級永久檔案是數(shù)字化的重點。進入信息時代,館際間重復(fù)的上級檔案文件,與其分頭進行數(shù)字化及開放鑒定,不如發(fā)揮中國特色檔案管理體制的優(yōu)勢,由上級檔案行政管理部門組織,向館際共建、共享數(shù)字化、開放鑒定成果的方向發(fā)展,盡量減少檔案館多層的重復(fù)勞動。
分步實施策略:館藏檔案數(shù)字化不可能一步到位,而且隨著時間的推移,檔案室進館范圍的檔案將陸續(xù)移交到檔案館,這些檔案采取館室共建、共贏、共享的數(shù)字化策略非常有意義。剔除無用策略:館藏現(xiàn)行檔案是否進館往往由立卷人員決定,加之保管期限表比較籠統(tǒng),館藏不該歸檔、不該進館、重復(fù)檔案頗多。特別是建國超過50年以后,市以下檔案館長期保管的檔案逐年超過保管期的上限。因此,開展檔案價值鑒定,剔除無用,以免再造數(shù)字化垃圾,避免資源浪費應(yīng)是長久的策略。
四、技術(shù)路線的優(yōu)化選擇檔案鑒定與數(shù)字化同步:從利用上講,解決制約檔案信息資源共享的主要瓶頸---檔案開放鑒定問題是當務(wù)之急;從成本上講,檔案價值鑒定是避免失效檔案數(shù)字化的最佳方法。只有這樣,才能控制檔案數(shù)字化投入與產(chǎn)出比例失調(diào)、數(shù)量很大共享很少的問題。
多種檔案數(shù)據(jù)庫建設(shè)同步:一是首先建立文件級目錄數(shù)據(jù)庫。滿足一次檢索需要,建好文件級目錄數(shù)據(jù)庫。目前,絕大多數(shù)檔案館,因沒實現(xiàn)全部檔案的文件級目錄機檢,查檔不快、不準、不全的問題不可避免。所以,把文件級目錄數(shù)據(jù)庫建設(shè)作為基礎(chǔ)性工作,是提高檔案查全率、查準率必經(jīng)之路。二是適時建立專題數(shù)據(jù)庫。隨著社會發(fā)展,對某一專題檔案集中需求時有發(fā)生,突擊建立專題數(shù)據(jù)庫,滿足社會需求是發(fā)揮檔案作用的最佳時機。三是優(yōu)選建設(shè)全文數(shù)據(jù)庫。滿足檔案信息資源開發(fā)利用需要,優(yōu)選建設(shè)全文數(shù)據(jù)庫。按照國家檔案局提出的利用頻繁檔案首先數(shù)字化的要求,遵循“二八”定律(即以20%的努力達到80%的效果),同步開展檔案全文數(shù)據(jù)庫建設(shè)。檔案數(shù)字化與上網(wǎng)利用同步:檔案數(shù)字化的根本目的是充分發(fā)揮其作用。通過計算機網(wǎng)絡(luò)技術(shù),實現(xiàn)檔案數(shù)字化與局域網(wǎng)上利用同步,開放檔案數(shù)字化與互聯(lián)網(wǎng)上利用同步。五.重組和再造的優(yōu)化流程為發(fā)揮計算機網(wǎng)絡(luò)的優(yōu)勢,重組和再造優(yōu)化流程的實質(zhì),就是對檔案數(shù)字化整個工作流程進行系統(tǒng)分析,不但要打破原有業(yè)務(wù)規(guī)程,還要改變行政管理分工,進行全方位的變革。檔案數(shù)字化的任何一個細節(jié)都會對整體產(chǎn)生影響,輕者降低效率,重者決定成敗。長春市檔案館高度重視每一個細節(jié),再造和優(yōu)化了上百個流程和內(nèi)部標準,保證優(yōu)化技術(shù)路線的順利執(zhí)行。六.檔案數(shù)字化示范案例----長春模式
從2004年開始,長春市檔案館以科研課題為先導(dǎo),以項目管理為手段,以效益實現(xiàn)為檢驗標準,組建并成功運行檔案數(shù)字化工作組織架構(gòu)、資源配置、數(shù)字化加工、上網(wǎng)利用“一站式”流水作業(yè)線,探索檔案數(shù)字化和網(wǎng)上利用服務(wù)工程優(yōu)化模式,終于闖出一條獨特的檔案數(shù)字化之路。
(一)實施三個工程,建立一個團隊
長春市檔案館把信息化帶動作為首位戰(zhàn)略,視為一把手工程、班子工程、全員工程突出抓,并創(chuàng)新管理機制,打破行政分工,在計算機網(wǎng)絡(luò)環(huán)境下,建立了行政領(lǐng)導(dǎo)、指導(dǎo)專家(技術(shù)業(yè)務(wù)總負責)、專業(yè)人員、外聘技工20人的長期流程團隊,并與現(xiàn)有計算機和掃描設(shè)備進行合理搭配。該團隊由局(館)黨組直接領(lǐng)導(dǎo),館技術(shù)部門提供支持,管理部門提供檔案,專家提供指導(dǎo),創(chuàng)立了高效的組織體系,搭建了投入小產(chǎn)出大機制框架。
(二)集中四個環(huán)節(jié),堅持流水作業(yè)
文件級目錄數(shù)據(jù)錄入是檔案數(shù)字化的基礎(chǔ),檔案鑒定是檔案信息資源共享的前提,全文數(shù)字化是提升檔案服務(wù)水平的途徑,整理是檔案文件實體管理主要環(huán)節(jié),把上述四個環(huán)節(jié)集中,是提高工作效率和質(zhì)量的最佳選擇。長春市檔案館四集中流水線上,目錄數(shù)據(jù)錄入崗位安排業(yè)務(wù)和技工7名、檔案鑒定崗位安排5人、檔案數(shù)字化加工4人、檔案實體整理4人,在網(wǎng)絡(luò)環(huán)境下實行集中辦公和流水作業(yè)。
(三)數(shù)字化成本降低,數(shù)字化速度加快
由于采用高效的組織體系和優(yōu)化的技術(shù)路線,已有20萬件檔案走下流水線。
低成本主要體現(xiàn)在:20萬件檔案緩銷剔出占24.7%,留存檔案占75.3%;留存的75.3%檔案,全文數(shù)字化占25.6%,現(xiàn)用現(xiàn)掃占49.7%,比全部掃描節(jié)省費用40%以上。同時,三年時間建成數(shù)據(jù)庫50個,文件級數(shù)據(jù)庫120萬條(包括20萬件全文);專題數(shù)據(jù)庫120萬條;照片數(shù)據(jù)庫2000張;資料數(shù)據(jù)庫5000條,案卷級目錄數(shù)據(jù)庫23萬條;現(xiàn)行文件和政府公開信息1萬余件(條)。局域網(wǎng)運行檔案目錄數(shù)據(jù)260萬余條,20萬件全文;互聯(lián)網(wǎng)運行檔案目錄數(shù)據(jù)120萬條,8萬件全文。完成這樣規(guī)模的數(shù)據(jù)庫建設(shè),全部人工費只有58.4萬元(包括流程團隊檔案干部的工資),經(jīng)濟成本很低,時間成本很少。
高效率主要體現(xiàn)在:價值鑒定、開放鑒定、數(shù)字化篩選、原件掃描、實體整理同步完成,比各項分步做效率高數(shù)倍,同時有現(xiàn)用現(xiàn)掃的方法配套,投入少量設(shè)備,相當于將20萬件(200萬頁)檔案全部掃描的效果。
(四)利用方式變革,社會效益顯著
為充分發(fā)揮網(wǎng)絡(luò)優(yōu)勢,長春市檔案館采取了直接與間接相結(jié)合的方法提供利用。
1、直接提供利用:對數(shù)字化檔案全文,在局域網(wǎng)內(nèi),接待人員利用網(wǎng)絡(luò)檢索后直接打印,為用戶提供數(shù)字化檔案打印件。在互聯(lián)網(wǎng)上提供數(shù)字化檔案全文下載、打印服務(wù)。并通過CA認證、電子簽名等安全技術(shù),對特定的用戶直接提供加蓋電子簽章的數(shù)字化檔案打印件,已有案例。
2.間接提供利用:對目錄數(shù)字化檔案,在局域網(wǎng)內(nèi),接待人員機檢到檔案后通知檔案庫管人員,檔案庫管人員調(diào)出原件全文掃描后,通過網(wǎng)絡(luò)打印機直接傳輸打印件,由接待人員提供給用戶。
目前,長春市檔案館基本實現(xiàn)了三個替代:網(wǎng)絡(luò)檢索替代手工目錄檢索,查看數(shù)字化檔案替代查看紙質(zhì)檔案,網(wǎng)絡(luò)打印替代手工復(fù)印。
高效益體現(xiàn)在:檔案全文數(shù)字化占館藏檔案的10%,提供數(shù)字化檔案占利用率的70%。為上萬人提供了檔案證明,公眾成為檔案數(shù)字化的最大受益者。檔案數(shù)字化成果得到社會公眾,上級檔案和信息化部門,當?shù)攸h委、政府,國內(nèi)外同行的普遍贊譽,數(shù)以百計的留言、錦旗、感謝信、獎勵證書、媒體報道就是最好的證明。
檔案數(shù)字化解決方案
檔案數(shù)字化是指采用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文本的處理過程。公司裝備多種掃描設(shè)備:高速掃描儀、零邊距掃描儀、寬幅掃描儀、書刊掃描儀,可處理各類紙質(zhì)文檔。可根據(jù)不同文檔的材質(zhì)、幅面大小及內(nèi)容,提供不同的電子化掃描及索引(著錄)解決方案,并可根據(jù)客戶需求量身制定掃描加工方案。
經(jīng)驗豐富的實施生產(chǎn)隊伍
自2002年開展數(shù)字化掃描加工業(yè)務(wù)以來,掌握了較全面的專業(yè)知識及積累了豐富的工作經(jīng)驗。
成熟的管理機制、有效的管理控制手段。
嚴謹?shù)馁|(zhì)量控制手段,可實現(xiàn)掃描加工過程中各個環(huán)節(jié)的質(zhì)量控制和自動化的量化記錄,可確保掃描加工的影像、索引的正確性。
嚴格的客戶財產(chǎn)保全制度及控制手段??纱_??蛻粑臋n資料、數(shù)據(jù)在掃描加工服務(wù)中的安全性、保密性。
先進、靈活的掃描加工生產(chǎn)系統(tǒng)
公司自主研發(fā)的掃描加工生產(chǎn)軟件系統(tǒng),基于工作流的任務(wù)機制,實現(xiàn)流水線式的生產(chǎn)模式,可根據(jù)客戶的需求靈活的配置、調(diào)整,以適應(yīng)不同客戶、不同類型文檔的加工任務(wù)。包括:文件、檔案、文獻、資料、報紙、書刊、雜志、合釘本、匯編掃描模式:黑白二值、灰度、彩色掃描分辨率:150DPI~2400DPI保存格式:TIFF、JPG、CEB、PDF等。
掃描加工生產(chǎn)軟件系統(tǒng)針對文件、檔案管理工作的特點,通過集合圖像處理、OCR等多項自動化智能技術(shù),實現(xiàn)處理掃描圖像自動糾偏、除黑邊、去污等處理,實現(xiàn)掃描文件自動命名與裝訂,生成多頁TIF文件,通過OCR識別技術(shù)實現(xiàn)電子文件元數(shù)據(jù)半自動獲取,在大幅度提高掃描加工的工作效率的同時,可以完成電子文件元數(shù)據(jù)的獲取工作,并在保證掃描圖像文件質(zhì)量前提下,以最低的容量存儲文件。主要功能介紹
①自動掃描與目錄圖象屬性加工設(shè)置;
②自動傾斜校正/去黑邊/去白頁/加粗/A3切割為A4;③前置處理設(shè)置:去斑、亮度/對比度、顏色通道設(shè)置;④自動文件命名;
⑤自動裝訂(將多個單頁TIF文件合并為1個多頁TIF文件),支持固定頁分割、白頁分割、標志按鈕分割;
⑥自動JPG輸出質(zhì)量設(shè)置;
⑦自動掃描頁計數(shù)(見主界面掃描計數(shù)器),目錄中文件與頁數(shù)自動統(tǒng)計。
根據(jù)各檔案館(室)在處理歷史檔案問題的經(jīng)驗,結(jié)合我公司圖像處理技術(shù)上的優(yōu)勢,特提出了檔案數(shù)字化制作流程及相應(yīng)的技術(shù)參考。
1、檔案分類整理
檔案分類整理是指將案卷按掃描要求進行分解整理,包括原件的拆卷、起釘、粘貼頁撕開。并按掃描后的電子文件組織形成進行分類,以便掃描時的批次處理。
2、檔案交接
分類整理后的檔案按時間先后或其他分類項順序提出,并按實際卷(頁)數(shù)填寫詳細的檔案交接清單,并由雙方管理人員簽字。
3、標引著錄
標引著錄為了方便查閱與管理,打印制作檔案目錄及檔案封面,對文字錄入的準確性要求較高,但著錄的文本域并不是完全統(tǒng)一的在某一頁面上,一些文本域要在多個文件中選擇,所以錄入時需要相關(guān)檔案管理人員進行指導(dǎo),制作相應(yīng)的《文字錄入工作說明書》,確保文本域錄入的準確率。
4、檔案的掃描
原件的掃描與存儲格式完全按照國家檔案管理的統(tǒng)一標準要求掃描。掃描圖像使用先進的圖像掃描處理軟件,掃描人員可根據(jù)原稿質(zhì)量,對系統(tǒng)進行定義,如傾斜校正、去污等批處理功能。在由系統(tǒng)自動處理功能的同時,掃描人員根據(jù)原件的實際情況做相應(yīng)的調(diào)整,如超大頁面的處理、紙張顏色深淺及薄厚的處理、掃描時可根據(jù)不同原件的情況,調(diào)整圖像的分辨率、明暗度以及掃描方式和掃描速度,確保在掃描圖像質(zhì)量清晰的情況下,使原件完好無損。圖像的分辨率正常情況下為150dpi,如遇字間距和行間距過密、原件本身是復(fù)印件等字跡不清楚的情況,可適當增加掃描的分辨率,但要保證圖像清晰的同時,又不影響遠程查詢和瀏覽的速度。
5、圖像處理
檔案數(shù)字化制作模塊中的圖像處理采用自動化處理和人工處理相結(jié)合的方式,確保圖像質(zhì)量的完美。通過對圖像進行校對,確保圖像順序正確,在校對時,發(fā)現(xiàn)不合格圖像及時返回前一工序進行改正。
1)污漬、黑白、偏斜處理2)全文字面的掃描密度3)粘帖頁與表格4)插頁
5)照片頁的處理
6)存儲格式與面頁空間分辨率:100-300dpi圖像格式:TIF、JPG、PDF、CEB儲存空間:A4,黑白二值,40-50KB/頁
6、質(zhì)量檢驗
對掃描處理完成后的圖像頁進行檢驗,對檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁的匹配等質(zhì)量進行全面檢驗。對文本域錄入與文本錄入域的標引、文件的頁號及頁數(shù)進行對比,對掃描前圖像頁的標引與掃描后的圖像頁的編號與頁數(shù)進行對比,發(fā)現(xiàn)不合格的登記清單并退回上一流程重新處理。
7、掛接
文本域錄入和掃描處理檢驗后的圖像成品,由系統(tǒng)自動進行文字圖像與系統(tǒng)的匹配掛接。掛接到檔案數(shù)據(jù)庫系統(tǒng)中后,進行再次的成品驗收。
8、案卷整理
檔案整理工作嚴格按照國家檔案局規(guī)定的相關(guān)標準和本單位實際情況進行有序的整理,安排專人負責案卷合并與整理。
9、入庫交接
裝訂還原后的檔案按時間先后或其他分類項順序入庫,并按實際卷(頁)數(shù)填寫詳細的檔案交接清單,并由雙方管理人員簽字。
檔案資料是歷史的見證、社會的財富,無論在國內(nèi)還是國外都對其價值與重要性給予了高度的重視。但是,由于傳統(tǒng)的檔案保存方式一直采用紙張保存和目錄式管理,不僅占用了大量庫房空間,管理成本高,保管時易損壞,如紙張易黃、易粘、易脆,而且查閱、利用非常不便;雖然目前有部分單位使用計算機管理,但其多數(shù)是基于目錄級的管理,文檔資料本身仍以紙張形式存在,其管理、查詢與利用仍需要在庫房中進行,因此并沒有解決傳統(tǒng)純粹紙張化文檔資料管理所固有的成本高、效率低、原件容易損毀等問題。
如何安全、有效地管理日益龐大的檔案信息并能滿足快速查詢的需求?建立一套完整的、自動化的、擴展性強的文檔信息管理系統(tǒng)已勢在必行。
一、目前現(xiàn)狀
1.傳統(tǒng)的檔案數(shù)據(jù)庫中分類信息復(fù)雜,需靠手工查詢紙張原件,響應(yīng)速度慢。
2.由于檔案量巨大,當需要查詢檔案時,需花費幾個小時甚至一天的時間在檔案室查找。耗時、耗力。
3.由于檔案需長期保存,為提高存儲環(huán)境,避免可能造成文檔紙張受潮、蟲蝕以及火災(zāi)等災(zāi)害,每年大量投
入文檔的保管經(jīng)費已在所難免,且因無備份而又為每年不得不有的文檔損失擔憂。
4.由于檔案需反復(fù)查閱,不可避免的存在原件受損或遺失,給文檔的保管與利用帶來管理上的困擾。
5.在已認知的低檔平板掃描儀錄入的方式下,大量文檔的電子化進程是不可想象和解決的,且大量電子化文
檔如何管理、查閱、應(yīng)用有待全面解決。
二、解決方案
高速文檔掃描儀:富士通掃描儀E-DOCscan文檔自動掃描軟件
MaxAttachNAS4000存儲器
服務(wù)器:自選
數(shù)據(jù)庫:SQL或Oracle大型數(shù)據(jù)庫軟件
軟件:數(shù)字化檔案管理軟件
操作系統(tǒng):服務(wù)器端Windows2000Server+IIS5.0以上
客戶端Windows9X+IE5.0以上
其它設(shè)備:打印機、條碼打印機等
檔案數(shù)字化方案制定與實施
長春市檔案局梁偉李學(xué)廣
館藏傳統(tǒng)載體檔案數(shù)字化的問題,許多地方檔案館進行了實踐,積累了一定的經(jīng)驗,對全國檔案數(shù)字化建設(shè)起到了推動作用。但是,總結(jié)以前我國檔案數(shù)字化建設(shè)的不足和失誤,往往不是信息技術(shù)支持不夠,而是絕大多數(shù)都知道搞數(shù)字化,但檔案數(shù)字化目的是利用的主題不突出,忽略檔案開放鑒定與數(shù)字化檔案利用的邏輯關(guān)系,對先剔除無用檔案后開展數(shù)字化的思路不明確,沒很好研究檔案數(shù)字化的整體效果就大張旗鼓地做起來了。進而出現(xiàn)數(shù)字化目錄數(shù)據(jù)和全文數(shù)據(jù)不對應(yīng)、找不著或不好用等問題不少,檔案數(shù)字化的量雖多,但能上網(wǎng)利用或者說能上互聯(lián)網(wǎng)利用的很少,數(shù)字化返工的現(xiàn)象比較突出,使有限的資金投入并沒有體現(xiàn)在數(shù)字化檔案的利用效益上,這一點已引起檔案系統(tǒng)管理和技術(shù)高層領(lǐng)導(dǎo)的重視,許多實踐工作者已開始進行有益的探索。
面對網(wǎng)絡(luò)時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數(shù)字化需要解決的一系列問題,長春市檔案館與中國人民大學(xué)信息資源管理學(xué)院共同承擔了國家檔案局科技項目《檔案數(shù)字化方案研究》。該項目經(jīng)過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數(shù)字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數(shù)字化指導(dǎo)思想與原則
檔案數(shù)字化指導(dǎo)思想是:以需求為導(dǎo)向,以利用為目的,充分利用計算機軟硬件功能,最大限度發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,保護館藏檔案原件完好,保證數(shù)字化檔案真實準確,更好地發(fā)揮檔案信息資源的作用。
檔案數(shù)字化原則是:遵循重要檔案數(shù)字化的價值性原則、常用檔案數(shù)字化的實用性原則、開放檔案數(shù)字化的開放性原則、褪跡檔案數(shù)字化的搶救性原則,解密檔案數(shù)字化的及時性原則,目錄數(shù)字化與全文數(shù)字化分步的時效性原則,檔案數(shù)字化加工與利用同步的一致性原則。
二、明確檔案數(shù)字化策略
(一)需求導(dǎo)向,急用先上策略
1.需求導(dǎo)向策略
社會需求對檔案利用的影響應(yīng)該是檔案工作者特別關(guān)注的問題。我們用統(tǒng)計數(shù)字加以分析。
(1)隨著編史修志工作納入各地工作規(guī)劃,1986年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的69%。隨著編史修志階段性高潮過去,2003年全國省(區(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的28%。下降41個百分點。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年)(2)隨著社會保障制度的建立和國有企業(yè)改革的深入,長春市檔案館查閱工人調(diào)配檔案卷數(shù)占利用總卷數(shù)的百分比,由2002年的1%增加到2004年的占利用總卷數(shù)的68%。(此數(shù)據(jù)來自長春市檔案館利用統(tǒng)計數(shù)據(jù)庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現(xiàn)了兩個轉(zhuǎn)變,服務(wù)重點由政治領(lǐng)域轉(zhuǎn)變?yōu)榻?jīng)濟領(lǐng)域,服務(wù)對象由機關(guān)干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態(tài)觀念研究當前與長遠社會對檔案的需求,并指導(dǎo)檔案數(shù)字化與利用服務(wù)工程實踐應(yīng)該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數(shù)量眾多。但并不是所有檔案都在現(xiàn)實中利用,有相當大一部分多年不用。2004年全國?。▍^(qū)、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當?shù)攸h委、政府全宗利用率高是一般規(guī)律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統(tǒng)計情況和發(fā)展趨勢確定數(shù)字化的先后順序是科學(xué)的選擇,利用優(yōu)化理論進行檔案數(shù)字化篩選,快速反應(yīng),突擊完成急用檔案數(shù)字化任務(wù),能夠達到更好地發(fā)揮檔案作用的目的,實現(xiàn)即時投入使用的預(yù)期。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年報)(二)本級為主,分步實施策略
(1)本級為主策略
根據(jù)檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數(shù)是本級機關(guān)形成的,一般都占50%以上,這部分檔案自然是當?shù)貦n案館數(shù)字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復(fù)是必要的,這些紙質(zhì)文件來源一般都是上級機關(guān)統(tǒng)一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數(shù)字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數(shù)字化,不如國家檔案局著手進行檔案全文數(shù)字化和開放鑒定分工、協(xié)作,向館際共建、共享已有鑒定和數(shù)字化成果的方向發(fā)展。地方檔案館堅持本級為主的原則,根據(jù)需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數(shù)字化,以滿足當前工作的急需,盡量減少檔案館多層的重復(fù)勞動。
(2)分步實施策略
館藏檔案數(shù)字化不可能一步到位,而且檔案室進館范圍檔案陸續(xù)進館,進館范圍檔案實施檔案數(shù)字化館室共建、共贏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人蔬菜采購合同范本
- 2025年晴綸棉項目可行性研究報告
- 2025年度智能家居系統(tǒng)授權(quán)及售后服務(wù)合同
- 瓦楞紙箱項目建議書寫作參考范文
- (技術(shù)規(guī)范標準)高標準農(nóng)田建設(shè)項目技術(shù)標
- 烏魯木齊外貿(mào)合同范本
- 2025年度智慧社區(qū)建設(shè)合同終止書
- 企業(yè)股權(quán)服務(wù)合同范本
- 2025年度廣告素材制作采購合同
- 2025年度汽車銷售區(qū)域代理合同
- 商業(yè)綜合體市場調(diào)研報告
- 少兒素描課件
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 生物 含解析
- 《對私外匯業(yè)務(wù)從業(yè)資格》開放式測試答案
- 《保險法解讀》課件
- 非煤礦山復(fù)工復(fù)產(chǎn)安全培訓(xùn)
- 變壓器投標書-技術(shù)部分
- 《我國跨境電子商務(wù)消費者權(quán)益保護問題研究》
- 2024九省聯(lián)考適應(yīng)性考試【甘肅省】歷史試卷及答案解析
- 四年級語文下冊第六單元【集體備課】(教材解讀+教學(xué)設(shè)計)
- 蘇教版小學(xué)信息技術(shù)五年級下冊五年級下冊教案全集
評論
0/150
提交評論