




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、TOC o 1-3 h z u HYPERLINK l _Toc318277855 (三)數(shù)數(shù)字化加加工部分分 PAGEREF _Toc318277855 h 1 HYPERLINK l _Toc318277856 6.1.需求分分析與總總結(jié) PAGEREF _Toc318277856 h 1 HYPERLINK l _Toc318277857 6.2.參考的的國家標(biāo)標(biāo)準(zhǔn)及技技術(shù)規(guī)范范 PAGEREF _Toc318277857 h 2 HYPERLINK l _Toc318277858 6.3.數(shù)字化化加工實(shí)實(shí)施細(xì)則則 PAGEREF _Toc318277858 h 3 HYPERLINK
2、l _Toc318277859 6.9.1.本本項(xiàng)的掃掃描加工工流程 PAGEREF _Toc318277859 h 33 HYPERLINK l _Toc318277860 6.9.2.生生產(chǎn)流程程有以下下幾個(gè)主主要的步步驟組成成: PAGEREF _Toc318277860 h 4 HYPERLINK l _Toc318277861 6.9.3.檔檔案整理理 PAGEREF _Toc318277861 h 5 HYPERLINK l _Toc318277862 6.9.4.著著錄標(biāo)引引 PAGEREF _Toc318277862 h 6 HYPERLINK l _Toc318277863
3、6.9.5.紙紙件掃描描 PAGEREF _Toc318277863 h 7 HYPERLINK l _Toc318277864 6.9.6.圖圖像處理理 PAGEREF _Toc318277864 h 8 HYPERLINK l _Toc318277865 6.9.7.質(zhì)質(zhì)量檢驗(yàn)驗(yàn) PAGEREF _Toc318277865 h 10 HYPERLINK l _Toc318277866 6.9.8.檔檔案還原原裝訂 PAGEREF _Toc318277866 h 110 HYPERLINK l _Toc318277867 6.9.9.數(shù)數(shù)據(jù)存儲儲與備份份 PAGEREF _Toc318277
4、867 h 12 HYPERLINK l _Toc318277868 6.9.10.檔案電電子數(shù)據(jù)據(jù)與XXXXXXXX煙草草檔案系系統(tǒng)的無無縫掛接接 PAGEREF _Toc318277868 h 12 HYPERLINK l _Toc318277869 6.4.項(xiàng)目所所采用的的OCRR處理技技術(shù)介紹紹 PAGEREF _Toc318277869 h 12 HYPERLINK l _Toc318277870 6.100.1.OCRR(光學(xué)學(xué)字符識識別)技技術(shù) PAGEREF _Toc318277870 h 122 HYPERLINK l _Toc318277871 6.100.2.所采用用的O
5、CCR及雙雙層PDDF生產(chǎn)產(chǎn)流程 PAGEREF _Toc318277871 h 113 HYPERLINK l _Toc318277872 6.100.3.生產(chǎn)流流程邏輯輯示意圖圖 PAGEREF _Toc318277872 h 14 HYPERLINK l _Toc318277873 6.5.XXXXXXXX檔案數(shù)數(shù)字化服服務(wù)特點(diǎn)點(diǎn) PAGEREF _Toc318277873 h 15 HYPERLINK l _Toc318277874 6.111.1.自動(dòng)化化程度高高 PAGEREF _Toc318277874 h 15 HYPERLINK l _Toc318277875 6.111.2
6、.標(biāo)準(zhǔn)化化程度高高 PAGEREF _Toc318277875 h 15 HYPERLINK l _Toc318277876 6.111.3.嚴(yán)格的的質(zhì)量控控制 PAGEREF _Toc318277876 h 155 HYPERLINK l _Toc318277877 6.111.4.文檔安安全性高高 PAGEREF _Toc318277877 h 15 HYPERLINK l _Toc318277878 6.111.5.標(biāo)準(zhǔn)的的格式 PAGEREF _Toc318277878 h 115 HYPERLINK l _Toc318277879 6.111.6.方便存存儲與管管理 PAGEREF
7、_Toc318277879 h 166(三)數(shù)數(shù)字化加加工部分分需求分析析與總結(jié)結(jié)此次項(xiàng)目目是將中中國煙草草總公司司XXXXXXXX省公司司及所屬屬11個(gè)個(gè)市煙草草公司的的約1883萬頁頁紙質(zhì)檔檔案進(jìn)行行數(shù)字化化加工并并將成品品數(shù)據(jù)掛掛接到檔檔案管理理系統(tǒng)中中,紙質(zhì)質(zhì)檔案的的折分整整理、掃掃描與圖圖像處理理、數(shù)據(jù)據(jù)的掛接接與光盤盤備份都都將嚴(yán)格格按照國國家檔案案局相關(guān)關(guān)標(biāo)準(zhǔn)及及XXXXXXXX省檔案案局相關(guān)關(guān)規(guī)定,結(jié)結(jié)合XXXXXXXX煙草草檔案現(xiàn)現(xiàn)狀定制制加工技技術(shù)規(guī)范范與生產(chǎn)產(chǎn)加工流流程。據(jù)上述述現(xiàn)狀,具具體人員員安排,項(xiàng)項(xiàng)目實(shí)施施周期,采采用標(biāo)準(zhǔn)準(zhǔn)及實(shí)施施細(xì)則如如下。參考的國國家標(biāo)準(zhǔn)準(zhǔn)及
8、技術(shù)術(shù)規(guī)范紙質(zhì)檔檔案數(shù)字字化技術(shù)術(shù)規(guī)范(DDA/TT 31120005)連續(xù)色色調(diào)靜態(tài)態(tài)圖像的的數(shù)字壓壓縮及編編碼(GGB/TT 1772355.1-19998)電子文文件歸檔檔與管理理規(guī)范(GGB/TT 1888944-20002)中央檔檔案館接接收檔案案的標(biāo)準(zhǔn)準(zhǔn)XXXXXXXX省檔案案接收和和收集管管理相關(guān)關(guān)規(guī)定歸檔文文件整理理規(guī)則(DDA/TT22-20000)檔案著著錄規(guī)則則(DDA/TT 188-19999)無酸檔檔案卷皮皮卷盒用用紙及紙紙板(DDA/TT 244-20000)檔案修修裱技術(shù)術(shù)規(guī)范(DDA/TT 255-20000)XXXXXXXXXXXXXXXX檔案數(shù)數(shù)字化技技術(shù)規(guī)
9、范范XXXXXXXX煙草檔檔案數(shù)字字化技術(shù)術(shù)規(guī)范數(shù)字化加加工實(shí)施施細(xì)則本項(xiàng)的掃掃描加工工流程生產(chǎn)流程程有以下下幾個(gè)主主要的步步驟組成成:紙質(zhì)檔案案的整理理從檔案室室進(jìn)行檔檔案提卷卷,并記記錄提卷卷的內(nèi)容容,接著著拆卷,并并進(jìn)行去去污、平平整化,并并依據(jù)檔檔案紙張張的大小小和厚薄薄分類。檔案的的整理工工作主要要是為了了以后檔檔案的掃掃描做準(zhǔn)準(zhǔn)備。掃描及圖圖像處理理根據(jù)不同同檔案紙紙張的大大小和厚厚薄,選選擇不同同的掃描描儀,較較為規(guī)整整的選擇擇快速掃掃描儀,較較薄、較較厚和不不規(guī)整的的用平板板掃描儀儀,這樣樣既能達(dá)達(dá)到保護(hù)護(hù)檔案(高高速掃描描儀會(huì)發(fā)發(fā)生卷紙紙,損壞壞檔案)的的目的,也也能提高高檔
10、案數(shù)數(shù)字化加加工的速速度。查重查漏漏在掃描的的過程中中,難免免會(huì)發(fā)生生重復(fù)掃掃描和漏漏掃的現(xiàn)現(xiàn)象,人人工的再再次校對對能夠發(fā)發(fā)現(xiàn)檔案案數(shù)字化化過程中中出現(xiàn)的的情況,并并即使糾糾正。數(shù)據(jù)項(xiàng)錄錄入依據(jù)檔案案著錄規(guī)規(guī)范或者者依據(jù)客客戶檔案案的實(shí)際際著錄項(xiàng)項(xiàng),錄入入標(biāo)題、責(zé)任者者、歸檔檔時(shí)間、檔號等等各種信信息。質(zhì)量檢測測對掃描圖圖像和著著錄的標(biāo)標(biāo)引數(shù)據(jù)據(jù)進(jìn)行檢檢驗(yàn),圖圖像主要要是檢驗(yàn)驗(yàn)其掃描描和凈化化處理質(zhì)質(zhì)量,數(shù)數(shù)據(jù)項(xiàng)的的質(zhì)量檢檢測主要要是檢測測其錄入入正確率率。檔案還原原完成檔案案數(shù)字化化后,要要把原先先的檔案案原件還還原成原原樣。檔案整理理檔案交接接檔案按年年度、案案卷提檔檔,提檔檔時(shí)數(shù)字字化
11、實(shí)施施方的提提卷人員員對每卷卷的所有有頁面進(jìn)進(jìn)行統(tǒng)一一的編號號,全卷卷所有文文件頁號號編寫完完成后,再再依據(jù)XXXXXXXX煙煙草的要要求抽出出不需要要掃描的的文件頁頁,然后后再次按按序編寫寫需要掃掃描的文文件頁號號,頁號號編寫完完成后,按按實(shí)際文文件頁數(shù)數(shù)填寫詳詳細(xì)的紙紙質(zhì)檔案案交按清清單,并并由雙方方主管人人員簽字字。檔案拆分分檔案拆分分前要對對檔案進(jìn)進(jìn)行統(tǒng)一一的編號號,編制制總頁號號后,要要從中選選中需要要掃描的的頁面。再一次次編制所所需掃描描的頁號號,兩個(gè)個(gè)頁號需需用鉛筆筆的顏色色或位置置區(qū)分,以以確保檔檔案還原原時(shí)能夠夠清楚區(qū)區(qū)別和核核時(shí)頁數(shù)數(shù)。目錄數(shù)據(jù)據(jù)準(zhǔn)備按照檔檔案著錄錄規(guī)則(D
12、A/T188)等的的要求,規(guī)規(guī)范檔案案中的目目錄內(nèi)容容。包括括確定檔檔案目錄錄的著錄錄項(xiàng)、字字段長度度和內(nèi)容容要求。如有錯(cuò)錯(cuò)誤或不不規(guī)范的的案卷題題名、文文件名、責(zé)任者者、起止止頁號和和頁數(shù)等等,應(yīng)進(jìn)進(jìn)行修改改。拆除裝訂訂在不去除除裝訂物物情況下下,影響響掃描工工作進(jìn)行行的檔案案,應(yīng)拆拆除裝訂訂物。拆拆除裝訂訂物時(shí)應(yīng)應(yīng)注意保保護(hù)檔案案不受損損害。區(qū)分掃描描件和非非掃描件件按要求把把同一案案卷中的的掃描件件和非掃掃描件區(qū)區(qū)分開。普發(fā)性性文件區(qū)區(qū)分的原原則是:無關(guān)和和重份的的文件要要剔除,有有正式件件的文件件可以不不掃描原原稿。頁面修整整破損嚴(yán)重重、無法法直接進(jìn)進(jìn)行掃描描的檔案案,應(yīng)先先進(jìn)行技技術(shù)
13、修復(fù)復(fù),折皺皺不平影影響掃描描質(zhì)量的的原件應(yīng)應(yīng)先進(jìn)行行相應(yīng)處處理(壓壓平或熨熨平等)后再進(jìn)進(jìn)行掃描描。檔案整理理登記制作并填填寫紙質(zhì)質(zhì)檔案數(shù)數(shù)字化加加工過程程交接登登記表單單,詳細(xì)細(xì)記錄檔檔案整理理后每份份文件的的起始頁頁號和頁頁數(shù)。著錄標(biāo)引引標(biāo)引著錄錄標(biāo)引著錄錄為了方方便查閱閱與管理理,打印印制作檔檔案目錄錄及檔案案封面,對對文字錄錄入的準(zhǔn)準(zhǔn)確性要要求較高高,但要要錄的文文本域并并不是完完全統(tǒng)一一的在某某一頁面面上,一一些文本本域要在在多個(gè)文文件中選選擇,所所以錄入入時(shí)需要要相關(guān)學(xué)學(xué)部專家家進(jìn)行指指導(dǎo),確確保文本本域錄入入的準(zhǔn)確確率。對所需錄錄入的文文本進(jìn)行行標(biāo)引、或?qū)Σ徊煌悇e別的檔案案錄
14、入特特征制作作相應(yīng)的的文字字錄入工工作說明明書,供供錄入員員和校對對人員參參考。錄入方式式由于文本本類型不不一,有有印刷體體、手寫寫體、有有表格內(nèi)內(nèi)的也有有表格外外的文本本信息,所所以采用用手工錄錄入和OOCR(光光學(xué)字符符識別)軟軟件相結(jié)結(jié)合的方方式錄入入。即手手寫體或或不清晰晰的印刷刷體采用用手工錄錄入,較較規(guī)整的的印刷體體采用OOCR技技術(shù)的錄錄入方式式。校對方式式校對以軟軟件校對對和打印印輸出對對比校對對相結(jié)合合的方式式,即對對手工錄錄入和OOCR自自動(dòng)錄入入的文本本打印輸輸出進(jìn)行行對比校校對的一一校、二二校、抽抽查校對對,確保保索引信信息達(dá)到到出版質(zhì)質(zhì)量萬分分之一以以下。紙件掃描描原
15、件的掃掃描與存存儲格式式完全按按照國家家檔案管管理的統(tǒng)統(tǒng)一標(biāo)準(zhǔn)準(zhǔn)和XXXXXXXX煙草草的相關(guān)關(guān)要求掃掃描。掃掃描人員員按照掃掃描與處處理工作作說明書書的要要求,填填寫移交交清單(此此移交清清單是檔檔案拆分分人員和和掃描人人員共同同填寫)并并簽字領(lǐng)領(lǐng)取并進(jìn)進(jìn)行紙件件掃描。掃描圖圖像使用用先進(jìn)的的圖像掃掃描處理理軟件(快快圖像系系統(tǒng)),掃掃描人員員可根據(jù)據(jù)原稿質(zhì)質(zhì)量,對對系統(tǒng)進(jìn)進(jìn)行定義義,如自自動(dòng)傾斜斜校正、自動(dòng)去去污、自自動(dòng)分文文件等批批處理功功能。在在由系統(tǒng)統(tǒng)自動(dòng)處處理功能能的同時(shí)時(shí),掃描描人員根根據(jù)原件件的實(shí)際際情況做做相應(yīng)的的調(diào)整,如如超大頁頁面的處處理、紙紙張顏色色深淺及及薄厚的的處理
16、、掃描時(shí)時(shí)可根據(jù)據(jù)不同原原件的情情況,調(diào)調(diào)整圖像像的分辨辨率、閥閥值、明明亮度以以及掃描描方式和和掃描速速度,確確保在掃掃描圖像像質(zhì)量清清晰的情情況下,使使原件完完好無損損。圖像的分分辨率正正常情況況下為3300ddpi,如遇字字間距和和行行距距過密、原件本本身是復(fù)復(fù)印件等等字跡不不清楚的的情況,可可適當(dāng)增增加掃描描的分辨辨率但要要保正圖圖像清晰晰的同時(shí)時(shí),又不不影響遠(yuǎn)遠(yuǎn)程查詢詢和游覽覽的速度度。掃描方式式根據(jù)檔案案幅面的的大小(A4、A3、A0等等)選擇擇相應(yīng)規(guī)規(guī)格的掃掃描儀或或?qū)I(yè)掃掃描儀(如工程程圖紙可可采用00號圖紙紙掃描儀儀)進(jìn)行行掃描。大幅面面檔案可可采用大大幅面數(shù)數(shù)碼平臺臺,或者
17、者縮微拍拍攝后的的膠片數(shù)數(shù)字化轉(zhuǎn)轉(zhuǎn)換設(shè)備備等進(jìn)行行掃描,也也可以采采用小幅幅面掃描描后的圖圖像拼接接方式處處理。紙張狀況況較差,以以及過薄薄、過軟軟或超厚厚的檔案案,應(yīng)采采用平板板掃描方方式;紙紙張狀況況好的檔檔案可采采用高速速掃描方方式以提提高工作作效率。掃描色彩彩模式掃描色彩彩模式一一般有黑黑白二值值、灰度度、彩色色等。通通常采用用黑白二二值。頁面為黑黑白兩色色,并且且字跡清清晰、不不帶插圖圖的檔案案可采采用黑白白二值模模式進(jìn)行行掃描。頁面為為黑白兩兩色,但但字跡清清晰度差差或帶有有插圖的的檔案,以以及頁面面為多色色文字的的檔案,可可以采用用灰度模模式掃描描。頁面面中有紅紅頭、印印章或插插
18、有黑白白照片、彩色照照片、彩彩色插圖圖的檔案案,可視視需要采采用彩色色模式進(jìn)進(jìn)行掃描描。掃描分辨辨率掃描分辨辨率參數(shù)數(shù)大小的的選擇,原原則上以以掃描后后的圖像像清晰、完整、不影響響圖像的的利用效效果為準(zhǔn)準(zhǔn)。采用用黑白二二值、灰灰度、彩彩色幾種種模式對對檔案進(jìn)進(jìn)行掃描描時(shí),其其分辨率率一般均均選擇大大于或等等于2000dppi。特特殊情況況下,如如文字偏偏小、密密集、清清晰度較較差等,可可適當(dāng)提提高分辨辨率。需需要進(jìn)行行OCRR漢字識識別的檔檔案,掃掃描分辨辨率建議議選擇大大于或等等于dppi。掃描登記記 認(rèn)真真填寫紙紙質(zhì)檔案案數(shù)字化化轉(zhuǎn)換過過程交接接登記表表單,登登記掃描描的頁數(shù)數(shù),核對對每份
19、文文件的實(shí)實(shí)際掃描描頁數(shù)與與檔案整整理時(shí)填填寫的文文件頁數(shù)數(shù)是否一一致,不不一致時(shí)時(shí)應(yīng)注明明具體原原因和處處理方法法。圖像處理理XXXXXXXXXXXXXXX檔檔案數(shù)字字化工廠廠采用自自動(dòng)化處處理和人人工處理理相結(jié)合合的方式式,確保保圖像質(zhì)質(zhì)量的完完美。通通過校對對系統(tǒng)對對圖像進(jìn)進(jìn)行校對對,確保保圖像順順序正確確、去斑斑點(diǎn)、校校驗(yàn)。,在在校對時(shí)時(shí)發(fā)現(xiàn)不不合格圖圖像及時(shí)時(shí)返回前前一工序序進(jìn)行改改正。污漬、黑黑邊、偏偏斜處理理數(shù)字化加加工系統(tǒng)統(tǒng)會(huì)根據(jù)據(jù)原件質(zhì)質(zhì)量的好好壞對污污漬的情情況進(jìn)行行自動(dòng)輕輕度、中中度、高高度去污污,對紙紙質(zhì)變質(zhì)質(zhì)或掃描描時(shí)的黑黑邊完全全自動(dòng)清清除、自自動(dòng)進(jìn)行行偏斜校校正處
20、理理。系統(tǒng)統(tǒng)支持局局部去污污、并能能對不能能夠自動(dòng)動(dòng)處理的的頁面進(jìn)進(jìn)行單頁頁多次修修正。圖圖像處理理人員在在發(fā)現(xiàn)掃掃描不合合格的文文件,進(jìn)進(jìn)行登記記后交掃掃描人員員處理,雙雙方簽字字確認(rèn)后后的表單單留存?zhèn)鋫洳?。使使因掃描描造成的的不合格格圖像機(jī)機(jī)時(shí)返回回上一生生產(chǎn)流程程。全文字面面的掃描描密度圖像處理理人員在在進(jìn)行處處理前,掃掃描人員員會(huì)根據(jù)據(jù)不同原原件的情情況,提提高圖像像掃描的的分辨率率、閥值值、明亮亮度以及及掃描方方式,如如遇字間間距和行行行距過過密、原原件本身身是復(fù)印印件等字字跡不清清楚的情情況,對對手寫過過密的要要對圖像像進(jìn)行細(xì)細(xì)致的修修正,確確保各書書寫工具具寫出的的不同顏顏色、深
21、深淺的文文字及圖圖像信息息清晰可可辯。粘帖頁與與表格對粘帖頁頁面的處處理先用用XXXXXXXX數(shù)字化化加工軟軟件系統(tǒng)統(tǒng)進(jìn)行自自動(dòng)處理理,在掃掃描的時(shí)時(shí)消除粘粘帖重疊疊的曲線線,不能能自動(dòng)處處理的放放大后人人工處理理。對字字跡與表表格線顏顏色深淺淺不一在在掃描時(shí)時(shí)進(jìn)行細(xì)細(xì)微調(diào)整整后,圖圖像處理理時(shí)再進(jìn)進(jìn)行局部部調(diào)整。以確保保數(shù)字檔檔案的可可閱讀性性。一般性文文本流程程圖提高圖像像掃描的的分辨率率,調(diào)整整閥值、明亮度度以及掃掃描方式式,采用用局部處處理技術(shù)術(shù)對圖像像進(jìn)行修修正。以以確保數(shù)數(shù)字檔案案游覽時(shí)時(shí)辨認(rèn)流流程圖的的流程線線。插圖頁面面處理檔案中有有插圖的的要在掃掃描時(shí)對對提高分分辨率及及相應(yīng)
22、調(diào)調(diào)整,圖圖文混排排的頁面面不做拆拆分,在在保持原原始頁面面信息的的同時(shí)使使圖像清清晰可辯辯。照片頁的的處理根據(jù)黑白白或彩色色圖像對對頁面進(jìn)進(jìn)行調(diào)整整,對特特殊照片片的處理理,必要要時(shí)采用用專業(yè)的的圖像處處理軟件件進(jìn)行處處理,確確保照片片的清晰晰度。存儲格式式與頁面面空間分辨率:2000dpii圖像格式式:TIIFF、JPGG儲存空間間:B55或A44,200-300KB/頁質(zhì)量檢驗(yàn)驗(yàn)對掃描處處理完成成后的圖圖像頁進(jìn)進(jìn)行檢驗(yàn)驗(yàn),對檔檔案拆分分、掃描描、修正正、去污污、文本本流程圖圖的處理理、插圖圖、照片片的處理理以及文文本和圖圖像頁的的匹配進(jìn)進(jìn)行檢驗(yàn)驗(yàn)等質(zhì)量量進(jìn)行全全面檢驗(yàn)驗(yàn)。對文本域域錄入與
23、與文本錄錄入域的的標(biāo)引、文件的的頁號及及頁數(shù)進(jìn)進(jìn)行對比比,對掃掃描前的的圖像頁頁的標(biāo)引引與掃描描后的圖圖像頁的的編號與與頁數(shù)進(jìn)進(jìn)行對比比,發(fā)現(xiàn)現(xiàn)不合格格的登記記清單并并退回上上一流程程重新處處理。檔案還原原裝訂檔案整理理工作嚴(yán)嚴(yán)格按照照中央檔檔案館進(jìn)進(jìn)館標(biāo)準(zhǔn)準(zhǔn)規(guī)定的的相關(guān)標(biāo)標(biāo)準(zhǔn)和XXXXXXXX煙煙草的實(shí)實(shí)際情況況進(jìn)行有有序的整整理,XXXXXXXXXXXXXXXX檔檔案數(shù)字字化中心心安排專專人負(fù)責(zé)責(zé)案卷合合并與整整理。原件合并并把掃描時(shí)時(shí)挑出的的頁面插插入到原原來的頁頁面位置置中去,將將掃描時(shí)時(shí)展開的的超大頁頁面還原原到掃描描前的原原樣,把把數(shù)字化化中挑出出的不要要的多余余頁面提提出。全卷整
24、理理將每卷文文件按形形成的時(shí)時(shí)間、順順序、文文件類別別進(jìn)行整整理。編寫頁號號按重新整整理頁面面上按順順序統(tǒng)一一的編寫寫頁號。案卷目錄錄和卷內(nèi)內(nèi)目錄按順序?qū)⒁粋€(gè)項(xiàng)項(xiàng)目文件件的合并并到一卷卷中,并并按中央央檔案館館進(jìn)館標(biāo)標(biāo)準(zhǔn)和XXXXXXXX煙煙草特有有字段組組成案卷卷目錄和和卷內(nèi)目目錄。打印案卷卷封面和和卷內(nèi)目目錄對案卷目目錄和卷卷內(nèi)目錄錄與卷內(nèi)內(nèi)文件進(jìn)進(jìn)行匹配配后打印印案卷目目錄和卷卷內(nèi)目錄錄以備裝裝訂使用用。裝訂嚴(yán)格按照照中央檔檔案館進(jìn)進(jìn)館標(biāo)準(zhǔn)準(zhǔn)和XXXXXXXX煙草草的要求求將每卷卷檔案的的封面、卷內(nèi)目目錄、卷卷內(nèi)文件件、左下下角對齊齊打成三三孔一線線裝訂還還原檔案案。案卷分盒盒按年度、
25、案卷、類別、機(jī)構(gòu)等等有規(guī)則則地按順順序裝入入定制的的檔案盒盒。打印裝箱箱單按年度、箱號、盒號、卷號、總頁數(shù)數(shù)打印裝裝箱清單單?;虬窗礄n案檔檔案館的的要求制制作打印印裝箱單單。按順序裝裝箱按箱子編編號、年年度、箱箱內(nèi)盒數(shù)數(shù)、案卷卷數(shù)與總總頁數(shù)裝裝箱,參參照國家家檔案館館的要求求結(jié)合XXXXXXXX煙煙草的實(shí)實(shí)際情況況按序裝裝箱。編制目錄錄(年度度目錄)制作出XXXXXXXX煙煙草檔案案裝箱目目錄,合合并各箱箱清單,統(tǒng)統(tǒng)一編制制頁碼,形形成裝箱箱目錄,并并按通用用格式存存儲裝箱箱目錄的的電子文文件,以以便檢索索與查找找,或按按檔案館館進(jìn)館要要求編制制。數(shù)據(jù)存儲儲與備份份在生產(chǎn)過過程中,XXXXXX
26、掃描加工中心是一個(gè)基于網(wǎng)絡(luò)化流程化生產(chǎn)管理系統(tǒng),我們在掃描的同時(shí)就同時(shí)產(chǎn)生兩份備原始圖像數(shù)據(jù)的備份數(shù)據(jù)。在經(jīng)過生生產(chǎn)系統(tǒng)統(tǒng)質(zhì)量驗(yàn)驗(yàn)收合格格的電子子文件后后,我們們將把掃掃描的成成品數(shù)據(jù)據(jù)與XXXXXXXX煙草草的檔案案管理系系統(tǒng)掛接接,將按按規(guī)則生生產(chǎn)原始始圖像光光盤及具具備單盤盤檢索的的數(shù)據(jù)光光盤。檔案電子子數(shù)據(jù)與與XXXXXXXX煙草檔檔案系統(tǒng)統(tǒng)的無縫縫掛接文本域錄錄入和掃掃描處理理檢驗(yàn)后后的圖像像成品,按按年度進(jìn)進(jìn)行文字字圖像與與系統(tǒng)的的掛接,不不需手工工掛接即即可實(shí)現(xiàn)現(xiàn)文本與與圖像頁頁與系統(tǒng)統(tǒng)的掛接接。掛接接到XXXXXXXX煙草草檔案管管理系統(tǒng)統(tǒng)中后,進(jìn)進(jìn)行再次次的成品品驗(yàn)收,對對各
27、種使使用習(xí)慣慣逐頁進(jìn)進(jìn)行檢驗(yàn)驗(yàn),驗(yàn)收收合格后后移交到到由XXXXXXXX煙草草專家組組成的驗(yàn)驗(yàn)收小組組驗(yàn)收。確保完美美無縫掛掛接因?yàn)閄XXXXXXX煙草草檔案管管理系統(tǒng)統(tǒng)是采用用XXXXXXXX軟件的的檔案管管理軟件件系統(tǒng),XXXXXX檔案掃描加工系統(tǒng)和XXXXXX檔案管理系統(tǒng)可以實(shí)現(xiàn)自動(dòng)批量掛接,無需人工干預(yù)即可實(shí)施目錄數(shù)據(jù)與原文電子數(shù)據(jù)的無縫掛接。項(xiàng)目所采采用的OOCR處處理技術(shù)術(shù)介紹OCR(光光學(xué)字符符識別)技技術(shù)OCR是是英文OOptiicall Chharaacteer RRecoogniitioon 的的縮寫,中中文意思思就是通通過光學(xué)學(xué)技術(shù)對對文字進(jìn)進(jìn)行識別別。OCCR概念念的產(chǎn)
28、生生是在119299年,德德國的科科學(xué)家TTausshecck首先先提出了了OCRR的概念念,并且且申請了了專利。幾年后后,美國國科學(xué)家家Hanndell也提出出了利用用技術(shù)對對文字進(jìn)進(jìn)行識別別的想法法。但這這種夢想想直到計(jì)計(jì)算機(jī)的的誕生才才變成了了現(xiàn)實(shí)。現(xiàn)在這這一技術(shù)術(shù)已經(jīng)由由計(jì)算機(jī)機(jī)來實(shí)現(xiàn)現(xiàn),OCCR的意意思就演演變成為為利用光光學(xué)技術(shù)術(shù)對文字字和字符符進(jìn)行掃掃描識別別,轉(zhuǎn)化化成計(jì)算算機(jī)內(nèi)碼碼。所采用的的OCRR及雙層層PDFF生產(chǎn)流流程識別模塊塊具有超強(qiáng)強(qiáng)的識別別核心.可以識識別簡、繁體漢漢字2萬萬多,識識別的語語言包括括中文簡簡、繁體體、英文文、日文文、韓文文,自動(dòng)動(dòng)版面分分析能力力大
29、大增增強(qiáng).最最大限度度減少手手工操作作量??v向校對對模塊可以將成成百上千千張圖像像一起校校對將識別成成同一個(gè)個(gè)字的圖圖像集中中在一個(gè)個(gè)窗口內(nèi)內(nèi),先標(biāo)標(biāo)記錯(cuò)誤誤,再自自動(dòng)與橫橫校進(jìn)行行合并,后后統(tǒng)一改改正,校校對工作作量減少少80%,錯(cuò)誤誤率可控控制在萬萬分之一一。版面恢復(fù)復(fù)模塊通過版面面恢復(fù)編編輯器,可可以將原原始圖像像的所有有信息恢恢復(fù)過來來。比如如:字體體、顏色色、花邊邊等。雙層PDDF生成成模塊可直接在在程序中中進(jìn)行后后臺PDDF處理理,無需需在Accrobbat中中生成,方方便而快快捷??煽梢赃x擇擇生成多多種PDDF格式式:雙層層PDFF文檔包包括圖文文混排的的PDFF、圖在在文上的的PDFF、圖在在文下的的PDFF等。自動(dòng)處理理模塊可以實(shí)現(xiàn)現(xiàn)圖像文文件到PPDF文文件的自自動(dòng)轉(zhuǎn)換換,生成成的PDDF文件件能夠?qū)崒?shí)現(xiàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度模具行業(yè)人才培養(yǎng)與交流協(xié)議模板
- 二零二五年度工業(yè)用地土地出租環(huán)保安全協(xié)議
- 新型能源設(shè)備安裝及維護(hù)協(xié)議
- 共享農(nóng)產(chǎn)品批發(fā)市場的買賣雙方合同
- 煤炭租賃合同
- 數(shù)字醫(yī)療健康平臺推廣合作協(xié)議
- 多功能餐廳運(yùn)營合同
- 餐飲行業(yè)食品安全承諾書與免責(zé)協(xié)議
- 專業(yè)資質(zhì)認(rèn)證服務(wù)合同書
- 高考英語題組限時(shí)訓(xùn)練含答案解析
- 2024年河北石家莊同濟(jì)醫(yī)學(xué)中等專業(yè)學(xué)校招聘教師考試真題
- 2025年河南工業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫審定版
- 施工現(xiàn)場應(yīng)對極端天氣的措施
- 江蘇2025年01月江蘇省揚(yáng)州生態(tài)科技新城管委會(huì)2025年招考6名勞務(wù)派遣人員筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025年內(nèi)蒙古呼倫貝爾農(nóng)墾拉布大林上庫力三河蘇沁農(nóng)牧場招聘115人歷年高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 中學(xué)創(chuàng)客教育教學(xué)活動(dòng)計(jì)劃
- 《移動(dòng)通信市場推廣策略》課件
- 2025年四川成都職業(yè)技術(shù)學(xué)院招聘筆試參考題庫含答案解析
- 2025年國家藥品監(jiān)督管理局藥品審評中心招聘11人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年廣東省《輔警招聘考試必刷500題》考試題庫含必背答案
- 餐飲企業(yè)牛奶產(chǎn)品推廣方案
評論
0/150
提交評論