掃描儀與OCR課件_第1頁
掃描儀與OCR課件_第2頁
掃描儀與OCR課件_第3頁
掃描儀與OCR課件_第4頁
掃描儀與OCR課件_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

掃描儀與OCR技術(shù)1、什么是掃描儀?

掃描儀是一種獲取圖像的設(shè)備,并將信息轉(zhuǎn)為電腦可以顯示、編輯、存儲和輸出的數(shù)字格式。即可以完成以下工作:在文件中插隊圖和照片;將文字識別,免去打字;將傳真文件掃到庫中存檔;在多媒體中加入圖像;在報刊中加入圖片有效表達(dá)主題。掃描儀通過光源照射到被掃描的材料上來獲得材料的圖像。材料將光線反射到CCD(ChangeCoupledDevice,電荷偶合器件)的光敏元件上,由于材料不同的位置反射的光線強(qiáng)弱不同,CCD器件將光線轉(zhuǎn)換成數(shù)字信號,并傳送到計算機(jī)中,此時我們就獲得了材料的圖像。如果您將紙張上的文字掃描到電腦中就可以通過OCR(光學(xué)字符識別)軟件將圖像轉(zhuǎn)換成文字,可以減輕錄入工作。掃描儀的技術(shù)發(fā)展很快,但就其光學(xué)系統(tǒng)而言,不外乎CIS、CCD和棱鏡分色系統(tǒng)幾類,由于CIS(接觸式圖像傳感器)十分適合OCR(光學(xué)字符識別),特別是其黑白方式,比CCD方式的掃描儀價格低廉,所以市場占有率曾一度較大,但隨著掃描儀市場從黑白到灰度再到彩色的轉(zhuǎn)變,彩色CIS掃描儀也已進(jìn)入市場。采用三棱鏡分色系統(tǒng),使得彩色掃描儀的關(guān)鍵技術(shù)全面提高,該系統(tǒng)利用光學(xué)物理原理,以三棱鏡來分離自然光R、G、B三原色,由于三原色采用一致的角度,同一時間曝光完成,使掃描的圖像的邊緣光潔度十分理想,掃描三維立體圖像時,效果更好,這一技術(shù)代表未來新潮流,目前,只有少數(shù)幾個廠家擁有該技術(shù)。CCD是目前掃描儀的主要技術(shù),它的發(fā)展已從黑白、灰度演變到8位、12位、24位、30位乃至36位彩色,這決定了掃描儀的基本發(fā)展趨勢,即其精度和色彩度方面將不斷增高。

決定掃描儀掃描質(zhì)量的因素很多,首先,分辨率是掃描儀的一項重要指標(biāo),掃描儀的分辨率包括光學(xué)分辨率和插值分辨率,作為掃描儀真實分辨率的光學(xué)分辨率,又分為水平分辨率和垂直分辨率兩種方式,水平分辨率和光源系統(tǒng)CCD的真實分辨率及相應(yīng)的硬件電路設(shè)計有關(guān),它是由CCD的像素點數(shù)除以掃描儀最大可掃描尺寸而得到的數(shù)值;垂直分辨率則與傳動機(jī)構(gòu)的精密程度有關(guān),水平分辨率較垂直分辨率顯得更為重要。為提高掃描儀的圖像質(zhì)量,利用軟件技術(shù)在硬件產(chǎn)生的像點之間插入另外的像點,由此獲得的分辨率稱為插值分辨率,該種分辨率在一定程度上使掃描儀的圖像質(zhì)量得到提高。所以,選擇掃描儀一定要弄清其光學(xué)分辨率是多少,即便是光學(xué)分辨率高的掃描儀,在處理不同的掃描儀介質(zhì)對象時,其性能表現(xiàn)也迥然不同。

例如在掃描彩色照片時,較低的分辨率效果反而更好,一般而言,分辨率在150~200dpi之間為最佳;而掃描膠片時則需要較高的分辨率,因此在選擇掃描儀時,對分辨率因素的選擇要和用戶的用途結(jié)合起來考慮。掃描儀具有精確的縮放技術(shù)能力也是非常重要的,它可極大地影響圖像質(zhì)量、掃描文件的大小以及掃描和處理的時間??s放的質(zhì)量和掃描圖像的質(zhì)量在不同掃描儀間差異非常大。實驗結(jié)果表明,一定的插值分辨率在一特定的掃描儀中能產(chǎn)生最小的鋸齒,而在其他插值分辨率下,卻不一定具有最低的鋸齒。某插值分辨率對某一掃描儀合適,對另一掃描儀卻不一定帶來最低的鋸齒,因此,僅根據(jù)插值分辨率的大小判斷掃描儀的質(zhì)量是不可靠的。

決定掃描質(zhì)量的因素還有色彩定位能力、圖像噪音、灰度精確度、光源的一致性等。另外,掃描儀的掃描速度和掃描圖像的質(zhì)量之間一直是相互制約的,掃描速度的提高總是以損失圖像信息為代價,對掃描儀的這一指標(biāo),也應(yīng)該和傳統(tǒng)的認(rèn)識有所區(qū)別。事實上,傳統(tǒng)的掃描速度只是將圖像送入計算機(jī)中所需的時間大小的度量,除了用于光學(xué)字符識別(OCR)或進(jìn)行掃描文檔管理的掃描儀之外,掃描速度不是十分關(guān)鍵的指標(biāo),而其他指標(biāo)也影響掃描處理的速度,如從掃描儀到計算機(jī)的數(shù)據(jù)傳輸速度;圖像存儲到磁盤的速度;掃描圖像瀏覽和設(shè)置曝光的時間;對掃描結(jié)果進(jìn)行校正處理和調(diào)整的時間等。

一、OCR的發(fā)展

要談OCR的發(fā)展,早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數(shù)字為對象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。

一個OCR識別系統(tǒng),其目的很簡單,只是要把影像作一個轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計算機(jī)文字,使能達(dá)到影像資料的儲存量減少、識別出的文字可再使用及分析,當(dāng)然也可節(jié)省因鍵盤輸入的人力與時間。掃描:掃描是紙質(zhì)文稿圖像輸入計算機(jī)的過程。一般把相關(guān)文稿順序掃描,在掃描質(zhì)量控制程序自動檢測并修正后,自動保存到數(shù)據(jù)庫中。圖像處理:為了提高識別率,對圖像進(jìn)行“消藍(lán)去污”的處理,即去掉圖像上影響識別率的噪音如麻點、下劃線等,圖像質(zhì)量控制程序自動監(jiān)測圖像處理質(zhì)量。版面分析:能自動進(jìn)行版面理解并定位,判別劃框區(qū)域是橫排文本區(qū)、豎排文本區(qū)、表格區(qū)還是圖像區(qū),并對不同屬性的區(qū)域以不同顏色的線框標(biāo)識出來。自動版面分析在后臺運行,操作人員可在前臺進(jìn)行確認(rèn),必要時對自動版面分析結(jié)果加入手工干預(yù)。識別:把文字圖像轉(zhuǎn)化為計算機(jī)文字內(nèi)碼,可以識別印刷體和手寫體中文(包括簡體字和繁體字)、表格、中英文混排,識別出來的文字內(nèi)碼可以是GB碼、BIG5碼、GBK碼或者Unicode碼。識別過程在后臺運行??v向校對:縱向校對是將一個圖像或若干個圖像中識別成同一個字的文字圖像列在一起顯示,并以突出顏色標(biāo)出可疑字,便于操作員發(fā)現(xiàn)錯誤和修改。橫向校對:這是傳統(tǒng)的人工校對方法,操作員直接對比識別結(jié)果文本和圖像,以發(fā)現(xiàn)識別錯誤文字。系統(tǒng)自動調(diào)出文字對應(yīng)的圖像,進(jìn)行比對。同時,以醒目的顏色標(biāo)出識別可信度不高的文字。版面還原:將識別并修改好的文本還原成跟掃描文稿版面的布局一樣、可以供計算機(jī)閱讀和查詢檢索的RTF、PDF、HTML、SGML/XML格式的數(shù)字文檔。文字特征抽?。簡我宰R別率而言,特征抽取可說是OCR的核心,用什么特征、怎么抽取,直接影響識別的好壞,也所以在OCR研究初期,特征抽取的研究報告特別的多。而特征可說是識別的籌碼,簡易的區(qū)分可分為兩類:一為統(tǒng)計的特征,如文字區(qū)域內(nèi)的黑/白點數(shù)比,當(dāng)文字區(qū)分成好幾個區(qū)域時,這一個個區(qū)域黑/白點數(shù)比之聯(lián)合,就成了空間的一個數(shù)值向量,在比對時,基本的數(shù)學(xué)理論就足以應(yīng)付了。而另一類特征為結(jié)構(gòu)的特征,如文字影像細(xì)線化后,取得字的筆劃端點、交叉點之?dāng)?shù)量及位置,或以筆劃段為特征,配合特殊的比對方法,進(jìn)行比對,市面上的線上手寫輸入軟件的識別方法多以此種結(jié)構(gòu)的方法為主。

對比數(shù)據(jù)庫:當(dāng)輸入文字算完特征后,不管是用統(tǒng)計或結(jié)構(gòu)的特征,都須有一比對數(shù)據(jù)庫或特征數(shù)據(jù)庫來進(jìn)行比對,數(shù)據(jù)庫的內(nèi)容應(yīng)包含所有欲識別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。

對比識別:這是可充分發(fā)揮數(shù)學(xué)運算理論的一個模塊,根據(jù)不同的特征特性,選用不同的數(shù)學(xué)距離函數(shù),較有名的比對方法有,歐式空間的比對方法、以及類神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫建立及比對、等著名的方法,為了使識別的結(jié)果更穩(wěn)定,也有所謂的專家系統(tǒng),利用各種特征比對方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論