基于深度學(xué)習(xí)的圖像文本切分與識別_第1頁
基于深度學(xué)習(xí)的圖像文本切分與識別_第2頁
基于深度學(xué)習(xí)的圖像文本切分與識別_第3頁
基于深度學(xué)習(xí)的圖像文本切分與識別_第4頁
基于深度學(xué)習(xí)的圖像文本切分與識別_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

摘要自從1929年德國科學(xué)家提出OCR的概念,各個國家就開始對此展開研究,OCR全稱OpticalCharacterRecognition,即光學(xué)字符識別。一開始專家們并沒有對字母、單詞、文字、字形等進(jìn)行研究,就像電話還沒有被發(fā)明之前一樣,人們覺得這是天方夜譚,研究要從基礎(chǔ)開始,因此,但是的人們是從最簡單的10個數(shù)字(0-9)開始的。由于歷史原因,中文識別起步較晚,并且由于漢字字形與由字母組成的英文、法文等不同,漢字字形各異,組織結(jié)構(gòu)復(fù)雜,機(jī)器尋求其中的規(guī)律比較困難,常常會因?yàn)槠圆渴壮霈F(xiàn)切分錯誤,要精準(zhǔn)地識別并不容易,可以說是相當(dāng)有挑戰(zhàn)性的。隨著信息化水平不斷的提升,圖像時代已經(jīng)越來越近,這是一件必然的事情,當(dāng)我們擁有足夠的科技,足夠的能力,印刷文化將會被新的視覺文化所取代,識別技術(shù)的發(fā)展勢不可擋,我們能很明顯地感受到身邊相關(guān)的技術(shù),百度、谷歌等都有相關(guān)應(yīng)用。在字符識別方面,可選擇的有谷歌Tesseract、百度API、傳統(tǒng)的字符特征提取、模板匹配法以及基于深度學(xué)習(xí)下的CNN字符識別。本文使用模板匹配法以及基于深度學(xué)習(xí)下的CNN字符識別相互結(jié)合的方法。關(guān)鍵詞:OCR中文文本識別卷積神經(jīng)網(wǎng)絡(luò)文本檢測AbstractSince1929,GermanscientistsputforwardtheconceptofOCR,Countriesbegantostudyit,andOCRfullnameopticalcharacterrecognition,Atthebeginning,expertsdidn'tstudyletters,words,characters,glyphs,etc.,justlikebeforethetelephonewasinvented,peoplethoughtitwasafantasy,andtheresearchshouldstartfromthefoundation,so,peoplestartedfromthesimplest10numbers(0-9).Forhistoricalreasons,Chineserecognitionstartedlate,andduetothedifferencesbetweenChinesecharactersandalphabeticEnglish,French,etc,Chinesecharactershavedifferentshapesandcomplicatedorganizationalstructure,soitisdifficultformachinestofindtherulesamongthem,Thereareoftensegmentationerrorsduetotheradicals,itisnoteasytoidentifyaccurately,whichisquitechallenging.Withthecontinuousimprovementofinformationtechnology,theimageagehasbecomemoreandmoreclose,whichisaninevitablething.Whenwehaveenoughtechnologyandability,theprintingculturewillbereplacedbythenewvisualculture,andthedevelopmentofrecognitiontechnologyisunstoppable,wecanclearlyfeeltherelevanttechnologyaroundus,Baidu,Googleandotherrelevantapplications.Intheaspectofcharacterrecognition,wecanchooseGoogleTesseract,baiduAPI,traditionalcharacterfeatureextraction,templatematchingandCNNcharacterrecognitionbasedondeeplearning.Inthispaper,templatematchingandCNNcharacterrecognitionbasedondeeplearningareused.Keywords:OCRChinesetextrecognitionCNNTextdetection廣東東軟學(xué)院本科生畢業(yè)設(shè)計(jì)(論文)目錄第一章緒論 11.1研究背景及意義 11.2國內(nèi)外研究歷史以及現(xiàn)狀 2第二章基礎(chǔ)理論及相關(guān)技術(shù) 32.1卷積神經(jīng)網(wǎng)絡(luò)概述 32.2OCR與卷積神經(jīng)網(wǎng)絡(luò)技術(shù) 52.3OCR流程 62.3.1預(yù)處理 72.3.2計(jì)算輪廓和切割 82.3.3字符識別 9第三章系統(tǒng)設(shè)計(jì)與實(shí)驗(yàn)分析 103.1建立中文字體庫 103.1.1生成漢字映射表 113.1.2收集字體文件 113.1.3文字圖像生成 123.2圖像處理 133.3文字識別 13第四章實(shí)驗(yàn)研究總結(jié) 164.1實(shí)驗(yàn)研究總結(jié) 134.2研究現(xiàn)狀 13參考文獻(xiàn) 17致謝 18第一章緒論1.1研究背景及意義生活中常常有一些時候,需要將手上的圖像資料重新整理一遍,或者要把紙質(zhì)材料輸入計(jì)算機(jī)存儲,每當(dāng)這個時候,我們會覺得如果能夠把手上的圖像資料或者紙質(zhì)材料通過某種手段、媒介,一下子就能由電子產(chǎn)品輸出,而不是逐字逐句地手抄或者手動輸出打印,那么就會方便很多,節(jié)省了大量地時間,也能減輕眼睛的負(fù)擔(dān),省心省力。隨著科學(xué)技術(shù)的不斷進(jìn)步,人們的生活質(zhì)量也而穩(wěn)步上升,多媒體信息成為信息傳遞重中之重,圖像信息更是因?yàn)樨S富的信息內(nèi)容和直觀的展現(xiàn)方式而具有高度可研究價值。隨著科技進(jìn)步,我們能很明顯地感受到身邊相關(guān)的技術(shù),百度、谷歌等都有相關(guān)應(yīng)用。我們?nèi)缃耠x圖像時代已經(jīng)越來越近,這是一件必然的事情,當(dāng)我們擁有足夠的科技,足夠的能力,印刷文化將會被新的視覺文化所取代??萍际菫榱巳祟惙?wù)的,從這方面出發(fā),這就對識別技術(shù)提出了更高的要求。舉個例子,如果我們高速路的收費(fèi)站采用全自動收費(fèi),那就意味著掃描識別的結(jié)果要清晰,處理速度要快,識別率要非常高,否則就會出錯,會由于速度不夠快而引起用戶不滿。因此,OCR技術(shù)在我們的生活具有重要的意義?,F(xiàn)如今OCR技術(shù)已經(jīng)有了顯著的成果,在多個領(lǐng)域都有其用武之地,包括郵政編碼的自動識別,政府交通部門的駕駛證自動檢測,公民身份證的只能輸入識別檢測以及現(xiàn)如今的5G技術(shù)融入汽車自動駕駛,醫(yī)療上對X射線結(jié)果的自動診斷,學(xué)校的自動評卷,由此可見文本識別的在生活中無處不在且相當(dāng)重要,然而在同時,因?yàn)闈h字?jǐn)?shù)量大,字體擁有形態(tài)種類多樣,尤其筆畫眾多,字形結(jié)構(gòu)極端復(fù)雜多變,這些使得對漢字圖像文的識別更加困難??茖W(xué)技術(shù)在發(fā)展,生產(chǎn)力在提高,人的需求也在增加,如今評判一個OCR產(chǎn)品的優(yōu)劣也不僅僅是識別精準(zhǔn)度,更包括識別速度、拒識率、用戶界面的友好性以及產(chǎn)品的易用程度、穩(wěn)定程度等等。通過結(jié)合深度學(xué)習(xí)技術(shù),對模糊不清的低質(zhì)量圖像的識別是可以實(shí)現(xiàn)的。1.2國內(nèi)外研究歷史自從1929年OCR概念被提出以后,印刷體字體識別是首先被研究的,60年代IBM公司公開了OCR產(chǎn)品——IBMl287,即首款OCR技術(shù)產(chǎn)品問世以后,經(jīng)過不斷的技術(shù)革新,算法變換,傳統(tǒng)的基于圖像處理和統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法分辨率和識別率也大大提升。初期的OCR技術(shù)主要研究數(shù)字和字母,且被運(yùn)用于郵政編碼、票據(jù)、身份證、駕駛證等簡單的印刷文本場景識別。目前,隨著技術(shù)的快步革新,以及掃描媒介的多樣化和推廣,手寫字體的識別也取得了令人矚目的成就。文本檢測框架DetectingTextinNaturalImagewithConnectionistTextProposalNetwork結(jié)合CNN和LSTM,用于復(fù)雜場景的文本檢測,效果良好,是目前比較熱門的、成熟的檢測框架,美中不足的是效率不高。Pixel-Anchor是結(jié)合anchor-based和pixel-based的優(yōu)點(diǎn)提出的框架,雖然框架創(chuàng)新性不高,但是想法新穎,并且能夠良好檢測長行的中文。RARE由空間變形網(wǎng)絡(luò)和序列識別網(wǎng)絡(luò)組成,適合低質(zhì)量的圖像文本檢測,例如文字扭曲,紙張變形。FOTS是端到端的集成檢測,計(jì)算速度是其顯著優(yōu)點(diǎn),同時學(xué)習(xí)效率也更高。中文識別起步較晚,并且由于漢字字形與由字母組成的英文、法文等不同,漢字字形各異,組織結(jié)構(gòu)復(fù)雜,機(jī)器尋求其中的規(guī)律比較困難,常常會因?yàn)槠圆渴壮霈F(xiàn)切分錯誤,要精準(zhǔn)地識別并不容易,可以說是相當(dāng)有挑戰(zhàn)性的。隨著信息化水平不斷的提升,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,圖像中的文字?jǐn)?shù)據(jù)包含豐富的語義信息與分析價值。1986年,國家863計(jì)劃信息領(lǐng)域課題組織了清華大學(xué)、北京信息工程學(xué)院、沈陽自動化所三家單位聯(lián)合進(jìn)行中文OCR軟件的開發(fā)工作。至1989年,清華大學(xué)率先推出了國內(nèi)第一套中文OCR軟件--清華文通TH-OCR1.0版,至此中文OCR正式從實(shí)驗(yàn)室走向了市場。而在接下來的三年,我國的漢字識別技術(shù)成果呈井噴式爆發(fā),多個單位對印刷體漢字進(jìn)行了多次檢測識別,這些漢字字體包括了fangzheng_fangsong,fangzheng_heti,fangzheng_kaiti,其中包括3至5號字體,識別速度很快,識別精準(zhǔn)度高。20世紀(jì)90年代初期,TH-OCR94系統(tǒng)被推出,這個包含了眾多人心血的系統(tǒng)被認(rèn)為是具有創(chuàng)新型、代表性的,它擁有超前的技術(shù),領(lǐng)先當(dāng)時的世界水準(zhǔn)。我國高校開始對漢字識別的綜合研究發(fā)生于20個世紀(jì)90年代中后期,在這之后,漢字識別檢測技術(shù)在各個領(lǐng)域全面地取得成績。其中TH-OCR97是佼佼者,它不僅可以完成印刷圖像多文種多字體混合的識別輸入,還能完成手寫識別。幾年來,中文OCR技術(shù)不斷更新,市場擴(kuò)大,全球各地都有用戶使用相干產(chǎn)品。第二章基礎(chǔ)理論及相關(guān)技術(shù)2.1卷積和人工神經(jīng)網(wǎng)絡(luò)在泛函分析中,卷積、旋積或摺積是通過兩個函數(shù)f和g生成第三個函數(shù)的一種數(shù)學(xué)算子,表征函數(shù)f與g經(jīng)過翻轉(zhuǎn)和平移的重疊部分函數(shù)值乘積對重疊長度的積分。卷積運(yùn)算是卷積神經(jīng)網(wǎng)絡(luò)中的核心,相當(dāng)于圖像處理中的“濾波器運(yùn)算”。對于一個mxn大小的卷積核W=w11w12…w1nw21其對某一原圖像進(jìn)行卷積運(yùn)算的過程為:卷積核中的每一個權(quán)值w分別和覆蓋的原圖像中所對應(yīng)的像素x相乘,然后再求和。計(jì)算公式為:z=W1X1+W2X2+…+WmnXmn=k=1mnWkXk=事實(shí)上卷積就是一種加權(quán)求和,如下公式:cx,y把函數(shù)所有的s值和t值遍歷一遍,然后函數(shù)f的值和函數(shù)g的值相乘再相加,得到c值。根據(jù)上面的式子,我們可以發(fā)現(xiàn)實(shí)際上卷積是一種以(x,y)為中心的加權(quán)求和。人工神經(jīng)網(wǎng)絡(luò)是一種模擬自然界的神經(jīng)細(xì)胞的計(jì)算模型,我們類比兩者之間的關(guān)系,就能很快明白人工神經(jīng)網(wǎng)絡(luò)是怎么工作的。輸入層相當(dāng)于自然界神經(jīng)元的樹突,它的作用就是輸入信息,另外,就像樹突有多個一樣,輸入的信息也可以是來自前一層的神經(jīng)元;線性計(jì)算和激活函數(shù)相當(dāng)于胞體,他是一種計(jì)算機(jī)制,決定是否激活從輸入層輸入的信息;顯而易見的,輸出層相當(dāng)于神經(jīng)元的軸突,他負(fù)責(zé)傳遞上一層的信息給下一層。單個的神經(jīng)元只能做簡單的數(shù)學(xué)運(yùn)算,異運(yùn)算和或運(yùn)算是無法進(jìn)行的,而大量的神經(jīng)元組成的人工神經(jīng)網(wǎng)絡(luò)就能解決這個問題。我們假設(shè)對輸入神經(jīng)元p1,p2,p3,…,pn加權(quán)求和,對以上操作后的式子施加函數(shù),就能夠得到下面的公式,a是神經(jīng)元的輸出,b是偏置值:A=f(n)=fi=inpiwi+b=fw1,w2,…,wnp1p2由多個這樣的神經(jīng)元連接而成的人工神經(jīng)網(wǎng)絡(luò)就可以擁有各種各樣的拓?fù)浣Y(jié)構(gòu),inputlayer輸入的數(shù)據(jù)要鏈接到hidinglayer1的每一個節(jié)點(diǎn),hidinglayer1的每一個節(jié)點(diǎn)的輸出數(shù)據(jù)又要連接到hidinglayer2的每一個節(jié)點(diǎn),然后再輸出,以此類推,可以有hidinglayer3、hidinglayer4等等,最后一層outputlayer的輸出就是整個神經(jīng)網(wǎng)絡(luò)的輸出。值得注意的是,并不是說卷積層的層數(shù)越多越好,這取決于數(shù)據(jù)的復(fù)雜程度。圖(1-1)是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖:圖(1-1)2.2OCR與卷積神經(jīng)網(wǎng)絡(luò)技術(shù)卷積神經(jīng)網(wǎng)絡(luò)是把卷積和人工神經(jīng)網(wǎng)絡(luò)的思想結(jié)合在一起的網(wǎng)絡(luò)。它是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),對處理大型圖像有優(yōu)秀的能力,在計(jì)算機(jī)視覺領(lǐng)域有廣泛應(yīng)用。如場景識別,圖像特征提取。卷積神經(jīng)網(wǎng)絡(luò)根據(jù)動物地視覺系統(tǒng)研究的,如S層對應(yīng)感受野,C則對應(yīng)就接收和回應(yīng)。卷積神經(jīng)網(wǎng)絡(luò)一開始被應(yīng)用于語音識別,當(dāng)平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)出現(xiàn)后,開始在醫(yī)學(xué)領(lǐng)域應(yīng)用,同時嘗試著結(jié)合計(jì)算機(jī)視覺問題以期得到更廣泛的應(yīng)用。1998年,LeNet-5在手寫數(shù)字識別中取得成功,卷積神經(jīng)網(wǎng)關(guān)注度上升。由于其表征學(xué)習(xí)能力強(qiáng),卷積神經(jīng)網(wǎng)絡(luò)在深度學(xué)習(xí)的概念被提出以后,得到空前的關(guān)注度。圖(2-1)神經(jīng)網(wǎng)絡(luò)輸入層(inputlayer)會對圖像做一個簡單預(yù)處理,首先式去均值化,去均值能夠把數(shù)據(jù)樣本貼合坐標(biāo),圍繞坐標(biāo)原點(diǎn)分布,避免了過擬。為了提高數(shù)據(jù)提取簡便度,可以進(jìn)行把數(shù)據(jù)變成(0,1)之間的小數(shù)。卷積層(hiddenlayer)可由多個卷積核組成,有多少圖像輸入通道就有多少卷積核,對他們進(jìn)行點(diǎn)積累加可以得到一張功能圖。舉個例子,我們把通過三個通道得到的三張功能圖的對應(yīng)的位置相加,就能得到一張新卷積操作的功能圖。一般來說,圖片有紅、綠、藍(lán)三個通道。卷積層的計(jì)算是圖像矩陣與卷積核點(diǎn)積的過程,即濾波。圖(2-2)圖(2-3)激活函數(shù)可以解決線性不可分的問題,如圖(2-2),要用一條直線分開圓形和三角形,明顯是做不到的,用激活函數(shù)加入非線性因素,這時候就可以使用激活函數(shù)來使數(shù)據(jù)可分,如圖(2-3)。激活函數(shù)再神經(jīng)網(wǎng)絡(luò)中尤其重要,如果沒有激活函數(shù),那么線性不管經(jīng)過多少層都仍然是線性。圖(2-4)池化就是取區(qū)域平均或最大,假設(shè)4x4的數(shù)據(jù)表,分成4個2x2的區(qū)域,分別取其中的最大數(shù),得到的新的2x2數(shù)據(jù)表,這個過程就是池化。如上圖圖(2-4),取左邊圖表左上的最大數(shù)6,左下的最大數(shù)3,右上的最大數(shù)8和右下的最大數(shù)4,組合在一起即右邊圖表。所謂的池化層特征不變性就是尺度不變性,當(dāng)一張動物的圖像被進(jìn)行壓縮時,我們?nèi)匀荒芸吹贸瞿鞘鞘裁?,這是因?yàn)閳D像壓縮不會刪除重要的特征,而我們判斷物體是什么就只根據(jù)其重要特征進(jìn)行的。一張圖像可以包含非常豐富的信息,有繁多的特征,但是有一些信息是不重要的,或者重復(fù)的去除這一類信息就是池化層特征降維。全連接層的作用是實(shí)現(xiàn)分類,全連接層之前是在做特征提取,而這一層就是把被找到圖像的各個特征組合在一起,然后尋找最符合要求的類,這就是全連接層。值得一提的是這一層的參數(shù)很多,可占整個網(wǎng)絡(luò)的80%。什么是CNN把握圖像局部特征?我們假設(shè)一個神經(jīng)網(wǎng)絡(luò),它接受mxm個輸入,有兩個hiddenlayer,每一層都有mxm個神經(jīng)元,第一層hiddenlayer有mxm個整數(shù)值輸入,實(shí)際上就是神經(jīng)網(wǎng)絡(luò)的圖像輸入。第二層的每個神經(jīng)元連接3x3范圍內(nèi)的值,把第二層hiddenlayer每個神經(jīng)元的輸入值和權(quán)重相乘,然后全部相加,產(chǎn)出mxm個輸出。到這里我們就可以發(fā)現(xiàn),這個神經(jīng)網(wǎng)絡(luò)并不是全連接的,第二層hiddenlayer的每一個節(jié)點(diǎn)只連接前一層的局部圖像輸入。把握局部特征會減少權(quán)值,運(yùn)算時間。這個時候其實(shí)整個神經(jīng)網(wǎng)絡(luò)只有9個權(quán)值,因?yàn)樗麄儗?shí)際上是共享的,如此這個網(wǎng)絡(luò)的計(jì)算就很少了。cl2.get_weights()卷積第二層len(w)=1權(quán)值列表的長度是1w[].shape元素的維度權(quán)值列表的長度是1。唯一的元素的維度是(32,32,3,3)。第一個32對應(yīng)著32個濾波器。后面的32*3*3是一個三維離散濾波器,取一個3*3區(qū)域,區(qū)域來自輸入的32個通道,把它們放在一起濾,得到的通道是28*28,因此第二層hiddenlayer仍然輸出32個通道,濾波器把輸入的32個通道放一起過濾出每一個通道。1.計(jì)算卷積:convolve()2.調(diào)整像素:np.uint8()3.保存濾波后的圖像:Image.fromarray().save()4.建立模型:model=Sequential()5.添加卷積層,有濾波器:model.add(Convolution2D())2.3OCR流程簡單來說,OCR就是把圖像輸入電子產(chǎn)品通過掃描后,由計(jì)算機(jī)輸出圖像內(nèi)容。計(jì)算機(jī)處理信息的方式不像自然界那么靈活,它只有0和1,圖像文本信息也不例外,他的數(shù)據(jù)一樣通過0、1進(jìn)行記錄識別。關(guān)于識別方法,OCR識別檢測圖像文本上的信息,主要有特征提取法和模式匹配法兩種。特征提取識別法流程可以分為:1.對樣本生成特征向量矩陣2.計(jì)算每一列的特征的平均值,和每一維度進(jìn)行相應(yīng)的減法運(yùn)算3.特征用數(shù)據(jù)表示,計(jì)算他們的協(xié)方差矩陣4.針對協(xié)方差矩陣進(jìn)行特征值和特征向量的計(jì)算5.對特征值排序6.取出前n個特征向量和特征值并回退。因此OCR特征提取就是將每個字符分解成組成字符的特征,接著將字符和分解而來的特征進(jìn)行匹配。這種方法可以滿足漢字字體多樣性的需求。模式匹配識別法原理很簡單,是一種暴力易用的方法,遍歷母串,一旦發(fā)現(xiàn)有和字串完全符合的片段即匹配成功。在OCR文本識別中,則將每一個字符比較匹配。向系統(tǒng)輸入一張文本頁圖像,系統(tǒng)會對頁面上的文本朝向進(jìn)行判斷識別。假如圖像是直接從電子儀器上截屏,那么識別很容易就能確定行線坐標(biāo),劃分區(qū)域,這是因?yàn)榻仄翀D像水平投影和垂直投影的情況都很理想。但是實(shí)際生活中我們可以發(fā)現(xiàn)所需要識別的圖像并不是理想的,它可能是傾斜的,可能會明暗度差,甚至可能還有污漬,因此進(jìn)行圖像預(yù)處理是首先要做的事,預(yù)處理包括圖像去噪和角度矯正。在進(jìn)行角度矯正的工作中,首先要檢測出圖像的文本范圍,這一步利用Sobel算子進(jìn)行邊緣檢測。Sobel算子是計(jì)算機(jī)常用的視覺領(lǐng)域處理方法,圖像中每個像素的都有四個灰度值,求它們的加權(quán)差。邊緣檢測之后用霍夫變換進(jìn)行平空間到極坐標(biāo)空間的轉(zhuǎn)換,圖像上的點(diǎn)會被分為不同的,屬于孤立的點(diǎn)、連續(xù)的曲線或者連續(xù)的區(qū)域的子集,這一步稱為特征檢測。最后利用數(shù)學(xué)模型仿射變換旋轉(zhuǎn)圖像。模式匹配識別法原理很簡單,是一種暴力易用的方法,遍歷母串,一旦發(fā)現(xiàn)有和字串完全符合的片段即匹配成功。在OCR文本識別中,則將每一個字符比較匹配。傳統(tǒng)文字識別技術(shù)就是在這個基礎(chǔ)上進(jìn)行的,但是對于長行文本,沒有辦法一下子就識別出來,只能切分文本行成數(shù)個單字,再對它們進(jìn)行逐個識別。流程如下圖圖(1-2.1)圖(1-2.1)2.3.1預(yù)處理我們向系統(tǒng)輸入的圖像如果是直接從電子儀器上截屏,那么識別很容易就能確定行線坐標(biāo),劃分區(qū)域并標(biāo)定各部分屬性,這是因?yàn)榻仄翀D像水平投影和垂直投影的情況都很理想。但假如我們拍攝下來的圖像角度傾斜,那么完成行列劃分就需要先將圖片角度矯正。不僅如此,因?yàn)榧垙埖暮癖〕潭取㈩伾?、透光度、反光度、平滑度和和字跡的清晰程度等等因素,都會造成識別的精準(zhǔn)率。因此我們要先對這些因素進(jìn)行排除處理,即去噪,然后再開始識別檢測。上訴的內(nèi)容都要在圖像文本識別之前進(jìn)行。預(yù)處理的工作有灰度化,二值化,版面矯正等等?;叶然菫榱颂幚韴D像的亮度,它不包含其他信息。舉個例子,把輸入的圖像進(jìn)行灰度化處理,那么計(jì)算機(jī)會把圖像的三個顏色通道的值設(shè)為相等,不管你的圖像是蒙娜麗莎還是乘法口訣表,計(jì)算機(jī)都不會處理。彩色的圖像一定要經(jīng)過二值化,它能夠大大減少圖像的數(shù)據(jù)量,在圖片文本識別中,二值化能夠凸顯輪廓,從而更好識別輪廓。用霍夫變換進(jìn)行平空間到極坐標(biāo)空間的轉(zhuǎn)換,從而進(jìn)行傾斜矯正。輸入:圖片路徑過程:讀取圖像:cv2.imread(圖片)非局部平均去噪:cv2.fastNlMeansDenoisingColored()轉(zhuǎn)灰度圖:cv2.cvtColor(img_c,cv2.COLOR_BGR2GRAY)二值化:cv2.threshold(()cv2.THRESH_OTSU+cv2.THRESH_BINARY)邊緣檢測:cv2.Sobel(gray,cv2.CV_8U,1,0,ksize=3)求直線斜率:hufu=binary.astype(np.uint8旋轉(zhuǎn)圖像:cv2.warpAffine輸出圖像:cv2.imwrite圖(1-3.1)圖(1-3.2)2.3.2計(jì)算輪廓和切割漢字字符切割是OCR的一大難題,主要原因是漢字的字形結(jié)構(gòu)復(fù)雜多變,左右結(jié)合的漢字容易一個字被切成兩個,排列密集的漢字則容易切割失敗,值得一提的是自從有字符識別技術(shù)到現(xiàn)在,都沒有一個能得到所有人認(rèn)可的解決方案。以下是本次實(shí)驗(yàn)計(jì)算輪廓和切割漢字用到的部分函數(shù):Non-LocalMeans():處理自然場景中圖片信息冗雜的問題,能夠較好地去噪cv2.findContours():接受兩個參數(shù),對輪廓進(jìn)行檢測,保留終點(diǎn)坐標(biāo)。cv2.drawContours():是輪廓填充函數(shù),里面可以有多個函數(shù),能夠指明要繪制輪廓地圖像,輪廓個數(shù),畫第幾個,輪廓顏色等信息cv2.RETR_EXTERNAL:表示只檢測外輪廓cv2.CHAIN_APPROX_SIMPLE:壓縮各個方向的元素,只保留終點(diǎn)坐標(biāo)圖(1-3.3)圖(1-3.4)圖(1-3.5)2.3.3字符識別文本識別讓計(jì)算機(jī)“認(rèn)字”的關(guān)鍵,我們都知道模式匹配識別法原理很簡單,是一種暴力易用的方法,遍歷母串,一旦發(fā)現(xiàn)有和字串完全符合的片段即匹配成功。在OCR文本識別中,則將每一個字符比較匹配。傳統(tǒng)文字識別技術(shù)就是在這個基礎(chǔ)上進(jìn)行的,但是對于長行文本,沒有辦法一下子就識別出來,只能切分文本行成數(shù)個單字,再對它們進(jìn)行逐個識別。由于漢字字形與由字母組成的英文、法文等不同,漢字字形各異,組織結(jié)構(gòu)復(fù)雜,機(jī)器尋求其中的規(guī)律比較困難,常常會因?yàn)槠圆渴壮霈F(xiàn)切分錯誤,要精準(zhǔn)地識別并不容易。舉個例子,我們要識別“好”字,但是實(shí)際結(jié)果出來,發(fā)現(xiàn)被切成“女”字和“子”字,為了解決這一問題,我們需要設(shè)計(jì)一個損失函數(shù)。第三章系統(tǒng)設(shè)計(jì)與實(shí)驗(yàn)分析3.1建立中文字體庫在本文中,我們只需要對印刷體的中文進(jìn)行識別,我們選用模板匹配的方法,因此需要生成一個有足夠量的中文字體圖片庫,其中包括常用漢字、常見字體的圖片。字體庫的圖片內(nèi)容自己決定,可以選擇多種字體,可以選擇字體的旋轉(zhuǎn)角度。但是并不是說圖片庫越大越好,圖片數(shù)據(jù)大固然可以提高識別率,但同時也會增加匹配時間。3.1.1生成漢字映射表首先確定所需要的漢字,這里選用了常見的漢字,寫入空白的txt文件中,建立字典,每一個漢字對應(yīng)相應(yīng)的ID,生成映射表利用pickle.dump讀入內(nèi)存,下面附上部分代碼:輸入:收集的漢字建立字典:d1=dict(zip('',range()))將字典寫入文本:withopen("my.txt","wb")asmy:讀入內(nèi)存:pickle.dump()讀入label:for()inlabel_dict.items()得到漢字映射表:label_dict圖(1-1)圖(1-2)圖(1-1)是漢字對應(yīng)label映射表,圖(1-2)是我們收集的部分常用漢字。3.1.2收集字體文件字體文件選擇適用于中文的字體,例如DroidSansFallback.ttf,考慮到字體多樣性,此次設(shè)計(jì)選用了九種字體,作為中文字體數(shù)據(jù)集所需的字體:DroidSansFallbackmingliuSourceHanSansCN-Lightfangzheng_fangsongfangzheng_kaitiSourceHanSansCN-BoldSourceHanSansCN-Heavyfangzheng_hetiSourceHanSansCN-Normal3.1.3文字圖像生成圖像生成使用PIL工具,利用其中的漢字生成工具結(jié)合字體文件,生成漢字圖片,此時可以設(shè)定我們想要的圖片尺寸以及圖片顏色。接下來寫兩個循環(huán),內(nèi)層循環(huán)是函子列表,外層循環(huán)是字體列表,按比例分開訓(xùn)練集和測試集。在讀取漢字文件txt之后,我們定義好輸入?yún)?shù),定義用argparse包,源碼如下(部分):1.漢字圖像存儲目錄:parser.add_argument('--out_dir',…)2.字體文件路徑:parser.add_argument('--font_dir',…)3.圖像寬度:parser.add_argument('--width',…)4.圖像高度:parser.add_argument('--height',…)5.字體與邊緣的間隔:parser.add_argument('--margin',…)6.生成字體圖像:classFont2Image(object):7.定義背景和字體顏色:font=ImageFont.truetype8.劃分訓(xùn)練集和測試集:parser.add_argument('--test_ratio',…)9.打亂圖像列表:random.shuffle代碼運(yùn)行之后會生成一個訓(xùn)練集,一個測試集。圖(1-1.1)圖(1-1.2)圖(1-1.1)和圖(1-1.2)分別是生成的mingliu字體圖片和仿宋楷體圖片。接下來我們可以對圖片進(jìn)行一些處理,對圖像增強(qiáng),比如說增加圖片尺寸,適當(dāng)膨脹,適當(dāng)腐蝕,圖像的膨脹和腐蝕都是建立在黑白像素地基礎(chǔ)上的,能夠把圖片中極小的白色括大,把圖片中極大的白色縮小,使圖像更加合理。3.2圖像處理要識別的圖像首先要經(jīng)過處理,不然可能會因?yàn)榍逦?、反光、角度不正、磨損污漬等原因造成文本切割不成,文字提取失敗。獲得文本行后,需要進(jìn)行單個字符的切割,將每個字符切割出來后以便于后續(xù)字符識別。輸入:圖片路徑1.讀取圖像:cv2.imread(圖片)2.灰度化轉(zhuǎn)換:cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)3.二值化:cv2.threshold(()cv2.THRESH_OTSU+cv2.THRESH_BINARY)4.邊緣檢測:cv2.Sobel(gray,cv2.CV_8U,1,0,ksize=3)5.求直線斜率:hufu=binary.astype(np.uint86.6.旋轉(zhuǎn)圖像:cv2.warpAffine得到字符后,我們首先要對圖像進(jìn)行預(yù)處理,包括圖像去噪、二值化、圖像邊緣檢測和切割、圖像角度矯正和統(tǒng)一分辨率。減弱或者去除不需要的信息,在進(jìn)行角度矯正的工作中,首先要檢測出圖像的文本范圍,邊緣檢測之后用霍夫變換進(jìn)行平空間到極坐標(biāo)空間的轉(zhuǎn)換,最后利用數(shù)學(xué)模型仿射變換旋轉(zhuǎn)圖像。3.3文字識別像神經(jīng)網(wǎng)絡(luò)輸入圖片樣本之后,經(jīng)過卷積層的處理后,輸出一個大于0小于1的數(shù),如果輸出的數(shù)值離1越近,那就證明和字符越接近。本次實(shí)驗(yàn)所使用的深度學(xué)習(xí)框架是Tensorflow,我們建立一個基本的網(wǎng)絡(luò)做文字識別。導(dǎo)入keras相關(guān)庫:fromkeras.modelsimportSequential…模型初始化:model=Sequential()創(chuàng)建第一個卷積層:model.add(Convolution2D()…)創(chuàng)建全連接層:model.add(Flatten())創(chuàng)建輸出層:model.add(Dense()…)設(shè)置損失函數(shù)和優(yōu)化算法:pile(…,metrics=[])訓(xùn)練:model.fit()圖(1-3.1)圖(1-3.2)圖(1-3.1)是損失函數(shù),圖(1-3.2)是準(zhǔn)確率,我們可以看到準(zhǔn)確率隨著損失函數(shù)的下降而上升,數(shù)值接近1訓(xùn)練好模型之后就可以進(jìn)行漢字識別,當(dāng)然在此之前還要對每張圖片尺寸進(jìn)行標(biāo)準(zhǔn)化和歸一化。我們把要識別的圖片按照順序進(jìn)行編號,依次放入文件夾中,識別時只需要讀取文件夾路徑,對里面內(nèi)容逐一識別。圖(1-3.3)圖(1-3.4)圖(1-3.3)是單字切分,圖(1-3.4)是測試結(jié)果。廣東東軟學(xué)院本科生畢業(yè)設(shè)計(jì)(論文)第四章實(shí)驗(yàn)研究總結(jié)4.1實(shí)驗(yàn)研究總結(jié)自從1929年德國科學(xué)家提出OCR的概念,各個國家就開始對此展開研究,OCR全稱OpticalCharacterRecognition,即光學(xué)字符識別。一開始專家們并沒有對字母、單詞、文字、字形等進(jìn)行研究,就像電話還沒有被發(fā)明之前一樣,人們覺得這是天方夜譚,研究要從基礎(chǔ)開始,因此,但是的人們是從最簡單的10個數(shù)字(0-9)開始的。圖片在被檢測之前要經(jīng)過版面分析和預(yù)處理,處理過的圖片會被切成大小一樣的單字,然后再開始匹配,識別使用的是基于Tensorflow的模板匹配法,結(jié)合卷積神經(jīng)網(wǎng)絡(luò),完成實(shí)驗(yàn)。在本次實(shí)驗(yàn)中,一開始就在漢字字體圖片庫上遇到難題。起初我使用的是python庫中的pygame,生成由Unicode的0x4E00到0x9FA5的圖片庫,生成的結(jié)果當(dāng)然是有兩萬多張漢字圖片,并且只是一種字體的。這不是我想要的結(jié)果,我只需要我們常用到的漢字就可以了,畢竟生僻字太多而且出現(xiàn)的機(jī)率極低,會大大減低處理速度并且造成空間浪費(fèi)。后來把事先找好的所需要的漢字寫入txt并存入內(nèi)存,利用font方法,解決了難題。接下來是圖像預(yù)處理的問題,在灰度化、二值化等沒有差錯,但是匹配不成功,檢查后發(fā)現(xiàn)是沒有對圖像進(jìn)行標(biāo)準(zhǔn)化,會因?yàn)榇笮〉纫蛩卦斐墒 ?.2研究現(xiàn)狀初期的OCR技術(shù)主要研究數(shù)字和字母,且被運(yùn)用于郵政編碼、票據(jù)、身份證、駕駛證等簡單的印刷文本場景識別。隨著技術(shù)的快步革新,以及掃描媒介的多樣化和推廣,手寫字體的識別也取得了令人矚目的成就。文本檢測框架DetectingTextinNaturalImagewithConnectionistTextProposalNetwork結(jié)合CNN和LSTM,用于復(fù)雜場景的文本檢測,效果良好,是目前比較熱門的、成熟的檢測框架,美中不足的是效率不高。Pixel-Anchor是結(jié)合anchor-based和pixel-based的優(yōu)點(diǎn)提出的框架,雖然框架創(chuàng)新性不高,但是想法新穎,并且能夠良好檢測長行的中文。RARE由空間變形網(wǎng)絡(luò)和序列識別網(wǎng)絡(luò)組成,適合低質(zhì)量的圖像文本檢測,例如文字扭曲,紙張變形。FOTS是端到端的集成檢測,計(jì)算速度是其顯著優(yōu)點(diǎn),同時學(xué)習(xí)效率也更高。如今漢字識別檢測技術(shù)在各個領(lǐng)域全面地取得成績。其中TH-OCR97是佼佼者,它不僅可以完成印刷圖像多文種多字體混合的識別輸入,還能完成手寫識別。幾年來,中文OCR技術(shù)不斷更新,市場擴(kuò)大,全球各地都有用戶使用相干產(chǎn)品?,F(xiàn)在OCR在我們生活中可以說是無處不在了,二維碼的掃描,無人超市,高鐵站的人臉識別,醫(yī)療領(lǐng)域的病理自動檢測,包括郵政編碼的自動識別,政府交通部門的駕駛證自動檢測,公民身份證的只能輸入識別檢測以及現(xiàn)如今的5G技術(shù)融入汽車自動駕駛,等都可以發(fā)現(xiàn)OCR的存在。參考文獻(xiàn)[1]王學(xué)梅.OCR文字識別系統(tǒng)的應(yīng)用[A].山東文宇工學(xué)院,2019.[2]李國強(qiáng),周賀,馬鍇,張露.特征分組提取融合深度網(wǎng)絡(luò)手寫漢字識別[J/OL].計(jì)算機(jī)工程與應(yīng)用.2019[3]夏昌新,莫浩泓,王成鑫,王瑤,閆仕宇.基于深度學(xué)習(xí)的圖像文字識別技術(shù)研究與應(yīng)用[A]南華大學(xué)計(jì)算機(jī)學(xué)院.2019[4]王來兵.基于貝葉斯與生成式對抗網(wǎng)絡(luò)的手寫字文本識別算法[A].滁州職業(yè)技術(shù)學(xué)院.2019[5]徐華鵬.基于多模態(tài)表征的細(xì)粒度圖像分類方法的研究[A].東南大學(xué),2018[6]周一楓.基于圖像識別的敏感文件檢測技術(shù)研究[A].浙江理工大學(xué).2019[7]唐結(jié)玲.基于視頻流的文本識別研究與實(shí)現(xiàn)[A].電子科技大學(xué).2019[8]劉藝.基于深度學(xué)習(xí)的低質(zhì)量中文圖像ORC識別算法研究[A].電子科技大學(xué).2019[9]裴宸平.基于深度學(xué)習(xí)的場景圖像文本檢測技術(shù):[A]河南大學(xué).20187[10]薛玉磊.圖像識別云服務(wù)自動[J].清遠(yuǎn)職業(yè)技術(shù)學(xué)院測試系統(tǒng)設(shè)計(jì)玉實(shí)現(xiàn)[A]北京郵電大學(xué).2019[11]汪一文.深度卷積神經(jīng)網(wǎng)絡(luò)在OCR問題中的應(yīng)用研究[A],電子科技大學(xué),2018.[12]于玉梅.面向醫(yī)學(xué)文獻(xiàn)的圖像模式識別關(guān)鍵技術(shù)研究[A],大連理工大學(xué),2018.[13]姜毅,彭清暢,徐娟.基于圖元識別的PCR文本圖像矯正算法分析[A],中車青島四方機(jī)車車輛股份有限公司,2019.致謝大學(xué)四年走過,這篇論文將是我大學(xué)生涯中最后一筆,也是最重要一筆。自從開始寫我的畢業(yè)設(shè)計(jì)兩個月以來,我遇到了非常多的困難,有的是軟件安裝的問題,有的是計(jì)算機(jī)本身硬件故障,有的是環(huán)境配置不成功,系統(tǒng)設(shè)計(jì)過程中我也想過要更換題目,因?yàn)槲覍CR的技術(shù)以及實(shí)現(xiàn)流程知之不多,相當(dāng)于學(xué)習(xí)一個全新的領(lǐng)域,因此實(shí)現(xiàn)過程非常困難,幸運(yùn)的是如今的網(wǎng)絡(luò)發(fā)達(dá),有技術(shù)的網(wǎng)友也很熱心,加上同學(xué)之間的互相交流討論,互相幫助,這些問題都逐一得到解決。今年的畢業(yè)設(shè)計(jì)以及答辯可能是最特殊的,由于世界范圍的疫情,一切問題只能網(wǎng)上解決,在此期間,特別感謝我的父母給予的關(guān)心愛護(hù)。在本文的撰寫過程中,我要特別感謝我的指導(dǎo)老師。從本文選題開始,我的知道老師一直都非常關(guān)心論題的合理性以及可實(shí)現(xiàn)性,老師幫我們收集資料,提供學(xué)習(xí)道具,指導(dǎo)論文的格式、內(nèi)容以及指出不合理的地方。對我來說,在最后階段老師對我的指導(dǎo)是最重要的,因?yàn)楫?dāng)時我的計(jì)算機(jī)除了一些問題,給了我不小的壓力,但是我的指導(dǎo)老師對我的關(guān)心使我振作信心,完成我的畢業(yè)實(shí)際。因此我要在這里由衷地對我的老師說一聲謝謝!畢業(yè)之際,感慨萬千。寫完這一筆,意味著我要和我四年的同窗好友說再見,要對培育我的老師們說再見,要對我親愛的母校說再見,即使再舍不得,我們也要互相道別,因?yàn)榇撕罂赡芫蜎]有機(jī)會了。再見以及謝謝你們!

電腦不啟動故障診治了解電腦啟動的過程在諸多電腦故障中,無法正常啟動是最令用戶頭痛的事了。筆者長期從事維護(hù)電腦的工作,在這個方面積累了一些經(jīng)驗(yàn),現(xiàn)在就將這些經(jīng)驗(yàn)整理歸納出來與朋友們分享。本文將以家用電腦和windows98操作系統(tǒng)為基礎(chǔ),介紹電腦無法正常啟動故障的診治。要想準(zhǔn)確地診斷電腦不啟動故障,首先要了解的起動過程,當(dāng)我們按下電源開關(guān)時,電源就開始向主板和其它設(shè)備供電,此時電壓還沒有完全穩(wěn)定,主板控制芯片組會根據(jù)CMOS中的CPU主頻設(shè)置向CPU發(fā)出一個Reset(重置)信號,讓CPU初始化,電壓完全穩(wěn)定后,芯片組會撤去Reset信號,CPU馬上從地址FFFF0H處執(zhí)行一條跳轉(zhuǎn)指令,跳到系統(tǒng)BIOS中真正的啟動代碼處。系統(tǒng)BIOS首先要做的事情就是進(jìn)行POST(PowerOnSelfTest,加電自檢)。POST的主要任務(wù)是檢測系統(tǒng)中的一些關(guān)鍵設(shè)備(電源、CPU芯片、BIOS芯片、定時器芯片、數(shù)據(jù)收發(fā)邏輯電路、DMA控制器、中斷控制器以及基本的64K內(nèi)存和內(nèi)存刷新電路等)是否存在和能否正常工作,如內(nèi)存和顯卡等。自檢通過后,系統(tǒng)BIOS將查找顯示卡的BIOS,由顯卡BIOS來完成顯示卡的初始化,顯示器開始有顯示,自此,系統(tǒng)就具備了最基本的運(yùn)行條件,可以對主板上的其它部分進(jìn)行診斷和測試,再發(fā)現(xiàn)故障時,屏幕上會有提示,但一般不死機(jī),接著系統(tǒng)BIOS將檢測CPU的類型和工作頻率,然后開始測試主機(jī)所有的內(nèi)存容量,內(nèi)存測試通過之后,系統(tǒng)BIOS將開始檢測系統(tǒng)中安裝的一些標(biāo)準(zhǔn)硬件設(shè)備,這些設(shè)備包括:硬盤、CD-ROM、軟驅(qū)、串行接口和并行接口等連接的設(shè)備,大多數(shù)新版本的系統(tǒng)BIOS在這一過程中還要自動檢測和設(shè)置內(nèi)存的相關(guān)參數(shù)、硬盤參數(shù)和訪問模式等。標(biāo)準(zhǔn)設(shè)備檢測完畢后,系統(tǒng)BIOS內(nèi)部的支持即插即用的代碼將開始檢測和配置系統(tǒng)中已安裝的即插即用設(shè)備。每找到一個設(shè)備之后,系統(tǒng)BIOS都會在屏幕上顯示出設(shè)備的名稱和型號等信息,同時為該設(shè)備分配中斷、DMA通道和I/O端口等資源。最后系統(tǒng)BIOS將更新ESCD(ExtendedSystemConfigurationData,擴(kuò)展系統(tǒng)配置數(shù)據(jù))。ESCD數(shù)據(jù)更新完畢后,系統(tǒng)BIOS的啟動代碼將進(jìn)行它的最后一項(xiàng)工作,即根據(jù)用戶指定的啟動順序從軟盤、硬盤或光驅(qū)啟動。以從C盤啟動為例,系統(tǒng)BIOS將讀取并執(zhí)行硬盤上的主引導(dǎo)記錄,主引導(dǎo)記錄接著從分區(qū)表中找到第一個活動分區(qū),然后讀取并執(zhí)行這個活動分區(qū)的分區(qū)引導(dǎo)記錄,而分區(qū)引導(dǎo)記錄將負(fù)責(zé)讀取并執(zhí)行IO.SYS,這是Windows最基本的系統(tǒng)文件。IO.SYS首先要初始化一些重要的系統(tǒng)數(shù)據(jù),然后就顯示出我們熟悉的藍(lán)天白云,在這幅畫面之下,Windows將繼續(xù)進(jìn)行DOS部分和GUI(圖形用戶界面)部分的引導(dǎo)和初始化工作,一切順利結(jié)束,電腦正常啟動。根據(jù)故障現(xiàn)象診治了解電腦啟動的過程,故障就好判斷了,下面我們就根據(jù)故障現(xiàn)象開始診治了:現(xiàn)象一:系統(tǒng)完全不能啟動,見不到電源指示燈亮,也聽不到冷卻風(fēng)扇的聲音。這時,基本可以認(rèn)定是電源部分故障,檢查:電源線和插座是否有電、主板電源插頭是否連好,UPS是否正常供電,再確認(rèn)電源是否有故障,最簡單的就是替換法,但一般用戶家中不可能備有電源等備件,這時可以嘗試使用下面的方法(注意:要慎重):先把硬盤,CPU風(fēng)扇,或者CDROM連好,然后把ATX主板電源插頭用一根導(dǎo)線連接兩個插腳(把插頭的一側(cè)突起對著自己,上層插腳從左數(shù)第4個和下層插腳從右數(shù)第3個,方向一定要正確),然后把ATX電源的開關(guān)打開,如果電源風(fēng)扇轉(zhuǎn)動,說明電源正常,否則電源損壞。如果電源沒問題直接短接主板上電源開關(guān)的跳線,如果正常,說明機(jī)箱面板的電源開關(guān)損壞?,F(xiàn)象二:電源批示燈亮,風(fēng)扇轉(zhuǎn),但沒有明顯的系統(tǒng)動作。這種情況如果出現(xiàn)在新組裝電腦上應(yīng)該首先檢查CPU是否插牢或更換CPU,而正在使用的電腦的CPU損壞的情況比較少見(人為損壞除外),損壞時一般多帶有焦糊味,如果剛剛升級了BIOS或者遭遇了CIH病毒攻擊,這要考慮BIOS損壞問題(BIOS莫名其妙的損壞也是有的),修復(fù)BIOS的方法很多雜志都介紹過就不重復(fù)了;確認(rèn)CPU和BIOS沒問題后,就要考慮CMOS設(shè)置問題,如果CPU主頻設(shè)置不正確也會出現(xiàn)這種故障,解決方法就是將CMOS信息清除,既要將CMOS放電,一般主板上都有一個CMOS放電的跳線,如果找不到這個跳線可以將CMOS電池取下來,放電時間不要低于5分鐘,然后將跳線恢復(fù)原狀或重新安裝好電池即可;如果CPU、BIOS和CMOS都沒問題還要考慮電源問題:PC機(jī)電源有一個特殊的輸出信號,稱為POWERGOOD(PG)信號,如果PG信號的低電平持續(xù)時間不夠或沒有低電平時間,PC機(jī)將無法啟動。如果PG信號一直為低電平,則PC機(jī)系統(tǒng)始終處于復(fù)位狀態(tài)。這時PC機(jī)也出現(xiàn)黑屏、無聲響等死機(jī)現(xiàn)象。但這需要專業(yè)的維修工具外加一些維修經(jīng)驗(yàn),因此,建議采用替換法;電源沒有問題就要檢查是否有短路,確保主板表面不和金屬(特別是機(jī)箱的安裝固定點(diǎn))接觸。把主板和電源拿出機(jī)箱,放在絕緣體表面,如果能啟動,說明主板有短路現(xiàn)象;如果還是不能啟動則要考慮主板問題,主板故障較為復(fù)雜,可以使用替換法確認(rèn),然后更換主板?,F(xiàn)象三:電源指示燈亮,系統(tǒng)能啟動,但系統(tǒng)在初始化時停住了,而且可以聽到嗽叭的鳴叫聲(沒有視頻):根據(jù)峰鳴代碼可以判斷出故障的部位。ccid_page/AwardBIOS1短聲:說明系統(tǒng)正常啟動。表明機(jī)器沒有問題。2短聲:說明CMOS設(shè)置錯誤,重新設(shè)置不正確選項(xiàng)。1長1短:說明內(nèi)存或主板出錯,換一個內(nèi)存條試試。1長2短:說明顯示器或顯示卡存在錯誤。檢查顯卡和顯示器插頭等部位是否接觸良好或用替換法確定顯卡和顯示器是否損壞。1長3短:說明鍵盤控制器錯誤,應(yīng)檢查主板。1長9短:說明主板FlashRAM、EPROM錯誤或BIOS損壞,更換FlashRAM。重復(fù)短響:說明主板電源有問題。不間斷的長聲:說明系統(tǒng)檢測到內(nèi)存條有問題,重新安裝內(nèi)存條或更換新內(nèi)存條重試。AMIBIOS1短:說明內(nèi)存刷新失敗。更換內(nèi)存條。2短:說明內(nèi)存ECC較驗(yàn)錯誤。在CMOS中將內(nèi)存ECC校驗(yàn)的選項(xiàng)設(shè)為Disabled或更換內(nèi)存。3短:說明系統(tǒng)基本內(nèi)存檢查失敗。換內(nèi)存。4短:說明系統(tǒng)時鐘出錯。更換芯片或CMOS電池。5短:說明CPU出現(xiàn)錯誤。檢查CPU是否插好。6短:說明鍵盤控制器錯誤。應(yīng)檢查主板。7短:說明系統(tǒng)實(shí)模式錯誤,不能切換到保護(hù)模式。8短:說明顯示內(nèi)存錯誤。顯示內(nèi)存有問題,更換顯卡試試。9短:說明BIOS芯片檢驗(yàn)和錯誤。1長3短:說明內(nèi)存錯誤。內(nèi)存損壞,更換。1長8短:說明顯示測試錯誤。顯示器數(shù)據(jù)線沒插好或顯示卡沒插牢?,F(xiàn)象四:系統(tǒng)能啟動,有視頻,出現(xiàn)故障提示,這時可以根據(jù)提示來判斷故障部位。下面就是一些常見的故障提示的判斷:一、提示“CMOSBatteryStateLow”原因:CMOS參數(shù)丟失,有時可以啟動,使用一段時間后死機(jī),這種現(xiàn)象大多是CMOS供電不足引起的。對于不同的CMOS供電方式,采取不同的措施:1.焊接式電池:用電烙鐵重新焊上一顆新電池即可;2.鈕扣式電池:直接更換;3.芯片式:更換此芯片,最好采用相同型號芯片替換。如果更換電池后時間不長又出現(xiàn)同樣現(xiàn)象的話,很可能是主板漏電,可檢查主板上的二極管或電容是否損壞,也可以跳線使用外接電池,不過這些都需要有一定的硬件維修基礎(chǔ)才能完成。二、提示“CMOSChecksumFailure”CMOS中的BIOS檢驗(yàn)和讀出錯;提示“CMOSSystemOptionNotSet”,CMOS系統(tǒng)未設(shè)置;提示“CMOSDisplayTypeMismatch”,CMOS中顯示類型的設(shè)置與實(shí)測不一致;提示“CMOSMemorySizeMismatch”,主板上的主存儲器與CMOS中設(shè)置的不一樣;提示“CMOSTime&DateNotSet”,CMOS中的時間和日期沒有設(shè)置。這些都需要對CMOS重新設(shè)置。三、提示“KeyboardInterfaceError”后死機(jī)原因:主板上鍵盤接口不能使用,拔下鍵盤,重新插入后又能正常啟動系統(tǒng),使用一段時間后鍵盤無反應(yīng),這種現(xiàn)象主要是多次拔插鍵盤引起主板鍵盤接口松動,拆下主板用電烙鐵重新焊接好即可;也可能是帶電拔插鍵盤,引起主板上一個保險(xiǎn)電阻斷了(在主板上標(biāo)記為Fn的東西),換上一個1歐姆/0.5瓦的電阻即可。四、自檢過程中斷在xxxKCache處這表示主板上Cache損壞,可以在CMOS設(shè)置中將“ExternalCache”項(xiàng)設(shè)為“Disable”故障即可排除。同理,在自檢主板部件時出現(xiàn)中斷,則可以認(rèn)為該部件損壞,解決方法一般可以在CMOS中將其屏蔽,如果不能屏蔽該部件最好更換主板。五、提示“FDDControllerFailure”BIOS不能與軟盤驅(qū)動器交換信息;提示“HDDControllerFailure”,BIOS不能與硬盤驅(qū)動器交換信息。應(yīng)檢查FDD(HDD)控制卡及電纜。六、提示“8042GateA20Error”8042芯片壞;提示“DMAError”,DMA控制器壞。這種故障需要更換。七、提示“DisplaySwitchNotProper”主板上的顯示模式跳線設(shè)置錯誤,重新跳線。八、提示“KeyboardisLock...Unlockit”鍵盤被鎖住,打開鎖后重新引導(dǎo)系統(tǒng)。九、IDE接口設(shè)備檢測信息為:“DetectingPrimary(或Secondary)Master(或Slave)...None”表示該IDE接口都沒有找到硬盤,如果該IDE口確實(shí)接有硬盤的話,則說明硬盤沒接上或硬盤有故障,可以從以下幾方面檢查:1、硬盤電源線和數(shù)據(jù)線是否接觸不良,或換一根線試試;2、CMOS設(shè)置有無錯誤,進(jìn)入CMOS將“PrimaryMaster”、“PrimarySlave”、“SecondaryMaster”三項(xiàng)的的“TYPE”都設(shè)置成“Auto”;3、替換法確認(rèn)硬盤本身有故障。十、IDE接口設(shè)備檢測信息下面顯示“Floppydisk(s)fail(40)”出錯信息表示CMOS所指定的軟盤驅(qū)動器有問題。判斷和解決的方法與硬盤相似?,F(xiàn)象五:系統(tǒng)不能引導(dǎo)。這種故障一般都不是嚴(yán)重問題,只是系統(tǒng)在找到的用于引導(dǎo)的驅(qū)動器中找不到引導(dǎo)文件,比如:BIOS的引導(dǎo)驅(qū)動器設(shè)置中將軟驅(qū)排在了硬盤驅(qū)動的前面,而軟驅(qū)中又放有沒有引導(dǎo)系統(tǒng)的軟盤或者BIOS的引導(dǎo)驅(qū)動器設(shè)置中將光驅(qū)排在了硬盤驅(qū)動的前面,而光驅(qū)中又放有沒有引導(dǎo)系統(tǒng)的光盤,這個都很簡單,將光盤或軟盤取出就可以了,實(shí)際應(yīng)用中遇到“DiskBootFailure,InsertSystemDiskAndPressEnter”的提示,多數(shù)都是這個原因。如果是硬盤不能引導(dǎo)的話一般有兩種情況:一種是硬盤數(shù)據(jù)線沒有插好,另一種就是硬盤數(shù)據(jù)損壞。前者一般多會出現(xiàn)硬盤容量檢測不正確和引導(dǎo)時出現(xiàn)死機(jī)的現(xiàn)象;后者則是干脆找不到引導(dǎo)文件或提示文件損壞。前者只需重新連接好數(shù)據(jù)線即可;后者則需要用win98的啟動軟盤或啟動光盤啟動,根據(jù)實(shí)際情況來定:一、提示“Invalidpartitiontable”或“NotFoundany[activepartition]inHDDDiskBootFailure,InsertSystemDiskAndPressEnter”,這說明找不到硬盤活動分區(qū),需要對硬盤重新分區(qū)。二、提示“Missoperationsyste”,說明硬盤活動分區(qū)需要重新格式化(formatc:/s)。三、提示“InvalidsystemdiskReplacethedisk,andthenpressanykey”或顯示“StartingWindows98…”時出現(xiàn)死機(jī),說明硬盤上的系統(tǒng)文件丟失了或損壞,使用“sysc:”,命令傳遞系統(tǒng)文件給c盤,再將C拷貝給c盤。現(xiàn)象六:硬盤可以引導(dǎo),但Windows不能正常啟動,也不能進(jìn)入安全模式。這種情況表明Windows98出現(xiàn)了嚴(yán)重的錯誤,首先,用殺毒軟件查殺病毒,看是不是病毒造成的,如果沒有發(fā)現(xiàn)病毒可以用以下方法試一試。一、直接將接口卡與各個外設(shè)都撥去,再插回去,并調(diào)整接口卡上的設(shè)置(如果可以的話)來檢查是否是硬件沖突造成,開機(jī)看看是否可正常進(jìn)入Windows。二、檢查CMOS中的設(shè)置是否有不正確的地方,若不清楚,可選擇LoadBiosDefault項(xiàng)目,然后重開機(jī),開機(jī)看是否可正常進(jìn)入Windows。三、在啟動時按下F8鍵,一般會出現(xiàn)6個選項(xiàng)(如果安裝了DOS6.22則出現(xiàn)7個選項(xiàng))選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論