如何破解字符驗證碼_第1頁
如何破解字符驗證碼_第2頁
如何破解字符驗證碼_第3頁
如何破解字符驗證碼_第4頁
如何破解字符驗證碼_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2021/4/212021/4/22對驗證碼的介紹對驗證碼的介紹字符驗證碼字符驗證碼如何破解字符驗證碼如何破解字符驗證碼小組總結(jié)小組總結(jié)2021/4/23驗證碼的英文CAPTCHA 這個詞最早是在2000年由卡內(nèi)基梅隆大學的Luis von Ahn等學者所提出的。CAPTCHA 是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自動區(qū)分計算機和人類的圖靈測試)的縮寫,是一種區(qū)分用戶是計算機和人的公共全自動程序。這個問題可以由計算機生成并評判,但是必須只有人類才能解答。由于計算機無法解答C

2、APTCHA的問題,所以回答出問題的用戶就可以被認為是人類。驗驗證證碼碼起起源源2021/4/24(1)由4個隨機數(shù)字組成的最原始驗證碼:驗證作用幾乎為零。(2)GIF動畫驗證碼 : 防垃圾注入可以達到100%,有效的同時能增加網(wǎng)站頁面的美觀效果。(3)手機驗證碼:通過發(fā)送驗證碼到手機,比較準確驗證用戶的正確性,是最有效的驗證碼之一。(4)字符驗證碼:服務(wù)器端隨機生成驗證碼字符串,保存在內(nèi)存中,并寫入圖片或者加入干擾線條,將圖片連同表單發(fā)給客戶端。是目前而言最常見的驗證碼。常常見見的的驗驗證證碼碼2021/4/25字符驗證碼的工作流程字符驗證碼的工作流程(1)、服務(wù)器端隨機生成驗證碼字符串,保

3、存在內(nèi)存中,并寫入圖片或者加入干擾線條,將圖片連同表單發(fā)給客戶端。 (2)、客戶端輸入驗證碼,并提交給表單,服務(wù)器端獲取客戶提交的驗證碼,和前面產(chǎn)生的的隨機數(shù)字相比較;如果相同,則繼續(xù)進行表單所描述的操作(如登錄、注冊等);如果不同,直接將錯誤信息返回給客戶端。避免程序的繼續(xù)運行以及訪問數(shù)據(jù)庫。2021/4/26如何破解字符驗證碼如何破解字符驗證碼 1、去噪去噪 (1)由于其 背景色 的亮度與文字或者數(shù)字的亮度差別較大,這樣我們就可以通過 設(shè)定亮度域值的方法來對它進行二值化處理,即將圖像上的像素點的灰度值設(shè)置為0或255,也就是將整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果。 (2)對于干擾線的去

4、除,我們通過對水平方向長度超過圖片二分之一的線直接去除,因為圖片文字本身寬度不可能超過二分之一的圖片大小。2021/4/27(3)先在x軸方向進行分割:對x軸上每一點,統(tǒng)計y坐標方向上黑點數(shù)目。當黑點數(shù)目少于設(shè)定的域值時候,認為是字符間的空白區(qū),而黑點數(shù)目大于設(shè)定的閾值時則認為是字符區(qū)。(4)有時存在字符相連的情況,為避免兩個相連的字符分割失敗,對字符的最大寬度和最小寬度設(shè)定閾值 : 當寬度大于最大寬度時候,即認為是兩個字符,需要將分割得到的字符繼續(xù)分割;如果分割得到的字符寬度小于設(shè)定的最小寬度,則需要進行合并鄰近的兩個字符進行分割。(5)利用同樣的方法可以進行y軸方向上的分割。(6)由于驗證

5、碼文字的隨機性,對分割得到的單個字符進行進一步的邊框確定。通過對水平和垂直方向掃描,確定出單個字符的邊框。2021/4/282、將分割出的字符與模版匹配,判別字符類型將分割出的字符與模版匹配,判別字符類型(1)模版庫的建立:從網(wǎng)絡(luò)上采集一系列驗證碼的樣本,建立驗證碼字符樣本空間。比如為字母AZ和數(shù)字09。對于每一個樣本,我們提取特征,建立模版。(2)將得到的圖片切割為固定的長度和寬度。先將字符從水平方向進行掃描,則每條掃描線都是由黑點或者白點構(gòu)成的序列,每條水平掃描線可以用一個向量表示。將向量分類為N種模式,比如模式0表示長的空白段,而模式1代表長的黑點段。模式2表示一段相對長的白點之后跟著一

6、段黑點。以此類推得到自己設(shè)計的模式圖。2021/4/29(3)用上述的編碼方法分別對模版與待識別的字符進行編碼,然后計算模版與待識別字符的編碼的相似度。把一個字當做一幅圖,從上往下一行行掃描,每一行都是由不同長短的黑色橫杠組成的,每種橫杠對應(yīng)著模式圖中的一個編碼。取相似度最高的模版字符為識別的結(jié)果。如圖所示,數(shù)字7的編碼為1288886999792021/4/210上述破解原理可用OCR(Optical Character Recognition):光學字符識別來實現(xiàn) 1、下載安裝Tesseract-OCR引擎2、 使用Tesseract-OCR引擎識別驗證碼2021/4/211取出所需要讀取的驗證碼圖片運行之后可得2021/4/212注:注:文檔資料素材和資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論