數據結構-數組和串的模式匹配

上傳人：1*** IP屬地：湖南上傳時間：2024-07-31 格式：PPT 頁數：16 大小：102KB 積分：4.8 舉報 版權申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

4.5.3模式匹配１.模式匹配的概念設有給定的兩個串T和P，則在T中尋找等于P的子串的過程，稱為模式匹配，T稱為正文(text)，P稱為模式(pattern)。通常T長度遠遠大于P的長度，若在T中找到等于P的子串，則匹配成功；否則，匹配失敗。2．簡單的模式匹配算法算法思想如下：對于i=0,1,…,n-m，依次執(zhí)行下列匹配：用p[0],p[1],…,p[m-1]依次與t[i],t[i+1],…,t[i+m-1]比較，若均對應相等，則匹配成功，整個算法結束；若存在某個k(0≤k≤m-1)，使得p[k]≠t[i+k]，則立即結束這輪比較，將模式P向右移動一位，再執(zhí)行下一個i的新一輪匹配。如執(zhí)行了n-m+1輪，即i從0到n-m的所有情況，在T中都沒有找到P的子串，則匹配失敗。#defineMAXN100#defineMAXM50chart[MAXN],p[MAXM];intsimple_match(t,p,n,m)chart[],p[];intn,m;{inti,j,k;for(i=0;i<=n-m;i++){for(j=0;k=i;j<m&&t[k]==p[j];k++,j++)if(j==m)return(i);}return(-1);}

簡單模式匹配算法，在最壞的情況下，比較的總次數為：m(n-m+1)，則時間復雜度為：O(mn)。3．模式匹配的KMP算法由D.E.Knuth，J.H.Morris和V.R.Pratt三個人提出來的。Kunth-Morris-Pratt算法舉例：T：abcabcaabcabcabcd……P：abcabc

d(abc)a

bcd(a)bcabcdabcabc

(abc)abcd

數據結構第4章數組和串第5節(jié)串KMP(D.E.Knuth-J.H.Morris-V.R.Pratt)算法t[0]…t[i-j]t[i-j+1]…t[i-k]t[i-k+1]…t[i-1]t[i]t[i+1]…

‖‖‖‖‖‖

p[0]p[1]…p[j-k]p[j-k+1]…p[j-1]p[j]p[j+1]…‖‖‖?

p[0]p[1]…p[k-1]p[k]p[k+1]如果模式P的開頭k個字符(p[0],…,p[k-1])依次與p[j]的前面k個字符(p[j-k],…,p[j-1])相同，那么可以省去煩瑣的一輪輪的比較，還可省去模式的前k個字符的比較，只需從t[i]與p[k]開始依次繼續(xù)進行比較。數據結構第4章數組和串第5節(jié)串數據結構第4章數組和串第5節(jié)串在執(zhí)行匹配過程中一旦出現ti≠pj處失配，我們必須在模式P中找出一段p0p1…pk-1=pj-kpj-k+1….pj-1，這個k我們稱pj的“失敗鏈接值”，我們發(fā)現在尋找模式P的各個字符的失敗鏈接值與正文T無關，只依賴模式本身。在進行匹配前，預先為模式P的每一個符號設置好它的失敗鏈接值，一旦出現ti≠pj處失配。那么就取出pj失敗鏈接值k，而下次匹配直接將模式P的pk開始與正文失敗處ti繼續(xù)比較下去。數據結構第4章數組和串第5節(jié)串計算失敗鏈接值數組元素（對應模式的下標j）j012345678910pabcabcabbacflink[j]-10001234501數據結構第4章數組和串第5節(jié)串失敗鏈接值的函數：#defineMAXN100#defineMAXM50chart[MAXN],p[MAXM];intflink[MAXN];voidfaillink(charp[],intflink[],intm){intj=1,k;flink[0]=-1;while(j<m){k=flink[j-1];while(k!=-1&&p[k]!=p[j-1])k=flink[k];flink[j]=k+1;j++;}}//時間復雜度分析為O(m)數據結構第4章數組和串第5節(jié)串KMP算法intkmp_match(t,p,flink,n,m)chart[],p[];Intflink[],n,m;{inti,j;i=0;j=0;while(i<n){while(j!=-1&&p[j]!=t[i])j=flink[j];If(j==m-1)return(i-m+1);i++;j++;}return(-1)}//時間復雜度分析為O(n)數據結構第4章數組和串第5節(jié)串4．模式匹配BM（Boyer-Moore）算法BM算法與KMP算法差別在于：（1）在模式匹配時，不是自左向右進行，而是自右向左進行。（2）事先計算一個函數d(x)，包含下列信息：當x不在模式P中，或出現在P的尾端，則d(x)取值為模式P的長度。其余情況，d(x)取值等于字符x在模式P中最右端的字符x到尾端的距離。給定的模式P=p0p1p2….pm-1，模式P長度為m，則D(x)函數表示如下：

m若x不在P，或x=pm-1，但x≠pi(0≤i≤m-2)d(x)=m-i-1其余情況，這里i=max例P=”doctor”，由d(x)函數求出，d(‘r’)=6，d(‘o’)=1，d(‘t’)=2，d(‘c)=3，d(d’)=5，其他不在模中的符號的值d(x)=6。BM算法的思想：假設在執(zhí)行正文T中自第i起，與模式P開始自右向左的匹配，一旦發(fā)現不匹配，則去執(zhí)行pm-1與ti+d(ti)開始的自右向左的匹配，相當于把整個模P向右滑過d(ti)個一段距離。若模式P在與正文第i位起的匹配過程中，假如中間某個符號與正文的符號不匹配，而ti不在模式中或是模的尾端，那么滑過的距離是最大的，也就是模P的長度m。

d(x):6614正文：thene

seturn

fathereturnreturnreturnreturnreturnreturn算法#defineMAXN1000#defineMAXM50chart[MAXN],p[MAXM];intn,m;intd[26];voiddx(charp[],intd[],intm)//建立d[26]數組{inti;for(i=0;i<26;i++)d[i]=m;for(i=0;i<m-1;i++)d[p[i]-‘a’]=m-i-1;//字符到尾端最短距離}intBM_patter(t,p,d,n,m)chart[],p[];intd[],n,m;{inti,j,k;i=m-1;//正文第一次起始位置do{j=m-1;k=i;while(j>=0&&p[j]==t[k]){j--;

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數據結構-數組和串的模式匹配

文檔簡介

溫馨提示

最新文檔

評論

數據結構-數組和串的模式匹配

文檔簡介

溫馨提示

最新文檔

評論

相關文檔