一個簡單語言的詞法分析器_第1頁
一個簡單語言的詞法分析器_第2頁
一個簡單語言的詞法分析器_第3頁
一個簡單語言的詞法分析器_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上遼寧師范大學計算機與信息技術學院綜合性實驗報告課程名稱: 編譯原理 實驗題目: 一個簡單語言的詞法分析器 學生姓名: 專業(yè): 計算機科學與技術 學號: 實驗日期: 【實驗目的】 1. 理解正規(guī)式和有限自動機的作用;進一步理解自動機理論。2. 用狀態(tài)圖和狀態(tài)矩陣表示有限自動機; 3. 以程序實現(xiàn)有限自動機的運行過程; 4. 掌握正規(guī)式轉換成自動機的技術及有窮自動機實現(xiàn)的方法。 【實驗內容】 利用正規(guī)表達式和自動機手段,設計各類單詞的自動機表示及組合自動機表示,生成并調試程序,實現(xiàn)詞法分析。 【實驗要求】 1. 待分析的簡單的詞法(1)關鍵字: begin if then

2、 while do end所有的關鍵字都是小寫。(2)運算符和界符: = + - * / < <= <> > >= = ; ( ) #(3)其他單詞是標識符(ID)和整型常數(shù)(SUM),通過以下正規(guī)式定義:ID = letter (letter | digit)*NUM = digit digit*(4)空格有空白、制表符和換行符組成。空格一般用來分隔ID、SUM、運算符、界符和關鍵字,詞法分析階段通常被忽略。 2. 各種單詞符號對應的種別碼:3. 詞法分析程序的功能:輸入:所給文法的源程序字符串。輸出:二元組(syn,token或sum)構成的序列。其中:

3、syn為單詞種別碼; token為存放的單詞自身字符串; sum為整型常數(shù)。例:對源程序begin x := 9; if x>9 then x:=2*x+1/3; end #的源文件,經(jīng)過詞法分析后輸出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,:)(2,if)(10,x)(23,>)(11,9)(3,then)(10,x)(18,:=)(11,2)(15,*)(10,x)(13,+)(11,1)(16,/)(11,3)(26,;)(6,end)(0,#)【實驗過程】程序思路:首先定義關鍵字數(shù)組,把題目設置的關鍵字存入;讀入源程序,對其進行詞法分析;從

4、input串中一個字符一個字符的賦值給ch,并對其進行分析:當為空格符時跳過;為字母時將其存入token數(shù)組;繼續(xù)判斷它的下一個字符,若為字符或數(shù)字則存入token數(shù)組,直至出現(xiàn)空格符;當為數(shù)字時,存入token數(shù)組,并判斷其下一字符;當為字符“+”、“-”、“/”、“;”、“(”、“)”、“#”時,則直接對應的種別碼;然而當碰到字符“:”“<”“>”時,則需要判斷它的下一字符是否為“=”“>”,因為有可能是“:=”“<>”“<=”“>=”。程序代碼如下:#include<stdio.h>#include<string.h>#i

5、nclude<iostream.h>char *keyword6="begin","if","then","while","do","end"/關鍵字char input80;/輸入串char token8;/單詞自身字符串char ch;int syn;/單詞種別碼int sum=0;/整型常數(shù)int p;/input下標int m=0;/token下標int n,i;void automata()/自動機for(i=0; i<8; i+)tokeni=N

6、ULL;ch=inputp+;while(ch=' ') ch=inputp+;/跳過空格/標識符:字母 或 以字母開頭和數(shù)字組成的ID = letter (letter | digit)*if(ch>='a' && ch<='z')|(ch>='A' && ch<='Z')m=0;while( (ch>='0' && ch<='9')|(ch>='a' && c

7、h<='z')|(ch>='A' && ch<='Z') )tokenm+ = ch;ch = inputp+;/識別出一個標識符tokenm+='0'p-;/回退一位syn=10;/單純的標識符(自定義的)for(i=0; i<6; i+)/將識別出來的字符和關鍵字做比較if(strcmp(token,keywordi)=0)syn=i+1;/關鍵字種別碼break;/數(shù)字NUM = digit digit*else if( ch>='0' && ch

8、<='9' )sum=0;while( ch>='0' && ch<='9' )sum=sum*10+ch-'0'ch=inputp+;/讀取下一個字符p-;/回退一下syn=11;/11標識數(shù)值類型/符號else switch(ch)/其他字符case'#':syn=0; token0=ch; break;case'+':syn=13; token0=ch; break;case'-':syn=14; token0=ch; break;case&#

9、39;*':syn=15; token0=ch; break;case'/':syn=16; token0=ch; break;case':':m=0;tokenm+=ch;/讀取下一個字符ch=inputp+;if(ch='=')syn=18;/:=tokenm+=ch;/讀取下一個字符elsesyn=17;/:p-;break;case '<':m=0; tokenm+=ch;ch=inputp+;/讀取下一個字符if(ch='>')syn=21;/ <>tokenm+=ch;/

10、讀取下一個字符else if(ch='=')syn=22;/ <=tokenm+=ch;/讀取下一個字符 elsesyn=20;/ <p-; break;case'>':m=0; tokenm+=ch;/讀取下一個字符ch=inputp+;if(ch='=')syn=24;/ >=tokenm+=ch;/讀取下一個字符elsesyn=23;/ >p-;break;case'=':syn=25; token0=ch; break;case'':syn=26; token0=ch; bre

11、ak;case'(':syn=27; token0=ch; break;case')':syn=28; token0=ch; break;case'n': break;default: break;void main()cout<<"Please input string:"<<endl;cin.getline(input,80);p=0;doautomata();/自動機if(syn=11)cout<<"("<<syn<<","<<sum<<"

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論