南华大学
计算机科学与技术学院
实 验 报 告
( 2011~2012 学年度 第 二 学期 )
课程名称
程序设计语言与编译
姓名 学号
专业 电气信息类 班级
地点 8—209 教师
题目: 用直接分析方法编制C++语言子集的词法分析程序.
一、分析
对于单词符号我们将其分成四类:保留字K、标识符I、常数C和界符P,每类单词符号均可使用一张表格表示.在词法分析过程中,保留字K和界符P这两个表格的内容是固定不变袭脊的(由语言确定),源程序字符串只能从其中选取,而标识符I、常数C这两表是在分析过程中不断形成的.
对于一个具体源程序而言,在扫描字符串时识别出一个单词,若这个单词的类型是K、I、C或P中之一,那么就以单词的二元式形式输出.每次调用词法分析程序,它均能自动继续扫描下去,形成下一个单词,直到整个源程序全部扫描完毕,从而形成相应的单词串.
各类单词的二元式表述均具有相同的结构与长度,形式如下:
(单词种别t,单词自身的值i)
t是单词种别,而单词种别共分为K、I、C、P四类且每类对应一张表格.因此,t实际上就是一个指向这四类中某一类对应表格的指针.i则为指向该类表格中一个特定项目的指针.
所以整个的词法分析过程就是从源程序中获得一个个的单词符号,将这些符号分别填入四张类表中,并且有一个二元式序列构成一个索引,这个索引为以后的语法分析提供处理上的方便.
为了减少实习量,可以适量地选取K,P中的一个子集来进行.如下表:
表1 保留字K表
内部地址 1 2 3 4 5 6 7 8 9 10
保 留 字 BEGIN CONST DO ELSE END IF PROCEDURE THEN VAR WHILE
表2 界符P表
内部地址 1 2 3 4 5 6 7 8 9 10
界 符 ; + : : ( , ) < < <
组合界符 = = >
保留字表包括10个有代表性的保留字,界符表包括关系运算符三种(8,9,10),算术运算符(2),分隔符三种(1,4,6),一对圆括号,加上赋值号共10种.这两表的内容表明PASCAL语言的条件语句,赋值语句,WHILE型循环语句,复合语句,过程及变量说明均可作为源程序例子输入给词法分析程序,标识符表I中的每一项包含一个标识符,常数表C中的每一项包含一个整常数,后两表的内容都是在词法分析过程中产生的.
如何从源程序中识别出一个个的单词符号呢?图1中的流图清晰地反映出这一过程.
图1中,双圆圈的状态表示终态,即能到达终态就代表识别出一个单词符号,而带有*号的终态是指处理时应回退一字符.
二、算法
词法分析器在扫描过程中,依次从源程序中取出源字符,根据图1的扫描过程状态转换图,当碰到终态时,即双圆圈的状态时就得到一个单词符号,此时可以根据第一个字符判断单词属于K,I,C,P中哪一类,从而确定单词的"单词种别"和"单词自身的值".整个词法分析的算法流程如图2.
三、实现
选择实习环境为TURBO C2.0语言. 实现程序见附录.
四、总结
上机前应做好准备.即根据实习目的、要求和分析,选择相应的数据结构,使用C语言参照算法中的流程编写词法分析的程序.将编好的程序上机进行调试.注意调试的例子应有词法正确的,也应有词法错误的或是超出所选数据结构范围的.
实验完成达到实习目的之后,若尚有余力者,可以对所选子集适当扩大或是增加相应功能如:扩充界符和保留字数目;允许实型常数;进行词法错误检查;最大范围扩充以至PASCAL语言所有字符的集合.
实验完成以后编写出完整的实验报告,反映出最后的实验学习结果.
附录拍或渗
/* 实验代码:*/
实验结果:
五、结果感想
实验中需要识别的词有:
关键字:DIM、IF、DO、STOP、END单词种别码为1.2.3.4.5。
标识符;单词种别码为6。
常数为无符号整形数;单词种别码为7。
运算符包括:=、-、*、**单词种别码为8.9.10.11。
分隔符包括:,、(、); 单词种别码为12.13.14。
通过此次实验,让我了解到如何设计、编制并调试词法分析程序,加深对词法分析原理的理解;熟悉了构造词法分析程序的手工方式的相关原理,根据识别语言单词的状态转换图,使用某种团漏高级语言(例如C++语言)直接编写此法分析程序。另外,也让我重新熟悉了C++语言的相关内容,加深了对C++语言的用途的理解。
嘿嘿,这个我做过哦。是编译原理的东西。不过现在没有程序,没带来,给你一个参考的:虽然不是完全符合你的要求。不过其中很多函数你是要用到的,比如词法分析部分,其实你的要求就是进行词法分析的,无非你用scanf(),你用词法分析,分析出scanf()语句,再进行内部参数分雀核析,就OK了;
祝你成功哦
///////////////////////////////////////////////////////////////////
for循环语句翻译 递归下降法 输出三地址码 /////////////
#define MAX 100
#include<iostream.h>
#include<stdio.h>
#include<string.h>
char str[MAX]
char ch
int turn
char strToken[MAX]
int kind
int n=0//存放strtoken[]元素的个数
struct Word//结构体 存放单词
{
int sort
char word[MAX]//存放strtoken[]的内容
}
//record[x]=new Word
Word *record[12]//放所有识别出来的单词,分别存放他们的编号以及字符串,x是其下标
////////////////////词法分析///////////////////////
int buffer()//载入
{
int i=0
cout<<"输入程序,以“#”作为结束标志。"<<endl
for(int n=0n<=MAXn++)
{
for(i<=MAXi++)
{
scanf("%c",&str[i])
/////////////cin>>str[i]不可用,用顷悄掘C语言读入字符。
if(str[i]=='#')
break///////如果尾数为识别码#,则表示程序读完,跳出循环.
}
break
}
return(i)
}
bool IsLetter(char ch)///////////判断是否是字母
{
if(ch>=65&&ch<=90||ch>=97&&ch<=122)
return(true)
else
return(false)
}
bool IsDigit(char ch)//////////判断是否是数字
{
if(ch>=48&&ch<=57)
return(true)
else
return(false)
}
char GetChar(int i)///////读取字符
{
char ch
ch=str[i]
return(ch)
}
char GetBC(char ch)////判断是不是空格或者换行,如果是,直接读取下一个字符直道不再空白为止
{
if(ch==32||ch==10)
{
turn++
ch=GetChar(turn)
ch=GetBC(ch)/////////递归实现
return(ch)
}
else
return(ch)
}
void Concat()/////////////运答连接,即为strtoken[]赋值
{
strToken[n]=ch
n++
}
int Reserve()/////以单词为单位查找保留字,是则返回编码,不是则返回0,用来区分标志符和保留字
{
if(strcmp(strToken," DIM\0")==0)///////调用strcmp函数实现,
return(1)
else if(strcmp(strToken,"for\0")==0)
return(2)
else if(strcmp(strToken,"step\0")==0)
return(3)
else if(strcmp(strToken,"until\0")==0)
return(4)
else if(strcmp(strToken,"do\0")==0)
return(5)
else
return(6)
}
void clear()
{
n=0
}
/////////////*语法递归分析*/////////////////
int A(int * c,int &q)
{
if(c[q++]==3)
{
if(c[q]==7)
{ q++
return 1
}
else {cout<<"step右部出错"<<endlreturn 0}
}else {cout<<"error 'step'"<<endlreturn 0}
}
int B(int * b,int &o)
{
if(b[o++]==4)
{
if(b[o]==7)
{ o++
return 1
}
else {cout<<"until右部出错"<<endlreturn 0}
}else {cout<<"error 'until'"<<endlreturn 0}
}
int S2(int * d,int &h)
{
if(d[h++]==6)
{
if(d[h++]==8)
{
if((d[h]==6||d[h]==7)) {h++return 1}
else {cout<<"赋值语句右部出错 "<<endlreturn 0}
}else {cout<<"赋值语句缺少赋值运算符 "<<endlreturn 0}
}else {cout<<"赋值语句左部出错 "<<endlreturn 0}
}
int S1(int * m,int &n)
{
if(S2(m,n))
{
if(A(m,n))
{
if(B(m,n)) return 1
else return 0
}else return 0
}else return 0
}
int S(int *a,int &z)
{
if (a[z++]==2)
{
if (S1(a,z))
{
if(a[z++]==5)
{
if(S2(a,z))
{
cout<<"succeed!"<<endlreturn 1
}else return 0
}else {cout<<"error 'do'"<<endlreturn 0}
}else return 0
}else {cout<<"error 'for'"<<endlreturn 0}
}
void main()
{
cout<<"*************产生式***************"<<endl// for step until do i j =
cout<<" S ->for S1 do S2"<<endl// 编号 2 3 4 5 6 7 8
cout<<" S1 ->S2AB"<<endl
cout<<" S2 ->i=j"<<endl
cout<<" A ->stepj"<<endl
cout<<" B ->untilj"<<endl
int num
turn=0
num=buffer()-1
int x=0//计识别的单词的个数
for(turn<=numturn++)//总循环,ch存放刚读入的字符,strtoken[]存放已识别的标志付或保留字,turn是数组str[]的下标
{
ch=GetChar(turn)
ch=GetBC(ch)
if(IsLetter(ch))
{
while(IsLetter(ch)&&turn<=num||IsDigit(ch)&&turn<=num)
{
Concat()
ch=GetChar(++turn)
}
strToken[n]='\0'
ch=NULL//此ch不是标志符中的符号
turn=turn-1
kind=Reserve()
record[x]=new Wordrecord[x]->sort=kind//12345或6
//cout<<kind//测试
cout<<"("
for(int i=0i<ni++)
{
record[x]->word[i]=strToken[i]
cout<<record[x]->word[i]//输出识别的标志符或保留字
}
cout<<","<<kind<<")"<<endl
record[x]->word[i]='\0'
clear()
x++
}
else if(IsDigit(ch))
{
while(IsDigit(ch)&&turn<=num)
{
Concat()
ch=GetChar(++turn)
}
ch=NULL
turn=turn-1
kind=7
//////////////
record[x]=new Word
record[x]->sort=kind
////////////////
cout<<"("
for(int i=0i<ni++)
{
record[x]->word[i]=strToken[i]
cout<<record[x]->word[i]
}
cout<<","<<kind<<")"<<endl
record[x]->word[i]='\0'
clear()x++
}
else if(ch=='=')
{
kind=8
///////
record[x]=new Word
record[x]->word[0]='='
record[x++]->sort=kind
cout<<"(=,"<<kind<<")"<<endl
}
else
cout<<"error input!"<<endl
}
//////////////////////*语法分析*////////////////
//int y
/*for(y=0y<xy++)
{cout<<record[y]->sort<<" "//打印单词的编号 。
}cout<<endl*/
int ana[MAX]//存放词法分析得到的单词序列的编号的序列
int m
for(m=0m<xm++)
{
ana[m]=record[m]->sort//将sort作为数组保存起来
}
/////////语法分析///////
int j=0
///////////////////制导翻译//////////////////
if(!S(ana,j)) cout<<"语法出错!"<<endl
else
{ cout<<"三地址码如下:"<<endl
cout<<"100 "
int i=0
while(record[1]->word[i]!='\0')
cout<<record[1]->word[i++]cout<<record[2]->word[0]
i=0
while(record[3]->word[i]!='\0')
cout<<record[3]->word[i++]cout<<endl
cout<<"101 goto 103"<<endl
cout<<"102 "
i=0
while(record[1]->word[i]!='\0')
cout<<record[1]->word[i++]cout<<":="
i=0
while(record[1]->word[i]!='\0')
cout<<record[1]->word[i++]cout<<"+"
i=0
while(record[5]->word[i]!='\0')
cout<<record[5]->word[i++]cout<<endl
cout<<"103 if "
i=0
while(record[1]->word[i]!='\0')
cout<<record[1]->word[i++]cout<<"<"
i=0
while(record[7]->word[i]!='\0')
cout<<record[7]->word[i++]
cout<<" goto 105"<<endl
cout<<"104 goto 107"<<endl
cout<<"105 "
i=0
while(record[9]->word[i]!='\0')
cout<<record[9]->word[i++]cout<<":="
i=0
while(record[11]->word[i]!='\0')
cout<<record[11]->word[i++]cout<<endl
cout<<"106 goto 102"<<endl
cout<<"107 end"<<endl
}
}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)