编译过程分为分析和综合两个部分,并进一步划分为词法分析、语法分析、语义分析、代码优化、存储分配和代码生成等六个相继的逻辑步骤。这六个步骤只表示编译程序各部分之间的逻辑联系,而不是时间关系。
编译过程既可以按照这六个逻辑步骤顺序地执行,也可以按照平行互锁方式去执行。在确定编译程序的具体结构时,常常分若干遍实现。对于源程序或中间语言程序,从头到尾扫视一次并实现所规定的工作称作一遍。每一遍可以完成一个或相连几个逻辑步骤的工作。
例如,可以把词法分析作为第一遍;语法分析和语义分析作为第二遍;代码优化和存储分配作为第三遍;代码生成作为第四遍。
反之,为了适应较小的存储空间或提高目标程序质量,也可以把一个逻辑步骤的工作分为几遍去执行。例如,代码优化可划分为代码优化准备工作和实际代码优化两遍进行。
扩展资料
从左至右逐个字符地对源程序进行扫描,产生一个个的单词符号,把作为字符串的源程序改造成为单词符号串的中间程序。执行词法分析的程序称为词法分析程序或扫描器。
源程序中的单词符号经扫描器分析,一般产生二元式:单词种别;单词自身的值。单词种别通常用整数编码,如果一个种别只含一个单词符号,那么对这个单词符号,种别编码就完全代表它自身的值了。若一个种别含有许多个单词符号,那么,对于它的每个单词符号,除了给出种别编码以外,还应给出自身的值。
词法分析器一般来说有两种方法构造:手工构造和自动生成。手工构造可使用状态图进行工作,自动生成使用确定的有限自动机来实现。
编译程序的语法分析器以单词符号作为输入,分析单词符号串是否形成符合语法规则的语法单位,如表达式、赋值、循环等,最后看是否构成一个符合要求的程序,按该语言使用的语法规则分析检查每条语句是否有正确的逻辑结构,程序是最终的一个语法单位。编译程序的语法规则可用上下文无关文法来刻画。
参考资料来源:百度百科-编译程序
#include <iostream>#include <ctype.h>
#include <fstream>
#include <string.h>
#include <malloc.h>
using namespace std
ifstream fp("source.txt",ios::in)
char cbuffer
char *key[13]={"if","else","for","while","do","return","break","continue","int","void"
,"main","const","printf"}//关键字
char *border[7]={ "," , "" , "{" , "}" , "(" , ")" ,"//"} //分界符
char *arithmetic[6]={"+" , "-" , "*" , "/" , "++" , "--"} //运算符
char *relation[7]={"<" , "<=" , "=" , ">" , ">=" , "==" ,"!="}//关系运算符
char *lableconst[80] //标识符
int constnum=40
int lableconstnum=0
int linenum=1 //统计常数和标识符数量
int search(char searchchar[],int wordtype)
{
int i=0,t=0
switch (wordtype)
{
case 1:
{ for (i=0i<=12i++) //关键字
{
if (strcmp(key[i],searchchar)==0)
return(i+1)
}
return(0)}
case 2:
{
for (i=0i<=6i++)//分界符
{
if (strcmp(border[i],searchchar)==0)
return(i+1)
}
return(0)
}
case 3:
{
for (i=0i<=5i++)//运算符
{
if (strcmp(arithmetic[i],searchchar)==0)
return(i+1)
}
return(0)
}
case 4:
{
for (i=0i<=6i++)//关系运算符
{
if (strcmp(relation[i],searchchar)==0)
return(i+1)
}
return(0)
}
case 5:
{
for (t=40t<=constnumt++) //常数
{
if (strcmp(searchchar,lableconst[t])==0)//判断该常数是否已出现过
return(t+1)
}
lableconst[t-1]=(char *)malloc(sizeof(searchchar))//为新的元素分配内存空间
strcpy(lableconst[t-1],searchchar)//为数组赋值lableconst指针数组名
constnum++ //常数个数自加
return(t)
}
case 6:
{
for (i=0i<=lableconstnumi++)
{
if (strcmp(searchchar,lableconst[i])==0) //判断标识符是否已出现过
return(i+1)
}
lableconst[i-1]=(char *)malloc(sizeof(searchchar))
strcpy(lableconst[i-1],searchchar)
lableconstnum++ //标识符个数自加
return(i)
}
default:cout<<"错误!"
}
}
char alphaprocess(char buffer)//字符处理过程
{
int atype
int i=-1
char alphatp[20]
while ((isalpha(buffer))||(isdigit(buffer)))
//这两个函数分别是判字符和判数字函数位于ctype.h中
{
alphatp[++i]=buffer
fp.get(buffer)
}
alphatp[i+1]='\0'//在末尾添加字符串结束标志
if (atype=search(alphatp,1))
cout<<"linenum: "<<linenum<<" String= "<<alphatp<<"\t\t\t"<<"关键字"<<endl
else
{
atype=search(alphatp,6) //标识符
cout<<"linenum: "<<linenum<<" String= "<<alphatp<<"\t\t\t"<<"标识符"<<endl
}
return(buffer)
}
char digitprocess(char buffer) //数字处理过程
{
int i=-1
char digittp[20]
int dtype
while ((isdigit(buffer)))
{
digittp[++i]=buffer
fp.get(buffer)
}
digittp[i+1]='\0'
dtype=search(digittp,5)
cout<<"linenum: "<<linenum<<" String= "<<digittp<<"\t\t\t"<<"数据"<<endl
return(buffer)
}
char otherprocess(char buffer) //分界符、运算符、逻辑运算符、等
{
int i=-1
char othertp[20]
int otype,otypetp
othertp[0]=buffer
othertp[1]='\0'
if (otype=search(othertp,3))
{
fp.get(buffer)
othertp[1]=buffer
othertp[2]='\0'
if (otypetp=search(othertp,3)) //判断该运算符是否是
//由连续的两个字符组成的
{
cout<<"linenum: "<<linenum<<" String= "<<othertp<<"\t\t\t"<<"运算符"<<endl
fp.get(buffer)
goto out
}
else //单字符逻辑运算符
{
othertp[1]='\0'
cout<<"linenum: "<<linenum<<" String= "<<othertp<<"\t\t\t"<<"逻辑运算符"<<endl
goto out
}
}
if (otype=search(othertp,4)) //关系运算符
{
fp.get(buffer)
othertp[1]=buffer
othertp[2]='\0'
if (otypetp=search(othertp,4)) //判断该关系运算符是否是
//由连续的两个字符组成的
{
cout<<"linenum: "<<linenum<<" String= "<<othertp<<"\t\t\t"<<"关系运算符"<<endl
fp.get(buffer)
goto out
}
else //单字符逻辑运算符
{
othertp[1]='\0'
cout<<"linenum: "<<linenum<<" String= "<<othertp<<"\t\t\t"<<"逻辑运算"<<endl
goto out
}
}
if (buffer=='!') //"=="的判断
{
fp.get(buffer)
if (buffer=='=')
//cout<<"!= (2,2)\n"
fp.get(buffer)
goto out
}
else
{
if (otype=search(othertp,2)) //分界符
{
cout<<"linenum: "<<linenum<<" String= "<<othertp<<"\t\t\t"<<"分界符"<<endl
fp.get(buffer)
goto out
}
}
if ((buffer!='\n')&&(buffer!=' '))
cout<<"错误!,字符非法"<<"\t\t\t"<<buffer<<endl
fp.get(buffer)
out: return(buffer)
}
void main()
{
int i
for (i=0i<=50i++)
{
lableconst[i]=" "//用于保存标识符
}
if (!fp)
cout<<"文件打开错误!!"<<endl
else
{
fp.get (cbuffer)
while (!fp.eof())
{
if(cbuffer=='\n')
{
linenum++
fp.get(cbuffer)
}
else if (isalpha(cbuffer))
{
cbuffer=alphaprocess(cbuffer)
}
else if (isdigit(cbuffer))
{
cbuffer=digitprocess(cbuffer)
}
else
cbuffer=otherprocess(cbuffer)
}
}
cout<<"标识符个数是:"<<lableconstnum<<"分别是"<<endl
i=0
while(i<lableconstnum)
{
cout<<lableconst[i++]<<" "
}
cout<<endl
cout<<"完成\n"
getchar()
}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)