📄 编译大作业.cpp
字号:
#include <stdio.h>
#include "编译大作业.h"
#include "string.h"
int main()
{
bool nxtlev[symnum];
printf("PL/0文法编译器\n输入PL/0源文件:\n");
scanf("%s",fname);
fin=fopen(fname,"r"); //输入文件名
if(fin)
{
printf("是否输出虚拟机代码:(y/n)"); //是否输出虚拟机代码
scanf("%s",fname);
listswitch=(fname[0]=='y'||fname[0]=='Y');
printf("是否输出名字表:(y/n)"); //是否输出名字表
scanf("%s",fname);
tableswitch=(fname[0]=='y'||fname[0]=='Y');
fa1=fopen("fa1.txt","w");
fprintf(fa1,"pl/0源文件:\n\n");
init(); //初始化
err=0; //初始化报错位置
cc=cx=ll=0; //初始化读字符指针
ch=' ';
if(-1 !=getsym())
{
fas=fopen("fas.txt","w");
addset(nxtlev,declbegsys,statbegsys,symnum);
nxtlev[period]=true;
if(-1==block(0,0,nxtlev)) //调用编译程序
{
fclose(fa1);
fclose(fas);
fclose(fin);
printf("\n");
return 0;
}
fclose(fa1);
fclose(fas);
if(sym != period)
{
error(9); //缺少.
}
if(err==0)
{
fa2=fopen("fa2.txt","w");
interpret(); //调用解释执行程序
fclose(fa2);
}
else
{
printf("pl/0程序有错误");
}
}
fclose(fin);
}
else
{
printf("无法打开文件! \n");
}
printf("\n");
return 0;
}
//初始化
void init()
{
int i;
//设置单词符号
for(i=0;i<=255;i++)
{
ssym[i]=nul;
}
ssym['+']=plus;
ssym['-']=minus;
ssym['*']=times;
ssym['/']=slash;
ssym['(']=lparen;
ssym[')']=rparen;
ssym['=']=eql;
ssym[',']=comma;
ssym['.']=period;
ssym[';']=semicolon;
//设置保留字名字,按照字母排序折半查找
strcpy(&(word[0][0]),"begin");
strcpy(&(word[1][0]),"call");
strcpy(&(word[2][0]),"const");
strcpy(&(word[3][0]),"do");
strcpy(&(word[4][0]),"else");
strcpy(&(word[5][0]),"end");
strcpy(&(word[6][0]),"if");
strcpy(&(word[7][0]),"odd");
strcpy(&(word[8][0]),"procedure");
strcpy(&(word[9][0]),"read");
strcpy(&(word[10][0]),"then");
strcpy(&(word[11][0]),"var");
strcpy(&(word[12][0]),"while");
strcpy(&(word[13][0]),"write");
//设置保留字符号
wsym[0]=beginsym;
wsym[1]=callsym;
wsym[2]=constsym;
wsym[3]=dosym;
wsym[4]=elsesym;
wsym[5]=endsym;
wsym[6]=ifsym;
wsym[7]=oddsym;
wsym[8]=procsym;
wsym[9]=readsym;
wsym[10]=thensym;
wsym[11]=varsym;
wsym[12]=whilesym;
wsym[13]=writesym;
//设置指令名称
strcpy(&(mnemonic[lit][0]),"lit");
strcpy(&(mnemonic[opr][0]),"opr");
strcpy(&(mnemonic[lod][0]),"lod");
strcpy(&(mnemonic[sto][0]),"sto");
strcpy(&(mnemonic[cal][0]),"cal");
strcpy(&(mnemonic[inte][0]),"int");
strcpy(&(mnemonic[jmp][0]),"jmp");
strcpy(&(mnemonic[jpc][0]),"jpc");
//设置符号集
for(i=0;i<symnum;i++) //初始将所有置为false
{
declbegsys[i]=false;
statbegsys[i]=false;
facbegsys[i]=false;
}
//设置声明开始符号集
declbegsys[constsym]=true;
declbegsys[varsym]=true;
declbegsys[procsym]=true;
//设置语句开始符号集
statbegsys[beginsym]=true;
statbegsys[callsym]=true;
statbegsys[ifsym]=true;
statbegsys[whilesym]=true;
//设置因子开始符号集
facbegsys[ident]=true;
facbegsys[number]=true;
facbegsys[lparen]=true;
}
//用数组实现集合的集合运算
int inset(int e,bool *s)
{
return s[e];
}
int addset(bool *sr,bool *s1,bool *s2,int n) //交运算
{
int i;
for(i=0;i<n;i++)
{
sr[i]=s1[i]||s2[i];
}
return 0;
}
int subset(bool *sr,bool *s1,bool *s2,int n)
{
int i;
for(i=0;i<n;i++)
{
sr[i]=s1[i]&&(! s2[i]);
}
return 0;
}
int mulset(bool *sr,bool *s1,bool *s2,int n)
{
int i;
for(i=0;i<n;i++)
{
sr[i]=s1[i]&&s2[i];
}
return 0;
}
//出错处理,打印出错位置和错误编码
void error(int n)
{
char space[81];
memset(space,32,81);
space[cc-1]=0; //出错时当前符号已经读完,所以cc-1
printf("****%S!%d\n",space,n);
fprintf(fa1,"****%s!%d\n",space,n);
err++;
}
//漏掉空格,读取下一个字符。
//每次读一行,存入line缓冲区,line被getsym取空后再读一行。被函数getsym调用。
int getch()
{
if(cc==ll)
{
if(feof(fin)) //到文件尾
{
printf("program incomplete");
return -1;
}
ll=0;
cc=0;
printf("%d ",cx);
fprintf(fa1,"%d ",cx);
ch=' ';
while(ch!=10)
{
if(EOF==fscanf(fin,"%c",&ch))
{
line[ll]=0;
break;
}
printf("%c",ch);
fprintf(fa1,"%c",ch);
line[ll]=ch;
ll++;
}
printf("\n");
fprintf(fa1,"\n");
}
ch=line[cc];
cc++;
return 0;
}
//词法分析,获取一个符号
int getsym()
{
int i,j,k;
while(ch==' '||ch==10||ch==9) //忽略空格、换行和TAB
{
getchdo;
}
if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))
{ //名字或保留字以a..z开头
k=0;
do{
if(k<AL)
{
a[k]=ch;
k++;
}
getchdo;
}while(ch>='a'&&ch<='z'||ch>='0'&&ch<='9'||ch>='A'&&ch<='Z');
a[k]=0;
strcpy(id,a);
i=0;
j=NROW-1;
do{ //搜索当前符号是否为保留字
k=(i+j)/2;
if(strcmp(id,word[k])<=0)
{
j=k-1;
}
if(strcmp(id,word[k])>=0)
{
i=k+1;
}
}while(i<=j);
if(i-1>j)
{
sym=wsym[k];
}
else
{
sym=ident; //搜索失败,则是名字或数字
}
}
else if(ch>='0'&&ch<='9')
{ //检测是否为数字:以0..9开头
k=0;
num=0;
sym=number;
do{
num=10*num+ch-'0';
k++;
getchdo;
}while(ch>='0'&&ch<='9'); //获取数字的值
k--;
if(k>NMAX)
{
error(30);
}
}
else if(ch==':') //检测赋值符号
{
getchdo;
if(ch=='=')
{
sym=becomes;
getchdo;
}
else
{
sym=nul; //不能识别的符号
}
}
else if(ch=='<') //检测小于或小于等于符号
{
getchdo;
if(ch=='=')
{
sym=leq;
getchdo;
}
else if(ch=='>')
{
sym=neq;
getchdo;
}
else
{
sym=lss;
}
}
else if(ch=='>') //检测大于或大于等于符号
{
getchdo;
if(ch=='=')
{
sym=geq;
getchdo;
}
else
{
sym=gtr;
}
}
else
{
sym=ssym[ch]; //当符号不满足上述条件时,全部按照单字符符号处理
if(sym !=period)
{
getchdo;
}
}
return 0;
}
//生成虚拟机代码 x:instruction; y:instruction; z:instruction;
int gen(enum fct x,int y,int z)
{
if(cx>=CXMAX)
{
printf("程序过长");
return -1;
}
code[cx].f=x;
code[cx].l=y;
code[cx].a=z;
cx++;
return 0;
}
//测试当前符号是否合法:在某一部分(如一条语句,一个表达式)将要结束时我们希望下一个符号属于某集合(该部分的后根符号),
//test负责这项检测,并且负责当检测不通过时的补救措施。
//程序在需要检测时指定当前需要的符号集合和补救用的集合(如之前未完成部分的后跟符号),以及检测不通过时的错误号。
//s1:我们需要的符号;s2:如果不是我们需要的,则需要一个补救用的集合;n:错误号
int test(bool *s1,bool *s2,int n)
{
if(! inset(sym,s1))
{
error(n);
//当检测不通过时,不停止获取符号,直到它属于需要的集合或补救的集合
while((! inset(sym,s1))&&(! inset(sym,s2)))
{
getsymdo;
}
}
return 0;
}
//编译程序主体:lev当前分程序所在层;tx名字表当前尾指针;fsys当前模块后跟符号集合
int block(int lev,int tx,bool *fsys)
{
int i;
int dx; //名字分配到的相对地址
int tx0; //保留初始tx
int cx0; //保留初始cx
bool nxtlev[symnum]; //在下级函数的参数中,符号集合均为值参,但由于使用数组实现,传递进来的是指针,为防止下级函数改变上级函数的集合,开辟新的空间传递给下级函数
dx=3;
tx0=tx; //记录本层名字的初始位置
table[tx].adr=cx;
gendo(jmp,0,0);
if(lev>LEVMAX)
{
error(32);
}
do{
if(sym==constsym) //收到常量声明符号,开始处理常量声明
{
getsymdo;
do{
constdeclarationdo(&tx,lev,&dx); //dx的值会被constdeclaration改变,使用指针
while(sym==comma)
{
getsymdo;
constdeclarationdo(&tx,lev,&dx);
}
if(sym==semicolon)
{
getsymdo;
}
else
{
error(5); //漏掉了逗号或者分号
}
}while(sym==ident);
}
if(sym==varsym) //收到变量声明符号,开始处理变量声明
{
getsymdo;
do{
vardeclarationdo(&tx,lev,&dx);
while(sym==comma)
{
getsymdo;
vardeclarationdo(&tx,lev,&dx);
}
if(sym==semicolon)
{
getsymdo;
}
else{
error(5);
}
}while(sym==ident);
}
while(sym==procsym) //收到过程声明符号,开始处理过程声明
{
getsymdo;
if(sym==ident)
{
enter(procedur,&tx,lev,&dx); //记录过程名字
getsymdo;
}
else
{
error(4); //procedure后应为标志符
}
if(sym==semicolon)
{
getsymdo;
}
else
{
error(5); //漏掉了分号
}
memcpy(nxtlev,fsys,sizeof(bool)*symnum);
nxtlev[semicolon]=true;
if(-1==block(lev+1,tx,nxtlev))
{
return -1; //递归调用
}
if(sym==semicolon)
{
getsymdo;
memcpy(nxtlev,statbegsys,sizeof(bool)*symnum);
nxtlev[ident]=true;
nxtlev[procsym]=true;
testdo(nxtlev,fsys,6);
}
else
{
error(5); //漏掉了分号
}
}
memcpy(nxtlev,statbegsys,sizeof(bool)*symnum);
nxtlev[ident]=true;
nxtlev[period]=true;
testdo(nxtlev,declbegsys,7);
}while(inset(sym,declbegsys)); //直到没有声明符号
code[table[tx0].adr].a=cx; //开始生成当前过程代码
table[tx0].adr=cx; //当前过程代码地址
table[tx0].size=dx; //声明部分中每增加一条声明都会给dx增加1,声明部分已经结束,dx就是当前过程数据的size
cx0=cx;
gendo(inte,0,dx); //生成分配内存代码
if(tableswitch) //输出名字表
{
printf("TABLE:\n");
if(tx0+1>tx)
{
printf("NULL\n");
}
for(i=tx0+1;i<=tx;i++)
{
switch(table[i].kind)
{
case constant:
printf("%d const %s",i,table[i].name);
printf("val = %d\n",table[i].val);
fprintf(fas,"%d const %s",i,table[i].name);
fprintf(fas,"val = %d\n",table[i].val);
break;
case variable:
printf("%d var %s",i,table[i].name);
printf("lev = %d addr = %d\n",table[i].level,table[i].adr);
fprintf(fas,"%d const %s",i,table[i].name);
fprintf(fas,"lev = %d addr = %d\n",table[i].level,table[i].adr);
break;
case procedur:
printf("%d proc %s",i,table[i].name);
printf("lev = %d addr = %d size= %d\n",table[i].level,table[i].adr,table[i].size);
fprintf(fas,"%d proc %s",i,table[i].name);
fprintf(fas,"lev = %d addr = %d size = %d\n",table[i].level,table[i].adr,table[i].size);
break;
}
}
printf("\n");
}
//语句后跟符号为分号或end
memcpy(nxtlev,fsys,sizeof(bool)*symnum); //每个后跟符号集和都包含上层后跟符号集合,以便补救
nxtlev[semicolon]=true;
nxtlev[endsym]=true;
statementdo(nxtlev,&tx,lev);
gendo(opr,0,0); //每个过程出口都要使用的释放数据段指令
memset(nxtlev,0,sizeof(bool)*symnum); //分程序没有补救集合
testdo(fsys,nxtlev,8); //检测后跟符号正确性
listcode(cx0); //输出代码
return 0;
}
//在名字表中加入一项 k:名字种类const,var or procedure; ptx:名字表尾指针的指针,为了可以改变名字表尾指针的值;
//lev:名字所在的层次,以后所有的lev都是这样;
//pdx:dx为当前应分配的变量的相对地址,分配后要增加1
void enter(enum object k,int *ptx,int lev,int *pdx)
{
(*ptx)++;
strcpy(table[(*ptx)].name,id); //全局变量id中已存有当前名字的名字
table[(*ptx)].kind=k;
switch(k)
{
case constant: //常量名字
if(num>AMAX)
{
error(31); //数越界
num=0;
}
table[(*ptx)].val=num;
break;
case variable: //变量名字
table[(*ptx)].level=lev;
table[(*ptx)].adr=(*pdx);
(*pdx)++;
break;
case procedur: //过程名字
table[(*ptx)].level=lev;
break;
}
}
//查找名字的位置,找到则返回在名字表中的位置,否则返回0。idt:要查找的名字;tx:当前名字表尾指针
int position(char *idt,int tx)
{
int i;
strcpy(table[0].name,idt);
i=tx;
while(strcmp(table[i].name,idt)!=0)
{
i--;
}
return i;
}
//常量声明处理
int constdeclaration(int *ptx,int lev,int *pdx)
{
if(sym==ident)
{
getsymdo;
if(sym==eql||sym==becomes)
{
if(sym==becomes)
{
error(1);
}
getsymdo;
if(sym==number)
{
enter(constant,ptx,lev,pdx);
getsymdo;
}
else
{
error(2); //常量说明=后应是数字
}
}
else
{
error(3); //常量说明标识后应是=
}
}
else
{
error(4); //const后应是标识
}
return 0;
}
//变量声明处理
int vardeclaration(int *ptx,int lev,int *pdx)
{
if(sym==ident)
{
enter(variable,ptx,lev,pdx); //填写名字表
getsymdo;
}
else
{
error(4); //var后应是标识
}
return 0;
}
//输出目标代码清单
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -