📄 编译大作业.cpp

📁 这是一个用c语言编写的编译大作业
💻 CPP
📖 第 1 页 / 共 2 页
字号:
12 下一页
#include <stdio.h>
#include "编译大作业.h"
#include "string.h"

int main()
{
	bool nxtlev[symnum];
	printf("PL/0文法编译器\n输入PL/0源文件：\n");
	scanf("%s",fname);	
	fin=fopen(fname,"r"); //输入文件名
	if(fin)
	{
		printf("是否输出虚拟机代码：(y/n)"); //是否输出虚拟机代码
		scanf("%s",fname);
		listswitch=(fname[0]=='y'||fname[0]=='Y');
		printf("是否输出名字表：(y/n)"); //是否输出名字表
		scanf("%s",fname);
		tableswitch=(fname[0]=='y'||fname[0]=='Y');
		fa1=fopen("fa1.txt","w");
		fprintf(fa1,"pl/0源文件:\n\n");
		init(); //初始化
		err=0; //初始化报错位置
		cc=cx=ll=0; //初始化读字符指针
		ch=' ';
		if(-1 !=getsym())
		{
			fas=fopen("fas.txt","w");
			addset(nxtlev,declbegsys,statbegsys,symnum);
			nxtlev[period]=true;
			if(-1==block(0,0,nxtlev)) //调用编译程序
			{
				fclose(fa1);
				fclose(fas);
				fclose(fin);
				printf("\n");
				return 0;
			}
			fclose(fa1);
			fclose(fas);
			if(sym != period)
			{
				error(9); //缺少.
			}
			if(err==0)
			{
				fa2=fopen("fa2.txt","w");
				interpret();               //调用解释执行程序
				fclose(fa2);
			}
			else
			{
				printf("pl/0程序有错误");
			}
		}
		fclose(fin);
	}
	else
	{
		printf("无法打开文件! \n");
	}
	printf("\n");
	return 0;
}
//初始化
void init()
{
	int i;

	//设置单词符号
	for(i=0;i<=255;i++)
	{
		ssym[i]=nul;
	}
	ssym['+']=plus;
	ssym['-']=minus;
	ssym['*']=times;
	ssym['/']=slash;
	ssym['(']=lparen;
	ssym[')']=rparen;
	ssym['=']=eql;
	ssym[',']=comma;
	ssym['.']=period;
	ssym[';']=semicolon;
	//设置保留字名字，按照字母排序折半查找
	strcpy(&(word[0][0]),"begin");
	strcpy(&(word[1][0]),"call");
	strcpy(&(word[2][0]),"const");
	strcpy(&(word[3][0]),"do");
	strcpy(&(word[4][0]),"else");
	strcpy(&(word[5][0]),"end");
	strcpy(&(word[6][0]),"if");
	strcpy(&(word[7][0]),"odd");
	strcpy(&(word[8][0]),"procedure");
	strcpy(&(word[9][0]),"read");
	strcpy(&(word[10][0]),"then");
	strcpy(&(word[11][0]),"var");
	strcpy(&(word[12][0]),"while");
	strcpy(&(word[13][0]),"write");
    
	//设置保留字符号
	wsym[0]=beginsym;
	wsym[1]=callsym;
	wsym[2]=constsym;
	wsym[3]=dosym;
	wsym[4]=elsesym;
	wsym[5]=endsym;
	wsym[6]=ifsym;
	wsym[7]=oddsym;
	wsym[8]=procsym;
	wsym[9]=readsym;
	wsym[10]=thensym;
	wsym[11]=varsym;
	wsym[12]=whilesym;
	wsym[13]=writesym;
   

	//设置指令名称
	strcpy(&(mnemonic[lit][0]),"lit");
	strcpy(&(mnemonic[opr][0]),"opr");
	strcpy(&(mnemonic[lod][0]),"lod");
	strcpy(&(mnemonic[sto][0]),"sto");
	strcpy(&(mnemonic[cal][0]),"cal");
	strcpy(&(mnemonic[inte][0]),"int");
	strcpy(&(mnemonic[jmp][0]),"jmp");
	strcpy(&(mnemonic[jpc][0]),"jpc");
	//设置符号集
	for(i=0;i<symnum;i++) //初始将所有置为false
	{
		declbegsys[i]=false;
		statbegsys[i]=false;
		facbegsys[i]=false;
	}
	//设置声明开始符号集
	declbegsys[constsym]=true;
	declbegsys[varsym]=true;
	declbegsys[procsym]=true;
	//设置语句开始符号集
	statbegsys[beginsym]=true;
	statbegsys[callsym]=true;
	statbegsys[ifsym]=true;
	statbegsys[whilesym]=true;
    
	//设置因子开始符号集
	facbegsys[ident]=true;
	facbegsys[number]=true;
	facbegsys[lparen]=true;
}
//用数组实现集合的集合运算
int inset(int e,bool *s)
{
	return s[e];
}
int addset(bool *sr,bool *s1,bool *s2,int n) //交运算
{
	int i;
	for(i=0;i<n;i++)
	{
		sr[i]=s1[i]||s2[i];
	}
	return 0;
}
int subset(bool *sr,bool *s1,bool *s2,int n) 
{
	int i;
	for(i=0;i<n;i++)
	{
		sr[i]=s1[i]&&(! s2[i]);
	}
	return 0;
}
int mulset(bool *sr,bool *s1,bool *s2,int n)
{
	int i;
	for(i=0;i<n;i++)
	{
		sr[i]=s1[i]&&s2[i];
	}
	return 0;
}
//出错处理，打印出错位置和错误编码
void error(int n)
{
	char space[81];
	memset(space,32,81);
	space[cc-1]=0; //出错时当前符号已经读完，所以cc-1
	printf("****%S!%d\n",space,n);
	fprintf(fa1,"****%s!%d\n",space,n);
	err++;
}
//漏掉空格，读取下一个字符。
//每次读一行，存入line缓冲区，line被getsym取空后再读一行。被函数getsym调用。
int getch()
{
	if(cc==ll)
	{
		if(feof(fin)) //到文件尾
		{
			printf("program incomplete");
			return -1;
		}
		ll=0;
		cc=0;
		printf("%d	",cx);
		fprintf(fa1,"%d	",cx);
		ch=' ';
		while(ch!=10)
		{
			if(EOF==fscanf(fin,"%c",&ch))
			{
				line[ll]=0;
				break;
			}
			printf("%c",ch);
			fprintf(fa1,"%c",ch);
			line[ll]=ch;
			ll++;
		}
		printf("\n");
		fprintf(fa1,"\n");
	}
	ch=line[cc];
	cc++;
	return 0;
}
//词法分析，获取一个符号
int getsym()
{
	int i,j,k;
	while(ch==' '||ch==10||ch==9) //忽略空格、换行和TAB
	{
		getchdo;
	}
	if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))
	{                    //名字或保留字以a..z开头
		k=0;
		do{
			if(k<AL)
			{
				a[k]=ch;
				k++;
			}
			getchdo;
		}while(ch>='a'&&ch<='z'||ch>='0'&&ch<='9'||ch>='A'&&ch<='Z');
		a[k]=0;
		strcpy(id,a);
		i=0;
		j=NROW-1;
		do{           //搜索当前符号是否为保留字                     
			k=(i+j)/2;
			if(strcmp(id,word[k])<=0)
			{
				j=k-1;
			}
			if(strcmp(id,word[k])>=0)
			{
				i=k+1;
			}
		}while(i<=j);
		if(i-1>j)
		{
			sym=wsym[k];
		}
		else 
		{
			sym=ident; //搜索失败，则是名字或数字
		}
	}
	else if(ch>='0'&&ch<='9')
	{         //检测是否为数字：以0..9开头
		k=0;
		num=0;
		sym=number;
		do{
			num=10*num+ch-'0';
			k++;
			getchdo;
		}while(ch>='0'&&ch<='9'); //获取数字的值
		k--;
		if(k>NMAX)
		{
			error(30);
		}
	}
	else if(ch==':') //检测赋值符号            
	{
		getchdo;
		if(ch=='=')
		{
			sym=becomes;
			getchdo;
		}
		else
		{
			sym=nul; //不能识别的符号
		}
	}
	else if(ch=='<') //检测小于或小于等于符号
	{
		getchdo;
		if(ch=='=')
		{
			sym=leq;
			getchdo;
		}
		else if(ch=='>')
		{
			sym=neq;
			getchdo;
		}
		else
		{
			sym=lss;
		}
	}
	else if(ch=='>') //检测大于或大于等于符号
	{
		getchdo;
		if(ch=='=')
		{
			sym=geq;
			getchdo;
		}
		else
		{
			sym=gtr;
		}
	}
	else		
	{
		sym=ssym[ch]; //当符号不满足上述条件时，全部按照单字符符号处理
		if(sym !=period)
		{
			getchdo;
		}	
	}
	return 0;
}
//生成虚拟机代码 x:instruction; y:instruction; z:instruction;
int gen(enum fct x,int y,int z)
{
	if(cx>=CXMAX)
	{
		printf("程序过长");       
		return -1;
	}
	code[cx].f=x;
	code[cx].l=y;
	code[cx].a=z;
	cx++;
	return 0;
}
//测试当前符号是否合法：在某一部分（如一条语句，一个表达式）将要结束时我们希望下一个符号属于某集合（该部分的后根符号），
//test负责这项检测，并且负责当检测不通过时的补救措施。
//程序在需要检测时指定当前需要的符号集合和补救用的集合（如之前未完成部分的后跟符号），以及检测不通过时的错误号。
//s1：我们需要的符号；s2：如果不是我们需要的，则需要一个补救用的集合；n：错误号
int test(bool *s1,bool *s2,int n)
{
	if(! inset(sym,s1))
	{
		error(n);
		//当检测不通过时，不停止获取符号，直到它属于需要的集合或补救的集合
		while((! inset(sym,s1))&&(! inset(sym,s2)))
		{
			getsymdo;
		}
	}
	return 0;
}
//编译程序主体：lev当前分程序所在层；tx名字表当前尾指针；fsys当前模块后跟符号集合
int block(int lev,int tx,bool *fsys)
{
	int i;
	int dx; //名字分配到的相对地址
	int tx0; //保留初始tx
	int cx0; //保留初始cx
	bool nxtlev[symnum]; //在下级函数的参数中，符号集合均为值参，但由于使用数组实现，传递进来的是指针，为防止下级函数改变上级函数的集合，开辟新的空间传递给下级函数

	dx=3;                            
	tx0=tx; //记录本层名字的初始位置
	table[tx].adr=cx;
	gendo(jmp,0,0);
	if(lev>LEVMAX)
	{
		error(32);
	}
	do{
		if(sym==constsym) //收到常量声明符号，开始处理常量声明
		{
			getsymdo;
			do{
				constdeclarationdo(&tx,lev,&dx); //dx的值会被constdeclaration改变，使用指针
				while(sym==comma)
				{
					getsymdo;
					constdeclarationdo(&tx,lev,&dx);
				}
				if(sym==semicolon)
				{
					getsymdo;
				}
				else
				{
					error(5); //漏掉了逗号或者分号
				}
			}while(sym==ident);

		}
		if(sym==varsym) //收到变量声明符号，开始处理变量声明
		{
			getsymdo;
			do{
				vardeclarationdo(&tx,lev,&dx);
				while(sym==comma)
				{
					getsymdo;
					vardeclarationdo(&tx,lev,&dx);
				}
				if(sym==semicolon)
				{
					getsymdo;
				}
				else{
					error(5);
				}
			}while(sym==ident);
		}
		while(sym==procsym) //收到过程声明符号，开始处理过程声明
		{
			getsymdo;
			if(sym==ident)
			{
				enter(procedur,&tx,lev,&dx); //记录过程名字
				getsymdo;
			}
			else
			{
				error(4); //procedure后应为标志符
			}
			if(sym==semicolon)
			{
				getsymdo;
			}
			else
			{
				error(5); //漏掉了分号
			}
			memcpy(nxtlev,fsys,sizeof(bool)*symnum);
	
			nxtlev[semicolon]=true;
			if(-1==block(lev+1,tx,nxtlev))
			{
				return -1; //递归调用
			}
			if(sym==semicolon)
			{
				getsymdo;
				memcpy(nxtlev,statbegsys,sizeof(bool)*symnum);
				nxtlev[ident]=true;
				nxtlev[procsym]=true;
				testdo(nxtlev,fsys,6);
			}
			else
			{
				error(5); //漏掉了分号
			}
		}
		memcpy(nxtlev,statbegsys,sizeof(bool)*symnum);
		nxtlev[ident]=true;
		nxtlev[period]=true;
		testdo(nxtlev,declbegsys,7);
	}while(inset(sym,declbegsys)); //直到没有声明符号
	code[table[tx0].adr].a=cx; //开始生成当前过程代码
	table[tx0].adr=cx; //当前过程代码地址
	table[tx0].size=dx; //声明部分中每增加一条声明都会给dx增加1，声明部分已经结束，dx就是当前过程数据的size
	cx0=cx;
	gendo(inte,0,dx); //生成分配内存代码
	if(tableswitch) //输出名字表
	{
		printf("TABLE:\n");
		if(tx0+1>tx)
		{
			printf("NULL\n");
		}
		for(i=tx0+1;i<=tx;i++)
		{
			switch(table[i].kind)
			{
				case constant:
					printf("%d	const	%s",i,table[i].name);
					printf("val = %d\n",table[i].val);
					fprintf(fas,"%d	const	%s",i,table[i].name);
					fprintf(fas,"val = %d\n",table[i].val);
					break;
				case variable:
					printf("%d	var	%s",i,table[i].name);
					printf("lev = %d	addr = %d\n",table[i].level,table[i].adr);
					fprintf(fas,"%d	const	%s",i,table[i].name);
					fprintf(fas,"lev = %d	addr = %d\n",table[i].level,table[i].adr);
					break;
				case procedur:
					printf("%d	proc	%s",i,table[i].name);
					printf("lev = %d	addr = %d size= %d\n",table[i].level,table[i].adr,table[i].size);
					fprintf(fas,"%d	proc	%s",i,table[i].name);
					fprintf(fas,"lev = %d	addr = %d	size = %d\n",table[i].level,table[i].adr,table[i].size);
					break;
			}
		}
		printf("\n");
	}
	//语句后跟符号为分号或end
	memcpy(nxtlev,fsys,sizeof(bool)*symnum); //每个后跟符号集和都包含上层后跟符号集合，以便补救
	nxtlev[semicolon]=true;
	nxtlev[endsym]=true;
	statementdo(nxtlev,&tx,lev);
	gendo(opr,0,0); //每个过程出口都要使用的释放数据段指令
	memset(nxtlev,0,sizeof(bool)*symnum); //分程序没有补救集合
	testdo(fsys,nxtlev,8); //检测后跟符号正确性
	listcode(cx0); //输出代码
	return 0;
}
//在名字表中加入一项 k:名字种类const,var or procedure; ptx:名字表尾指针的指针，为了可以改变名字表尾指针的值；
//lev:名字所在的层次，以后所有的lev都是这样；
//pdx:dx为当前应分配的变量的相对地址，分配后要增加1
void enter(enum object k,int *ptx,int lev,int *pdx)
{
	(*ptx)++;
	strcpy(table[(*ptx)].name,id); //全局变量id中已存有当前名字的名字
	table[(*ptx)].kind=k;
	switch(k)
	{
		case constant: //常量名字
			if(num>AMAX)
			{
				error(31); //数越界
				num=0;
			}
			table[(*ptx)].val=num;
			break;
		case variable: //变量名字
			table[(*ptx)].level=lev;
			table[(*ptx)].adr=(*pdx);
			(*pdx)++;
			break;
		case procedur: //过程名字
			table[(*ptx)].level=lev;
			break;
	}
}
//查找名字的位置，找到则返回在名字表中的位置，否则返回0。idt:要查找的名字；tx:当前名字表尾指针
int position(char *idt,int tx)
{
	int i;
	strcpy(table[0].name,idt);
	i=tx;
	while(strcmp(table[i].name,idt)!=0)
	{
		i--;
	}
	return i;
}
//常量声明处理
int constdeclaration(int *ptx,int lev,int *pdx)
{
	if(sym==ident)
	{
		getsymdo;
		if(sym==eql||sym==becomes)
		{
			if(sym==becomes)
			{
				error(1);                 
			}
			getsymdo;
			if(sym==number)
			{
				enter(constant,ptx,lev,pdx);
				getsymdo;
			}
			else
			{
				error(2); //常量说明=后应是数字
			}
		}
		else
		{
			error(3); //常量说明标识后应是=
		}
	}
	else
	{
		error(4); //const后应是标识
	}
	return 0;
}
//变量声明处理
int vardeclaration(int *ptx,int lev,int *pdx)
{
	if(sym==ident)
	{
		enter(variable,ptx,lev,pdx); //填写名字表
		getsymdo;
	}
	else
	{
		error(4); //var后应是标识
	}
	return 0;
}
//输出目标代码清单
12 下一页
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -