📄 pl0c_2005.cpp
字号:
// PL0C_2005.cpp : 定义控制台应用程序的入口点。
//
/* 编译和运行环境:
* 1 Visual C++6.O、Visual C++.NET and Visual C++.NET 2003
* WinNT,Win2000,WinXP and Win2003
* 2 gcc version 3.3.2 20031022(Red Hat Linux 3.3.2-1)
* Redhat Fedora core 1
* Intel 32 platform
* 使用方法:
* 运行后输入PL/O源程序文件名
* 回答是否输出虚拟机代码
* 回答是否输出名字表
* fa.tmp输出虚拟机代码
* fal.tmp输出源文件及其各行对应的首地址
* fa2.tmp输出结果
* fas.tmp输出名字表
*/
#include "stdafx.h"
#include <stdio.h>
#include <string.h>
#include "PL0C_3.h"
/* 解释执行时使用的栈 */
#define stacksize 500
int _tmain(int argc, _TCHAR* argv[])
{
bool nxtlev[symnum];
printf(" Input pl/0 file?");
scanf("%s", fname); /* 输入文件名 */
fin=fopen(fname, "r");
if(fin)
{
printf(" List object code?(Y/N)"); /* 是否输出虚拟机代码 */
scanf("%s", fname);
listswitch=(fname[0]=='y' || fname[0]=='Y');
printf("List symbol table?(Y/N)"); /* 是否输出名字表 */
scanf("%s", fname);
tableswitch=(fname[0]=='y' || fname[0]=='Y');
fa1=fopen("fa1.tmp", "w");
fprintf(fa1, "Input pl/O file? ");
fprintf(fa1, "%s\n", fname);
init(); /* 初始化 */
err=0;
cc=cx=ll=0;
ch=' ';
if(-1 !=getsym())
{
fa=fopen("fa.tmp", "w");
fas=fopen("fas.tmp", "w");
addset(nxtlev, declbegsys, statbegsys, symnum);
nxtlev[period]=true;
if(-1==block(0, 0, nxtlev)) /* 调用编译程序 */
{
fclose(fa);
fclose(fa1);
fclose(fas);
fclose(fin);
printf("\n");
return 0;
}
fclose(fa);
fclose(fa1);
fclose(fas);
if(sym!=period)
{
error(9);
}
if(err==0)
{
fa2=fopen("fa2.tmp", "w");
interpret(); /* 调用解释执行程序 */
fclose(fa2);
}
else
{
printf("Errors in pl/O program" );
}
}
fclose(fin);
}
else
{
printf("Can't open file! \n ");
}
printf("\n");
return 0;
}
/*
* 初始化
*/
void init()
{
int i;
/* 设置单字符符号 */
for(i=0; i<-255; i++)
{
ssym[i]=nul;
}
ssym['+']=plus;
ssym['-']=minus;
ssym['*']=times;
ssym['/']=slash;
ssym['(']=lparen;
ssym[')']=rparen;
ssym['=']=eql;
ssym[',']=comma;
ssym['.']=period;
ssym['#']=neq;
ssym[';']=semicolon;
/* 设置保留字名字,按照字母顺序,便于折半查找 */
strcpy(&(word[0][0]), "begin");
strcpy(&(word[1][0]), "call");
strcpy(&(word[2][0]), "const");
strcpy(&(word[3][0]), "do");
strcpy(&(word[4][0]), "end");
strcpy(&(word[5][0]), "if");
strcpy(&(word[6][0]), "odd");
strcpy(&(word[7][0]), "procedure");
strcpy(&(word[8][0]), "read");
strcpy(&(word[9][0]), "then");
strcpy(&(word[10][0]), "var");
strcpy(&(word[11][0]), "while");
strcpy(&(word[12][0]), "write");
/* 设置保留字符号 */
wsym[0] =beginsym;
wsym[1] =callsym;
wsym[2] =constsym;
wsym[3] =dosym;
wsym[4] =endsym;
wsym[5] =ifsym;
wsym[6] =oddsym;
wsym[7] =procsym;
wsym[8] =readsym;
wsym[9] =thensym;
wsym[10]=varsym;
wsym[11]=whilesym;
wsym[12]=writesym;
/* 设置指令名称 */
strcpy(&(mnemonic[lit][0]), "lit");
strcpy(&(mnemonic[opr][0]), "opr");
strcpy(&(mnemonic[lod][0]), "lod");
strcpy(&(mnemonic[sto][0]), "sto");
strcpy(&(mnemonic[cal][0]), "cal");
strcpy(&(mnemonic[inte][0]), "int");
strcpy(&(mnemonic[jmp][0]), "jmp");
strcpy(&(mnemonic[jpc][0]), "jpc");
/* 设置符号集 */
for(i=0; i<symnum; i++)
{
declbegsys[i]=false;
statbegsys[i]=false;
facbegsys[i]=false;
}
/* 设置声明开始符号集 */
declbegsys[constsym]=true;
declbegsys[varsym]=true;
declbegsys[procsym]=true;
/* 设置语句开始符号集 */
statbegsys[beginsym]=true;
statbegsys[callsym]=true;
statbegsys[ifsym]=true;
statbegsys[whilesym]=true;
/* 设置因子开始符号集 */
facbegsys[ident]=true;
facbegsys[number]=true;
facbegsys[lparen]=true;
}
/*
* 用数组实现集合的集合运算
*/
int inset(int e, bool *s)
{
return s[e];
}
int addset(bool *sr, bool *s1, bool *s2, int n)
{
int i;
for(i=0; i<n; i++)
{
sr[i]=s1[i]||s2[i];
}
return 0;
}
int subset(bool *sr, bool *s1, bool *s2, int n)
{
int i;
for(i=0; i<n; i++)
{
sr[i]=s1[i]&&(!s2[i]);
}
return 0;
}
int mulset(bool *sr, bool *s1, bool *s2, int n)
{
int i;
for(i=0; i<n; i++)
{
sr[i]=s1[i]&&s2[i];
}
return 0;
}
/*
* 出错处理,打印出错位置和错误编码
*/
void error(int n)
{
char space[81];
memset(space, 32, 81);
space[cc-1]=0; //出错时当前符号已经读完,所以cc-1
printf("****%s!%d\n", space, n);
fprintf(fa1, "****%s!%d\n", space, n);
err++;
}
/*
* 漏掉空格,读取一个字符。
*
* 每次读一行,存人line缓冲区,line被getsym取空后再读一行
*
* 被函数getsym调用。
*/
int getch()
{
if(cc==ll)
{
if(feof(fin))
{
printf("program incomplete !");
return -1;
}
ll=0;
cc=0;
printf("%d ", cx);
fprintf(fa1, "%d", cx);
ch=' ';
while(ch!=10)
{
// fscanf(fin, "%c", &ch);
if(EOF==fscanf(fin, "%c", &ch))
{
line[ll]=0;
break;
}
printf("%c", ch);
fprintf(fa1, "%c", ch);
line[ll]=ch;
ll++;
}
printf("\n");
fprintf(fa1, "\n");
}
ch=line[cc];
cc++;
return 0;
}
/*
* 词法分析,获取一个符号
*/
int getsym()
{
int i, j, k;
while(ch==' ' || ch==10 || ch==9) /* 忽略空格、换行和TAB */
{
getchdo;
}
if(ch>='a' && ch<='z')
{ /* 名字或保留字以a..z开头 */
k=0;
do{
if(k<al)
{
a[k]=ch;
k++;
}
getchdo;
}while(ch>='a' && ch<='z' || ch>='0' && ch<='9');
a[k]=0;
strcpy(id, a);
i=0;
j=norw-1;
do{ /* 搜索当前符号是否为保留字 */
k=(i+j)/2;
if(strcmp(id, word[k])<=0)
{
j=k-1;
}
if(strcmp(id, word[k])>=0)
{
i=k+1;
}
}while(i<=j);
if(i-1>j)
{
sym=wsym[k];
}
else
{
sym=ident; /* 搜索失败,则是名字或数字 */
}
}
else
{
if(ch>='0' && ch<='9')
{ /* 检测是否为数字:以0..9开头 */
k=0;
num=0;
sym=number;
do{
num=10*num+ch-'O';
k++;
getchdo;
}while(ch>='0' && ch<='9'); /* 获取数字的值 */
k--;
if(k>nmax)
{
error(30);
}
}
else
{
if(ch==':') /* 检测赋值符号 */
{
getchdo;
if(ch=='=')
{
sym=becomes;
getchdo;
}
else
{
sym=nul; /* 不能识别的符号 */
}
}
else
{
if(ch=='<') /* 检测小于或小于等于符号 */
{
getchdo;
if(ch=='=')
{
sym=leq;
getchdo;
}
else
{
sym=lss;
}
}
else
{
if(ch=='>') /* 检测大于或大于等于符号 */
{
getchdo;
if(ch=='=')
{
sym=geq;
getchdo;
}
else
{
sym=gtr;
}
}
else
{
sym=ssym[ch]; /* 当符号不满足上述条件时,全部按照单字符符号处理 */
// getchdo;
//richard
if(sym!=period)
{
getchdo;
}
//end richard
}
}
}
}
}
return 0;
}
/*
* 生成虚拟机代码
*
* x:instruction.f;
* y:instruction.l;
* z:instruction.a;
*/
int gen(enum fct x, int y, int z)
{
if(cx>=cxmax)
{
printf("Program too long"); /* 程序过长 */
return -1;
}
code[cx].f=x;
code[cx].l=y;
code[cx].a=z;
cx++;
return 0;
}
/*
* 测试当前符号是否合法
*
* 在某一部分(如一条语句,一个表达式)将要结束时时我们希望下一个符号属于某集合(该部分的后跟符号),
* test负责这项检测,并且负责当检测不通过时的补救措施
* 程序在需要检测时指定当前需要的符号集合和补救用的集合(如之前未完成部分的后跟符号),
* 以及检测不通过时的错误号
*
* s1:我们需要的符号
* s2:如果不是我们需要的,则需要一个补救用的集合
* n:错误号
*/
int test(bool *s1, bool *s2, int n)
{
if(!inset(sym, s1))
{
error(n);
/* 当检测不通过时,不停获取符号,直到它属于需要的集合或补救的集合 */
while((!inset(sym, s1))&&(!inset(sym, s2)))
{
getsymdo;
}
}
return 0;
}
/*
* 编译程序主体
*
* lev:当前分程序所在层
* tx:名字表当前尾指针
* fsys:当前模块后跟符号集合
*/
int block(int lev, int tx, bool *fsys)
{
int i;
int dx; /* 名字分配到的相对地址 */
int tx0; /* 保留初始tx */
int cx0; /* 保留初始cx */
bool nxtlev[symnum]; /* 在下级函数的参数中,符号集合均为值参,但由于使用数组
实现,传递进来的是指针,为防止下级函数改变上级函数的
集合,开辟新的空间传递给下级函数 */
dx=3;
tx0=tx; /* 记录本层名字的初始位置 */
table[tx].adr=cx;
gendo(jmp, 0, 0);
if(lev>levmax)
{
error(32);
}
do{
if(sym==constsym) /* 收到常量声明符号,开始处理常量声明 */
{
getsymdo;
do{
constdeclarationdo(&tx, lev, &dx); /* dx的值会被constdeclaration改变,使用指针 */
while(sym==comma)
{
getsymdo;
constdeclarationdo(&tx, lev, &dx);
}
if(sym==semicolon)
{
getsymdo;
}
else
{
error(5); /* 漏掉了逗号或者分号 */
}
}while(sym==ident);
}
if(sym==varsym) /* 收到变量声明符号,开始处理变量声明 */
{
getsymdo;
do{
vardeclarationdo(&tx, lev, &dx);
while(sym==comma)
{
getsymdo;
vardeclarationdo(&tx, lev, &dx);
}
if(sym==semicolon)
{
getsymdo;
}
else
{
error(5);
}
}while(sym==ident);
}
while(sym==procsym) /* 收到过程声明符号,开始处理过程声明 */
{
getsymdo;
if(sym==ident)
{
enter(procedur, &tx, lev, &dx); /* 记录过程名字 */
getsymdo;
}
else
{
error(4); /* procedure后应为标识符 */
}
if(sym==semicolon)
{
getsymdo;
}
else
{
error(5); /* 漏掉了分号 */
}
memcpy(nxtlev, fsys, sizeof(bool) *symnum);
nxtlev[semicolon]=true;
if(-1==block(lev+1, tx, nxtlev))
{
return -1; /* 递归调用 */
}
if(sym==semicolon)
{
getsymdo;
memcpy(nxtlev, statbegsys, sizeof(bool) *symnum);
nxtlev[ident]=true;
nxtlev[procsym]=true;
testdo(nxtlev, fsys, 6);
}
else
{
error(5); /* 漏掉了分号 */
}
}
memcpy(nxtlev, statbegsys, sizeof(bool) *symnum);
nxtlev[ident]=true;
nxtlev[period]=true;
testdo(nxtlev, declbegsys, 7);
}while(inset(sym, declbegsys)); /* 直到没有声明符号 */
code[table[tx0].adr].a=cx; /* 开始生成当前过程代码 */
table[tx0].adr=cx; /* 当前过程代码地址 */
table[tx0].size=dx; /* 声明部分中每增加一条声明都会给dx增加1,声明
部分已经结束,dx就是当前过程数据的size */
cx0=cx;
gendo(inte, 0, dx); /* 生成分配内存代码 */
if(tableswitch) /* 输出名字表 */
{
printf("TABLE:\n");
if(tx0+1>tx)
{
printf("NULL\n");
}
for(i=tx0+1; i<=tx; i++)
{
switch(table[i].kind)
{
case constant:
printf("%d const%s", i, table[i].name);
printf("val=%d\n", table[i].val);
fprintf(fas, "%d const %s", i, table[i].name);
fprintf(fas, "val=%d\n", table[i].val);
break;
case variable:
printf("%d var%s", i, table[i].name);
printf("lev=%d addr=%d\n", table[i].level, table[i].adr);
fprintf(fas, "%d var%s", i, table[i].name);
fprintf(fas, "lev=%d addr=%d\n", table[i].level, table[i].adr);
break;
case procedur:
printf("%d proc%s", i, table[i].name);
printf("lev=%d addr=%d size=%d\n", table[i].level, table[i].adr, table[i].size);
fprintf(fas, "%d proc%s", i, table[i].name);
fprintf(fas, "lev=%d addr=%d size=%d\n", table[i].level, table[i].adr, table[i].size);
break;
}
}
printf("\n");
}
/* 语句后跟符号为分号或end */
memcpy(nxtlev, fsys, sizeof(bool)*symnum); /* 每个后跟符号集和都包含上层后跟符号集和,以便补救 */
nxtlev[semicolon]=true;
nxtlev[endsym]=true;
statementdo(nxtlev, &tx, lev);
gendo(opr, 0, 0); /* 每个过程出口都要使用的释放数据段指令 */
memset(nxtlev, 0, sizeof(bool)*symnum); /* 分程序没有补救集合 */
testdo(fsys, nxtlev, 8); /* 检测后跟符号正确性 */
listcode(cx0); /* 输出代码 */
return 0;
}
/*
* 在名字表中加入一项
*
* k: 名字种类const,var or procedure
* ptx:名字表尾指针的指针,为了可以改变名字表尾指针的值
* lev:名字所在的层次,以后所有的lev都是这样
* pdx:dx为当前应分配的变量的相对地址,分配后要增加1
*/
void enter(enum object k, int *ptx, int lev, int *pdx)
{
(*ptx)++;
strcpy(table[(*ptx)].name, id); /* 全局变量id中已存有当前名字的名字 */
table[(*ptx)].kind=k;
switch(k)
{
case constant: /* 常量名字 */
if(num>amax)
{
error(31); /* 数越界 */
num=0;
}
table[(*ptx)].val=num;
break;
case variable: /* 变量名字 */
table[(*ptx)].level=lev;
table[(*ptx)].adr=(*pdx);
(*pdx)++;
break;
case procedur: /* 过程名字 */
table[(*ptx)].level=lev;
break;
}
}
/*
* 查找名字的位置
* 找到则返回在名字表中的位置,否则返回O
*
* idt:要查找的名字
tx:当前名字表尾指针
*/
int position(char *idt, int tx)
{
int i;
strcpy(table[0].name, idt);
i=tx;
while(strcmp(table[i].name, idt)!=0)
{
i--;
}
return i;
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -